Lord Kelvin to řekl nejlépe: "Když dokážete změřit, o čem mluvíte, a vyjádřit to v číslech, něco o tom víte; ale když to nemůžete změřit, když to nemůžete vyjádřit v číslech, vaše znalosti jsou skrovného a neuspokojivého druhu." Gratulujeme @BrendanFoody a @mercor_ai k poskytnutí tohoto pro modely AI
AI má za sebou doktorát a nyní je na trhu práce. Představujeme index produktivity umělé inteligence (APEX), benchmark, který měří, jak dobře jsme automatizovali nejcennější průmyslová odvětví na světě. Většina benchmarků studuje abstraktní schopnosti. APEX hodnotí výkonnost modelu na základě skutečných výstupů v oblasti práva, financí, poradenství a medicíny. Modely, které jsou dnes podle APEXu nejschopnější pracovat: 🥇 GPT 5 🥈 Grok 4 🥉 Gemini 2.5 Flash Další zjištění: - GPT 5 vykazuje nejsilnější výkon ve všech 4 doménách - Některé levnější modely překonávají dražší modely od stejného poskytovatele (např. Gemini 2.5 Flash vs. Gemini 2.5 Pro) - Nejlepší open source model, Qwen (7. místo), zaostává za Grok 4 celkově pouze o 2 %
Zobrazit originál
10,99 tis.
43
Obsah na této stránce poskytují třetí strany. Není-li uvedeno jinak, společnost OKX není autorem těchto informací a nenárokuje si u těchto materiálů žádná autorská práva. Obsah je poskytován pouze pro informativní účely a nevyjadřuje názory společnosti OKX. Nejedná se o doporučení jakéhokoli druhu a nemělo by být považováno za investiční poradenství ani nabádání k nákupu nebo prodeji digitálních aktiv. Tam, kde se k poskytování souhrnů a dalších informací používá generativní AI, může být vygenerovaný obsah nepřesný nebo nekonzistentní. Další podrobnosti a informace naleznete v připojeném článku. Společnost OKX neodpovídá za obsah, jehož hostitelem jsou externí weby. Držená digitální aktiva, včetně stablecoinů a tokenů NFT, zahrnují vysokou míru rizika a mohou značně kolísat. Měli byste pečlivě zvážit, zde je pro vás obchodování s digitálními aktivy nebo jejich držení vhodné z hlediska vaší finanční situace.