Lord Kelvin l'a dit le mieux : « Lorsque vous pouvez mesurer de quoi vous parlez et l'exprimer en chiffres, vous en savez quelque chose ; mais lorsque vous ne pouvez pas le mesurer, lorsque vous ne pouvez pas l'exprimer en chiffres, votre connaissance est d'une nature maigre et insatisfaisante. » Félicitations à @BrendanFoody et @mercor_ai pour avoir réalisé cela pour les modèles d'IA
L'IA a son doctorat et est maintenant sur le marché du travail.
Présentation de l'Indice de Productivité de l'IA (APEX), un référentiel qui mesure à quel point nous avons automatisé les industries les plus précieuses au monde.
La plupart des référentiels étudient des capacités abstraites. APEX évalue la performance des modèles sur des livrables réels dans les domaines du droit, de la finance, du conseil et de la médecine.
Les modèles les plus capables de travailler aujourd'hui, selon APEX :
🥇 GPT 5
🥈 Grok 4
🥉 Gemini 2.5 Flash
Autres résultats :
- GPT 5 démontre la meilleure performance dans les 4 domaines
- Certains modèles moins chers surpassent des modèles plus chers du même fournisseur (par exemple, Gemini 2.5 Flash contre Gemini 2.5 Pro)
- Le meilleur modèle open source, Qwen (7e), n'est performant qu'à 2 % derrière Grok 4 au total.
11 k
43
Le contenu de cette page est fourni par des tiers. Sauf indication contraire, OKX n’est pas l’auteur du ou des articles cités et ne revendique aucun droit d’auteur sur le contenu. Le contenu est fourni à titre d’information uniquement et ne représente pas les opinions d’OKX. Il ne s’agit pas d’une approbation de quelque nature que ce soit et ne doit pas être considéré comme un conseil en investissement ou une sollicitation d’achat ou de vente d’actifs numériques. Dans la mesure où l’IA générative est utilisée pour fournir des résumés ou d’autres informations, ce contenu généré par IA peut être inexact ou incohérent. Veuillez lire l’article associé pour obtenir davantage de détails et d’informations. OKX n’est pas responsable du contenu hébergé sur des sites tiers. La détention d’actifs numériques, y compris les stablecoins et les NFT, implique un niveau de risque élevé et leur valeur peut considérablement fluctuer. Examinez soigneusement votre situation financière pour déterminer si le trading ou la détention d’actifs numériques vous convient.