Lord Kelvin lo dijo mejor: "Cuando puedes medir de lo que estás hablando y expresarlo en números, sabes algo al respecto; pero cuando no puedes medirlo, cuando no puedes expresarlo en números, tu conocimiento es de un tipo escaso e insatisfactorio". Felicitaciones a @BrendanFoody y @mercor_ai por ofrecer esto para los modelos de IA
La IA tiene su doctorado y ahora está en el mercado laboral.
Presentamos el Índice de Productividad de IA (APEX), un punto de referencia que mide qué tan bien hemos automatizado las industrias más valiosas del mundo.
La mayoría de los puntos de referencia estudian las capacidades abstractas. APEX evalúa el rendimiento del modelo en entregables reales en derecho, finanzas, consultoría y medicina.
Los modelos más capaces de hacer trabajo hoy en día, según APEX:
🥇 GPT 5
🥈 Grok 4
🥉 Gemini 2.5 Flash
Otros hallazgos:
- GPT 5 demuestra el rendimiento más sólido en los 4 dominios
- Algunos modelos más baratos superan a los modelos más caros del mismo proveedor (por ejemplo, Gemini 2.5 Flash vs. Gemini 2.5 Pro)
- El mejor modelo de código abierto, Qwen (7º), rinde solo un 2% por detrás de Grok 4 en general
11 k
43
El contenido al que estás accediendo se ofrece por terceros. A menos que se indique lo contrario, OKX no es autor de la información y no reclama ningún derecho de autor sobre los materiales. El contenido solo se proporciona con fines informativos y no representa las opiniones de OKX. No pretende ser un respaldo de ningún tipo y no debe ser considerado como un consejo de inversión o una solicitud para comprar o vender activos digitales. En la medida en que la IA generativa se utiliza para proporcionar resúmenes u otra información, dicho contenido generado por IA puede ser inexacto o incoherente. Lee el artículo enlazado para más detalles e información. OKX no es responsable del contenido alojado en sitios de terceros. Los holdings de activos digitales, incluidos stablecoins y NFT, suponen un alto nivel de riesgo y pueden fluctuar mucho. Debes considerar cuidadosamente si el trading o holding de activos digitales es adecuado para ti según tu situación financiera.