Lord Kelvin disse melhor: "Quando você pode medir o que está falando e expressá-lo em números, você sabe algo sobre isso; mas quando você não pode medi-lo, quando você não pode expressá-lo em números, seu conhecimento é de um tipo escasso e insatisfatório. Parabéns a @BrendanFoody e @mercor_ai por entregar isso para modelos de IA
A IA tem seu PhD e agora está no mercado de trabalho.
Apresentamos o Índice de Produtividade de IA (APEX), um benchmark que mede o quão bem automatizamos os setores mais valiosos do mundo.
A maioria dos benchmarks estuda capacidades abstratas. O APEX avalia o desempenho do modelo em entregas reais em direito, finanças, consultoria e medicina.
Os modelos mais capazes de fazer o trabalho hoje, de acordo com a APEX:
🥇 GPT 5
🥈 Grok 4
🥉 Gêmeos 2.5 Flash
Outras descobertas:
- GPT 5 demonstra o desempenho mais forte em todos os 4 domínios
- Alguns modelos mais baratos superam os modelos mais caros do mesmo fornecedor (por exemplo, Gemini 2.5 Flash vs. Gemini 2.5 Pro)
- O melhor modelo de código aberto, Qwen (7º), tem desempenho de apenas 2% atrás do Grok 4 no geral
7,44 mil
32
O conteúdo desta página é fornecido por terceiros. A menos que especificado de outra forma, a OKX não é a autora dos artigos mencionados e não reivindica direitos autorais sobre os materiais apresentados. O conteúdo tem um propósito meramente informativo e não representa as opiniões da OKX. Ele não deve ser interpretado como um endosso ou aconselhamento de investimento de qualquer tipo, nem como uma recomendação para compra ou venda de ativos digitais. Quando a IA generativa é utilizada para criar resumos ou outras informações, o conteúdo gerado pode apresentar imprecisões ou incoerências. Leia o artigo vinculado para mais detalhes e informações. A OKX não se responsabiliza pelo conteúdo hospedado em sites de terceiros. Possuir ativos digitais, como stablecoins e NFTs, envolve um risco elevado e pode apresentar flutuações significativas. Você deve ponderar com cuidado se negociar ou manter ativos digitais é adequado para sua condição financeira.