
Zoom alcança a melhor pontuação em IA, suscitando debate sobre crédito e originalidade
Zoom alcança a melhor pontuação em IA, suscitando debate sobre crédito e originalidade
aitech.pt
aitech.pt
Zoom Claims Top AI Benchmark Score, Sparking Credit and Originality Debate

A necessidade de avaliar sistemas de inteligência artificial (IA) de forma precisa tornou-se crítica à medida que a tecnologia avança. Na vanguarda dessa evolução, a Zoom Video Communications anunciou um resultado notável: 48.1% no teste conhecido como Humanity’s Last Exam (HLE). Este resultado não só destaca a performance da nova tecnologia da Zoom, mas também levanta questões sobre sua originalidade e o mérito do método utilizado.

O que é o Humanity’s Last Exam?
O Humanity’s Last Exam (HLE) é um benchmark amplamente adotado para a avaliação de modelos de linguagem natural. Este teste mede a habilidade dos modelos em compreender e gerar texto em contextos complexos, tornando-se uma importante referência para comparar o desempenho de diversas IAs.
Resultados e Comparação com Competidores

A pontuação de 48.1% da Zoom não só é impressionante, mas também supera o desempenho anterior dos principais concorrentes. O Google Gemini 3 Pro, por exemplo, alcançou 45.8%. Este feito foi divulgado pela Zoom em 10 de dezembro de 2025, sendo destacado como um novo state-of-the-art (SOTA).
Tabela Comparativa de Resultados
| Modelo | Pontuação (%) |
|---|---|
| Zoom AI | 48.1 |
| Google Gemini 3 Pro | 45.8 |
| Outros Competidores | N/A |
Como Funciona o Sistema da Zoom?
A IA da Zoom adota uma arquitetura federativa, que combina saídas de múltiplos modelos. Não se limita a um grande modelo de linguagem, mas se utiliza de modelos internos e externos. O processo é otimizado por um avaliador denominado Z-scorer.
Processo de Funcionamento
- Distribuição de Tarefas: Solicitações simples são encaminhadas para modelos pequenos, enquanto perguntas complexas vão para modelos externos maiores.
- Composição de Respostas: Saídas dos diferentes modelos são integradas.
- Avaliação Final: O Z-scorer classifica as respostas antes da apresentação final.
Debate sobre Crédito e Originalidade
A pontuação da Zoom levanta questões importantes sobre a natureza de seu sistema. O que realmente importa: a criação de um novo modelo ou a habilidade de gerenciar múltiplos modelos?
Pontos de Vista
Apoiado pelos Defensores:
- A orquestração inteligente pode resultar em melhor eficiência e custo.
- Melhorias práticas a nível de sistema beneficiam a indústria de IA.
Críticas:
- A abordagem de combinar modelos e reavaliar suas saídas pode ser muito diferente de um novo modelo único submetido a testes.
- Comparações entre sistemas de orquestração e entradas de modelos únicos são potencialmente enganosas e não refletem inovação verdadeira.
Conformidade com Normas de Benchmark
Alguns líderes em benchmarking limitam entradas a modelos únicos ou exigem transparência total em práticas de orquestração. Reports sugerem que a abordagem da Zoom pode não se adequar aos padrões convencionais, gerando controvérsia ao redor de sua pontuação.
O Que é Claro e o Que é Incerto
Claro:
- A Zoom anunciou abertamente a pontuação de 48.1% e compartilhou detalhes sobre sua arquitetura federativa e o mecanismo Z-scorer.
Incerto:
- Existe debate sobre se essa pontuação deve ser considerada state-of-the-art de um único modelo, dado que muitos benchmarks se restringem a submissões de modelos únicos.
Conclusão: Implicações e Próximos Passos no Campo da IA
O anúncio da Zoom sobre sua pontuação recorde de 48.1% no Humanity’s Last Exam é um marco significativo no campo da inteligência artificial. Contudo, a controvérsia em torno do método sugere que a evolução dos benchmarks de IA precisará ser revista para acomodar novas abordagens tecnológicas. A repercussão desses eventos nos próximos meses poderá não apenas redefinir a posição da Zoom no mercado, mas também influenciar o desenvolvimento e pesquisa em IA no futuro. O debate sobre o que constitui resultados justos e inovadores permanece apenas no início.
Fontes
Share this post
Like this post? Share it with your friends!