Os principais matemáticos lançaram o “First Proof”, um desafio único concebido para testar rigorosamente as capacidades matemáticas da inteligência artificial. O exame apresenta sistemas de IA com problemas reais e não resolvidos extraídos diretamente de pesquisas atuais, dando-lhes uma semana para encontrar soluções. Isto marca um passo significativo em relação aos testes existentes, que muitas vezes dependem de conjuntos de dados pré-existentes ou de problemas de concorrência.
O problema com os testes atuais de matemática de IA
Tentativas anteriores de avaliar as proezas matemáticas da IA falharam. Embora modelos como o Gemini Deep Think do Google tenham alcançado pontuações altas na Olimpíada Internacional de Matemática, esses testes usam problemas padronizados que não refletem pesquisas reais. Além disso, algumas “soluções” geradas pela IA revelaram-se redescobertas de provas obscuras publicadas anteriormente – essencialmente pesquisas bibliográficas sofisticadas disfarçadas de trabalho original. Como observa Daniel Spielman, professor de Yale, muitos avanços relatados vêm das próprias empresas que desenvolvem a IA, levantando questões sobre a objetividade.
Primeira prova: uma experiência controlada
A iniciativa First Proof visa corrigir esses problemas. Onze matemáticos importantes, incluindo um vencedor da Medalha Fields, criaram problemas originais que nunca apareceram em nenhum dado de treinamento de IA. As soluções são criptografadas e serão reveladas no dia 13 de fevereiro, garantindo um teste justo.
Os problemas não foram projetados para serem teoremas inovadores, mas sim “lemas” — etapas pequenas e essenciais em provas maiores. Esses são os tipos de cálculos tediosos, mas cruciais, que consomem o tempo dos matemáticos. Resolvê-los demonstraria o potencial da IA para acelerar a investigação, automatizando estas tarefas fundamentais.
Por que isso é importante: o futuro da IA na matemática
O foco na utilidade prática em vez de resultados chamativos é fundamental. O matemático Andrew Sutherland sugere que o impacto a curto prazo da IA será sentido não na resolução de grandes problemas não resolvidos, mas em tornar-se uma ferramenta indispensável para os matemáticos profissionais. Se a IA conseguir lidar de forma fiável com o “trabalho árduo” da prova de teoremas, poderá libertar os investigadores para se concentrarem em tarefas mais criativas e conceptuais.
“Este pode ser o ano em que muito mais pessoas começarão a prestar atenção”
– Andrew Sutherland, MIT
A Primeira Prova não é apenas um teste; é uma referência para o futuro da matemática assistida por IA, com potencial para remodelar a forma como a pesquisa é conduzida.


























