A inteligência artificial ainda não é capaz de substituir os matemáticos humanos, de acordo com os resultados do desafio “First Proof” – um teste rigoroso concebido para avaliar a capacidade de grandes modelos de linguagem (LLMs) para conduzir pesquisas matemáticas originais. Lançado no Dia dos Namorados, o desafio apresentou dez “lemas” complexos (teoremas menores) para IAs, tarefas normalmente atribuídas a estudantes de pós-graduação superdotados. O resultado? Nenhum LLM resolveu todos os dez problemas de forma independente.
O desafio e seu propósito
A iniciativa First Proof, liderada por onze matemáticos renomados, teve como objetivo levar a IA além da regurgitação de técnicas existentes. Os problemas foram concebidos para exigir originalidade genuína, forçando os LLMs a sintetizar novas soluções em vez de simplesmente remixar as conhecidas. Este teste sublinha uma realidade crítica: embora a IA seja excelente no reconhecimento de padrões e no processamento de dados, ainda enfrenta dificuldades com a criatividade e o pensamento abstrato que impulsionam os avanços matemáticos.
Engajamento inesperado de desenvolvedores de IA
O desafio atraiu inesperadamente uma atenção significativa de empresas de IA como a OpenAI, que mobilizou recursos substanciais para resolver os problemas. Mohammed Abouzaid, da Universidade de Stanford, membro da equipe First Proof, observou: “Não esperávamos que as empresas de IA levassem isso tão a sério e investissem tanto trabalho nisso”. Isto destaca a crescente competição dentro da indústria de IA para desenvolver modelos capazes de raciocínio matemático genuíno.
Resultados: Confiança não é igual a correção
A equipe da Primeira Prova revelou que os LLMs produziram provas com segurança para todos os dez problemas, mas apenas dois foram verificados como corretos. Uma dessas provas já havia sido documentada e outra foi parcialmente derivada de um esboço arquivado de um renomado matemático. Além disso, muitas soluções apresentadas revelaram-se convincentes, mas, em última análise, falhas, sublinhando a dificuldade de distinguir entre uma visão genuína e a plausibilidade gerada pela IA.
Um vislumbre do “estilo” matemático da IA
Curiosamente, as soluções corretas geradas pelas IA exibiam uma abordagem matemática distinta do século XIX, de acordo com Abouzaid. Isto sugere que, embora a IA possa imitar métodos estabelecidos, ainda não evoluiu para as técnicas de ponta que definem a matemática moderna.
O futuro da IA em matemática
O experimento da Primeira Prova não trata apenas do fracasso. É uma oportunidade de aprendizado. A equipe planeja uma segunda rodada com controles mais rígidos, indicando um compromisso em refinar a metodologia e levar ainda mais a IA. Apesar das limitações atuais, o rápido progresso nas capacidades de LLM sugere que a IA continuará a desempenhar um papel crescente na investigação matemática. Alguns matemáticos acreditam que as ferramentas assistidas por IA já estão preparadas para mudar o campo, como observou Scott Armstrong, da Universidade de Sorbonne: “Estas ferramentas estão a chegar para mudar a matemática, e está a acontecer agora”.
O desafio da Primeira Prova reforça um ponto crucial: embora a IA possa acelerar certos aspectos do trabalho matemático, ainda não alcançou o raciocínio independente e criativo necessário para substituir os matemáticos humanos.


























