A IA pode resolver provas matemáticas reais? Pesquisadores colocam modelos generativos à prova

по

-

25.03.2026

10

<br>

Em 2026, a questão não é se as máquinas podem nos superar, mas onde. Embora o Deep Blue tenha derrotado o campeão de xadrez Garry Kasparov em 1997, a verdadeira questão nunca foi sobre o poder de processamento bruto. Hoje, a IA generativa está a forçar um cálculo semelhante num campo muito mais abstrato: a matemática. Os pesquisadores estão investigando se esses modelos podem realmente avançar a matemática, e não apenas resolver problemas de livros didáticos.

A diferença entre cálculo e descoberta

A maioria das pessoas associa matemática a números e fórmulas. Mas ao nível da investigação, a matemática trata de provar afirmações verdadeiras ou falsas – muitas vezes sobre conceitos demasiado complexos para serem visualizados. Ao contrário do trabalho de casa, onde a resposta é um valor único, os matemáticos lidam com formas abstratas em múltiplas dimensões, provando suas propriedades por meio de equações. Esta não é uma questão de computação, mas de compreensão conceitual.

A IA já demonstrou um desempenho impressionante em testes padronizados como a Olimpíada Internacional de Matemática e até “resolveu” alguns problemas de Erdős. No entanto, esses parâmetros de referência são enganosos. Eles se assemelham mais ao dever de casa do que à pesquisa de ponta. Assim como uma calculadora é diferente de um matemático, passar em um teste não significa ter uma visão matemática genuína. A questão central é se a IA pode mudar fundamentalmente a forma como a matemática é feita, e não apenas acelerar os processos existentes.

O primeiro desafio de prova: um teste rigoroso

Para determinar as verdadeiras capacidades da IA, uma equipe de 11 matemáticos lançou o desafio “Primeira Prova”. Eles colocaram problemas reais de pesquisa não resolvidos, dividindo-os em “lemas” menores (subprovas) de seus próprios artigos futuros. Isto garantiu que as perguntas não estivessem nos dados de treinamento de IA, eliminando a possibilidade de regurgitação. O objetivo era simples: poderia a IA contribuir para descobertas matemáticas originais?

Os primeiros resultados são mistos. Os testes iniciais com chatbots disponíveis publicamente produziram apenas duas respostas corretas em dez. No entanto, as maiores empresas de IA, utilizando modelos proprietários e supervisão humana, obtiveram pontuações significativamente melhores. A OpenAI reivindicou seis soluções corretas e o Google Gemini relatou sucesso semelhante. Uma comunidade de entusiastas da matemática também contribuiu, ampliando os limites do que é possível com os LLMs.

A ascensão da colaboração com IA: estrutura e iteração

A descoberta mais surpreendente foi a disparidade entre o desempenho da IA pública e privada. Os modelos internos superaram amplamente os de acesso aberto. Mas surgiu outra tendência: “andaimes”. Os pesquisadores não dependem de LLMs únicos, mas sim de orquestrar múltiplas interações de IA, usando-as para interrogar e refinar o trabalho uns dos outros. Este processo iterativo aumenta a precisão, mas confunde a linha entre a IA e a contribuição humana.

Matemática do século XIX: um problema de estilo?

Mesmo quando a IA chega a provas corretas, os matemáticos notam uma diferença de estilo. As soluções de IA muitas vezes se assemelham aos métodos do século XIX – trabalhosos, indiretos e sem elegância. A verdadeira descoberta matemática envolve a criação de novos conceitos que agilizam a compreensão, um processo que a IA ainda não domina. No entanto, algumas provas geradas pela IA surpreenderam os investigadores com a sua criatividade, sugerindo o potencial para avanços genuínos.

O futuro da IA em matemática

A equipe do First Proof planeja continuar o desafio com controles mais rígidos, fornecendo insights mais claros sobre os recursos de IA. O objetivo não é substituir os matemáticos, mas compreender se a IA é uma ferramenta poderosa ou uma força revolucionária. Se a IA puder produzir consistentemente provas originais e elegantes, poderá remodelar o campo. Por enquanto, a questão permanece em aberto. As próximas rondas de testes revelarão se a IA pode realmente avançar a matemática ou simplesmente acelerar os métodos existentes.