¿Puede la IA resolver pruebas matemáticas reales? Los investigadores ponen a prueba los modelos generativos

7

En 2026, la pregunta no es si las máquinas pueden superarnos en inteligencia, sino dónde. Si bien Deep Blue derrotó al campeón de ajedrez Garry Kasparov en 1997, la verdadera pregunta nunca fue sobre el poder de procesamiento en bruto. Hoy en día, la IA generativa está forzando un ajuste de cuentas similar en un campo mucho más abstracto: las matemáticas. Los investigadores están investigando si estos modelos realmente pueden hacer avanzar las matemáticas, no sólo resolver problemas de libros de texto.

La diferencia entre cálculo y descubrimiento

La mayoría de la gente asocia las matemáticas con números y fórmulas. Pero a nivel de investigación, las matemáticas consisten en demostrar afirmaciones verdaderas o falsas, a menudo sobre conceptos demasiado complejos para visualizarlos. A diferencia de las tareas en las que la respuesta es un valor único, los matemáticos trabajan con formas abstractas en múltiples dimensiones y demuestran sus propiedades mediante ecuaciones. No se trata de una cuestión de cálculo, sino de comprensión conceptual.

La IA ya ha mostrado un desempeño impresionante en pruebas estandarizadas como la Olimpiada Internacional de Matemáticas e incluso ha “resuelto” ciertos problemas de Erdős. Sin embargo, estos puntos de referencia son engañosos. Se parecen más a una tarea que a una investigación de vanguardia. Así como una calculadora es diferente de un matemático, aprobar un examen no equivale a una comprensión matemática genuina. La pregunta central es si la IA puede cambiar fundamentalmente cómo se hacen las matemáticas, no solo acelerar los procesos existentes.

El primer desafío de prueba: una prueba rigurosa

Para determinar las verdaderas capacidades de la IA, un equipo de 11 matemáticos lanzó el desafío “Primera prueba”. Plantearon problemas de investigación reales sin resolver, dividiéndolos en “lemas” (subpruebas) más pequeños a partir de sus propios artículos futuros. Esto aseguró que las preguntas no estuvieran en los datos de entrenamiento de la IA, eliminando la posibilidad de regurgitación. El objetivo era simple: ¿podría la IA contribuir al descubrimiento matemático original?

Los primeros resultados son mixtos. Las pruebas iniciales con chatbots disponibles públicamente arrojaron solo dos respuestas correctas de diez. Sin embargo, las empresas de IA más grandes, que utilizaron modelos propietarios y supervisión humana, lograron puntuaciones significativamente mejores. OpenAI afirmó seis soluciones correctas y Google Gemini informó un éxito similar. También contribuyó una comunidad de entusiastas de las matemáticas, ampliando los límites de lo que es posible con los LLM.

El auge de la colaboración con IA: andamiaje e iteración

El hallazgo más sorprendente fue la disparidad entre el desempeño de la IA pública y privada. Los modelos internos superaron ampliamente a los de acceso abierto. Pero surgió otra tendencia: el “andamio”. Los investigadores no dependen de un solo LLM, sino que más bien orquestan múltiples interacciones de IA, utilizándolas para interrogar y perfeccionar el trabajo de los demás. Este proceso iterativo aumenta la precisión pero difumina la línea entre la IA y la contribución humana.

Matemáticas del siglo XIX: ¿un problema de estilo?

Incluso cuando la IA llega a pruebas correctas, los matemáticos notan una diferencia en estilo. Las soluciones de IA a menudo se parecen a los métodos del siglo XIX: laboriosas, indirectas y carentes de elegancia. El verdadero descubrimiento matemático implica la creación de nuevos conceptos que agilicen la comprensión, un proceso que la IA aún debe dominar. Sin embargo, algunas pruebas generadas por IA han sorprendido a los investigadores por su creatividad, sugiriendo el potencial de verdaderos avances.

El futuro de la IA en matemáticas

El equipo de First Proof planea continuar el desafío con controles más estrictos, brindando información más clara sobre las capacidades de la IA. El objetivo no es reemplazar a los matemáticos sino comprender si la IA es una herramienta poderosa o una fuerza revolucionaria. Si la IA puede producir consistentemente pruebas originales y elegantes, podría remodelar el campo. Por ahora, la pregunta sigue abierta. Las próximas rondas de pruebas revelarán si la IA realmente puede hacer avanzar las matemáticas o simplemente acelerar los métodos existentes.

попередня статтяLa ciencia de los sonidos del sueño: blanco, marrón y más
наступна статтяJapón es pionero en el reciclaje de circuito cerrado de pañales desechables