Los principales matemáticos han lanzado la “Primera prueba”, un desafío único diseñado para probar rigurosamente las capacidades matemáticas de la inteligencia artificial. El examen presenta sistemas de IA con problemas reales sin resolver extraídos directamente de investigaciones actuales, dándoles una semana para encontrar soluciones. Esto marca un paso significativo más allá de las pruebas existentes, que a menudo se basan en conjuntos de datos preexistentes o problemas de competencia.
El problema con las pruebas matemáticas de IA actuales
Los intentos anteriores de medir la destreza matemática de la IA han fracasado. Si bien modelos como Gemini Deep Think de Google han logrado puntuaciones altas en la Olimpiada Internacional de Matemáticas, estas pruebas utilizan problemas estandarizados que no reflejan la investigación real. Además, algunas “soluciones” generadas por IA han resultado ser redescubrimientos de pruebas oscuras publicadas anteriormente: búsquedas bibliográficas esencialmente sofisticadas disfrazadas de trabajos originales. Como señala el profesor de Yale Daniel Spielman, muchos de los avances reportados provienen de las propias empresas que desarrollan la IA, lo que plantea dudas sobre la objetividad.
Primera prueba: un experimento controlado
La iniciativa First Proof tiene como objetivo corregir estos problemas. Once destacados matemáticos, incluido un ganador de la medalla Fields, crearon problemas originales que nunca han aparecido en ningún dato de entrenamiento de IA. Las soluciones están cifradas y se revelarán el 13 de febrero, lo que garantiza una prueba justa.
Los problemas no están diseñados para ser teoremas innovadores, sino más bien “lemas”: pasos pequeños y esenciales en demostraciones más grandes. Estos son el tipo de cálculos tediosos, pero cruciales, que consumen el tiempo de los matemáticos. Resolverlos demostraría el potencial de la IA para acelerar la investigación mediante la automatización de estas tareas fundamentales.
Por qué esto es importante: el futuro de la IA en las matemáticas
La clave es centrarse en la utilidad práctica por encima de los resultados llamativos. El matemático Andrew Sutherland sugiere que el impacto a corto plazo de la IA no se sentirá en la resolución de grandes problemas sin resolver, sino en convertirse en una herramienta indispensable para los matemáticos en activo. Si la IA puede manejar de manera confiable el “trabajo duro” de demostrar teoremas, podría liberar a los investigadores para que se centren en tareas más creativas y conceptuales.
“Este puede ser el año en el que mucha más gente empiece a prestar atención”
-Andrew Sutherland, MIT
La Primera Prueba no es sólo una prueba; es un punto de referencia para el futuro de las matemáticas asistidas por IA, con el potencial de remodelar la forma en que se realizan las investigaciones.
