De nouvelles machines de test d’examen de mathématiques IA sur des problèmes non résolus

11

Des mathématiciens de renom ont lancé « First Proof », un défi unique conçu pour tester rigoureusement les capacités mathématiques de l’intelligence artificielle. L’examen présente aux systèmes d’IA des problèmes réels et non résolus tirés directement de la recherche actuelle, leur donnant une semaine pour trouver des solutions. Cela marque une étape significative au-delà des tests existants, qui reposent souvent sur des ensembles de données préexistants ou sur des problèmes de concurrence.

Le problème avec les tests mathématiques d’IA actuels

Les tentatives précédentes visant à évaluer les prouesses mathématiques de l’IA se sont révélées erronées. Même si des modèles tels que Gemini Deep Think de Google ont obtenu des scores élevés à l’Olympiade mathématique internationale, ces tests utilisent des problèmes standardisés qui ne reflètent pas la recherche réelle. En outre, certaines « solutions » générées par l’IA se sont révélées être des redécouvertes de preuves obscures déjà publiées – des recherches documentaires essentiellement sophistiquées se faisant passer pour des œuvres originales. Comme le note Daniel Spielman, professeur à Yale, de nombreuses avancées signalées proviennent des entreprises développant elles-mêmes l’IA, ce qui soulève des questions d’objectivité.

Première preuve : une expérience contrôlée

L’initiative First Proof vise à corriger ces problèmes. Onze mathématiciens de renom, dont un lauréat de la médaille Fields, ont élaboré des problèmes originaux qui ne sont jamais apparus dans aucune donnée de formation à l’IA. Les solutions sont cryptées et seront révélées le 13 février, garantissant ainsi un test équitable.

Les problèmes ne sont pas conçus pour être des théorèmes révolutionnaires, mais plutôt des ** « lemmes » — de petites étapes essentielles dans des preuves plus grandes.** Ce sont le genre de calculs fastidieux, mais cruciaux, qui font perdre du temps aux mathématiciens. Les résoudre démontrerait le potentiel de l’IA à accélérer la recherche en automatisant ces tâches fondamentales.

Pourquoi c’est important : l’avenir de l’IA en mathématiques

L’accent mis sur l’utilité pratique plutôt que sur des résultats flashy est essentiel. Le mathématicien Andrew Sutherland suggère que l’impact à court terme de l’IA ne se fera pas sentir dans la résolution de grands problèmes non résolus, mais dans le fait de devenir un outil indispensable pour les mathématiciens en activité. Si l’IA peut gérer de manière fiable le « gros travail » de la démonstration de théorèmes, elle pourrait libérer les chercheurs et leur permettre de se concentrer sur des tâches plus créatives et conceptuelles.

“C’est peut-être l’année où beaucoup plus de gens commenceront à y prêter attention”
– Andrew Sutherland, MIT

La première preuve n’est pas seulement un test ; il s’agit d’une référence pour l’avenir des mathématiques assistées par l’IA, avec le potentiel de remodeler la manière dont la recherche est menée.

попередня статтяLe supervolcan de Yellowstone montre un soulèvement de sol inhabituel