Neue KI-Mathe-Prüfung testet Maschinen auf ungelöste Probleme

9

Top-Mathematiker haben „First Proof“ ins Leben gerufen, eine einzigartige Herausforderung, die darauf abzielt, die mathematischen Fähigkeiten künstlicher Intelligenz rigoros zu testen. Die Prüfung stellt KI-Systeme vor tatsächliche, ungelöste Probleme, die direkt aus der aktuellen Forschung stammen, und gibt ihnen eine Woche Zeit, Lösungen zu finden. Dies stellt einen bedeutenden Schritt über bestehende Tests hinaus dar, die häufig auf bereits vorhandenen Datensätzen oder Wettbewerbsproblemen basieren.

Das Problem mit aktuellen KI-Mathe-Tests

Frühere Versuche, die mathematischen Fähigkeiten der KI zu messen, waren fehlerhaft. Während Modelle wie Googles Gemini Deep Think bei der Internationalen Mathematikolympiade hohe Punktzahlen erzielt haben, verwenden diese Tests standardisierte Probleme, die nicht die reale Forschung widerspiegeln. Darüber hinaus haben sich einige KI-generierte „Lösungen“ als Wiederentdeckungen obskurer, zuvor veröffentlichter Beweise herausgestellt – im Wesentlichen anspruchsvolle Literaturrecherchen, die sich als Originalwerke ausgeben. Wie Yale-Professor Daniel Spielman feststellt, stammen viele gemeldete Durchbrüche von den Unternehmen, die die KI selbst entwickeln, was Fragen zur Objektivität aufwirft.

Erster Beweis: Ein kontrolliertes Experiment

Die First Proof-Initiative zielt darauf ab, diese Probleme zu beheben. Elf führende Mathematiker, darunter ein Fields-Medaillengewinner, haben originelle Probleme erstellt, die noch nie in KI-Trainingsdaten aufgetaucht sind. Die Lösungen sind verschlüsselt und werden am 13. Februar veröffentlicht, um einen fairen Test zu gewährleisten.

Bei den Problemen handelt es sich nicht um bahnbrechende Theoreme, sondern vielmehr um „Lemmas“ – kleine, wesentliche Schritte in größeren Beweisen. Dies sind langwierige, aber entscheidende Berechnungen, die die Zeit der Mathematiker in Anspruch nehmen. Ihre Lösung würde das Potenzial der KI demonstrieren, die Forschung durch die Automatisierung dieser grundlegenden Aufgaben zu beschleunigen.

Warum das wichtig ist: Die Zukunft der KI in der Mathematik

Der Schwerpunkt liegt auf dem praktischen Nutzen und nicht auf auffälligen Ergebnissen. Der Mathematiker Andrew Sutherland geht davon aus, dass die kurzfristigen Auswirkungen der KI nicht darin zu spüren sein werden, große ungelöste Probleme zu lösen, sondern dass sie zu einem unverzichtbaren Werkzeug für arbeitende Mathematiker wird. Wenn KI die „lästige Arbeit“ des Theorembeweisens zuverlässig erledigen kann, könnte sie Forschern die Möglichkeit geben, sich auf kreativere und konzeptionellere Aufgaben zu konzentrieren.

„Dies könnte das Jahr sein, in dem viel mehr Menschen anfangen, aufmerksam zu werden“
– Andrew Sutherland, MIT

Der erste Beweis ist nicht nur ein Test; Es ist ein Maßstab für die Zukunft der KI-gestützten Mathematik und hat das Potenzial, die Art und Weise, wie Forschung durchgeführt wird, neu zu gestalten.

попередня статтяYellowstones Supervulkan zeigt ungewöhnliche Bodenhebung