Kann KI echte mathematische Beweise lösen? Forscher stellen generative Modelle auf die Probe

22
Kann KI echte mathematische Beweise lösen? Forscher stellen generative Modelle auf die Probe

Im Jahr 2026 ist die Frage nicht, ob Maschinen uns übertreffen können, sondern wo. Während Deep Blue 1997 den Schachweltmeister Garry Kasparov besiegte, ging es bei der eigentlichen Frage nie um die rohe Rechenleistung. Heutzutage erzwingt die generative KI eine ähnliche Abrechnung in einem weitaus abstrakteren Bereich: der Mathematik. Forscher untersuchen, ob diese Modelle die Mathematik tatsächlich voranbringen und nicht nur Lehrbuchprobleme lösen können.

Der Unterschied zwischen Berechnung und Entdeckung

Die meisten Menschen assoziieren Mathematik mit Zahlen und Formeln. Aber auf der Forschungsebene geht es in der Mathematik darum, Aussagen als wahr oder falsch zu beweisen – oft geht es um Konzepte, die zu komplex sind, um sie zu visualisieren. Im Gegensatz zu Hausaufgaben, bei denen die Antwort ein einzelner Wert ist, beschäftigen sich Mathematiker mit abstrakten Formen in mehreren Dimensionen und beweisen ihre Eigenschaften mithilfe von Gleichungen. Dabei geht es nicht um Berechnungen, sondern um konzeptionelles Verständnis.

KI hat bei standardisierten Tests wie der Internationalen Mathematikolympiade bereits beeindruckende Leistungen gezeigt und sogar bestimmte Erdős-Probleme „gelöst“. Diese Benchmarks sind jedoch irreführend. Sie ähneln eher Hausaufgaben als modernster Forschung. So wie sich ein Taschenrechner von einem Mathematiker unterscheidet, ist das Bestehen einer Prüfung nicht gleichbedeutend mit echten mathematischen Erkenntnissen. Die Kernfrage ist, ob KI die Art und Weise, wie Mathematik gemacht wird, grundlegend verändern und nicht nur bestehende Prozesse beschleunigen kann.

Die erste Beweisherausforderung: Ein strenger Test

Um die wahren Fähigkeiten der KI zu ermitteln, startete ein Team von 11 Mathematikern die Herausforderung „Erster Beweis“. Sie stellten tatsächlich ungelöste Forschungsprobleme und zerlegten sie in kleinere „Lemmas“ (Unterbeweise) aus ihren eigenen bevorstehenden Arbeiten. Dadurch wurde sichergestellt, dass die Fragen nicht in KI-Trainingsdaten enthalten waren, wodurch die Möglichkeit eines Aufstoßens ausgeschlossen wurde. Das Ziel war einfach: Könnte KI zu ursprünglichen mathematischen Entdeckungen beitragen?

Die ersten Ergebnisse sind gemischt. Erste Tests mit öffentlich zugänglichen Chatbots ergaben nur zwei von zehn richtigen Antworten. Allerdings erzielten größere KI-Unternehmen, die proprietäre Modelle und menschliche Aufsicht nutzten, deutlich bessere Ergebnisse. OpenAI beanspruchte sechs richtige Lösungen und Google Gemini meldete ähnliche Erfolge. Eine Gemeinschaft von Mathematikbegeisterten leistete ebenfalls einen Beitrag und verschob die Grenzen dessen, was mit LLMs möglich ist.

Der Aufstieg der KI-Zusammenarbeit: Gerüstbau und Iteration

Das auffälligste Ergebnis war die Diskrepanz zwischen öffentlicher und privater KI-Leistung. Eigene Modelle übertrafen offen zugängliche Modelle bei weitem. Doch es zeichnete sich ein weiterer Trend ab: „Scaffolding“. Forscher verlassen sich nicht auf einzelne LLMs, sondern orchestrieren mehrere KI-Interaktionen und nutzen sie, um die Arbeit der anderen zu befragen und zu verfeinern. Dieser iterative Prozess erhöht die Genauigkeit, verwischt jedoch die Grenze zwischen KI und menschlichem Beitrag.

Mathematik des 19. Jahrhunderts: Ein Stilproblem?

Selbst wenn die KI zu korrekten Beweisen gelangt, bemerken Mathematiker einen Unterschied im Stil. KI-Lösungen ähneln oft den Methoden des 19. Jahrhunderts – mühsam, umständlich und ohne Eleganz. Bei echten mathematischen Entdeckungen geht es darum, neue Konzepte zu entwickeln, die das Verständnis optimieren – ein Prozess, den die KI erst noch beherrschen muss. Allerdings haben einige KI-generierte Beweise die Forscher mit ihrer Kreativität überrascht und das Potenzial für echte Durchbrüche nahegelegt.

Die Zukunft der KI in der Mathematik

Das First Proof-Team plant, die Herausforderung mit strengeren Kontrollen fortzusetzen und klarere Einblicke in die KI-Fähigkeiten zu liefern. Das Ziel besteht nicht darin, Mathematiker zu ersetzen, sondern zu verstehen, ob KI ein mächtiges Werkzeug oder eine revolutionäre Kraft ist. Wenn KI durchweg originelle und elegante Beweise liefern kann, könnte sie das Fachgebiet neu gestalten. Die Frage bleibt vorerst offen. Die nächsten Testrunden werden zeigen, ob KI die Mathematik wirklich voranbringen oder lediglich bestehende Methoden beschleunigen kann.