Czy sztuczna inteligencja może rozwiązywać prawdziwe dowody matematyczne? Naukowcy testują modele generatywne

по

-

25.03.2026

9

<br>

W 2026 r. pytanie nie brzmi: czy maszyny mogą nas przechytrzyć, ale gdzie dokładnie. Choć Deep Blue pokonał mistrza szachowego Garry’ego Kasparowa w 1997 roku, tak naprawdę pytanie nigdy nie dotyczyło czystej mocy obliczeniowej. Dzisiaj generatywna sztuczna inteligencja zmusza nas do podobnego przemyślenia w znacznie bardziej abstrakcyjnej dziedzinie: matematyce. Naukowcy badają, czy modele te rzeczywiście mogą pchnąć matematykę do przodu, a nie tylko rozwiązywać problemy podręcznikowe.

Różnica między obliczeniami a odkryciem

Większość ludzi kojarzy matematykę z liczbami i formułami. Jednak na poziomie badawczym matematyka polega na udowadnianiu prawdziwości lub fałszywości twierdzeń – często dotyczących koncepcji, które są zbyt skomplikowane, aby je sobie wyobrazić. W przeciwieństwie do zadania domowego, gdzie odpowiedzią jest pojedyncza wartość, matematycy zajmują się abstrakcyjnymi kształtami w przestrzeni wielowymiarowej, dowodząc ich właściwości za pomocą równań. To nie jest kwestia obliczeń, ale kwestia pojęciowego zrozumienia.

Sztuczna inteligencja wykazała już imponujące wyniki w standardowych testach, takich jak Międzynarodowa Olimpiada Matematyczna, a nawet „rozwiązała” niektóre problemy Erdősa. Jednak te testy wprowadzają w błąd. Wyglądają bardziej jak praca domowa niż nowatorskie badania. Tak jak kalkulator różni się od matematyka, tak zdanie testu nie jest tym samym, co prawdziwa intuicja matematyczna. Kluczowym pytaniem jest, czy sztuczna inteligencja może zasadniczo zmienić sposób wykonywania matematyki, a nie tylko przyspieszyć istniejące procesy.

Pierwsze wyzwanie dowodu: ścisły test

Aby określić prawdziwe możliwości sztucznej inteligencji, grupa 11 matematyków uruchomiła konkurs First Proof Challenge. Zaprezentowali rzeczywiste, nierozwiązane problemy badawcze, dzieląc je na mniejsze „lematy” (konkretne dowody) ze swoich przyszłych prac. Zapewniło to, że w danych szkoleniowych AI nie znalazły się pytania, eliminując możliwość powtórzeń. Cel był prosty: czy sztuczna inteligencja może przyczynić się do oryginalnego odkrycia matematycznego?

Początkowe wyniki są mieszane. Wstępne testy z publicznymi chatbotami dały tylko dwie z dziesięciu poprawnych odpowiedzi. Znacznie lepsze wyniki osiągnęły jednak większe firmy korzystające z własnych modeli i kontroli człowieka. OpenAI zgłosiło sześć poprawnych rozwiązań, a Google Gemini odnotował podobny sukces. Społeczność entuzjastów matematyki również wniosła swój wkład, przesuwając granice możliwości dzięki LLM.

Rozwój współpracy w zakresie sztucznej inteligencji: konserwacja i iteracja

Najbardziej godnym uwagi odkryciem była różnica w wydajności między publiczną i prywatną sztuczną inteligencją. Modele wewnętrzne znacznie przewyższały modele dostępne publicznie. Ale pojawił się inny trend: „wsparcie”. Naukowcy nie polegają na pojedynczym LLM, ale raczej organizują wiele interakcji AI, wykorzystując je do wzajemnego testowania i udoskonalania swojej pracy. Ten iteracyjny proces poprawia dokładność, ale zaciera granicę między sztuczną inteligencją a wkładem człowieka.

Matematyka XIX wieku: problem stylu?

Nawet gdy sztuczna inteligencja przedstawi właściwe dowody, matematycy zauważają różnicę w stylu. Rozwiązania AI często przypominają metody z XIX wieku – są pracochłonne, okrężne i pozbawione elegancji. Prawdziwe odkrycia matematyczne polegają na tworzeniu nowych koncepcji, które ułatwiają zrozumienie, a jest to proces, którego sztuczna inteligencja jeszcze nie opanowała. Jednak niektóre dowody generowane przez sztuczną inteligencję zaskoczyły badaczy swoją kreatywnością, wskazując na potencjał prawdziwych przełomów.

Przyszłość sztucznej inteligencji w matematyce

Zespół First Call of Proof planuje kontynuować próbę z bardziej rygorystycznymi kontrolami, zapewniając jaśniejszy obraz możliwości sztucznej inteligencji. Celem nie jest zastąpienie matematyków, ale zrozumienie, czy sztuczna inteligencja jest potężnym narzędziem, czy siłą rewolucyjną. Jeśli sztuczna inteligencja będzie w stanie konsekwentnie generować oryginalne, eleganckie dowody, może zmienić tę dziedzinę. Na razie pytanie pozostaje otwarte. Kolejne rundy testów pokażą, czy sztuczna inteligencja rzeczywiście może popchnąć matematykę do przodu, czy po prostu przyspieszyć istniejące metody.