Nowy egzamin z matematyki dla AI: testowanie nierozwiązanych problemów

7

Czołowi matematycy uruchomili Project First Proof, wyjątkowe wyzwanie mające na celu rygorystyczną ocenę matematycznych możliwości sztucznej inteligencji. Egzamin przedstawia systemy AI z rzeczywistymi, nierozwiązanymi problemami zaczerpniętymi bezpośrednio z bieżących badań, dając im tydzień na znalezienie rozwiązań. Stanowi to znaczną poprawę w porównaniu z istniejącymi benchmarkami, które często opierają się na wstępnie wytrenowanych zbiorach danych lub konkurencyjnych zadaniach.

Problem z istniejącymi testami AI w matematyce

Poprzednie próby oceny matematycznej mocy sztucznej inteligencji zakończyły się niepowodzeniem. Choć modele takie jak Google Gemini Deep Think osiągnęły wysokie wyniki na Międzynarodowej Olimpiadzie Matematycznej, w testach tych wykorzystywane są standaryzowane problemy, które nie odpowiadają badaniom w świecie rzeczywistym. Co więcej, niektóre z „rozwiązań” generowanych przez sztuczną inteligencję okazały się ponownym odkryciem mało znanych, wcześniej opublikowanych dowodów – zasadniczo zaawansowanymi poszukiwaniami literatury pod przykrywką oryginalnych prac. Jak wskazuje profesor Uniwersytetu Yale, Daniel Spielman, wiele z rzekomych przełomów pochodzi od firm rozwijających sztuczną inteligencję, co rodzi pytania o obiektywność.

„Pierwszy dowód”: kontrolowany eksperyment

Inicjatywa Proof First ma na celu skorygowanie tych niedociągnięć. Jedenastu czołowych matematyków, w tym zdobywca Medalu Fieldsa, opracowało oryginalne problemy, które nigdy nie pojawiły się w żadnych danych szkoleniowych AI. Decyzje są zaszyfrowane i zostaną upublicznione 13 lutego, aby zapewnić uczciwe testy.

Problemy nie mają być przełomowymi twierdzeniami, ale raczej „lematami” – małymi, ale ważnymi krokami w większych dowodach. To właśnie te żmudne, ale krytyczne obliczenia zajmują czas matematyków. Sprostanie tym wyzwaniom pokaże potencjał sztucznej inteligencji w przyspieszaniu badań poprzez automatyzację tych podstawowych zadań.

Dlaczego to ma znaczenie: przyszłość sztucznej inteligencji w matematyce

Kluczem jest skupienie się na praktycznych korzyściach, a nie na efektownych wynikach. Matematyk Andrew Sutherland sugeruje, że wpływ sztucznej inteligencji w najbliższej przyszłości będzie odczuwalny nie w rozwiązywaniu nierozwiązanych globalnych problemów, ale w stanie się niezbędnym narzędziem dla pracujących matematyków. Jeśli sztuczna inteligencja będzie w stanie niezawodnie poradzić sobie z najcięższą pracą polegającą na dowodzeniu twierdzeń, umożliwi badaczom skupienie się na bardziej kreatywnych i koncepcyjnych zadaniach.

„Ten rok może być punktem zwrotnym, kiedy wiele osób zacznie zwracać większą uwagę”.
– Andrew Sutherland, MIT

„Pierwszy dowód” to nie tylko test; stanowi punkt odniesienia dla przyszłości matematyki w oparciu o sztuczną inteligencję i może zmienić sposób prowadzenia badań.

попередня статтяSuperwulkan Yellowstone pokazuje niezwykłe wypiętrzenie powierzchni ziemi