V roce 2026 otázka nezní jestli nás mohou stroje přechytračit, ale kde přesně. Zatímco Deep Blue v roce 1997 porazila šachového šampiona Garryho Kasparova, skutečná otázka nikdy nebyla o surovém výpočetním výkonu. Dnes nás generativní AI nutí k podobnému přehodnocení v mnohem abstraktnějším oboru: v matematice. Vědci zkoumají, zda tyto modely skutečně mohou posunout matematiku dopředu, spíše než jen řešit učebnicové problémy.
Rozdíl mezi výpočtem a zjišťováním
Většina lidí spojuje matematiku s čísly a vzorci. Ale na úrovni výzkumu je matematika o dokazování pravdivosti nebo nepravdivosti tvrzení – často o konceptech, které jsou příliš složité na vizualizaci. Na rozdíl od domácích úkolů, kde je odpovědí jediná hodnota, se matematici zabývají abstraktními tvary ve vícerozměrném prostoru, přičemž jejich vlastnosti dokazují pomocí rovnic. To není otázka výpočtů, ale věc koncepčního porozumění.
AI již prokázala působivé výsledky ve standardizovaných testech, jako je Mezinárodní matematická olympiáda, a dokonce „vyřešila“ některé Erdőovy problémy. Tyto testy jsou však zavádějící. Vypadají spíše jako domácí úkol než jako špičkový výzkum. Stejně jako se liší kalkulačka od matematika, absolvování testu není totéž jako pravá matematická intuice. Klíčovou otázkou je, zda umělá inteligence může zásadně změnit jak se dělá matematika, spíše než jen urychlit stávající procesy.
První důkazní výzva: Přísný test
K určení skutečných schopností umělé inteligence zahájila skupina 11 matematiků soutěž First Proof Challenge. Prezentovali skutečné nevyřešené výzkumné problémy a rozdělili je na menší „lemmata“ (konkrétní důkazy) ze svých budoucích prací. To zajistilo, že otázky nebyly obsaženy v datech školení AI, což eliminovalo možnost opakování. Cíl byl jednoduchý: Může umělá inteligence přispět k originálnímu matematickému objevu?
Prvotní výsledky jsou smíšené. Prvotní testy s veřejnými chatboty přinesly pouze dvě z deseti správných odpovědí. Větší společnosti využívající proprietární modely a lidskou kontrolu však dosáhly výrazně lepších výsledků. OpenAI tvrdilo šest správných řešení a Google Gemini hlásil podobný úspěch. Komunita nadšenců pro matematiku přispěla také tím, že posouvá hranice toho, co je možné s LLM.
Vzestup AI Collaboration: Údržba a opakování
Nejpozoruhodnějším zjištěním byl rozdíl ve výkonu mezi veřejnou a soukromou AI. Interní modely byly výrazně lepší než ty veřejně dostupné. Ale objevil se další trend: „podpora“. Výzkumníci se nespoléhají na jeden LLM, ale spíše organizují více interakcí AI a používají je k testování a zdokonalování práce toho druhého. Tento iterativní proces zlepšuje přesnost, ale stírá hranici mezi umělou inteligencí a lidskými příspěvky.
Matematika 19. století: Problém stylu?
I když AI přijde se správnými důkazy, matematici si všimnou rozdílu ve stylu. Řešení umělé inteligence často připomínají metody 19. století – pracné, zdlouhavé a postrádající eleganci. Skutečný matematický objev zahrnuje vytváření nových konceptů, které usnadňují pochopení, což je proces, který si umělá inteligence teprve musí osvojit. Některé důkazy vytvořené umělou inteligencí však překvapily výzkumníky svou kreativitou, což naznačuje potenciál pro skutečné průlomy.
Budoucnost umělé inteligence v matematice
Tým First Call of Proof plánuje pokračovat ve zkušební verzi s přísnějšími kontrolami, které poskytují jasnější obrázek o schopnostech AI. Cílem není nahradit matematiky, ale pochopit, zda je AI mocný nástroj nebo revoluční síla. Pokud umělá inteligence dokáže důsledně generovat originální, elegantní důkazy, mohlo by to změnit pole. Otázka zatím zůstává otevřená. Další kola testování ukážou, zda umělá inteligence skutečně dokáže posunout matematiku kupředu, nebo jen zrychlit stávající metody.
