Штучний інтелект стрімко змінює підхід математиків до роботи з недавніми проривами у вирішенні давніх проблем. Дослідники використовують інструменти, такі як ChatGPT, щоб знаходити забуті докази і навіть генерувати нові рішення, що знаменує потенційне зрушення у математичних відкриттях. Ця тенденція почалася в жовтні минулого року, коли математик Мехтааб Соуні використав ChatGPT для вирішення проблеми Ердеша № 339, припущення, яке залишалося невирішеним майже два десятиліття після смерті Пола Ердеша.
ІІ як Помічник у Дослідженнях
Використання ІІ в математиці не спрямовано заміну людських дослідників, але в розширення їх можливостей. Великі мовні моделі (LLM) чудово справляються з пошуком у величезному математичному архіві, виявленням неочевидних посилань і навіть комбінуванням існуючих теорем отримання нових доказів. У деяких випадках ІІ самостійно збудував допустимі докази з мінімальною участю людини. З жовтня інструменти ІІ допомогли вирішити близько 100 проблем Ердеша, перевівши їх зі статусу відкритих до вирішених.
Подолання Пошук у Літературі: Значні Пропозиції
Хоча LLM спочатку використовувалися як потужні пошукові системи, вони пропонують набагато більше, ніж просто витяг інформації. Математики повідомляють, що ІІ може надавати цінні пропозиції, спрямовуючи дослідників до рішень, з якими вони не могли впоратися самостійно. Ендрю Сазерленд із Массачусетського технологічного інституту зазначає, що «математики, чий єдиний досвід роботи з LLM заснований на більш ранніх моделях, ще не повною мірою це цінують».
Перевірка Межі: Перший Виклик Доказам
Щоб суворо перевірити математичні навички ІІ, команда First Proof запустила виклик, представивши LLM одинадцять невирішених сегментів доказів. Мета: визначити, чи може ІІ згенерувати допустимі докази протягом тижня — терміну, який є коротшим, ніж потрібно багатьом математикам. Експеримент вже залучив сотні учасників, що відправляють рішення, згенеровані ІІ, хоча перевірка залишається серйозною перешкодою. Лорен Вільямс із Гарварда підкреслює, що «перевірка є проблемою, тому що в 90 відсотках випадків він придумає рішення… він напише щось і буде впевнений у цьому».
Поворотний Рік для ІІ в Математиці
Незважаючи на ажіотаж, поточний вплив залишається обмеженим. Жоден великий математичний журнал не опублікував доказ, що рецензується, з явною вказівкою на допомогу ІІ, хоча очікується, що це зміниться в 2026 році. Раві Вакіл, президент Американського математичного товариства, нещодавно спільно написав препринт, у якому задокументував, як LLM від Google допоміг вирішити математичне завдання, актуальне для його досліджень, що сигналізує про зміну академічної практики.
Проблеми Ердеша є ефективним еталоном, але математики визнають необхідність більш суттєвих тестів. Карло Пагано, який співпрацює з DeepMind від Google, наголошує, що основну увагу слід перенести на проблеми, що мають ширші наслідки.
Зрештою, інтеграція ІІ в математичні дослідження неминуча. Математики вже пристосовуються, і деякі навіть беруть відпустку з академічних кіл, щоб приєднатися до компаній, які займаються ІІ. Це відображає зростаючий консенсус щодо того, що ІІ фундаментально змінить те, як робиться математика.





























