Может ли ИИ Решать Реальные Математические Доказательства? Исследователи Проверяют Генеративные Модели

по

-

25.03.2026

8

<br>

В 2026 году вопрос заключается не в том, смогут ли машины перехитрить нас, а где именно. Пока Deep Blue обыграл чемпиона по шахматам Гарри Каспарова в 1997 году, истинный вопрос никогда не касался грубой вычислительной мощности. Сегодня генеративный ИИ вынуждает нас к подобному переосмыслению в области, гораздо более абстрактной: математике. Исследователи выясняют, могут ли эти модели действительно продвигать математику вперед, а не просто решать задачи из учебников.

Разница Между Вычислением и Открытием

Большинство людей ассоциируют математику с числами и формулами. Но на исследовательском уровне математика заключается в доказательстве истинности или ложности утверждений – часто о концепциях, которые слишком сложны для визуализации. В отличие от домашнего задания, где ответ – одно значение, математики имеют дело с абстрактными формами в многомерном пространстве, доказывая их свойства с помощью уравнений. Это не вопрос вычислений, а вопрос концептуального понимания.

ИИ уже продемонстрировал впечатляющие результаты на стандартизированных тестах, таких как Международная математическая олимпиада, и даже «решил» некоторые проблемы Эрдёша. Однако эти тесты вводят в заблуждение. Они больше похожи на домашнее задание, чем на передовые исследования. Как калькулятор отличается от математика, так и успешная сдача теста не равнозначна настоящей математической интуиции. Основной вопрос заключается в том, может ли ИИ принципиально изменить то, как делается математика, а не просто ускорить существующие процессы.

Первый Вызов Доказательства: Строгий Тест

Чтобы определить истинные возможности ИИ, группа из 11 математиков запустила «Первый вызов доказательства». Они представили реальные нерешенные исследовательские проблемы, разбив их на более мелкие «леммы» (частные доказательства) из своих будущих статей. Это гарантировало, что вопросы не содержатся в данных для обучения ИИ, исключая возможность повторения. Цель была простой: может ли ИИ внести вклад в оригинальное математическое открытие?

Первоначальные результаты неоднозначны. Первоначальные тесты с общедоступными чат-ботами дали только два правильных ответа из десяти. Однако более крупные компании, использующие проприетарные модели и человеческий контроль, добились значительно лучших результатов. OpenAI заявила о шести правильных решениях, а Google Gemini сообщила об аналогичном успехе. Сообщество энтузиастов математики также внесло свой вклад, расширяя границы возможного с помощью LLM.

Расцвет Сотрудничества с ИИ: Поддержка и Итерация

Наиболее заметным выводом стало различие в производительности между общедоступным и частным ИИ. Внутренние модели значительно превосходили открыто доступные. Но появилась и другая тенденция: «поддержка». Исследователи не полагаются на одну LLM, а скорее организуют несколько взаимодействий ИИ, используя их для проверки и уточнения работы друг друга. Этот итеративный процесс повышает точность, но размывает грань между вкладом ИИ и человека.

Математика XIX Века: Проблема Стиля?

Даже когда ИИ приходит к правильным доказательствам, математики замечают разницу в стиле. Решения ИИ часто напоминают методы XIX века – трудоемкие, окольные и лишенные элегантности. Настоящее математическое открытие предполагает создание новых концепций, которые упрощают понимание, процесса, которому ИИ еще предстоит овладеть. Однако некоторые доказательства, сгенерированные ИИ, удивили исследователей своей креативностью, что указывает на потенциал для настоящих прорывов.

Будущее ИИ в Математике

Команда «Первого вызова доказательства» планирует продолжить испытание с более строгим контролем, предоставляя более четкое представление о возможностях ИИ. Цель не в том, чтобы заменить математиков, а в том, чтобы понять, является ли ИИ мощным инструментом или революционной силой. Если ИИ сможет последовательно генерировать оригинальные, элегантные доказательства, он может изменить эту область. Пока вопрос остается открытым. Следующие раунды тестирования покажут, действительно ли ИИ может продвинуть математику вперед или просто ускорить существующие методы.