Математика

GPT-5.2 решила задачу Эрдёша. Но есть нюансы

Теренс Тао подтвердил результат по задаче №728. Только это не та история про «ИИ обыграл математиков».

Игорь Исаев
Игорь ИсаевАвтор об ИИ
10 января 2026 г.5 мин чтения
Поделиться:
Математические обозначения на тёмной поверхности с подсвеченными фрагментами доказательства, проверенного ИИ

Восьмого января Теренс Тао написал на Mathstodon, что задачу Эрдёша решил «более или менее автономно искусственный интеллект». Задача №728 про делимость факториалов, открытая несколько десятилетий. GPT-5.2 сгенерировала доказательство, система Aristotle от Harmonic формализовала его в Lean, математическое сообщество проверило за несколько часов.

Вирусная версия этой новости, которая сейчас расходится по X: «Впервые большая языковая модель самостоятельно решила задачу Эрдёша». Формально не враньё. Но и не правда.

Что вообще такое задачи Эрдёша

Пол Эрдёш — венгерский математик, умер в 1996-м, опубликовал больше статей, чем кто-либо в истории. Любил формулировать задачи, сотни штук, часто с денежными призами. За задачу на $25 можно было засесть на выходные. За $1000 — на десять лет. Деньги символические, скорее способ ранжировать сложность.

На сайте erdosproblems.com Томаса Блума сейчас каталогизировано больше 1100 таких гипотез. Около 40% решены. Остальные — от «наверное, решаемо известными методами» до «может потребовать совершенно новой математики». Теория чисел, комбинаторика, теория графов.

Решить задачу Эрдёша раньше кое-что значило. Сейчас тоже значит, только смысл усложняется.

Три оговорки, которые никто не читает

Кембриджский студент-математик AcerFur, объявивший о результате 6 января, честно перечислил три оговорки. Большинство, кто репостил новость, их пропустило.

Первая: исходная формулировка была неоднозначной. У Эрдёша получались тривиальные решения, которые явно не имелись в виду. Сообществу erdosproblems.com пришлось реконструировать, что Эрдёш, вероятно, имел в виду, добавив ограничения вроде a, b ≤ (1-ε)n. То есть GPT-5.2 решила интерпретацию сообщества, не совсем оригинальную задачу.

Вторая: GPT-5.2 нуждалась в обратной связи. Первая попытка не сработала. После нескольких итераций модель уточнила подход. «Более или менее автономно» — это важные слова.

Третья: похожие результаты похожими методами уже были в литературе. Статья Померанса 2015 года покрывала смежную территорию. Вклад ИИ — применение известных техник к конкретной формулировке, а не изобретение новой математики.

Это уже было

Знакомо звучит? Должно. В октябре 2025-го исследователи OpenAI заявили, что GPT-5 решила десять задач Эрдёша. Кевин Вейл, вице-президент OpenAI, написал, что все они «были открыты десятилетиями». Математическое сообщество возразило моментально. Томас Блум, который ведёт erdosproblems.com, назвал это «драматическим искажением». Задачи не были нерешёнными. GPT-5 просто нашла существующую литературу, которую Блум не видел.

Демис Хассабис из DeepMind назвал эпизод «позорным». Янн ЛеКун был менее дипломатичен. Оригинальные твиты удалили.

Поэтому когда Тао пишет о задаче №728, он осторожен. Результат «не воспроизведён в существующей литературе (хотя похожие результаты, доказанные похожими методами, были обнаружены)». Он отмечает, что это согласуется с «другими недавними демонстрациями ИИ, использующего существующие методы для решения задач Эрдёша».

Различие существенно: ИИ теперь достаточно хорош, чтобы применять стандартные техники к задачам, до которых люди не добрались. Это реально полезно. И это отличается от создания новой математики.

Что конкретно произошло с №728

Задача спрашивает, существует ли бесконечно много целых чисел a, b, n, удовлетворяющих определённым условиям делимости факториалов при a + b в режиме n + O(log n). Оригинальная формулировка на erdosproblems.com была, как выразился Тао, «некорректно сформулирована».

Пользователь Kevin Barreto запромптил GPT-5.2 Pro и получил доказательство. Обсуждение на форуме erdosproblems.com показывает процесс: первые попытки, уточнения, вопросы о том, не существуют ли уже похожие результаты. Потом Boris Alexeev прогнал доказательство через Aristotle для формальной верификации.

Формализация в Lean прошла. Математика корректна.

Один комментатор на форуме уловил суть амбивалентности: «В текущем неопределённом случае... это оказывается первым случаем, когда LLM полностью решила открытую задачу Эрдёша самостоятельно, которую ни один человек ранее не решил, по-настоящему на этот раз». Но дальше: «Хочу выразить следующее беспокойство: это был в первую очередь научный эксперимент, чтобы увидеть, как далеко можно продвинуть модели».

Теория длинного хвоста

У Тао есть теория о том, что происходит. Нерешённые математические задачи следуют распределению с длинным хвостом. В самом конце этого хвоста — задачи, «поддающиеся простым доказательствам с использованием достаточно стандартных техник», но не решённые, потому что недостаточно экспертов-математиков их рассмотрело.

ИИ теперь достаточно хорош, чтобы собирать урожай с этого хвоста. Несколько задач на erdosproblems.com недавно были «решены» ИИ, только чтобы кто-то обнаружил, что решение уже существовало в статье 1977 или 1981 года. ИИ их не решил, а переоткрыл — то ли через утечку из обучающих данных, то ли независимо выведя тот же прямолинейный аргумент.

Задача №728 может быть другой. Решение, по всей видимости, не в литературе, по крайней мере для этой конкретной формулировки. Но оно использует техники из статьи 2015 года. Так это ИИ делает новую математику или ИИ делает обзор литературы плюс интерполяцию?

Что это значит на практике

Инструменты ИИ становятся реально полезными для математических исследований. Не для взлома гипотезы Римана. Для рутинной работы: поиск релевантных статей, проверка конструкций, формализация доказательств, которые люди уже понимают неформально.

В анонсе GPT-5.2 от OpenAI в начале месяца утверждается, что модель помогла «решить открытую исследовательскую проблему в статистической теории обучения». Они аккуратно отмечают, что «ответственность за корректность, интерпретацию и контекст остаётся за исследователями-людьми».

Примерно здесь мы и находимся. ИИ может вносить вклад в математику так же, как очень добросовестный аспирант. Может проверять, находить, пробовать. Иногда это оказывается новым. Часто оказывается, что уже существует.

Сообщество erdosproblems.com начало систематически отслеживать вклад ИИ. Таблица показывает смесь: некоторые полные решения, некоторый частичный прогресс, много случаев, когда «решение» ИИ оказалось совпадающим с существующей литературой.

Один участник форума сформулировал так: «Я поддерживаю помощь ИИ, а не полную замену людей на ИИ». Беспокойство не в том, что ИИ захватит математику. В том, что нарратив вокруг этих результатов опережает реальность, а хайп создаёт проблемы в будущем.

Что дальше

Проект Formal Conjectures в DeepMind формализовал утверждения для более чем 240 задач Эрдёша. Около 40% из примерно 1100 задач на erdosproblems.com решены, многие недавно. Инфраструктура для математики с помощью ИИ улучшается.

Ждите больше таких объявлений. Некоторые выдержат проверку, некоторые нет. История с октябрём подсказывает: проверяйте детали прежде чем репостить.

Посты Тао на Mathstodon остаются лучшим источником для понимания происходящего. Он последовательно разграничивает «ИИ находит литературу», «ИИ генерирует доказательства» и «ИИ создаёт новую математику». Различия важны, даже когда твиты их не включают.

Игорь Исаев

Игорь Исаев

Автор об ИИ

Игорь рассказывает о самых важных новостях из мира ИИ прямо сейчас. Без хайпа, только чёткий ежедневный обзор инструментов, трендов и разработок, которые в реальном времени меняют целые отрасли. Он делает сложное понятным и привычным.

Похожие статьи

Будьте впереди в мире ИИ

Получайте последние новости, обзоры и скидки ИИ прямо на почту. Присоединяйтесь к 100 000+ энтузиастов ИИ.

Подписываясь, вы соглашаетесь с нашей Политикой конфиденциальности. Отписаться можно в любое время.