ChatGPT‑5.2 продемонстрировал, что крупные языковые модели способны решать задачи, ранее считавшиеся исключительно человеческой областью. За несколько недель 15 задач из более чем 1 000 открытых задач Эрдёша попали в раздел «solved», а 11 из них признали результатом ИИ.
Что произошло
Тестирование провёл Neel Somani, бывший квантовый исследователь. Он ввёл задачу в чат‑бот, дал модели 15 минут на размышление, а полученное доказательство проверил инструмент Harmonic. Инструмент подтвердил корректность решения. Позже модель нашла решение, опубликованное Noam Elkies в 2013 году, и создала более полное доказательство задачи, сформулированной Paul Erdős. На GitHub Терренс Тао отметил восемь проблем, где ИИ внёс автономный прогресс, и шесть, где он помог собрать предшествующие результаты.
Почему это важно
Результаты показывают, что LLM умеют не только искать литературу, но и создавать новые математические доказательства, усиливая их роль в фундаментальных исследованиях. Рост применения формальных помощников, таких как Aristotle и открытый доказательный ассистент Lean, снижает барьер верификации и ускоряет публикацию. По словам Tudor Achim, сооснователя Harmonic, главное — ведущие математики открыто используют ИИ‑инструменты, повышая доверие к их результатам.
Что дальше
С учётом ускоренного темпа решения задач Эрдёша исследовательские группы планируют включать LLM в этапы генерации гипотез и предварительной проверки доказательств. Ожидается, что в течение следующего года количество автоматизированных решений удвоится, что может изменить практику публикаций в математических журналах и усилить конкуренцию между традиционными и AI‑поддержанными подходами.