Сколько баллов набрала Gemini Deep Think на IMO?

35 баллов из 42 возможных, что соответствует золотой медали по стандартам олимпиады.

Сколько задач решил ИИ?

5 из 6 задач Международной математической олимпиады.

Чем результат Gemini отличается от прошлогоднего AlphaProof?

AlphaProof в 2023 году получила серебряную медаль с 28 баллами. Gemini Deep Think улучшила результат на 25% и получила золото.

Означает ли это, что ИИ превзошёл человеческий интеллект в математике?

Нет. ИИ показал выдающиеся результаты в решении конкретных олимпиадных задач, но фронт современной математической науки значительно шире и сложнее. Это инструмент, а не замена математикам.

Gemini Deep Think победила на IMO: золотая медаль ИИ в математике

Официально: ИИ получил золотую медаль. И это не шутка

Прошлой осенью DeepMind хвасталась результатами Gemini на тестах. Звучало впечатляюще, но математики только усмехались. «Тесты — это одно, а настоящая математика — другое», — говорили они. Теперь улыбки сошли с лиц.

На этой неделе Международная математическая олимпиада (IMO) официально сертифицировала результат Gemini Deep Think: 35 баллов из 42. Это золотая медаль по человеческим меркам. Модель решила 5 из 6 задач за 4.5 часа — ровно столько же, сколько дают школьникам.

Для сравнения: в 2023 году система AlphaProof от DeepMind набрала 28 баллов и получила серебряную медаль. За год прогресс на 25% — это не линейный рост, это качественный скачок.

Как это работает? Не так, как вы думаете

Если вы представляете себе нейросеть, которая «думает» как человек, — забудьте. Gemini Deep Think использует гибридный подход, который больше похож на работу математического детектива, чем на интуицию гения.

1 Формализация задачи

Сначала модель переводит условие на формальный язык. Не на Python или Java, а на специальный язык математических рассуждений. Это ключевой момент: большинство ошибок ИИ в математике происходят из-за неверной интерпретации условия.

# Пример формализации задачи IMO (упрощенно)
# Оригинал: "Докажите, что для любых положительных a,b,c..."

problem_formalized = {
    "variables": ["a", "b", "c"],
    "constraints": [
        "a > 0",
        "b > 0", 
        "c > 0",
        "a + b + c = 1"
    ],
    "goal": "prove inequality: a/(1+b) + b/(1+c) + c/(1+a) >= 3/2"
}

2 Генерация гипотез

Система генерирует десятки возможных подходов к решению. Не один «правильный» путь, а множество вариантов, включая экзотические и контр-интуитивные. Здесь работает техника цепочек рассуждений, но на стероидах.

3 Поиск контрпримеров

Прежде чем пытаться доказать гипотезу, система ищет, как её опровергнуть. Если находит контрпример — гипотеза отбрасывается. Это радикально отличается от человеческого мышления: мы часто влюбляемся в свою первую идею и пытаемся её доказать, игнорируя противоречия.

4 Синтез доказательства

Когда найдена жизнеспособная стратегия, система строит формальное доказательство. Не «объяснение для человека», а строгую последовательность логических шагов, которую можно проверить автоматически.

💡

Любопытный факт: в одной из задач Gemini предложила доказательство, которое оказалось короче и элегантнее «канонического» решения из официальной брошюры IMO. Эксперты олимпиады признали его корректным.

Что это ломает в математическом AI

До сих пор существовало убеждение: ИИ может решать шаблонные задачи, но творческая математика — прерогатива человека. Многие эксперты писали об этом. Gemini Deep Think этот миф разрушает.

Что умели раньше	Что умеет теперь
Решать типовые задачи из учебников	Находить нетривиальные доказательства
Действовать по известным алгоритмам	Генерировать новые стратегии решения
Работать с формальной логикой	Соединять интуицию и строгость
Имитировать рассуждения	Создавать оригинальные математические идеи

Самое интересное — не то, что ИИ решил задачи. А то, как он это сделал. В некоторых случаях подходы отличались от человеческих. Не были «лучше» или «хуже» — просто другими. Как если бы математику с Марса показали земные задачи.

А что с людьми? Конкуренция или сотрудничество?

Когда Deep Blue обыграл Каспарова, шахматы не умерли. Стали другими. С математикой произойдет то же самое.

Олимпиады изменятся. Уже в следующем году организаторы IMO обсудят, как адаптировать правила. Возможно, появятся отдельные категории для ИИ или задачи, специально designed to be «AI-resistant».
Обучение математике изменится. Студенты смогут проверять не только ответ, но и ход решения. Получать альтернативные доказательства. Видеть, как одна задача связана с другой.
Научные исследования ускорятся. Математики получат инструмент для проверки гипотез. Не замену себе, а мощный микроскоп для изучения математических структур.

Важный нюанс: Gemini Deep Think не «понимает» математику в человеческом смысле. Она манипулирует символами по правилам. Разница тонкая, но критическая. Модель может доказать теорему, но не объяснить, почему она красивая или глубокая.

Что будет дальше? Три прогноза

1. Гонка усилится. OpenAI уже готовит ответ. Их план на триллион долларов явно включает математическое направление. Антропик не останется в стороне — Claude уже показывает чудеса в коде.

2. Появятся специализированные математические ИИ. Не универсальные модели вроде Gemini, а узкоспециализированные системы для конкретных областей: теория чисел, топология, алгебраическая геометрия.

3. Математика станет более экспериментальной. Ученые будут ставить «вычислительные эксперименты»: генерировать гипотезы с помощью ИИ, проверять их на тысячах примеров, и только затем искать человеческое доказательство.

И последнее: не ждите, что ИИ скоро докажет гипотезу Римана или решит проблему P против NP. Олимпиадные задачи — это всё ещё «игрушечные» проблемы по сравнению с фронтом современной математики. Но мост через пропасть между вычислениями и пониманием начали строить. И первый пролет уже стоит.

Что делать математику-студенту сегодня? Учить не только решать задачи, но и ставить их. Формулировать вопросы — это то, что ИИ пока делает плохо. И вряд ли научится скоро.

Золотая медаль IMO: как Gemini Deep Think решила олимпиадные задачи и что это значит для математического AI