GPT-5 скандал: как соцсети создают ложные прорывы ИИ | Хайп vs наука | AiManual
AiManual Logo Ai / Manual.
11 Янв 2026 Новости

Хайп против науки: как соцсети раздувают ложные прорывы ИИ (на примере скандала GPT-5 и математических задач)

Разбор скандала с GPT-5 и задачами Эрдёша: как соцмедиа инфляция ожиданий вредит реальным исследованиям ИИ. Критика ложных прорывов от экспертов.

Когда твит стоит больше, чем научная статья

Все началось с одного поста. Кажется, так начинаются все современные скандалы. На прошлой неделе в X (бывший Twitter) всплыл скриншот внутренней переписки. Будто бы сотрудник OpenAI писал коллеге, что их новая модель - не GPT-4.5, а уже GPT-5 - решает задачи из списка Эрдёша. Те самые, над которыми математики бьются десятилетиями.

Интернет взорвался. За сутки пост набрал 15 тысяч репостов. «ИИ преодолел ключевой барьер!», «Математика пала!», «AGI уже здесь!» - заголовки росли как грибы после дождя. Проблема в одном: все это оказалось фейком. Грубым, примитивным, но невероятно эффективным.

CEO Google DeepMind Демис Хассабис публично назвал историю "безответственной дезинформацией". Ученый из OpenAI, чье имя фигурировало в утечке, заявил, что никогда не вел такой переписки. Но хайп-поезд уже уехал.

Математика не терпит суеты

Задачи Пала Эрдёша - не тест для ИИ. Это глубокие, фундаментальные проблемы теории чисел, комбинаторики, теории графов. Некоторые не решены со времен Второй мировой. Предполагать, что языковая модель внезапно «поняла» их - все равно что ждать, что попугай решит уравнение Шрёдингера.

Но соцсетям все равно. Им нужна драма, сенсация, повод для кликов. Научная строгость? Экспериментальная проверка? Рецензирование? Это слишком медленно. Твит за 280 символов распространяется быстрее, чем любой peer-reviewed paper.

💡
Ложные заявления о математических способностях ИИ - не просто безобидный хайп. Они создают искаженные ожидания у инвесторов, политиков, обычных пользователей. Когда обещания не сбываются, наступает «зима ИИ» - сокращение финансирования, уход талантов, замедление реальных исследований. Мы уже проходили это в 1970-х и 1990-х.

Почему это работает? Алгоритм дезинформации

Соцсети создали идеальную среду для научных спекуляций. Вот как работает механизм:

  1. Кто-то создает правдоподобный фейк (скриншот, "утечку", цитату без контекста).
  2. Включаются инфлюенсеры с миллионами подписчиков. Они не проверяют факты - им нужен контент.
  3. Алгоритмы усиливают эмоциональный контент. Сенсация получает в 100 раз больше охвата, чем опровержение.
  4. Настоящие ученые вынуждены тратить время на опровержения вместо исследований.
  5. Через неделю все забывают, но осадок остается. Общественность думает, что ИИ уже все умеет.

Самое опасное - этот хайп проникает в реальные исследования. Молодые ученые начинают гнаться за «громкими» результатами вместо тщательной работы. Фонды требуют «прорывов» каждый квартал. О фундаментальных математических ошибках в архитектуре ИИ говорить становится не модно.

Что на самом деле умеют современные ИИ с математикой?

Давайте без иллюзий. Текущие большие языковые модели (LLM) - это продвинутые системы поиска закономерностей в тексте. Они не «понимают» математику в человеческом смысле. Они угадывают следующий токен.

Да, они решают некоторые задачи - но только те, которые уже миллион раз встречались в обучающих данных. Новую, действительно сложную проблему? Забудьте. Как показали исследования, ИИ часто выдает разные ответы на один и тот же вопрос в разные дни. Какая уж тут стабильность.

Что ИИ делает хорошо Что ИИ не умеет (и не научится скоро)
Генерировать код по шаблону Создавать новые математические доказательства
Объяснять известные концепции Понимать абстрактные концепции на глубоком уровне
Решать типовые учебные задачи Работать с принципиально новой информацией

Кому выгоден хайп? (Подсказка: не ученым)

Пока исследователи бьются над реальными проблемами - например, над тем, как защитить ИИ от промпт-инъекций, которые признали неистребимыми - индустрия живет в параллельной реальности.

Стартапы привлекают инвестиции под громкие заявления. Крупные компании поддерживают миф о «неизбежном AGI» - это держит акции на плаву. Блогеры зарабатывают на кликах. В этой системе настоящая наука становится невидимой.

История с IQuest-Coder-V1 - идеальный пример. Несколько месяцев назад сообщество взорвалось от «прорывной» модели кодирования. Оказалось - тщательно сфабрикованная фальшивка. Но сколько людей до сих пор верят в ее существование?

Что делать? Инструкция по выживанию в эпоху инфляции ожиданий

Первое - дышите. AGI не завтра. Возможно, не в этом десятилетии. И это нормально.

Второе - проверяйте источники. Увидели громкий заголовок? Ищите оригинальную статью. Нет статьи - значит, это просто чье-то мнение. Ученые публикуют в arXiv, конференциях, журналах. Не в твиттере.

Третье - требуйте доказательств. «Модель решает задачи Эрдёша»? Покажите бенчмарки, код, условия экспериментов. Нет доступа к модели? Значит, проверить нельзя. Значит, верить нельзя.

Четвертое - цените скромный прогресс. Настоящие прорывы в ИИ сейчас происходят в скучных, технических областях: оптимизация обучения, эффективность вычислений, энергопотребление моделей. Это не секси, но это фундамент.

Будущее: хайп умрет, наука останется

Соцсети устареют. Алгоритмы поменяются. Нынешние инфлюенсеры забудутся. Но задачи Эрдёша останутся. Математика останется. Научный метод - проверка гипотез, воспроизводимость экспериментов, коллегиальное рецензирование - переживет все тренды.

Настоящая опасность не в том, что ИИ не оправдает хайп. А в том, что хайп отвлечет ресурсы от реальных проблем. Вместо вложений в фундаментальные исследования деньги уйдут на пиар-кампании. Вместо решения этических проблем ИИ будем слушать сказки о суперразуме.

Мой прогноз? Через год мы увидим новую «утечку» о GPT-6. И снова начнется. Но те, кто работает в тишине лабораторий, продолжат делать свое дело. Потому что в конечном счете математика победит большие языковые модели. Всегда побеждала.

⚠️
Совет для разработчиков: не гонитесь за хайпом. Следующая большая веха в ИИ придет не от гигантских моделей, а от архитектурных инноваций. Посмотрите на исследования System 2 и координационных слоев. Это менее эффектно, но более перспективно.