Grok 4.20 от xAI: обзор мультиагентной архитектуры, сравнение с GPT-5 | AiManual
AiManual Logo Ai / Manual.
28 Фев 2026 Новости

Grok 4.20: Илон Маск выпустил стаю. Что умеет новая мультиагентная модель и почему это не очередной хайп

Разбираем Grok 4.20 — новую мультиагентную модель от xAI. Как работает архитектура из нескольких агентов, возможности и первые тесты на фоне утечек про безопасн

Две недели назад Илон Маск в своем стиле — без пресс-релизов, на своей платформе X — бросил фразу: "Grok теперь думает компанией". Сообщество AI проигнорировало это как очередную шутку про травку. Ошибка. Вчера, 27 февраля 2026 года, xAI тихо открыла доступ к бета-версии Grok 4.20. И это не апдейт, а землетрясение. Модель не просто "улучшена". Она теперь работает как команда из пяти разных ИИ-агентов под капотом.

Почему это важно? Потому что все последние два года гонка LLM была войной монолитов. Больше параметров, больше контекста, больше всего. Grok 4.20 ломает эту логику. Вместо одного гиганта — несколько узких специалистов, которые спорят, координируются и приходят к общему решению. Звучит как маркетинг, но первые тесты показывают прирост в 40% на задачах, где нужно планирование и проверка фактов. Хотя есть нюанс: иногда эти агенты начинают бесконечно спорить о формате ответа. Классический Маск — гениально и с багами.

От Baldur's Gate к военному совету: эволюция Grok

Чтобы понять 4.20, нужно вспомнить, с чего xAI начинала. Всего пару месяцев назад мы писали про историю с BaldurBench. Тогда Маск задержал релиз Grok 4.1, пока модель не научилась идеально разбираться в механике Baldur's Gate 3. Казалось бы, причуда. Теперь логика проясняется. Сложная RPG с сотнями переменных — идеальный полигон для отработки агентного взаимодействия. Персонажи в партии (танк, маг, лекарь) — это и есть прообраз мультиагентной системы.

Инсайдер из xAI, пожелавший остаться анонимным, подтвердил: часть команды, которая работала над BaldurBench, затем перешла на архитектуру Grok 4.20. "Мы поняли, что один супер-интеллект всегда будет уступать хорошо скоординированной группе специалистов. Как в D&D".

Но игровые квесты — это цветочки. Реальные применения, которые тестирует xAI, куда серьезнее. В том же январе 2026 просачивались данные об уходах инженеров по безопасности. Часть из них была связана как раз с этическими дилеммами при обучении мультиагентных систем для принятия решений в условиях неопределенности. Грубо говоря, как вести себя, если агенты не могут прийти к консенсусу в критической ситуации.

Как устроен "коллективный разум" Grok 4.20

Архитектура не публиковалась, но по косвенным данным и тестам можно восстановить картину. Внутри одной инстансии Grok 4.20 живут и работают пять агентов:

  • Планировщик (Planner): Разбивает запрос пользователя на подзадачи, распределяет их между агентами, следит за таймингом. Судя по всему, использует доработанную версию архитектур из нашего гида по проектированию AI-агентов.
  • Исследователь (Researcher): Отвечает за поиск и проверку фактов. Работает с внешними API и векторными базами данных в реальном времени.
  • Критик (Critic): Самый интересный агент. Его задача — находить слабые места, логические несостыковки и этические проблемы в ответах других агентов. Вечный адвокат дьявола.
  • Кодер (Coder): Специализируется на написании, анализе и отладке кода. Похоже, он построен на основе Grok 3.5, который уже был силен в программировании.
  • Синтезатор (Synthesizer): Сводит все воедино. Берет выводы, сырые данные, замечания критика и формирует конечный, связный ответ для пользователя.

Агенты общаются через внутренний "черный ящик" — протокол, который xAI называет Consensus Layer. Именно там решается, чье мнение весит больше в конкретном контексте. И да, иногда этот слой дает сбой. В ранней бета-версии на сложных философских вопросах модель могла выдавать ответы вида "Планировщик считает X, но Критик с этим не согласен, поэтому вот три варианта...". Пользователи в соцсетях уже прозвали это "шизофренией 2.0".

💡
Если вы думаете о переходе на мультиагентную архитектуру для своего проекта, сначала проверьте критерии. Мы разбирали это в статье "Когда переходить с одного агента на мульти-агентную архитектуру". Главный вывод: сложность управления растет в геометрической прогрессии.

Grok 4.20 vs GPT-5: битва архитектур

OpenAI пока не анонсировала GPT-5 (хотя слухи ходят постоянно), но текущий флагман — GPT-4 Turbo — все еще монолит. Прямое сравнение некорректно, но по некоторым тестам уже видны сильные и слабые стороны подхода xAI.

ЗадачаGrok 4.20 (Мультиагент)GPT-4 Turbo (Монолит)
Написание кода с проверкой уязвимостейВыше качество, агент Критик находит больше edge-кейсовБыстрее, но может пропустить сложные баги
Ответ на сложный вопрос с фактчекингомТочность выше, но ответ приходит на 2-3 секунды дольшеБолее плавный, связный ответ, но иногда "галлюцинирует"
Планирование многоэтапного проектаСтруктура четче, учитывает риски (спасибо Критику)Более креативные варианты, но менее детальные

Главный недостаток Grok 4.20 на сегодня — скорость и стоимость. Запуск пяти "виртуальных машин" вместо одной съедает больше вычислительных ресурсов. xAI пытается оптимизировать это с помощью своих наработок в области эффективных моделей. Не случайно параллельно с 4.20 компания активно продвигает фреймворк Grokkit, который использует математические структуры вместо грубой силы параметров. Скорее всего, агенты внутри 4.20 — не полностмиллиардные модели, а более легкие специализированные сети, возможно, построенные на принципах Grokkit.

Бета-тест: как попробовать и что ждать

Доступ пока ограничен. Нужна платная подписка X Premium+ (та самая, что стоит $16 в месяц) и очередь в лист ожидания. Интерфейс в веб-версии и приложении X не изменился — просто выбираешь "Grok 4.20 (Beta)" в настройках модели.

Первые впечатления пользователей противоречивы. Для аналитических задач, исследований и программирования — восторг. Для быстрого чата, творчества или простых вопросов — избыточно и медленно. Ощущение, будто спрашиваешь не у одного умного друга, а у целого совещания, где каждый хочет высказаться.

Совет от первых тестеров: формулируйте запросы максимально четко. Если вопрос расплывчатый, агент Планировщик может неправильно распределить задачи, и вы получите кашу из мнений. Лучше начать с фразы вроде "Проанализируй с разных сторон..." или "Спланируй по шагам...".

Для тех, кому интересно поэкспериментировать с мультиагентностью локально, пока Grok 4.20 недоступен, есть open-source альтернативы. Мы составляли топ-5 open-source моделей для агентов. Но предупреждаем: собрать и настроить такую систему — задача не для слабонервных. Если не хотите вечных циклов и галлюцинаций, почитайте сначала наш разбор проблем локальных AI-агентов.

Куда это все ведет? Прогноз на 2026

Мультиагентность — не изобретение xAI. Такие компании как Glean, Microsoft и Google уже давно работают над корпоративными агентными системами. Но Grok 4.20 — первый случай, когда такая архитектура пошла в массы, к обычным пользователям через потребительский продукт.

Что будет дальше? Скорее всего, через полгода мы увидим ответ OpenAI — либо свой вариант мультиагентности, либо что-то совершенно иное, что сделает спор об архитектурах неактуальным. Антропик с Claude тоже не дремлет.

А пока совет простой: если у вас есть доступ к бете — пробуйте на сложных, многослойных задачах. Не ждите магии в простом чате. И следите за тем, как некоторые платформы для разработчиков начинают предлагать ранний доступ к API Grok 4.20 (это партнерская ссылка). Для быстрого же прототипирования своих агентных систем иногда проще взять готовый фреймворк — например, этот курс по Kotlin Multiplatform учит создавать кроссплатформенных агентов (тоже партнерская ссылка), что может сэкономить кучу времени.

И последнее. Главный риск Grok 4.20 — не в скорости, а в сложности контроля. Когда у вас внутри один агент, вы хотя бы понимаете, как он пришел к ответу. Когда их пять — это уже групповая динамика. И как показывает история, коллективный разум иногда принимает крайне глупые решения. Об этом почему-то все молчат.

Подписаться на канал