Две недели назад Илон Маск в своем стиле — без пресс-релизов, на своей платформе X — бросил фразу: "Grok теперь думает компанией". Сообщество AI проигнорировало это как очередную шутку про травку. Ошибка. Вчера, 27 февраля 2026 года, xAI тихо открыла доступ к бета-версии Grok 4.20. И это не апдейт, а землетрясение. Модель не просто "улучшена". Она теперь работает как команда из пяти разных ИИ-агентов под капотом.
Почему это важно? Потому что все последние два года гонка LLM была войной монолитов. Больше параметров, больше контекста, больше всего. Grok 4.20 ломает эту логику. Вместо одного гиганта — несколько узких специалистов, которые спорят, координируются и приходят к общему решению. Звучит как маркетинг, но первые тесты показывают прирост в 40% на задачах, где нужно планирование и проверка фактов. Хотя есть нюанс: иногда эти агенты начинают бесконечно спорить о формате ответа. Классический Маск — гениально и с багами.
От Baldur's Gate к военному совету: эволюция Grok
Чтобы понять 4.20, нужно вспомнить, с чего xAI начинала. Всего пару месяцев назад мы писали про историю с BaldurBench. Тогда Маск задержал релиз Grok 4.1, пока модель не научилась идеально разбираться в механике Baldur's Gate 3. Казалось бы, причуда. Теперь логика проясняется. Сложная RPG с сотнями переменных — идеальный полигон для отработки агентного взаимодействия. Персонажи в партии (танк, маг, лекарь) — это и есть прообраз мультиагентной системы.
Инсайдер из xAI, пожелавший остаться анонимным, подтвердил: часть команды, которая работала над BaldurBench, затем перешла на архитектуру Grok 4.20. "Мы поняли, что один супер-интеллект всегда будет уступать хорошо скоординированной группе специалистов. Как в D&D".
Но игровые квесты — это цветочки. Реальные применения, которые тестирует xAI, куда серьезнее. В том же январе 2026 просачивались данные об уходах инженеров по безопасности. Часть из них была связана как раз с этическими дилеммами при обучении мультиагентных систем для принятия решений в условиях неопределенности. Грубо говоря, как вести себя, если агенты не могут прийти к консенсусу в критической ситуации.
Как устроен "коллективный разум" Grok 4.20
Архитектура не публиковалась, но по косвенным данным и тестам можно восстановить картину. Внутри одной инстансии Grok 4.20 живут и работают пять агентов:
- Планировщик (Planner): Разбивает запрос пользователя на подзадачи, распределяет их между агентами, следит за таймингом. Судя по всему, использует доработанную версию архитектур из нашего гида по проектированию AI-агентов.
- Исследователь (Researcher): Отвечает за поиск и проверку фактов. Работает с внешними API и векторными базами данных в реальном времени.
- Критик (Critic): Самый интересный агент. Его задача — находить слабые места, логические несостыковки и этические проблемы в ответах других агентов. Вечный адвокат дьявола.
- Кодер (Coder): Специализируется на написании, анализе и отладке кода. Похоже, он построен на основе Grok 3.5, который уже был силен в программировании.
- Синтезатор (Synthesizer): Сводит все воедино. Берет выводы, сырые данные, замечания критика и формирует конечный, связный ответ для пользователя.
Агенты общаются через внутренний "черный ящик" — протокол, который xAI называет Consensus Layer. Именно там решается, чье мнение весит больше в конкретном контексте. И да, иногда этот слой дает сбой. В ранней бета-версии на сложных философских вопросах модель могла выдавать ответы вида "Планировщик считает X, но Критик с этим не согласен, поэтому вот три варианта...". Пользователи в соцсетях уже прозвали это "шизофренией 2.0".
Grok 4.20 vs GPT-5: битва архитектур
OpenAI пока не анонсировала GPT-5 (хотя слухи ходят постоянно), но текущий флагман — GPT-4 Turbo — все еще монолит. Прямое сравнение некорректно, но по некоторым тестам уже видны сильные и слабые стороны подхода xAI.
| Задача | Grok 4.20 (Мультиагент) | GPT-4 Turbo (Монолит) |
|---|---|---|
| Написание кода с проверкой уязвимостей | Выше качество, агент Критик находит больше edge-кейсов | Быстрее, но может пропустить сложные баги |
| Ответ на сложный вопрос с фактчекингом | Точность выше, но ответ приходит на 2-3 секунды дольше | Более плавный, связный ответ, но иногда "галлюцинирует" |
| Планирование многоэтапного проекта | Структура четче, учитывает риски (спасибо Критику) | Более креативные варианты, но менее детальные |
Главный недостаток Grok 4.20 на сегодня — скорость и стоимость. Запуск пяти "виртуальных машин" вместо одной съедает больше вычислительных ресурсов. xAI пытается оптимизировать это с помощью своих наработок в области эффективных моделей. Не случайно параллельно с 4.20 компания активно продвигает фреймворк Grokkit, который использует математические структуры вместо грубой силы параметров. Скорее всего, агенты внутри 4.20 — не полностмиллиардные модели, а более легкие специализированные сети, возможно, построенные на принципах Grokkit.
Бета-тест: как попробовать и что ждать
Доступ пока ограничен. Нужна платная подписка X Premium+ (та самая, что стоит $16 в месяц) и очередь в лист ожидания. Интерфейс в веб-версии и приложении X не изменился — просто выбираешь "Grok 4.20 (Beta)" в настройках модели.
Первые впечатления пользователей противоречивы. Для аналитических задач, исследований и программирования — восторг. Для быстрого чата, творчества или простых вопросов — избыточно и медленно. Ощущение, будто спрашиваешь не у одного умного друга, а у целого совещания, где каждый хочет высказаться.
Совет от первых тестеров: формулируйте запросы максимально четко. Если вопрос расплывчатый, агент Планировщик может неправильно распределить задачи, и вы получите кашу из мнений. Лучше начать с фразы вроде "Проанализируй с разных сторон..." или "Спланируй по шагам...".
Для тех, кому интересно поэкспериментировать с мультиагентностью локально, пока Grok 4.20 недоступен, есть open-source альтернативы. Мы составляли топ-5 open-source моделей для агентов. Но предупреждаем: собрать и настроить такую систему — задача не для слабонервных. Если не хотите вечных циклов и галлюцинаций, почитайте сначала наш разбор проблем локальных AI-агентов.
Куда это все ведет? Прогноз на 2026
Мультиагентность — не изобретение xAI. Такие компании как Glean, Microsoft и Google уже давно работают над корпоративными агентными системами. Но Grok 4.20 — первый случай, когда такая архитектура пошла в массы, к обычным пользователям через потребительский продукт.
Что будет дальше? Скорее всего, через полгода мы увидим ответ OpenAI — либо свой вариант мультиагентности, либо что-то совершенно иное, что сделает спор об архитектурах неактуальным. Антропик с Claude тоже не дремлет.
А пока совет простой: если у вас есть доступ к бете — пробуйте на сложных, многослойных задачах. Не ждите магии в простом чате. И следите за тем, как некоторые платформы для разработчиков начинают предлагать ранний доступ к API Grok 4.20 (это партнерская ссылка). Для быстрого же прототипирования своих агентных систем иногда проще взять готовый фреймворк — например, этот курс по Kotlin Multiplatform учит создавать кроссплатформенных агентов (тоже партнерская ссылка), что может сэкономить кучу времени.
И последнее. Главный риск Grok 4.20 — не в скорости, а в сложности контроля. Когда у вас внутри один агент, вы хотя бы понимаете, как он пришел к ответу. Когда их пять — это уже групповая динамика. И как показывает история, коллективный разум иногда принимает крайне глупые решения. Об этом почему-то все молчат.