Тихий анонс, громкие результаты
Zhipu AI выкатила GLM 5.1 без помпы - просто обновление в API. Через неделю модель возглавила Code Arena и устроила разгром в агентских бенчмарках. Claude Opus, который год считался королем сложных задач, теперь стоит втрое дороже при сопоставимом качестве.
Цена как у open-source, качество как у проприетарных
Стоимость инференса GLM 5.1 на OpenRouter - $0.12 за 1M входных токенов и $0.48 за 1M выходных. Claude Opus просит $0.75 и $3.00 соответственно. Разница в 3-6 раз. При этом в задачах на многошаговое планирование (AgentBench) GLM 5.1 показывает эффективность выше 94% против 91% у Opus.
| Модель | Code Arena Score | Стоимость (1M входных) | Стоимость (1M выходных) |
|---|---|---|---|
| GLM 5.1 | 89.7 | $0.12 | $0.48 |
| Claude Opus | 86.5 | $0.75 | $3.00 |
| GPT-4.5 Turbo | 87.1 | $0.50 | $1.50 |
Что изменилось внутри
GLM 5.1 - это не просто дообученная GLM-5. Zhipu пересмотрела архитектуру тренировки: добавила синхронное многомодальное предобучение и усилила reinforcement learning с человеческой обратной связью (RLHF) для агентских сценариев. Модель теперь лучше понимает контекст длиной до 128K токенов и способна разбивать сложные задачи на подзадачи без явных указаний.
В наших прошлых тестах GLM-5 против Claude Code китайская модель уже показывала себя неожиданно хорошо. Но 5.1 - это другой уровень. Она не просто генерирует код, а планирует его выполнение как полноценный агент, что подтверждают результаты Game Agent Coding League.
GLM 5.1 все еще слабее в креативных задачах на английском. Если вам нужна генерация маркетинговых текстов или сложные нарративы - Claude Opus и GPT-4.5 пока впереди. Но для структурированных задач и кода китайская модель вырвалась в лидеры.
Кому переходить на GLM 5.1
Если вы строите coding agents или сложные цепочки задач - попробуйте GLM 5.1. Модель доступна на OpenRouter и через официальный API Zhipu. Для локального развертывания пока только GLM-5, но команда обещает выкатить 5.1 в открытом доступе к концу квартала.
Тем, кто использует стек локальных LLM, стоит посмотреть на настройку стека локальных LLM-агентов. Когда GLM 5.1 станет доступна для скачивания, она может заменить собой связку из нескольких моделей.
После запуска GLM-5 и MiniMax 2.5 китайские компании начали войну за многошаговые AI. Теперь, с выходом 5.1, они бьют по карману: за те же деньги можно запускать в три раза больше агентов. Это продолжение тренда, который мы видели на AGI-NEXT.
Что дальше
Совет: если вы закладываете бюджет на AI на следующий квартал - замените половину запросов к Claude Opus на GLM 5.1. Сэкономите 60% без потери качества в коде и планировании. А для творческих задач оставьте старых провайдеров - пока.
Zhipu явно нацелилась на рынок агентских систем. Их технология DSA и асинхронный RL, о которых мы писали ранее, позволили не только снизить цену, но и резко поднять качество. Теперь выбор между «дорого и отлично» и «дешево и хорошо» больше не актуален. Можно получить «дешево и отлично» - по крайней мере, в генерации кода.
Ожидайте, что к середине 2026 года открытые версии GLM 5.1 появятся в лучших open-source инструментах для работы с LLM. А пока - тестируйте через API. И готовьтесь к тому, что ваши agent-пайплайны станут в три раза дешевле.