GLM 5.1 превосходит Claude Opus в Code Arena и дешевле на 70%

Тихий анонс, громкие результаты

Zhipu AI выкатила GLM 5.1 без помпы - просто обновление в API. Через неделю модель возглавила Code Arena и устроила разгром в агентских бенчмарках. Claude Opus, который год считался королем сложных задач, теперь стоит втрое дороже при сопоставимом качестве.

💡

Code Arena - открытый бенчмарк для оценки моделей в генерации кода на реальных задачах. По данным на 10.04.2026, GLM 5.1 набрала 89.7 баллов, обойдя Claude Opus на 3.2 пункта и установив новый рекорд.

Цена как у open-source, качество как у проприетарных

Стоимость инференса GLM 5.1 на OpenRouter - $0.12 за 1M входных токенов и $0.48 за 1M выходных. Claude Opus просит $0.75 и $3.00 соответственно. Разница в 3-6 раз. При этом в задачах на многошаговое планирование (AgentBench) GLM 5.1 показывает эффективность выше 94% против 91% у Opus.

Модель	Code Arena Score	Стоимость (1M входных)	Стоимость (1M выходных)
GLM 5.1	89.7	$0.12	$0.48
Claude Opus	86.5	$0.75	$3.00
GPT-4.5 Turbo	87.1	$0.50	$1.50

Что изменилось внутри

GLM 5.1 - это не просто дообученная GLM-5. Zhipu пересмотрела архитектуру тренировки: добавила синхронное многомодальное предобучение и усилила reinforcement learning с человеческой обратной связью (RLHF) для агентских сценариев. Модель теперь лучше понимает контекст длиной до 128K токенов и способна разбивать сложные задачи на подзадачи без явных указаний.

В наших прошлых тестах GLM-5 против Claude Code китайская модель уже показывала себя неожиданно хорошо. Но 5.1 - это другой уровень. Она не просто генерирует код, а планирует его выполнение как полноценный агент, что подтверждают результаты Game Agent Coding League.

GLM 5.1 все еще слабее в креативных задачах на английском. Если вам нужна генерация маркетинговых текстов или сложные нарративы - Claude Opus и GPT-4.5 пока впереди. Но для структурированных задач и кода китайская модель вырвалась в лидеры.

Кому переходить на GLM 5.1

Если вы строите coding agents или сложные цепочки задач - попробуйте GLM 5.1. Модель доступна на OpenRouter и через официальный API Zhipu. Для локального развертывания пока только GLM-5, но команда обещает выкатить 5.1 в открытом доступе к концу квартала.

Тем, кто использует стек локальных LLM, стоит посмотреть на настройку стека локальных LLM-агентов. Когда GLM 5.1 станет доступна для скачивания, она может заменить собой связку из нескольких моделей.

После запуска GLM-5 и MiniMax 2.5 китайские компании начали войну за многошаговые AI. Теперь, с выходом 5.1, они бьют по карману: за те же деньги можно запускать в три раза больше агентов. Это продолжение тренда, который мы видели на AGI-NEXT.

Что дальше

Совет: если вы закладываете бюджет на AI на следующий квартал - замените половину запросов к Claude Opus на GLM 5.1. Сэкономите 60% без потери качества в коде и планировании. А для творческих задач оставьте старых провайдеров - пока.

Zhipu явно нацелилась на рынок агентских систем. Их технология DSA и асинхронный RL, о которых мы писали ранее, позволили не только снизить цену, но и резко поднять качество. Теперь выбор между «дорого и отлично» и «дешево и хорошо» больше не актуален. Можно получить «дешево и отлично» - по крайней мере, в генерации кода.

Ожидайте, что к середине 2026 года открытые версии GLM 5.1 появятся в лучших open-source инструментах для работы с LLM. А пока - тестируйте через API. И готовьтесь к тому, что ваши agent-пайплайны станут в три раза дешевле.

Подписаться на канал

GLM 5.1: новый китайский лидер в агентских задачах и генерации кода

Тихий анонс, громкие результаты

Цена как у open-source, качество как у проприетарных

Что изменилось внутри

Кому переходить на GLM 5.1

Что дальше

Подписывайтесь на наш канал!