Mistral Vibe и Devstral 2: обзор автономного агента для кодинга с открытыми весами | AiManual
AiManual Logo Ai / Manual.
07 Янв 2026 Инструмент

Mistral Vibe и Devstral 2: автономный кодер, который не просит ключ API

Разбираем Devstral 2 — автономный агент для кодинга на 123B параметров с открытыми весами. Результаты на SWE-bench, CLI под Apache 2.0 и сравнение с проприетарн

Vibe coding без подписки: что вышло у Mistral

Mistral выпустила Devstral 2 — автономного агента для кодинга с открытыми весами. Модель на 123B параметров, CLI под Apache 2.0 и результаты на SWE-bench, которые заставляют присмотреться. Это не просто очередная кодовая модель. Это инструмент, который сам решает задачи, а не ждет ваших подсказок.

Devstral 2 — это автономный агент, а не чат-бот. Он анализирует код, запускает тесты, исправляет ошибки и пишет новые функции без постоянного вмешательства человека.

Как работает этот автономный кодер

Devstral 2 построен на Mistral Vibe — архитектуре, специально заточенной под автономное выполнение задач. Модель не просто генерирует код. Она:

  • Читает и анализирует существующую кодовую базу
  • Запускает тесты и проверяет результаты
  • Исправляет ошибки на основе выводов тестов
  • Пишет документацию и коммитит изменения
  • Работает через CLI — никаких веб-интерфейсов

В теории это звучит как магия. На практике — это цепочка решений, где модель сама решает, что делать дальше. Не нужно писать промпты типа "сначала сделай это, потом то". Вы даете задачу, а модель разбирается сама.

💡
Если вы уже экспериментировали с агентными workflow в Gemini 3 Flash, то Devstral 2 покажется знакомым. Только с открытыми весами и без привязки к облаку Google.

Цифры, которые имеют значение

SWE-bench — стандартный тест для автономных кодинг-агентов. Devstral 2 показывает 31.2% решенных задач. Цифра не бьет рекорды, но учитывая открытые веса и размер модели — это серьезно.

МодельSWE-bench (%)ВесаРазмер
Devstral 231.2Открытые123B
Claude 3.5 Sonnet~44.5ЗакрытыеНеизвестно
GPT-4o~48.1ЗакрытыеНеизвестно
Gemini 1.5 Pro~35.0ЗакрытыеНеизвестно

31.2% против 48.1% у GPT-4o. Разница есть, но не катастрофическая. Особенно если учесть, что Devstral 2 можно запустить локально, модифицировать и не платить за токены.

CLI, который не стыдно показать

Интерфейс Devstral 2 — это командная строка. Никаких графических оберток. Установка через pip, конфигурация в YAML-файле, запуск одной командой.

1Установка и настройка

pip install devstral2 — и все. Модель весит много, но можно использовать квантованную версию. Конфигурационный файл определяет, какие инструменты доступны агенту: запуск тестов, работа с git, анализ логов.

2Работа с задачами

Вызываете devstral2 solve path/to/issue.md. Агент читает описание задачи, анализирует код, запускает тесты, вносит изменения. Весь процесс логируется. Можно прервать в любой момент.

3Что делать с результатами

Devstral 2 создает патчи, коммиты, иногда даже пулл-реквесты. Но финальное решение — за вами. Агент предлагает изменения, а вы решаете, применять их или нет.

Не ждите, что Devstral 2 решит все задачи с первого раза. Модель иногда зацикливается или предлагает странные решения. Всегда проверяйте изменения перед коммитом.

С чем сравнивать: открытые vs проприетарные

Devstral 2 — не единственный автономный агент. Но у него есть особенности, которые выделяют его на фоне конкурентов.

Против проприетарных решений (GPT-4o, Claude, Gemini): Devstral 2 работает локально, не отправляет код в облако, не требует подписки. Но уступает в точности и требует мощного железа для запуска полной версии.

Против других открытых моделей: Многие opensource-модели для кодинга (CodeLlama, DeepSeek-Coder) — это просто чат-боты. Они не умеют автономно выполнять задачи. Devstral 2 — именно агент, с планированием и выполнением действий.

Если вам интересно, как другие модели справляются с многошаговыми задачами, посмотрите статью про проблемы GLM 4.7 и Kimi K2 в автономном кодинге. Там разобраны типичные ошибки, которые допускают даже крупные модели.

Кому подойдет Devstral 2

Этот инструмент — не для всех. Но есть сценарии, где он блестяще себя показывает.

  • Команды с ограниченным бюджетом: Нет денег на Claude или GPT-4 Enterprise? Devstral 2 дает 70% функциональности за 0% стоимости.
  • Проекты с требованиями к конфиденциальности: Код не покидает ваш сервер. Никаких соглашений о неразглашении не нарушается.
  • Разработчики, которые любят ковыряться: Веса открыты под Apache 2.0. Можете дообучить модель на своем коде, изменить поведение, адаптировать под свои нужды.
  • Поддержка legacy-кода: Автоматическое исправление устаревших функций, миграция с одной версии библиотеки на другую.

Если вы уже работали с чем-то вроде CodeMender от DeepMind, то Devstral 2 покажется более универсальным. CodeMender заточен под безопасность, а Devstral 2 — под общие задачи разработки.

Где споткнетесь: подводные камни

Идеальных инструментов не бывает. Devstral 2 — не исключение.

Требования к железу: Полная версия на 123B параметров требует минимум 80 ГБ VRAM. Это не для слабых видеокарт. Квантованные версии (4-бит, 8-бит) экономят память, но теряют в качестве.

Скорость работы: Генерация кода — не мгновенная. Особенно если агент запускает тесты между итерациями. На сложных задачах можно ждать несколько минут.

Ошибки планирования: Иногда агент выбирает странный путь решения. Вместо простого исправления одной функции начинает рефакторить полпроекта. Нужно следить за логированием.

Контекстное окно: 128K токенов — много, но не бесконечно. Очень большие проекты могут не поместиться. Придется разбивать задачи на части.

💡
Для стабильной работы с opensource-моделями пригодятся готовые промпты. Да, Devstral 2 автономный, но начальные инструкции все равно влияют на качество работы.

Что дальше: прогноз на 2025

Devstral 2 — важный шаг. Но не последний. Ожидайте, что через полгода появятся:

  • Более компактные версии (7B, 13B) с похожей функциональностью
  • Интеграции с популярными IDE (VS Code, JetBrains)
  • Специализированные агенты для конкретных языков или фреймворков
  • Улучшенное планирование — меньше глупых ошибок в логике действий

Автономные агенты становятся стандартом. Не как замена разработчикам, а как инструмент, который берет на себя рутину. Devstral 2 показывает, что это можно делать с открытыми весами. Без привязки к крупным корпорациям.

Попробуйте запустить его на своей задаче. Не на продакшене, а на тестовом проекте. Посмотрите, как модель справляется. Даже если результат будет неидеальным — вы поймете, куда движется индустрия. И будете готовы, когда следующий Devstral 3 решит уже 50% задач на SWE-bench.