Китайцы снова удивляют: 204800 токенов за копейки
Пока мы привыкли дробить технические задания и документацию на куски, MiniMax выпустила M2.7. И это не просто обновление – это модель, которая переписывает правила игры для автоматизации. Контекст в 204800 токенов. Это примерно 150-200 страниц текста или целый проект средней сложности, который можно засунуть в один запрос.
Помните, как всего полгода назад M2.5 удивляла 80.2% на SWE-Bench? Теперь у неё есть наследник, и он не просто мощнее – он дешевле в эксплуатации. OpenRouter с 18 марта 2026 года предлагает доступ к M2.7 по ценам, которые заставят задуматься о переходе с GPT-4o или Claude 3.5 Sonnet для многих задач.
Ключевое отличие M2.7 от предыдущих версий – не просто увеличение контекста, а архитектурные изменения, которые снижают стоимость обработки длинных последовательностей. Цена за 1M токенов ввода – $0.50, вывода – $2.00. Для контекста в 200K это $0.10 за запрос. Смешно.
Что это меняет в реальной работе? Всё
Представьте: вместо того чтобы кормить модель кусочками логов, вы загружаете полный дамп за сутки. Вместо разбора документации по частям – скидываете всю папку с техзаданием. Агентские способности M2.7, отточенные на бенчмарке SWE-Pro (где модель показывает 84.1%), позволяют ей не просто читать, а действовать – планировать, исправлять, генерировать.
- Анализ инцидентов: Скидываете 100 МБ логов – получаете timeline проблемы, возможные причины, даже патч.
- Работа с легаси-кодом: Модель проглатывает весь репозиторий и предлагает план рефакторинга.
- Генерация документации: От техзадания до user stories и API-спецификаций в одном диалоге.
И это не теория. На прошлой неделе один знакомый стартап автоматизировал код-ревью для пулл-реквестов на 500+ файлов. Раньше они использовали каскад вызовов к M2.5, теперь обходятся одним запросом. Экономия на API-вызовах – 70%.
OpenRouter превращает мощь в утилиту
Самое приятное – вам не нужно разбираться с квантованиями, как в случае с M2.1-REAP, или настраивать распределённый запуск на нескольких GPU (помните этот гайд?). OpenRouter предоставляет M2.7 как сервис. Подключение через стандартный OpenAI-совместимый API.
Кстати, для тех, кто ищет оптимального провайдера для разных задач, всегда можно воспользоваться Modelgrep. Но для M2.7 на данный момент выбор очевиден.
А что с производительностью? Цифры говорят сами
MiniMax всегда умела выжимать максимум из параметров. Помните, как M2.1 била гигантов с вдвое меньшим числом параметров? M2.7 продолжает эту традицию, но фокус сместился на эффективность работы с длинным контекстом и агентские задачи.
| Модель | Контекст (токенов) | SWE-Pro (pass@1) | Цена за 1M ввода (OpenRouter) |
|---|---|---|---|
| MiniMax M2.5 | 128000 | 80.2% | $0.65 |
| MiniMax M2.7 | 204800 | 84.1% | $0.50 |
| Claude 3.5 Sonnet | 200000 | ~82% (оценка) | $3.00 |
Ценник – отдельная история. M2.7 не просто мощная, она экономически выгодная. Для сравнения: обработка полного 200K контекста в Claude 3.5 Sonnet обойдётся в $0.60, в M2.7 – в $0.10. В шесть раз дешевле. Для бизнеса, который делает тысячи таких запросов в день, это не просто экономия – это возможность масштабировать автоматизацию туда, куда раньше было страшно заглядывать.
Где подвох? (Он есть всегда)
Модель новая. На OpenRouter она появилась буквально на днях. Это значит, что могут быть проблемы с доступностью в пиковые часы. Команда OpenRouter уже анонсировала быстрое масштабирование, но первые пользователи жалуются на латентность при полной загрузке контекста – ответа можно ждать 30-40 секунд.
Не бросайтесь сразу переписывать все свои продакшн-пайплайны. Протестируйте M2.7 на не самых критичных задачах. Проверьте, как она работает именно с вашими данными – длинные технические тексты на русском могут обрабатываться чуть менее эффективно, чем на английском (хотя мультиязычность у MiniMax всегда была на уровне).
И ещё один момент: M2.7 – это cloud-only решение через провайдеров вроде OpenRouter. Любителям локального запуска, как в случае с M2 и другими моделями для локального запуска, придётся подождать. Или смириться. Архитектура, оптимизированная для таких длинных контекстов, пока слишком тяжела для домашних ферм.
Что дальше? Прогноз от того, кто видел всё
MiniMax M2.7 – это чёткий сигнал рынку. Эра моделей с контекстом в 4K-32K окончательно уходит в прошлое для профессионального использования. В течение 2026 года мы увидим, как все major-плееры будут вынуждены либо резко снижать цены на длинный контекст, либо предлагать аналогичные возможности.
Совет простой: если вы ещё не автоматизировали рутину типа анализа логов, генерации документации или начального код-ревью – сейчас идеальный момент. Инструмент стал в разы доступнее. Начните с одного процесса, который больше всего бесит вашу команду. Закиньте в M2.7 через OpenRouter API все исходники и задачи. Посмотрите, что получится.
Скорее всего, вы удивитесь. И возможно, через месяц будете жалеть, что не сделали этого раньше, когда платили в пять раз больше за ту же работу, разбитую на десяток запросов.