МТС выкатила Cotype Light 3 – мультимодальную модель на 9 миллиардов параметров, которая смотрит на ваш скриншот, читает договор и строит SQL-запрос, не выжимая из видеокарты последние соки. Инженеры сделали ставку не на гигантизм, а на эффективность: модель влезает на один GPU и по некоторым задачам бьёт монстров в 10 раз крупнее. Бизнес, наконец, получил инструмент, который можно пощупать без бюджета на дата-центр.
Что внутри у этой «лайтовой» версии?
Архитектура – классический трансформер, но с хитрой мультимодальной начинкой. Модель жуёт текст, изображения и структурированные данные (таблицы, JSON) через единый энкодер. На выходе – тот же текст, но уже с пониманием контекста из картинки. Техническая документация сухая: 9B параметров, контекстное окно 128к токенов, квантование до 4-bit без фатальной потери качества.
Главный козырь – аппетиты. Для инференса (вывода) хватает одной видеокарты с 18 ГБ памяти, типа NVIDIA A100 40GB в половинном режиме или RTX 6000 Ada. Полноценное обучение, конечно, потребует кластера, но для дообучения под свои данные – пара карт. Это уровень, доступный не только «Газпрому», но и средней IT-конторе.
Цифры, которые заставляют присвистнуть
Релиз сопровождался результатами на популярных бенчмарках. В тесте MERA (российский стандарт для оценки языковых моделей) Cotype Light 3 на апрель 2026 года показала 89.7 баллов в категории «Мультимодальное понимание». Для моделей своего класса – это топ.
| Бенчмарк | Cotype Light 3 (9B) | GPT-4o-mini (2025) | Claude 3.5 Haiku |
|---|---|---|---|
| MMLU (многостороннее понимание) | 74.5 | 78.1 | 76.8 |
| HumanEval (генерация кода) | 68.3 | 72.0 | 65.1 |
| Apex-Agents (логика агентов) | 61.2 | 59.8 | 57.4 |
Обратите внимание на строчку Apex-Agents. Это тот самый бенчмарк, где крупные модели позорно проваливались. Cotype Light 3, будучи в разы меньше, обходит и GPT-4o-mini, и Claude. Видимо, инженеры МТС тренировали её именно на задачах последовательных действий и планирования, а не на генерацию стихов про котиков.
Зачем это вашему бизнесу? Три живых примера
В теории все модели хороши. Практика Cotype Light 3 выглядит так:
- Ассистент в службе поддержки. Загружаете скриншот ошибки от клиента. Модель не только читает текст на экране, но и понимает, что изображено (кнопка «Отправить» неактивна, граф интерфейса сломан). Формирует ответ с шагами по исправлению, которые уже можно скормить другой системе. Это похоже на сложный пайплайн из архитектуры для борьбы с мошенниками, но дешевле.
- Анализ сканов договоров. Юристам не нужно вручную сравнивать правки в 50-страничном PDF. Модель выделяет ключевые пункты, изменения и потенциальные риски, выдавая сводку. И делает это локально, не отправляя конфиденциальные документы в чужие облака.
- Прототипирование агентов. Хотите попробовать внедрить мульти-агентную систему, но боитесь сложностей? Запустите несколько инстансов Cotype Light 3 на одном сервере, назначьте им роли (аналитик, исполнитель, валидатор) и посмотрите, как они справляются с вашим workflow. Цена эксперимента – стоимость аренды GPU на несколько часов.
Важный нюанс: прямой доступ к исходному коду модели нет. МТС предлагает API и контейнеры для развертывания. С одной стороны, это ограничивает хакеров-энтузиастов. С другой – бизнес получает готовый, сертифицированный и поддерживаемый продукт, а не «кота в мешке» с Hugging Face. Для корпоративного сектора это часто плюс.
Железо: на чём это бегает в 2026 году?
Рекомендуемая конфигурация для production-развертывания – сервер с одной или двумя картами NVIDIA A100 40GB/80GB. Для тестов и небольших нагрузок подойдёт RTX 6000 Ada Generation (48 GB). Память – главный ресурс. Модель в полной версии занимает около 18 ГБ в FP16. С квантованием (INT8/INT4) можно ужать до 5-9 ГБ, что открывает двери для менее мощного железа.
МТС, как телеком-гигант, естественно, продвигает и свою облачную платформу для ИИ, где Cotype Light 3 можно развернуть в пару кликов. Но ничто не мешает купить свою железку и крутить её локально. (Это редкий случай, когда долгосрочная аренда облачного GPU может быть выгоднее покупки, учитывая скорость морального старения ускорителей).
Чего боится Cotype Light 3 и когда она не нужна
Модель не всесильна. Она проигрывает GPT-5 Turbo (если такая есть на апрель 2026) в творческих задачах и генерации длинных, связных нарративов. Её конёк – структурированные бизнес-задачи с чёткими входными данными.
Не стоит ждать от неё чудес в сценариях, где ломаются даже продвинутые ассистенты – при полном хаосе во входных данных, противоречивых инструкциях или необходимости глубокого экспертного знания узкой области без дообучения. Это инструмент, а не волшебная палочка.
И главное: если ваша задача – просто чат-бот для ответов на FAQs, возможно, вам хватит и более простых и дешёвых опенсорс-моделей. Cotype Light 3 раскрывается там, где нужна мультимодальность и логика агента.
Что в сухом остатке?
Cotype Light 3 – это прагматичный ответ на запрос рынка: «Дайте модель, которая работает здесь и сейчас, а не в гипотетическом будущем с эксафлопсными кластерами». МТС удалось упаковать способности крупных моделей в формат, который финансовый директор не зарубит на совете директоров.
Тренд на компактные, эффективные модели для нишевых корпоративных задач только набирает силу. Вместо того чтобы гоняться за параметрами, инженеры теперь соревнуются в оптимизации. И это, пожалуй, самый здоровый тренд в индустрии ИИ за последние годы. Cotype Light 3 – его яркий представитель. Не революция, а качественная, продуманная эволюция.
Попробуйте оценить свои бизнес-процессы: где сотрудник тратит 20 минут на просмотр картинок и таблиц, чтобы принять простое решение? Вот туда и стоит прицельно запускать таких «лайтовых» агентов. Это окупится быстрее, чем вы думаете.