Cotype Light 3: обзор 9B модели для ИИ-агентов | МТС ИИ

МТС выкатила Cotype Light 3 – мультимодальную модель на 9 миллиардов параметров, которая смотрит на ваш скриншот, читает договор и строит SQL-запрос, не выжимая из видеокарты последние соки. Инженеры сделали ставку не на гигантизм, а на эффективность: модель влезает на один GPU и по некоторым задачам бьёт монстров в 10 раз крупнее. Бизнес, наконец, получил инструмент, который можно пощупать без бюджета на дата-центр.

Что внутри у этой «лайтовой» версии?

Архитектура – классический трансформер, но с хитрой мультимодальной начинкой. Модель жуёт текст, изображения и структурированные данные (таблицы, JSON) через единый энкодер. На выходе – тот же текст, но уже с пониманием контекста из картинки. Техническая документация сухая: 9B параметров, контекстное окно 128к токенов, квантование до 4-bit без фатальной потери качества.

Главный козырь – аппетиты. Для инференса (вывода) хватает одной видеокарты с 18 ГБ памяти, типа NVIDIA A100 40GB в половинном режиме или RTX 6000 Ada. Полноценное обучение, конечно, потребует кластера, но для дообучения под свои данные – пара карт. Это уровень, доступный не только «Газпрому», но и средней IT-конторе.

Цифры, которые заставляют присвистнуть

Релиз сопровождался результатами на популярных бенчмарках. В тесте MERA (российский стандарт для оценки языковых моделей) Cotype Light 3 на апрель 2026 года показала 89.7 баллов в категории «Мультимодальное понимание». Для моделей своего класса – это топ.

Бенчмарк	Cotype Light 3 (9B)	GPT-4o-mini (2025)	Claude 3.5 Haiku
MMLU (многостороннее понимание)	74.5	78.1	76.8
HumanEval (генерация кода)	68.3	72.0	65.1
Apex-Agents (логика агентов)	61.2	59.8	57.4

Обратите внимание на строчку Apex-Agents. Это тот самый бенчмарк, где крупные модели позорно проваливались. Cotype Light 3, будучи в разы меньше, обходит и GPT-4o-mini, и Claude. Видимо, инженеры МТС тренировали её именно на задачах последовательных действий и планирования, а не на генерацию стихов про котиков.

💡

Результат в Apex-Agents – ключевой для бизнеса. Это означает, что модель может неплохо справляться с ролями простых автономных агентов: обработать тикет, проанализировать график продаж и предложить гипотезу, собрать данные из нескольких источников. Не идеально, но уже работающе.

Зачем это вашему бизнесу? Три живых примера

В теории все модели хороши. Практика Cotype Light 3 выглядит так:

Ассистент в службе поддержки. Загружаете скриншот ошибки от клиента. Модель не только читает текст на экране, но и понимает, что изображено (кнопка «Отправить» неактивна, граф интерфейса сломан). Формирует ответ с шагами по исправлению, которые уже можно скормить другой системе. Это похоже на сложный пайплайн из архитектуры для борьбы с мошенниками, но дешевле.
Анализ сканов договоров. Юристам не нужно вручную сравнивать правки в 50-страничном PDF. Модель выделяет ключевые пункты, изменения и потенциальные риски, выдавая сводку. И делает это локально, не отправляя конфиденциальные документы в чужие облака.
Прототипирование агентов. Хотите попробовать внедрить мульти-агентную систему, но боитесь сложностей? Запустите несколько инстансов Cotype Light 3 на одном сервере, назначьте им роли (аналитик, исполнитель, валидатор) и посмотрите, как они справляются с вашим workflow. Цена эксперимента – стоимость аренды GPU на несколько часов.

Важный нюанс: прямой доступ к исходному коду модели нет. МТС предлагает API и контейнеры для развертывания. С одной стороны, это ограничивает хакеров-энтузиастов. С другой – бизнес получает готовый, сертифицированный и поддерживаемый продукт, а не «кота в мешке» с Hugging Face. Для корпоративного сектора это часто плюс.

Железо: на чём это бегает в 2026 году?

Рекомендуемая конфигурация для production-развертывания – сервер с одной или двумя картами NVIDIA A100 40GB/80GB. Для тестов и небольших нагрузок подойдёт RTX 6000 Ada Generation (48 GB). Память – главный ресурс. Модель в полной версии занимает около 18 ГБ в FP16. С квантованием (INT8/INT4) можно ужать до 5-9 ГБ, что открывает двери для менее мощного железа.

МТС, как телеком-гигант, естественно, продвигает и свою облачную платформу для ИИ, где Cotype Light 3 можно развернуть в пару кликов. Но ничто не мешает купить свою железку и крутить её локально. (Это редкий случай, когда долгосрочная аренда облачного GPU может быть выгоднее покупки, учитывая скорость морального старения ускорителей).

Чего боится Cotype Light 3 и когда она не нужна

Модель не всесильна. Она проигрывает GPT-5 Turbo (если такая есть на апрель 2026) в творческих задачах и генерации длинных, связных нарративов. Её конёк – структурированные бизнес-задачи с чёткими входными данными.

Не стоит ждать от неё чудес в сценариях, где ломаются даже продвинутые ассистенты – при полном хаосе во входных данных, противоречивых инструкциях или необходимости глубокого экспертного знания узкой области без дообучения. Это инструмент, а не волшебная палочка.

И главное: если ваша задача – просто чат-бот для ответов на FAQs, возможно, вам хватит и более простых и дешёвых опенсорс-моделей. Cotype Light 3 раскрывается там, где нужна мультимодальность и логика агента.

Что в сухом остатке?

Cotype Light 3 – это прагматичный ответ на запрос рынка: «Дайте модель, которая работает здесь и сейчас, а не в гипотетическом будущем с эксафлопсными кластерами». МТС удалось упаковать способности крупных моделей в формат, который финансовый директор не зарубит на совете директоров.

Тренд на компактные, эффективные модели для нишевых корпоративных задач только набирает силу. Вместо того чтобы гоняться за параметрами, инженеры теперь соревнуются в оптимизации. И это, пожалуй, самый здоровый тренд в индустрии ИИ за последние годы. Cotype Light 3 – его яркий представитель. Не революция, а качественная, продуманная эволюция.

Попробуйте оценить свои бизнес-процессы: где сотрудник тратит 20 минут на просмотр картинок и таблиц, чтобы принять простое решение? Вот туда и стоит прицельно запускать таких «лайтовых» агентов. Это окупится быстрее, чем вы думаете.

Подписаться на канал

Cotype Light 3: мультимодальная карманная ракета от МТС, которая не просит ферму GPU