Неделя выдалась жаркой. OpenAI наконец-то научил свою модель изображений писать без ошибок, китайцы выкатили модели с триллионами параметров, а Google предложил Deep Research в максимальной комплектации. И да, Cerebras наконец-то вышел на IPO — кто бы сомневался. Держите подборку главных взрывов, которые стоит знать.
ChatGPT Images 2.0: теперь с мозгами и без опечаток
Самая ожидаемая фича недели — ChatGPT Images 2.0. OpenAI добавил Thinking Mode: теперь нейросеть не просто генерирует картинку по запросу, а сначала обдумывает композицию, освещение и — о чудо! — проверяет орфографию. Текст на изображениях перестал быть лотереей: буквы не разъезжаются, шрифты осмысленные, опечатки — редкость. Разработчики уверяют, что модель использует ту же технику цепочки рассуждений, что и o3, но адаптированную для визуального синтаксиса.
Впрочем, без скандала не обошлось. Пользователи тут же натравили ChatGPT Images 2.0 на конкурента — Nano Banana, стартап из Кремниевой долины, который позиционирует себя как "AI для дизайна без лишних телодвижений". Результат — сотни сравнительных постов в X/Twitter. OpenAI явно целится в рынок графических редакторов, и у неё есть козыри.
Мы уже писали про ChatGPT Images 2.0: Thinking Mode, текст без опечаток и война с Nano Banana — там полный разбор новой архитектуры и тесты. Если коротко: модель работает быстро, но думает медленно. Зато результат — чистый шедевр.
Qwen 3.6 Max: Alibaba вытаскивает новый козырь
Alibaba не унимается. Через две недели после выхода Qwen 3.5 (мы разобрали его архитектуру) компания выпускает Qwen 3.6 Max. Что нового? Улучшенная работа с контекстом до 256K токенов, встроенный код-генератор на уровне Codex и — главное — поддержка инструментов (tool use) прямо из коробки. Модель открыта под лицензией Apache 2.0, веса лежат на Hugging Face.
Если сравнивать с конкурентами из Middle Kingdom, то Qwen 3.6 Max встаёт в один ряд с последними версиями DeepSeek и Kimi. Кстати, гонка китайских LLM в 2025-2026 только набирает обороты: каждый новый релиз перетягивает одеяло то на одну, то на другую сторону.
Kimi K2.6 1T MoE: когда параметров больше, чем нейронов в вашей голове
Moonshot AI, создатели Kimi, выкатили Kimi K2.6 — модель с архитектурой Mixture of Experts и 1 триллионом параметров. Это почти в два раза больше, чем у GPT-5.3. Но не ведитесь на цифры: активных параметров на каждый токен — всего 120 миллиардов, остальные дрыхнут до востребования. Зато это позволило сделать модель невероятно быстрой на инференсе при колоссальной ёмкости знаний.
Kimi K2.6 заточен на задачи с длинным контекстом: суммаризация сотен страниц документации, анализ кодовых баз, юридические исследования. В бенчмарках он обходит Kimi 2.5 и Qwen3-Coder-Next на 15-20% по точности. Цена вопроса — модель доступна через API и в open-source весах, но для коммерческого использования придётся выложить круглую сумму.
Google Deep Research Max: AI-журналист-трудоголик
Google обновил свою флагманскую исследовательскую фичу — Deep Research Max. Теперь агент не просто ищет информацию, а строит многоуровневые доводы, проверяет противоречия и выдаёт 20-страничные отчёты с цитатами из 50+ источников. Режим "Deep" позволяет настроить глубину поиска: от быстрого сниппета до полноценного исследования уровня аспирантской работы.
Ключевое отличие от Gemini 2.5 Pro — агент сам определяет, когда нужно обратиться к внешним инструментам (Wolfram Alpha, научные базы, GitHub). Интеграция с Google Scholar работает безупречно. Пока доступно только подписчикам Google One AI Premium, но, судя по тестам, это лучшее, что есть для ресерча.
Cerebras, SpaceX Cursor и другие бизнес-новости
На этой неделе Cerebras наконец-то провёл IPO. Акции выросли на 18% в первый день, капитализация перевалила за $9 млрд. Компания позиционирует себя как "альтернатива NVIDIA для инференса" — их WSE-3 чип способен запускать модели с 1 триллионом параметров без распределения по кластеру. Партнёрство с G42 и Abu Dhabi принесло контракты на строительство новых дата-центров.
А вот SpaceX Cursor — это не про ракеты. Это кодовое имя нового AI-помощника для написания кода, который Маск анонсировал в X. Говорят, что Cursor на базе их собственной LLM (засекреченной) будет конкурировать с Copilot и Cursor IDE. Пока деталей нет, но заявление прозвучало громко. Ожидаем бета-версию к лету.
По касательной: Minimax M 2.7 и другие релизы
Среди менее шумных, но важных событий: Minimax M 2.7 — новая версия китайской мультимодальной модели, которая теперь генерирует видео в 4K с частотой 30 кадров в секунду. Качество почти неотличимо от Sora, а цена на генерацию в 3 раза ниже. Ещё отметим, что итоги недели в AI не обошлись без скандалов: Thinking Machines покинули несколько ключевых инженеров из-за этических разногласий.
И если вы ещё думаете, что российские модели отстают навсегда — вот свежий бенчмарк. Спойлер: отстают, но уже не так безнадёжно. А с учётом новых законов США о контроле AI-экспорта (про это мы писали в февральском дайджесте), возможно, скоро увидим сдвиг.