AI дайджест за неделю: GPT-5.3, Gemini 3.1, Claude Opus 4.6 | 01.03.2026

Неделя, когда ИИ перестал быть вежливым

Последние семь дней в индустрии напоминали драку в баре – все выпустили свои самые тяжелые аргументы одновременно. OpenAI, Google и Anthropic не просто обновили модели, а переписали правила ценообразования и возможностей. Если вы пропустили главное – вот что случилось с 23 февраля по 1 марта 2026 года.

Все данные и версии моделей актуальны на 1 марта 2026 года. Если кто-то говорит вам про GPT-5.1 или Claude Opus 4.5 – они живут в прошлом году.

GPT-5.3-Codex: тихий реванш OpenAI

После февральского релиза GPT-5.3-Codex все ждали, что OpenAI устроит маркетинговый карнавал. Вместо этого они выпустили тихое, но смертоносное обновление. Теперь модель по умолчанию понимает контекст в 2 миллиона токенов – это примерно 1500 страниц текста. Стоимость упала до $1.80 за 1М токенов вывода. Не революция, но ощутимо.

Главный трюк – новая система "авто-отладки". Вы даете ей кусок кода с багом, а она не просто находит ошибку, а симулирует выполнение, строит граф зависимостей и предлагает три варианта фикса с оценкой рисков. В тестах на HumanEval показывает 93.7%. Звучит скучно, пока не попробуешь заставить её переписать legacy-код на COBOL. Тогда понимаешь – это не инструмент, это личный техдолжник.

Gemini 3.1 Pro: когда 4 миллиона токенов – это норма

Google ответила увеличением контекстного окна до 4 миллионов токенов в Gemini 3.1 Pro. Цена – $1.50 за 1М. Но главное не цифры, а то, как модель их использует. Загрузите часовое видео с конференции – она сделает расшифровку, выделит ключевые тезисы, найдет противоречия в речи спикеров и предложит вопросы для дискуссии. Мультимодальность перестала быть фичей и стала воздухом.

Интересно, что Google почти перестал гоняться за бенчмарками. Вместо этого они показывают кейсы: анализ 10-тысячных датасетов для фармакологических исследований, синтез технической документации из обрывочных заметок. Это напоминает стратегию из ноябрьских анонсов, но теперь это работает в продакшене.

Модель (версия на 01.03.2026)	Контекстное окно	Стоимость вывода (за 1М токенов)	Фишка недели
GPT-5.3-Codex	2 млн токенов	$1.80	Автономная отладка и рефакторинг кода
Gemini 3.1 Pro	4 млн токенов	$1.50	Анализ длинного видео и аудио без потерь контекста
Claude Opus 4.6	1.5 млн токенов	$2.10	Встроенный "скептик" для проверки собственных выводов

Claude Opus 4.6: дорого, но честно

Anthropic не стал снижать цены. Вместо этого они выпустили Claude Opus 4.6 с функцией "внутреннего критика". Модель теперь не просто генерирует ответ, а сопровождает его мета-комментариями: "Я уверен в этом на 85%, потому что в источнике X есть противоречие", "Этот вывод требует проверки экспериментом". Звучит как паранойя, но для юристов и ученых – это священный грааль.

В сравнении с Sonnet Opus 4.6 выигрывает в задачах, где цена ошибки высока. Но за это платят $2.10 за 1М токенов. Стоит ли? Если ваш промпт стоит дороже, чем ответ – да.

💡

Практический совет: не гонитесь за самой большой контекстной памятью. GPT-5.3-Codex с 2 млн токенов часто справляется лучше, чем Gemini с 4 млн, потому что умеет фильтровать шум. Тестируйте на своих данных.

Деньги пошли в узкие ниши

Пока гиганты меряются токенами, венчурные инвесторы бросились финансировать стартапы, которые решают конкретные боли. За неделю зафиксировано три крупных раунда:

NeuroContract – $120 млн. Платформа для автоматического анализа юридических документов на уровне старшего партнера крупной фирмы. Использует ансамбль из Claude Opus 4.6 и Gemini 3.1.
CodeCanvas AI – $80 млн. Редактор, который преобразует словесное описание фичи в рабочую ветку кода с тестами и документацией. Построен поверх GPT-5.3-Codex.
FactFlow – $45 млн. Система проверки фактов в реальном времени для новостных редакций и соцсетей. Заявляет о 99,8% точности на текущих событиях.

Тренд очевиден: время универсальных моделей замедляется. Ценность теперь в глубокой интеграции в рабочий процесс. (Именно поэтому сервисы вроде AITUNNEL набирают популярность – один API для всех моделей, чтобы быстро переключаться между ними без головной боли).

Что делать на этой неделе?

Не пытайтесь угнаться за всем. Выберите одну задачу, которая сейчас болит сильнее всего – анализ договоров, написание кода, исследование рынка. Возьмите триал каждой из топ-моделей и проведите слепой тест. GPT-5.3-Codex может оказаться гением в коде, но провалиться в креативе. Claude Opus 4.6 – педант для важных документов. Gemini 3.1 – швейцарский нож для мультимедиа.

И последнее. Не верьте хайпу вокруг "искусственного общего интеллекта". На 1 марта 2026 года мы имеем набор очень продвинутых инструментов, каждый со своими странностями. GPT может галлюцинировать даты, Gemini иногда теряет нить в длинных диалогах, а Claude слишком часто сомневается в себе. Знайте слабые места вашего молотка – и не используйте его как отвертку.

Прогноз на следующую неделю: ждите анонсов от китайских компаний. После декабрьской гонки DeepSeek и Baidu затаились, но их тишина подозрительна. Скорее всего, готовят ответный удар по ценам.

Подписаться на канал

Еженедельный дайджест AI-новостей: от GPT-5.3-Codex до Claude Opus 4.6 – главные взрывы начала марта