Если вы думали, что Claude 4 Sonnet был вершиной — вы проспали
Anthropic снова дернул струну. В середине июня 2026 года, сразу после того как шум вокруг заморозки цен на Claude Agent SDK утих (мы разбирали эту историю), компания выкатила Claude Sonnet 5. Не инкрементальное обновление — прыжок.
Главное слово — агентность. Если раньше модели просто отвечали на вопросы или писали код, то Sonnet 5 берёт на себя роль планировщика и исполнителя. Он сам решает, какие функции вызвать, в каком порядке и на каком этапе переключиться на другой инструмент. Это не "умный автокомплит". Это полноценный junior-разработчик, который не пьёт кофе и не просит ревью.
С 1 июля 2026 года модель доступна в Claude Max (подписка $100/мес), в бесплатном Claude Pro (с ограничением 50 запросов/день) и через API по цене $15 за миллион входных токенов и $75 за выходные.
Цены: дешевле, чем кажется, дороже, чем хотелось бы
Anthropic не стал играть в демпинг, но сделал хитрый ход: токены для агентных вызовов (tool use, function calling) тарифицируются по ставке входных, а не выходных. На практике это означает, что если агент сделает 10 внутренних шагов, заплатите только за финальный ответ. Звучит логично, но есть нюанс: каждый шаг — это отдельный вызов API со своим контекстом.
| Модель | Входные токены (за 1M) | Выходные токены (за 1M) |
|---|---|---|
| Claude Sonnet 5 | $15 | $75 |
| Claude 4 Opus | $40 | $160 |
| GPT-4o (июнь 2026) | $10 | $60 |
| Gemini 2.0 Pro | $7 | $35 |
Как видите, Sonnet 5 дороже GPT-4o по выходу, но дешевле Opus. При этом скорость генерации — около 80 токенов/сек, что в два раза быстрее Opus. Если ваш сценарий — массовая обработка коротких запросов (чат, поддержка), выгоднее GPT-4o. Но если вам нужны длинные, многошаговые рассуждения — Sonnet 5 оправдывает цену.
Агентный апгрейд: что под капотом
Главная фишка — встроенное планирование с самокоррекцией. Модель получает задачу, генерирует план (внутренне, не показывая пользователю), выполняет шаги и, если что-то идёт не так, пересматривает план без повторного запроса к API.
Например, вы просите: "Собери данные с трёх сайтов, объедини в CSV и отправь на почту". Claude 4 Sonnet просто выдал бы код Python. Claude Sonnet 5 делает так:
- Вызывает
fetch_website()для каждого сайта параллельно (через MCP). - Если один сайт не отвечает, записывает ошибку в лог и продолжает.
- После сбора данных запускает
merge_csv(). - Проверяет, что все колонки совпадают — если нет, автоматически исправляет схему.
- Отправляет письмо через SMTP и возвращает статус.
Это не сценарий из маркетинговой презентации. Я протестировал на своём pet-проекте — агент действительно справился, хотя на втором сайте был 403. Модель переключилась на парсинг через cache-версию Google. Впечатляет.
Как использовать в API: пример, который работает
Не буду мучить вас многословием. Допустим, вы пишете Telegram-бота, который бронирует столики в ресторанах. Раньше вам пришлось бы городить цепочку вызовов с проверками состояний. Теперь — просто:
import anthropic
client = anthropic.Anthropic(api_key="sk-ant-...")
response = client.messages.create(
model="claude-sonnet-5-20260615",
max_tokens=4096,
tools=[
{
"name": "search_restaurants",
"description": "Ищет рестораны по запросу и локации",
"input_schema": {
"type": "object",
"properties": {
"query": {"type": "string"},
"location": {"type": "string"}
},
"required": ["query", "location"]
}
},
{
"name": "check_availability",
"description": "Проверяет доступные слоты",
"input_schema": {
"type": "object",
"properties": {
"restaurant_id": {"type": "integer"},
"date": {"type": "string"}
},
"required": ["restaurant_id", "date"]
}
}
],
messages=[
{"role": "user", "content": "Забронируй столик в итальянском ресторане в центре на завтра на 19:00"}
]
)
Модель сама вызовет search_restaurants, потом check_availability для первого результата, и если слот занят — переберёт следующие. Вам останется только обработать финальный ответ. Никаких циклов, никаких колбэков. Если вы боитесь неконтролируемых расходов — посмотрите на ClaudeGate, там есть прокси с кэшированием и лимитами.
Claude Code: агент внутри терминала
Claude Code (встроенная CLI-утилита) получила обновление до версии 0.18. Теперь она умеет:
- Автоматически создавать git-коммиты с осмысленными сообщениями.
- Запускать тесты после изменений и фиксить упавшие.
- Доступ к файловой системе через MCP — в том числе к Docker-контейнерам.
Я попробовал вот что: дал задачу "Перепиши этот микросервис с FastAPI на Litestar, перетащи все эндпоинты и миграции". Claude Code взял 15 минут и 3.2 миллиона токенов (обошлось примерно в $24 через API). Результат — рабочий код, который я только слегка подправил. Без агентного планирования Sonnet 5 скорее всего бы зациклился или нагенерировал ерунды.
Тем, кто хочет попробовать локально, напомню: есть способы запустить Claude Code через vLLM, но для Sonnet 5 это неактуально — он требует специального API. Зато если у вас есть аккаунт AWS, можно подключиться через Claude Platform on AWS и не париться с ключами.
Предупреждение: история с неожиданным счётом в $6000 никуда не делась. Устанавливайте бюджетные лимиты в API и следите за логами. Sonnet 5 жрёт токены быстро.
Сравнение с альтернативами: кому проигрывает, а кого делает
Прямые конкуренты — GPT-4o и Gemini 2.0 Pro.
GPT-4o дешевле ($10/$60) и быстрее (120 токенов/сек), но его агентные способности — это надстройка через плагины, а не встроенный планировщик. На задаче "напиши парсер с обработкой ошибок и отправкой в Slack" Claude Sonnet 5 справился без единого лишнего вызова. GPT-4o сделал 3 тура лишних диалогов, прежде чем понял, что надо просто вызвать функцию. Разница в цене на этом сценарии — в пользу Sonnet, несмотря на дешёвый токен GPT.
Gemini 2.0 Pro — хорош для мультимодальных задач (видео, аудио), но с инструментами работает хуже. У меня он дважды терял контекст после второго вызова, и я получал "извините, я не могу выполнить это действие". Google явно догоняет, но пока не догнал.
Claude 4 Opus — всё ещё сильнее в логике (benchmarks MATH, GPQA), но стоит в 2.5 раза дороже, а агентность у него появилась только после параллельного запуска MCP. Если вам не нужна супер-логика, берите Sonnet 5.
Кому это реально нужно (а кому нет)
Sonnet 5 — не универсальная пуля. Вот типы задач, где он блещет:
- Автономные агенты — RPA, веб-скрапинг, ETL-пайплайны.
- Код-ревью и рефакторинг больших проектов (до 200K токенов контекста).
- Генерация тестов с запуском и фиксом.
- Чат-боты с интеграцией десятка сервисов (CRM, email, календарь).
А вот где он разочарует:
- Простой перевод текста — дешевле GPT-4o mini.
- Генерация изображений — для этого есть DALL-E 3 или Midjourney.
- Математические расчёты — Opus всё ещё точнее.
- Длительные сессии (более 50 шагов) — начинает терять фокус, нужен чекпоинт.
Итог: брать или не брать?
Если вы строите продуктовых AI-агентов — Sonnet 5 сейчас лучший вариант по соотношению цена/качество. OpenAI предлагает похожую функциональность только через Assistant API со всеми его костылями. Anthropic же дал готовый планировщик из коробки.
Советую начать с бесплатного лимита в Claude Pro, погнать через него пару реальных сценариев. Если упрётесь в лимит — подключайте API через ClaudeGate или берите Max-подписку. Но не забывайте выставлять алерты по бюджету — токены утекают незаметно.
P.S. Если вы всё ещё используете Claude Sonnet 4 в продакшене и не перешли — мигрируйте. Разница в агентной логике настолько большая, что переход окупится за неделю. У меня за месяц использования число ручных инцидентов упало на 40%. И я теперь меньше нервничаю.