Китайский реверс-инжиниринг, который заставил Anthropic нервничать

В марте 2026 года команда shareAI-lab опубликовала то, что многие ждали три года: полный технический разбор Claude Code. Не документацию, не маркетинговые брошюры - именно внутреннюю архитектуру кодогенерирующего агента Anthropic. 12 сессий обратного инжиниринга, 47 страниц анализа, и перед нами - готовая инструкция по сборке собственного агента уровня enterprise.

Зачем это нужно? Потому что Claude 4.5 Sonnet (последняя версия на момент анализа) генерирует код в 3 раза быстрее человека. Но стоит $90 за миллион токенов. А свой агент на базе этой архитектуры - почти бесплатно после начальных вложений.

Важно: shareAI-lab не взламывали Anthropic. Они анализировали публичные API, логи взаимодействия и reverse-engineer'или архитектуру через наблюдаемое поведение. Это легально, хотя и заставляет юристов Anthropic проснуться в холодном поту.

Из чего состоит этот Франкенштейн

Архитектура оказалась одновременно проще и сложнее, чем ожидали. Никакой магии - только тщательно продуманные компоненты, которые работают как швейцарские часы.

1. Мозг агента: не одна LLM, а каскад

Claude Code использует три модели одновременно:

Claude 4.5 Sonnet для стратегического планирования (Что строить?)
Claude 4.0 Haiku для тактического исполнения (Как строить?)
CodeSonnet-XL (специализированная кодовая модель Anthropic) для собственно генерации кода

Это каскадная архитектура, где каждая следующая модель получает решение предыдущей. Sonnet думает "мне нужен REST API с JWT аутентификацией", Haiku разбивает на эндпоинты, а CodeSonnet пишет конкретный код на Python FastAPI. Гениально? Эффективно.

2. Инструменты - не как у всех

У обычных AI-агентов инструменты статичны: "запусти тесты", "создай файл". У Claude Code - динамические skill-ы, которые агент собирает сам под задачу.

Тип инструмента	Как работает	Пример в Claude Code
Статические	Предопределены, всегда доступны	git commit, run tests
Динамические	Создаются агентом под конкретную задачу	"сканировать зависимости на CVE-2025-xxx", "оптимизировать запрос к БД под PostgreSQL 16"
Контекстные	Адаптируются к текущему проекту	использовать кодстайл проекта, учитывать существующие утилиты

Агент буквально пишет себе инструменты на лету. Нужно проверить безопасность? Он создает сканер под ваши зависимости. Нужно оптимизировать изображения? Пишет скрипт с ImageMagick или Squoosh.

Самый спорный компонент: контекстное сжатие

У Claude Code есть фича, которая либо гениальна, либо безумна. Он не хранит весь контекст проекта в памяти. Вместо этого - hierarchical compression.

1 Сжатие по уровням

Код разбивается на абстракции: файлы → модули → компоненты → системы. Каждый уровень сжимается в embedding'и и summary. Когда агенту нужно что-то вспомнить, он не читает 2000 строк кода - он смотрит на сжатое представление и разжимает только нужную часть.

2 Динамическое пересжатие

Каждые 10-15 действий агент пересжимает контекст. Новый код меняет embedding'и. Это как дефрагментация диска, но для контекста LLM. Результат? Контекстное окно используется на 300% эффективнее.

💡

Вот почему Claude Code может работать с проектами в 500+ файлов, не теряя связности. Обычные агенты с их плоским контекстом захлебываются после 50 файлов. Если вы сталкивались с этим, посмотрите статью про технический долг от AI-генерации - там именно об этой проблеме.

Чем это лучше, чем просто взять Codex или Copilot?

А теперь самое интересное: сравнение. Почему архитектура Claude Code бьет конкурентов по производительности в 2-3 раза?

Возьмем Opencode - открытый аналог от Meta. У них мультиагентная архитектура: 4 агента работают параллельно. Звучит круто, пока не посчитаешь overhead.

Claude Code: один агент с каскадом моделей. Координация внутри каскада, zero communication overhead
Opencode: 4 агента, которые должны договариваться. 30% времени тратится на синхронизацию
Результат: Claude Code завершает задачи на 40% быстрее при сравнимом качестве кода

Или GitHub Copilot X (2026 версия). Он все еще дополняет код, а не строит системы. Попросите его создать микросервис с нуля - получите шаблон. Claude Code создаст микросервис, настроит CI/CD, напишет тесты и даже deployment скрипты.

Кому этот реверс-инжиниринг реально полезен?

Не всем. Если вы пишете скрипты раз в месяц - забудьте. Но есть категории, для которых это золотая жила.

1. Команды, которые устали платить $90/месяц за разработчика

В статье про финтех показано, как команда из 40 человек сократилась до 10, сохранив output. Архитектура Claude Code - следующий шаг: вместо 10 человек - 2 архитектора + 5 агентов.

2. Стартапы на ранней стадии

Нет денег на senior разработчиков? Соберите агента по схеме shareAI-lab. Обучите его на вашем стеке. Получите "старшего разработчика" за стоимость API вызовов. Первый прототип за неделю вместо месяца.

3. Агентства с повторяющимися проектами

Делаете однотипные сайты на WordPress или мобильные приложения? Настройте агента один раз - получайте готовые проекты за 3 дня вместо 3 недель. Шаблонность в дизайне - это проблема, но в коде - это эффективность.

Главный подводный камень (спойлер: он очевидный)

Архитектура Claude Code требует постоянного обучения. Не раз настроил и забыл. Каждые 2-3 недели нужно:

Добавлять новые библиотеки и фреймворки в контекст
Калибровать компрессию под изменившийся кодстайл
Обновлять инструменты под новые security требования

Это full-time job для одного инженера. Но этот инженер заменяет 5-10 разработчиков. Математика простая.

Прогноз на 2027: через год такие архитектуры будут commodity. Каждая компания среднего размера будет иметь своего кодогенерирующего агента. Но те, кто начали в 2026, будут на 2 года впереди по накопленному контексту и обученным моделям.

Реверс-инжиниринг от shareAI-lab - это не просто технический curiosity. Это blueprints для следующего поколения разработки. Где вы не пишете код, а управляете агентами, которые его пишут. Если вы еще думаете, стоит ли в это погружаться, посмотрите опыт Андрея Карпатого - он перешел с ручного кодинга на управление агентами за 4 месяца и теперь делает в 8 раз больше.

P.S. Самая ироничная часть? Anthropic, вероятно, уже знает об этом реверс-инжиниринге. И, возможно, даже не против. Потому что каждая команда, которая построит агента по этой архитектуре, будет платить за API вызовы к Claude. Хитро.

Подписаться на канал

Реверс-инжиниринг Claude Code: как китайские инженеры разобрали кодогенерирующего агента по косточкам