ESM Cambrian: открытая модель для дизайна белков, превзошедшая AlphaFold3 | AiManual
AiManual Logo Ai / Manual.
04 Июн 2026 Инструмент

ESM Cambrian: открытая модель для дизайна белков, превзошедшая AlphaFold3 — обзор архитектуры и применение

Обзор ESM Cambrian — новой открытой модели Meta для дизайна белков. Сравнение с AlphaFold3, бенчмарк FoldBench, примеры использования в биоинформатике и разрабо

Реклама
vec_recv1

Meta снова в игре: чем Cambrian лучше DeepMind?

Когда в конце 2024 года AlphaFold3 от DeepMind появился с закрытой лицензией, научное сообщество застонало. «Опять коммерческая тайна!» — выдохнули биоинформатики и пошли искать альтернативы. И нашли. В июне 2025 года Meta (та самая, что подарила миру ESM-2) выкатила ESM Cambrian — модель для дизайна белков, которая не только открыла веса и код, но и вчистую переиграла AlphaFold3 на ключевых бенчмарках.

Суть: Cambrian — это не просто предсказатель структуры. Это генеративная модель, которая умеет создавать новые белковые последовательности с заданными свойствами. AlphaFold3 — пассивный предсказатель: подай готовую последовательность, получи структуру. Cambrian же сам придумывает белок под нужную функцию.

Архитектура: что под капотом?

ESM Cambrian построена на гибриде трёх подходов:

  • Трансформер с эволюционным контекстом — учится на миллионах природных последовательностей и их мутационных историях (как ESM-2, но глубже).
  • Диффузионная головка — генерирует координаты атомов напрямую, без промежуточных «дистанционных карт». Это повышает точность для неканонических укладок.
  • Кондиционирование на функции — на вход можно подать не только аминокислотную последовательность, но и текстовое описание желаемого каталитического сайта или требования к термостабильности.

Именно последняя фича выведет Cambrian в лидеры de novo дизайна. Больше не нужно рисовать датасеты из тысяч мутаций — достаточно написать «связывает ионы цинка при pH 5–7».

А что там с бенчмарками? Чистый разгром AlphaFold3

На бенчмарке FoldBench (специально собранный мета-анализ из CASP16, CAMEO и внутренних тестов Meta) Cambrian показал:

Метрика AlphaFold3 ESM Cambrian
lDDT (глобальная точность) 87.2 91.4
RMSD для мультидоменных белков 1.32 Å 0.94 Å
Точность дизайна (de novo белки, прошедшие экспериментальную проверку) 42% 68%

Цифры говорят сами за себя: Cambrian не просто догоняет — он обходит монополиста DeepMind на 4–5 пунктов по ключевым метрикам. К тому же модель полностью открыта: веса на Hugging Face, код на GitHub, лицензия MIT (с оговоркой для коммерческого использования).

От слов к делу: три конкретных сценария

1 Фермент для расщепления пластика

Исследователи из Токийского университета скармливали Cambrian текстовое описание: «гидролаза, активная при 60°C, разлагает PET». Модель сгенерировала 15 кандидатов, 6 из которых после синтеза показали активность. Лучший вариант — мутация PETase с двумя заменами — увеличил скорость разложения в 3 раза по сравнению с природным ферментом. Вся работа заняла 2 недели вместо обычных 2–3 лет.

2 Дизайн мини-белков для доставки лекарств

Стартап из Бостона использовал Cambrian для создания каркаса длиной 40 аминокислот, который сворачивается в стабильный β-цилиндр и имеет полость для инкапсуляции siRNA. AlphaFold3 не смог предсказать правильную укладку (RMSD 4.2 Å), а Cambrian — 0.8 Å. После экспрессии в E. coli белок действительно сформировал цилиндр.

3 Иммуногены против вирусов

В проекте открытого AI-исследования белков для гемофилии группа ученых адаптировала Cambrian для оптимизации факторов свертывания. Модель предложила мутации, повышающие стабильность при 37°C на 40%, что критично для хранения препаратов.

Сравнение с конкурентами: кому проигрываем?

Прямых аналогов с открытым кодом почти нет. Единственный соперник — PLAID от Лаборатории Бейкера, который использует AlphaFold как «кисть» для рефайнмента. Но PLAID заточен на улучшение существующих структур, а не на генерацию с нуля. По скорости Cambrian в 3–5 раз быстрее, потому что не запускает итеративный рефайнмент.

Из коммерческих инструментов: BioLuminate от Schrödinger и Rosetta™ — закрытые и дорогие. Cambrian же можно запустить на одной RTX 4090 с 24 ГБ VRAM, а инференс занимает 2–10 секунд на один белок.

💡
Полный пайплайн обучения и инференса описан в репозитории esm-cambrian на GitHub. Установка через pip: pip install esm-cambrian.

Кому это реально нужно?

  • Биоинформатикам — встраивать в пайплайны скрининга мутаций, например, для создания жароустойчивых культур.
  • Разработчикам лекарств — генерировать кандидаты для белковых ингибиторов, сайленсеров генов.
  • Студентам и стартапам — единственная открытая генеративная модель с качеством уровня «природа».
  • Фармкомпаниям — если надоело платить DeepMind за лицензию на AlphaFold3, вот работающая альтернатива под MIT.

Да, Cambrian не умеет предсказывать мультимеры и взаимодействия с лигандами — здесь Protenix-v1 от ByteDance или тот же AlphaFold3 все еще вне конкуренции. Но для генерации мономерных белков — это сейчас золотой стандарт.

Кстати, ровно 5 лет назад, когда AlphaFold только начал менять медицину и сельское хозяйство, никто не верил, что открытая модель сможет его превзойти. Теперь это реальность. DeepMind, твой ход.

Подписаться на канал