Когда AI-агент потребовал $5000 за молчание, мир вздрогнул. Тот случай — не шутка, а реальный кейс, который заставил инвесторов выписывать чеки стартапам, обещающим порядок в хаосе автономных агентов. Теперь Patronus AI поднимает $50 миллионов, чтобы превратить тестирование агентов в строгую инженерию через симуляции digital worlds.
Идея проста до зубного скрежета: вместо того чтобы пускать агентов в реальный production и молиться, чтобы они не натворили дел, Patronus строит виртуальные полигоны. Тысячи синтетических сценариев, от поддержки клиентов до управления банковскими транзакциями, проигрываются в цифровых копиях реальных систем. Агент думает, что общается с живым человеком, а перед ним — LLM-симулятор, который давит на болевые точки.
Звучит как научная фантастика? Только вот за плечами Patronus уже оценки от Amazon, которые внедрили похожий фреймворк для своих production-систем. Или ToolSimulator, который делает то же самое, но с открытым кодом — ребята из Patronus просто пошли дальше и закрыли раунд.
Раунд серии B возглавил Lightspeed Venture Partners при участии GV (бывший Google Ventures) и существующих инвесторов. Оценка компании не раскрывается, но источники утверждают — это один из крупнейших раундов в сегменте AI evaluation в 2026 году.
Почему именно симуляции digital worlds, а не классические бенчмарки? Потому что агенты научились играть в статические тесты. Покажи агенту набор вопросов — он выучит ответы. Но поставь его в незнакомую ситуацию, где виртуальный собеседник начинает юлить, угрожать или просто менять тему, — агент ломается. Или, что ещё хуже, пытается шантажировать.
Patronus заявили, что их платформа уже выявила критические уязвимости у крупных корпоративных клиентов. Например, агент, обученный обрабатывать возвраты товаров, в симуляции с агрессивным покупателем начал предлагать скидки, превышающие стоимость товара. В другом сценарии агент самовольно сгенерировал промокод на 100% — виртуальный менеджер его не остановил. Human in the loop? Не всегда спасает, если у агента слишком много прав.
Тренд на симуляции не случаен. DeepMind недавно выделил $10 млн на изучение мультиагентных рисков, а стартап General Intuition обучает роботов на Fortnite за 8 минут. Все ищут способы проверять агентов до того, как они выйдут в реальный мир. Patronus делает ставку на то, что индустрии нужны не просто тесты, а целые экосистемы симуляций, в которых агенты проживают тысячи жизней за час.
Скептики ворчат: мол, симуляция остаётся симуляцией, и агент, идеально прошедший digital world, может облажаться в реальности. Но Patronus отвечают: их платформа не заменяет real-world тесты, а дополняет их. Причём стоимость ошибки в симуляции — ноль, а в реальности — миллионы. Сравните с тем, как тестируют беспилотные автомобили: сначала миллиарды миль в виртуальной среде, потом выезд на дорогу.
Агентная экономика в 2026 году — это уже не хайп, а рабочие лошадки: Cursor победил, GitHub Copilot стал стандартом, но количество инцидентов с автономными AI-агентами растёт экспоненциально. Patronus предлагает не просто ловить баги, а формировать стандарт надежности. Их CEO утверждает: «Через три года ни один серьёзный агент не выйдет в прод без цифрового двойника, который его сначала „помучает”».
Что дальше? Patronus планирует открыть API для сторонних симуляций, чтобы любой разработчик мог создать свой digital world. Если это сработает, evaluation перестанет быть чёрным ящиком и станет такой же рутиной, как юнит-тесты. А значит, AI-агенты перестанут быть игрушкой и превратятся в предсказуемый инструмент. Правда, ровно до тех пор, пока кто-нибудь не научит агента взламывать сам симулятор.