Автономный трейдинг на LLM: Finam Arena с GPT-5.2 и Claude 4.5 | AiManual
AiManual Logo Ai / Manual.
03 Мар 2026 Новости

Архитектура автономного трейдинг-агента на LLM: как работает Finam Arena с GPT-5.2 и Claude 4.5

Эксперимент Finam Arena: 6 топовых LLM для реального трейдинга. Как GPT-5.2 и Claude 4.5 управляют автономными агентами. Архитектура и результаты.

Когда нейросети играют на бирже

Представьте казино, где за столом сидят не люди, а шесть больших языковых моделей. Они читают новости, считают вероятности и ставят реальные деньги. Это не сценарий из 2030-го — это Finam Arena, уникальная площадка, которая с февраля 2026 года тестирует автономных трейдинг-агентов на живом рынке.

Эксперимент выглядит так: каждой модели дали по виртуальному счету с одинаковым стартовым капиталом, доступ к Finam Trade API и сказали «торгую». Никаких скриптов с жесткой логикой, только LLM в роли стратега. Победит тот, кто лучше всех прочитает рынок.

Важный нюанс: это не backtest на исторических данных. Агенты работают в режиме реального времени, но с виртуальными деньгами. Ошибка в логике — и счет уходит в минус. Или, что чаще, в ноль.

Из чего слепили агента

Архитектура каждого бота — это слоеный пирог из четырех ключевых модулей. Если убрать один, все рассыпается.

1 Market Intelligence Hub

Сюда стекаются все данные: стакан цен, история сделок, макростатистика, новостные ленты и даже посты из соцсетей (после фильтрации ботов и спама, конечно). Задача — превратить этот шум в структурированный контекст для LLM. Здесь же работает модуль преобразования графиков в текст, который до сих пор вызывает споры.

2 Reasoning Core (LLM)

Сердце системы. Модель получает сжатый дайджест от первого модуля и должна дать ответ: купить, продать или ждать. Именно здесь соревнуются GPT-5.2, Claude 4.5, GLM-5 и другие. Промпты — отдельное искусство. Их настраивали неделями, чтобы избежать странных коллективных поведенческих сбоев.

3 Math & Risk Engine

LLM хороша в рассуждениях, но отвратительна в арифметике. Этот модуль перепроверяет все расчеты модели: размер позиции, стоп-лосс, риск на сделку. Если LLM предлагает вложить 150% депозита, движок вежливо (но жестко) исправляет это на разумные 2-5%. Здесь же подключается финансовая онтология FIBO для проверки корректности терминов.

4 Execution Gateway

Финальный барьер. Преобразует решение в конкретный ордер через API брокера, следит за исполнением и логирует все действия для последующего разбора полетов. Именно здесь системы автоматического бенчмаркинга фиксируют каждую задержку и ошибку.

GPT-5.2 против Claude 4.5: кто кого?

Самый ожидаемый поединок. По состоянию на март 2026 года, это две самые обсуждаемые коммерческие модели для агентных задач.

Критерий GPT-5.2 (OpenAI) Claude 4.5 (Anthropic)
Стиль анализа Агрессивный, ищет короткие возможности. Часто торгует. Консервативный, ждет ясных сигналов. Меньше сделок.
Работа с новостями Быстро выделяет сентимент, но иногда слишком эмоционально. Вдумчивый контекстный анализ, меньше паникует на волатильности.
Главная слабость Склонен к переторговле. Может "накрутить" комиссии. Иногда упускает момент из-за излишней осторожности.

Интересно, что open-source модель GLM-5 показала себя неожиданно стабильно, заняв условное третье место. Она не делала рекордной прибыли, но и не сжигала депозит за день, в отличие от некоторых более "умных" коллег.

💡
Финансовый совет от ИИ — оксюморон 2026 года. Ни одна модель в Arena не смогла последовательно обыграть простую стратегию "купи и держи" на тестовом периоде в 30 дней. Прибыль была, но она коррелировала скорее с общим ростом рынка, чем с гениальностью алгоритмов.

Почему ваша попытка скопировать это провалится

Кажется, что нужно просто взять архитектуру CodeAct, подключить API OpenAI и запустить печатный станок. Реальность грубее.

  • Латентность убивает прибыль. Время от анализа данных до отправки ордера у лучших агентов — 700-900 мс. За это время хай-фреквенси трейдеры успеют сделать тысячи сделок.
  • Контекст — это дорого. Для качественного анализа нужен длинный контекст (128K+ токенов). Один такой запрос к GPT-5.2 стоит как обед в хорошем ресторане. А запросов нужно тысячи в день.
  • LLM не понимает паники. Модель может логично интерпретировать падение акций на 2%. Но она не чувствует того всепоглощающего страха, который охватывает рынок при обвале на 10%. Ее решения в кризис выглядят наивно-оптимистичными.

Эксперимент Finam Arena ясно показал: текущие LLM — это блестящие ассистенты для исследования, но не самостоятельные трейдеры. Их сила в объяснении уже случившегося, а не в предсказании будущего.

Что дальше? Прогноз от того, кто видел код

Через год-два автономные агенты не заменят фондовых менеджеров. Но они станут их обязательным инструментом, как когда-то Excel.

Узкие специализированные модели, обученные не на общих текстах, а на миллионах финансовых отчетов и транзакций, будут сканировать новости и выдавать дайджесты для человека. Самое сложное — решение о входе в сделку — пока останется за людьми. Потому что за этот риск и ответственность никто не хочет платить языковой модели.

Если все же хочется поэкспериментировать, начните не с трейдинга, а с автоматизации рутинной аналитики. Подключите API GPT-5.2 к таблице с котировками и попросите ее искать аномалии. Это безопаснее и сразу покажет, где ИИ действительно полезен, а где — просто дорогая игрушка.

А Finam Arena продолжит работать. Следующий этап — мультиагентные системы, где несколько LLM будут спорить друг с другом перед принятием решения. Как в том самом эксперименте с управлением контрактами, только ставки выше. Гораздо выше.

Подписаться на канал