LLM в трейдинге: языковые модели для прогнозирования рынка и анализа временных рядов

Текст — это просто числа, а рынок — это тоже текст

Представьте на секунду, что вся финансовая история — это просто очень длинный роман. Каждая свеча на графике — предложение. Каждый торговый день — глава. А внезапный крах рынка — сюжетный поворот, который все предвидели, но никто не ожидал. Кванты это поняли первыми.

Традиционные модели прогнозирования смотрят на рынок как на набор чисел. ARIMA, GARCH, регрессии — они ищут статистические закономерности. Но рынок — это не просто числа. Это психология, новости, слухи, паника, жадность. И вот здесь LLM показывают зубы.

Важно: кванты не используют ChatGPT для торговли. Они берут архитектуру трансформеров и обучают её на чистых финансовых данных. Это не вопрос-ответ, это прогнозирование последовательностей.

Почему трансформеры работают там, где пасуют статистики

Временные ряды финансовых данных — это кошмар для классических моделей. Нестационарность, шум, пропуски, выбросы. Статистик видит аномалию и пытается её исключить. Трансформер видит аномалию и запоминает контекст, в котором она возникает.

Механизм внимания (attention) в LLM — это идеальный инструмент для финансов. Модель не просто смотрит на последние 10 свечей. Она находит корреляции между событиями, которые разделены неделями или месяцами. Вспомните, как в статье "LLM понимают цель, но игнорируют её" мы обсуждали, как модели находят неочевидные связи. В финансах эти неочевидные связи и есть альфа.

💡

Кванты из Hudson River Trading не раскрывают детали, но по косвенным данным они используют модифицированные трансформеры с окнами внимания до 10 000 шагов. Это позволяет модели "видеть" сезонные эффекты, квартальные отчеты и даже влияние лунных циклов (да, это реально влияет на настроения трейдеров).

Авторегрессия на стероидах: как превратить цену в текст

Самый простой способ — квантование. Берете дневное изменение цены акции, делите на 100 бакетов. Каждому бакету присваиваете токен. Вуаля — у вас есть "алфавит" из 100 символов, и история цены превращается в последовательность символов. Теперь можно обучать языковую модель предсказывать следующий символ.

Но это детский сад. Настоящие кванты идут дальше:

Мультимодальность: Цена + объем + волатильность + новостной поток. Каждый модалитет — свой "язык". Модель учится переводить между ними.
Иерархические токенизаторы: Вместо простых бакетов — кластеризация по паттернам. Паттерн "галочка" — один токен, "голова и плечи" — другой.
Временные метки как позиционные эмбеддинги: В LLM позиция слова в предложении имеет значение. В финансах позиция свечи во времени тоже имеет значение. Но время в рынке нелинейно — пятничные послеобеды и открытия американской сессии требуют своих эмбеддингов.

И вот здесь возникает главная проблема: переобучение. Финансовые данные шумные, а паттерны нестабильны. Модель прекрасно запоминает прошлое, но не может предсказать будущее. Решение? Как в статье "Datasets streaming=True" — непрерывный поток данных и онлайн-обучение.

Статистический арбитраж: когда LLM ищет дисбалансы

Стат-арб — это поиск пар активов, которые исторически двигались вместе, но временно разошлись. Классические методы используют корреляции. LLM используют нечто большее.

Представьте две акции: Apple и Microsoft. Классическая модель видит, что их цены скоррелированы на 0.8. LLM видит, что:

Когда выходит новость о новом iPhone, Apple реагирует сразу, Microsoft — через 2 часа
В пятницу после 16:00 корреляция ослабевает на 30%
Если в один день выходят отчеты обеих компаний, дисбаланс длится ровно 47 минут

LLM находит эти временные задержки и контекстные зависимости, потому что работает с последовательностями, а не с моментальными снимками. Это как раз тот случай, когда "LLM решают задачи, недоступные человеку" — человеческий мозг не может отслеживать тысячи пар активов с миллисекундной точностью.

Подход	Точность	Латентность	Интерпретируемость
Классический стат-арб	65-75%	Высокая	Высокая
RNN/LSTM	70-80%	Средняя	Низкая
Трансформеры (LLM)	78-85%	Низкая	Очень низкая

Как НЕ надо использовать LLM в трейдинге: ошибки новичков

Самая большая ошибка — пытаться заставить LLM "объяснить" свои прогнозы. Черный ящик остается черным ящиком. Если ваша модель говорит "покупайте", а вы спрашиваете "почему?" — вы уже проиграли.

Ошибка 1: Обучение на короткой истории. Финансовые циклы бывают десятилетними. Ваши 5 лет данных — это один абзац в романе.
Ошибка 2: Игнорирование транзакционных издержек. Модель предсказывает движение цены, но не учитывает комиссии, проскальзывание, ликвидность.
Ошибка 3: Переобучение на новостях. LLM прекрасно учатся на заголовках финансовых новостей. Но связь между заголовком "Apple представила новый iPhone" и движением акций нелинейна и зависит от тысячи факторов.
Ошибка 4: Использование публичных LLM через API. Задержки в 200-300 мс убивают любую прибыль. Нужны локальные модели, развернутые в том же дата-центре, что и торговые сервера. Здесь пригодятся фреймворки для локального запуска LLM.

Архитектурные хитрости: что скрывают хедж-фонды

Кванты не используют стандартные GPT. Они строят гибридные архитектуры:

Двухголовые модели: Одна голова предсказывает направление движения, вторая — волатильность. Потому что нет смысла покупать, если вы ожидаете движение в 0.1%, а спред — 0.2%.

Мультимасштабные трансформеры: Один блок анализирует тиковые данные (миллисекунды), другой — дневные свечи, третий — недельные. Потом их выходы агрегируются. Это как в визуализации RAG в 3D — разные уровни абстракции дают разную перспективу.

Контекстные ротации: Вместо фиксированного контекстного окна — скользящее окно, которое расширяется в периоды высокой волатильности и сужается в спокойные часы. Потому что в кризис нужно смотреть дальше в прошлое, чтобы найти аналогии.

Практический совет: с чего начать эксперименты

Не пытайтесь построить модель для торговли на NASDAQ. Начните с:

Криптовалют. Данные доступны, волатильность высокая, паттерны повторяются чаще.
Используйте маленькие трансформеры типа TinyBERT. Они быстрее обучаются и меньше переобучаются.
Симулируйте транзакционные издержки с первого дня. Добавьте 0.1% комиссии к каждой сделке в бэктесте.
Разверните модель локально через Ollama или llama.cpp. API-вызовы к OpenAI — это для хобби, не для реальной торговли.

И помните главное: LLM в финансах — это не волшебная палочка. Это сложный, ресурсоемкий инструмент, который дает преимущество только тем, кто понимает его ограничения. Самые успешные кванты сегодня — это не те, у кого самая сложная модель, а те, у кого самая простая модель, которая работает в 100% случаев, а не в 85%.

Финансовые рынки — это игра с нулевой суммой. Ваша LLM должна быть лучше чьей-то LLM. И пока большинство трейдеров только начинают изучать трансформеры, у вас есть окно возможностей. Но оно закрывается быстрее, чем вы думаете.

LLMs в финансах: как кванты используют языковые модели для прогнозирования рынка