Текст — это просто числа, а рынок — это тоже текст
Представьте на секунду, что вся финансовая история — это просто очень длинный роман. Каждая свеча на графике — предложение. Каждый торговый день — глава. А внезапный крах рынка — сюжетный поворот, который все предвидели, но никто не ожидал. Кванты это поняли первыми.
Традиционные модели прогнозирования смотрят на рынок как на набор чисел. ARIMA, GARCH, регрессии — они ищут статистические закономерности. Но рынок — это не просто числа. Это психология, новости, слухи, паника, жадность. И вот здесь LLM показывают зубы.
Важно: кванты не используют ChatGPT для торговли. Они берут архитектуру трансформеров и обучают её на чистых финансовых данных. Это не вопрос-ответ, это прогнозирование последовательностей.
Почему трансформеры работают там, где пасуют статистики
Временные ряды финансовых данных — это кошмар для классических моделей. Нестационарность, шум, пропуски, выбросы. Статистик видит аномалию и пытается её исключить. Трансформер видит аномалию и запоминает контекст, в котором она возникает.
Механизм внимания (attention) в LLM — это идеальный инструмент для финансов. Модель не просто смотрит на последние 10 свечей. Она находит корреляции между событиями, которые разделены неделями или месяцами. Вспомните, как в статье "LLM понимают цель, но игнорируют её" мы обсуждали, как модели находят неочевидные связи. В финансах эти неочевидные связи и есть альфа.
Авторегрессия на стероидах: как превратить цену в текст
Самый простой способ — квантование. Берете дневное изменение цены акции, делите на 100 бакетов. Каждому бакету присваиваете токен. Вуаля — у вас есть "алфавит" из 100 символов, и история цены превращается в последовательность символов. Теперь можно обучать языковую модель предсказывать следующий символ.
Но это детский сад. Настоящие кванты идут дальше:
- Мультимодальность: Цена + объем + волатильность + новостной поток. Каждый модалитет — свой "язык". Модель учится переводить между ними.
- Иерархические токенизаторы: Вместо простых бакетов — кластеризация по паттернам. Паттерн "галочка" — один токен, "голова и плечи" — другой.
- Временные метки как позиционные эмбеддинги: В LLM позиция слова в предложении имеет значение. В финансах позиция свечи во времени тоже имеет значение. Но время в рынке нелинейно — пятничные послеобеды и открытия американской сессии требуют своих эмбеддингов.
И вот здесь возникает главная проблема: переобучение. Финансовые данные шумные, а паттерны нестабильны. Модель прекрасно запоминает прошлое, но не может предсказать будущее. Решение? Как в статье "Datasets streaming=True" — непрерывный поток данных и онлайн-обучение.
Статистический арбитраж: когда LLM ищет дисбалансы
Стат-арб — это поиск пар активов, которые исторически двигались вместе, но временно разошлись. Классические методы используют корреляции. LLM используют нечто большее.
Представьте две акции: Apple и Microsoft. Классическая модель видит, что их цены скоррелированы на 0.8. LLM видит, что:
- Когда выходит новость о новом iPhone, Apple реагирует сразу, Microsoft — через 2 часа
- В пятницу после 16:00 корреляция ослабевает на 30%
- Если в один день выходят отчеты обеих компаний, дисбаланс длится ровно 47 минут
LLM находит эти временные задержки и контекстные зависимости, потому что работает с последовательностями, а не с моментальными снимками. Это как раз тот случай, когда "LLM решают задачи, недоступные человеку" — человеческий мозг не может отслеживать тысячи пар активов с миллисекундной точностью.
| Подход | Точность | Латентность | Интерпретируемость |
|---|---|---|---|
| Классический стат-арб | 65-75% | Высокая | Высокая |
| RNN/LSTM | 70-80% | Средняя | Низкая |
| Трансформеры (LLM) | 78-85% | Низкая | Очень низкая |
Как НЕ надо использовать LLM в трейдинге: ошибки новичков
Самая большая ошибка — пытаться заставить LLM "объяснить" свои прогнозы. Черный ящик остается черным ящиком. Если ваша модель говорит "покупайте", а вы спрашиваете "почему?" — вы уже проиграли.
- Ошибка 1: Обучение на короткой истории. Финансовые циклы бывают десятилетними. Ваши 5 лет данных — это один абзац в романе.
- Ошибка 2: Игнорирование транзакционных издержек. Модель предсказывает движение цены, но не учитывает комиссии, проскальзывание, ликвидность.
- Ошибка 3: Переобучение на новостях. LLM прекрасно учатся на заголовках финансовых новостей. Но связь между заголовком "Apple представила новый iPhone" и движением акций нелинейна и зависит от тысячи факторов.
- Ошибка 4: Использование публичных LLM через API. Задержки в 200-300 мс убивают любую прибыль. Нужны локальные модели, развернутые в том же дата-центре, что и торговые сервера. Здесь пригодятся фреймворки для локального запуска LLM.
Архитектурные хитрости: что скрывают хедж-фонды
Кванты не используют стандартные GPT. Они строят гибридные архитектуры:
Двухголовые модели: Одна голова предсказывает направление движения, вторая — волатильность. Потому что нет смысла покупать, если вы ожидаете движение в 0.1%, а спред — 0.2%.
Мультимасштабные трансформеры: Один блок анализирует тиковые данные (миллисекунды), другой — дневные свечи, третий — недельные. Потом их выходы агрегируются. Это как в визуализации RAG в 3D — разные уровни абстракции дают разную перспективу.
Контекстные ротации: Вместо фиксированного контекстного окна — скользящее окно, которое расширяется в периоды высокой волатильности и сужается в спокойные часы. Потому что в кризис нужно смотреть дальше в прошлое, чтобы найти аналогии.
Практический совет: с чего начать эксперименты
Не пытайтесь построить модель для торговли на NASDAQ. Начните с:
- Криптовалют. Данные доступны, волатильность высокая, паттерны повторяются чаще.
- Используйте маленькие трансформеры типа TinyBERT. Они быстрее обучаются и меньше переобучаются.
- Симулируйте транзакционные издержки с первого дня. Добавьте 0.1% комиссии к каждой сделке в бэктесте.
- Разверните модель локально через Ollama или llama.cpp. API-вызовы к OpenAI — это для хобби, не для реальной торговли.
И помните главное: LLM в финансах — это не волшебная палочка. Это сложный, ресурсоемкий инструмент, который дает преимущество только тем, кто понимает его ограничения. Самые успешные кванты сегодня — это не те, у кого самая сложная модель, а те, у кого самая простая модель, которая работает в 100% случаев, а не в 85%.
Финансовые рынки — это игра с нулевой суммой. Ваша LLM должна быть лучше чьей-то LLM. И пока большинство трейдеров только начинают изучать трансформеры, у вас есть окно возможностей. Но оно закрывается быстрее, чем вы думаете.