Что такое Attention Algebra?

Это прототип с открытым кодом, использующий формальную грамматику для перевода естественного языка в спектрограммы. В основе — алгебраические операции над токенами с учётом Jungian типов.

С какими языками работает?

На данный момент (20.06.2026) грамматика настроена для английского и русского. Для языков с эргативным строем тесты ещё в плане.

Где попробовать live demo?

Демо доступно на сайте проекта — можно вставить любой текст и сразу получить спектрограмму.

Attention Algebra: перевод текста в спектрограммы через формальную грамматику

Что, если бы у текста был звуковой след?

Когда в 2025-м все кинулись мерять семантику гигапараметрами и эмбеддингами размером с Ктулху, парочка безумцев решила пойти другим путём. Они задались вопросом: почему мы до сих пор не видим структуру языка так же, как видим музыку? Никаких вероятностных распределений — только чёткие правила, ритм и тональность. Так родился Attention Algebra — прототип с открытым кодом, который превращает предложения в спектрограммы. И да, это не метафора. Буквально — частота, амплитуда, фаза.

🔊

На сайте проекта есть live demo: вбиваете текст — получаете спектр. Забудьте про 'семантическое ядро' — теперь это 'семантический аккорд'.

Математический гомункул внутри

Главная фишка Attention Algebra — формальная грамматика, отображающая синтаксические и pragmatic-роли в параметры звуковой волны. В основе лежит модифицированная модель многоцелевой динамики Юнга: каждый токен получает 'направление' (как интроверт/экстраверт) и 'вес' (как мышление/чувство). Дальше — чистая алгебра: сложение, умножение, свёртка. На выходе — спектрограмма, где частота соответствует грамматической сложности, а амплитуда — эмоциональной насыщенности.

В теории это работает так: фраза 'я сломал твой любимый стул' даёт резкие высокие пики на 'сломал' и 'твой' (агрессия + possessive). А 'на стуле лежит мягкое одеяло' — плавная низкая кривая с равномерной амплитудой. На практике же авторы честно признаются: пока корреляция с реальной семантикой не идеальна, но как инструмент для визуализации формальных структур — это бомба.

Сравнение: с чем есть?

Инструмент	Что делает	Интерпретируемость	Зависимость от данных
TF-IDF / BOW	Частотный мешок слов	Высокая, но грубая	Нужен корпус
Word2Vec / BERT	Эмбеддинги в n-мерном пространстве	Низкая (чёрный ящик)	Огромные датасеты
Attention Algebra	Спектрограмма через формальную грамматику	Полная (каждый пик — конкретное правило)	Не нужны — только грамматика

Звучит как рай для перфекциониста? Есть нюанс. В отличие от GestaltSyntax, который пытался впихнуть FORTRAN в контекстное окно, Attention Algebra не сжимает старый код, а создаёт новое представление. И если SAE Steering сломал JSON, потому что вмешивался в представления модели, то здесь вы вмешиваетесь напрямую в грамматику — это безопаснее и строже.

Как это выглядит на деле: спектрограмма vs. LLM-анализ

Берём два предложения: 'Кот сидит на коврике' и 'Коврик сидит на коте'. LLM (типа GPT-4o, Claude 3.5) скажут, что в первом случае субъект — кот, во втором — коврик. Это мы и так знаем. Attention Algebra же покажет, что грамматическая структура обоих предложений идентична (рефлексивный паттерн), но спектры различаются на позиции субъект-объект — меняются фазы. Это даёт исследователю возможность видеть синтаксические инверсии, которые не всегда очевидны.

⚠️

На текущий момент (20.06.2026) грамматика хорошо работает для английского и русского (с морфологическими модификациями). Для языков с эргативным строем (например, баскского) пока тесты только в плане — следите за репозиторием.

Кто не пройдёт мимо?

Исследователи семантики — получите инструмент для визуализации гипотез о том, как грамматика отражает смысл. Может стать отличной заменой утомительным t-SNE графикам.
Инженеры NLP — если вы устали от чёрных ящиков и хотите встроить интерпретируемый слой в пайплайн (например, для контроля качества нормализации текста перед TTS).
Лингвисты-компьютерщики — подозреваю, что сразу захотят расширить грамматику для жестовых языков или тональных языков (китайский, вьетнамский). Ребята, код открыт, дерзайте.
AI-евангелисты — хотите показать, что не только нейросети могут удивлять? Спектрограмма текста — отличный wow-эффект на конференциях.

Кстати, если вам кажется, что всё это напоминает гибридную архитектуру Falcon-H1-Arabic — нет, тут другой принцип. Falcon пытался объединить рекуррентность и трансформеры, а Attention Algebra вообще не использует нейросети. Это как сравнивать велосипед с мотором и механический метроном. Оба делают что-то полезное, но по-разному.

Только не называйте это 'ещё одним инструментом визуализации'

Авторы не скрывают, что проект экспериментальный. Они даже не называют его законченным продуктом — скорее, манифестом о том, что формальные методы не умерли, а просто ждали своего часа. Код на GitHub с MIT-лицензией, live demo на Vercel, математическая модель описана в PDF на 14 страницах. Всё, чтобы любой мог зафоркать и доработать.

И последнее: не ищите в этом инструменте утилитарной пользы для продакшена прямо сейчас. Это как смотреть на прототип квантового компьютера — он смешной, шумный, но именно он покажет дорогу. Если вам нужно сейчас быстро извлечь смысл из текста — берите LLM. Если хотите понять, почему смысл таков — берите Attention Algebra. И да, попробуйте загрузить в демо свой самый сумбурный пост из соцсетей — уверен, та частотная психоделия развеселит вас больше любой аналитики.

Подписаться на канал

Attention Algebra: когда грамматика текста превращается в музыку сфер