Legacy-код, который никто не трогал 30 лет, вдруг понадобился

Представьте: где-то в подвале банка работает система на COBOL, написанная когда ваш отец был студентом. Или в научной лаборатории - десятитысячные строки FORTRAN, которые считают что-то важное, но уже никто не помнит, что именно. Мигрировать? В теории просто - дайте это нейросети. На практике - даже Claude 3.7 со 128K контекста не проглотит такой монолит.

Вот тут и появляется GestaltSyntax. Не очередной транскомпилятор, а инструмент, который сначала 'пережёвывает' код, уменьшая его в 12 раз, а потом кормит нейросети. Репозиторий на GitHub живой, обновлялся в феврале 2026.

Как это работает? Сначала сжать, потом спросить

GestaltSyntax не переводит код сам. Его задача - подготовить код так, чтобы современные LLM смогли с ним работать. Алгоритм в трёх шагах:

1 Семантический анализ и кластеризация

Инструмент проходит по коду, находит повторяющиеся паттерны, однотипные операции, избыточные проверки. Вместо 100 похожих циклов - оставляет один с комментарием 'повторить для всех массивов'. Это не просто удаление пробелов - это понимание структуры.

2 Абстракция и переименование

COBOL любит переменные вроде WS-INPUT-DATA-AREA-01. GestaltSyntax заменяет их на human-readable имена, сохраняя mapping. FORTRAN с его GOTO и COMMON blocks превращается в структурированное представление.

3 Интеграция с LLM через единый интерфейс

Сжатый код подаётся в выбранную модель - через OpenAI API, локально через Ollama (кстати, про сборку локального ассистента у нас есть отдельная статья), или даже в llama.cpp с грамматиками. Модель видит логику, а не шум.

💡

На март 2026 инструмент тестировали с GPT-4.5 Turbo (128K контекст) и Claude 3.7 Sonnet. Сжатый код занимает 8-12% от оригинала, что влезает даже в стандартные 32K окон.

Чем не угодили старые методы?

Раньше были два пути: писать транслятор (годы работы, миллионы долларов) или кормить LLM кусками (теряется контекст, результат нерабочий). GestaltSyntax - третий путь.

Метод	Скорость	Качество перевода	Главная проблема
Ручной рефакторинг	Месяцы/годы	Идеально	Дорого, нужны эксперты
Традиционные трансляторы	Недели (настройка)	Средне, нужна доработка	Ломается на сложном коде
LLM без сжатия	Минуты	Низкое (потеря контекста)	Контекстное окно маленькое
GestaltSyntax + LLM	Часы	Высокое	Требует проверки (но меньше)

Ключевое отличие - инструмент не пытается понять бизнес-логику. Он только готовит код для того, кто поймёт (LLM). Это как перевести древнюю рукопись с сокращениями на современный язык перед тем, как дать историку.

Из коробки: что умеет последняя версия (2026)

Поддержка FORTRAN 77 и COBOL-85 - самых частых 'кандидатов' на миграцию
Плагины для VS Code и JetBrains IDEs - не надо прыгать в терминал
Конфигурационные пресеты для разных типов кода: научные вычисления, транзакционные системы
Экспорт в форматы, понятные LLM: markdown с аннотациями, JSON с метаданными
Обратное преобразование - если AI нагенерировала ерунду, можно вернуться к исходнику

Важный нюанс: инструмент открытый, но требует Python 3.11+. И да, он сам написан на Python - ирония в том, что мигрирует старый код на тот же язык, на котором написан.

Кому это реально нужно? (Спойлер: не всем)

Если у вас 500 строк FORTRAN - откройте ChatGPT и скопируйте кусками. GestaltSyntax для случаев, когда 'кусками' не получится.

Идеальные кандидаты:

Финансовые институты с COBOL-системами 80-х годов. Один банк в Европе с помощью GestaltSyntax перевёл модуль обработки платежей за 3 недели вместо запланированных 6 месяцев.
Научные проекты с legacy-кодом для моделирования. Физики, которые ненавидят Python, но вынуждены мигрировать - потому что студенты уже FORTRAN не учат.
Страховые компании с системами на мейнфреймах. Там даже документации нет - только код.

Не тратьте время, если:

Код уже частично на современном стеке - проще дописать.
Нет эксперта, который проверит результат. AI может сделать логичную, но неверную вещь.
Система должна работать с точностью до бита (например, аэрокосмические расчёты). Здесь лучше ручной перевод.

С чем сочетать? Экосистема для миграции

GestaltSyntax - не волшебная палочка. Это первый этап конвейера. Дальше нужны:

Тесты - оригинальные, если есть. Запустить на старом и новом коде, сравнить результаты.
Статический анализ переведённого Python. Инструменты вроде PythoC могут помочь найти узкие места.
Документация - AI может сгенерировать комментарии, но проверять надо.

Интересно, что подход GestaltSyntax похож на то, как Cursor индексирует код - тоже семантическое сжатие, но для других целей. Или на Polyglot-r2 с его суффиксными преобразованиями.

Что будет дальше? (Спойлер: больше автоматизации)

Разработчики GestaltSyntax анонсировали на 2026 год интеграцию с агентскими системами. Представьте: инструмент сжимает код, передаёт агенту на основе Step 3.5 Flash, тот переводит, запускает тесты, исправляет ошибки - и всё без человека. Страшно? Зато эффективно.

💡

Мой совет: если у вас есть legacy-код, который ' когда-нибудь надо будет переписать ' - попробуйте GestaltSyntax сейчас. Через год AI станут умнее, но код не станет моложе. А инструмент уже сегодня даёт 80% результата за 20% усилий.

Кстати, о производительности: переведённый Python код часто тормозит. Но это уже другая история - про AOT-компиляцию и оптимизацию. Главное - сначала получить работающий Python, а потом уже его ускорять.

Подписаться на канал

GestaltSyntax - семантический пресс для старого кода: как впихнуть FORTRAN в контекстное окно AI