Legacy-код, который никто не трогал 30 лет, вдруг понадобился
Представьте: где-то в подвале банка работает система на COBOL, написанная когда ваш отец был студентом. Или в научной лаборатории - десятитысячные строки FORTRAN, которые считают что-то важное, но уже никто не помнит, что именно. Мигрировать? В теории просто - дайте это нейросети. На практике - даже Claude 3.7 со 128K контекста не проглотит такой монолит.
Вот тут и появляется GestaltSyntax. Не очередной транскомпилятор, а инструмент, который сначала 'пережёвывает' код, уменьшая его в 12 раз, а потом кормит нейросети. Репозиторий на GitHub живой, обновлялся в феврале 2026.
Как это работает? Сначала сжать, потом спросить
GestaltSyntax не переводит код сам. Его задача - подготовить код так, чтобы современные LLM смогли с ним работать. Алгоритм в трёх шагах:
1 Семантический анализ и кластеризация
Инструмент проходит по коду, находит повторяющиеся паттерны, однотипные операции, избыточные проверки. Вместо 100 похожих циклов - оставляет один с комментарием 'повторить для всех массивов'. Это не просто удаление пробелов - это понимание структуры.
2 Абстракция и переименование
COBOL любит переменные вроде WS-INPUT-DATA-AREA-01. GestaltSyntax заменяет их на human-readable имена, сохраняя mapping. FORTRAN с его GOTO и COMMON blocks превращается в структурированное представление.
3 Интеграция с LLM через единый интерфейс
Сжатый код подаётся в выбранную модель - через OpenAI API, локально через Ollama (кстати, про сборку локального ассистента у нас есть отдельная статья), или даже в llama.cpp с грамматиками. Модель видит логику, а не шум.
Чем не угодили старые методы?
Раньше были два пути: писать транслятор (годы работы, миллионы долларов) или кормить LLM кусками (теряется контекст, результат нерабочий). GestaltSyntax - третий путь.
| Метод | Скорость | Качество перевода | Главная проблема |
|---|---|---|---|
| Ручной рефакторинг | Месяцы/годы | Идеально | Дорого, нужны эксперты |
| Традиционные трансляторы | Недели (настройка) | Средне, нужна доработка | Ломается на сложном коде |
| LLM без сжатия | Минуты | Низкое (потеря контекста) | Контекстное окно маленькое |
| GestaltSyntax + LLM | Часы | Высокое | Требует проверки (но меньше) |
Ключевое отличие - инструмент не пытается понять бизнес-логику. Он только готовит код для того, кто поймёт (LLM). Это как перевести древнюю рукопись с сокращениями на современный язык перед тем, как дать историку.
Из коробки: что умеет последняя версия (2026)
- Поддержка FORTRAN 77 и COBOL-85 - самых частых 'кандидатов' на миграцию
- Плагины для VS Code и JetBrains IDEs - не надо прыгать в терминал
- Конфигурационные пресеты для разных типов кода: научные вычисления, транзакционные системы
- Экспорт в форматы, понятные LLM: markdown с аннотациями, JSON с метаданными
- Обратное преобразование - если AI нагенерировала ерунду, можно вернуться к исходнику
Важный нюанс: инструмент открытый, но требует Python 3.11+. И да, он сам написан на Python - ирония в том, что мигрирует старый код на тот же язык, на котором написан.
Кому это реально нужно? (Спойлер: не всем)
Если у вас 500 строк FORTRAN - откройте ChatGPT и скопируйте кусками. GestaltSyntax для случаев, когда 'кусками' не получится.
Идеальные кандидаты:
- Финансовые институты с COBOL-системами 80-х годов. Один банк в Европе с помощью GestaltSyntax перевёл модуль обработки платежей за 3 недели вместо запланированных 6 месяцев.
- Научные проекты с legacy-кодом для моделирования. Физики, которые ненавидят Python, но вынуждены мигрировать - потому что студенты уже FORTRAN не учат.
- Страховые компании с системами на мейнфреймах. Там даже документации нет - только код.
Не тратьте время, если:
- Код уже частично на современном стеке - проще дописать.
- Нет эксперта, который проверит результат. AI может сделать логичную, но неверную вещь.
- Система должна работать с точностью до бита (например, аэрокосмические расчёты). Здесь лучше ручной перевод.
С чем сочетать? Экосистема для миграции
GestaltSyntax - не волшебная палочка. Это первый этап конвейера. Дальше нужны:
- Тесты - оригинальные, если есть. Запустить на старом и новом коде, сравнить результаты.
- Статический анализ переведённого Python. Инструменты вроде PythoC могут помочь найти узкие места.
- Документация - AI может сгенерировать комментарии, но проверять надо.
Интересно, что подход GestaltSyntax похож на то, как Cursor индексирует код - тоже семантическое сжатие, но для других целей. Или на Polyglot-r2 с его суффиксными преобразованиями.
Что будет дальше? (Спойлер: больше автоматизации)
Разработчики GestaltSyntax анонсировали на 2026 год интеграцию с агентскими системами. Представьте: инструмент сжимает код, передаёт агенту на основе Step 3.5 Flash, тот переводит, запускает тесты, исправляет ошибки - и всё без человека. Страшно? Зато эффективно.
Кстати, о производительности: переведённый Python код часто тормозит. Но это уже другая история - про AOT-компиляцию и оптимизацию. Главное - сначала получить работающий Python, а потом уже его ускорять.