GestaltSyntax: обзор инструмента для сжатия и миграции FORTRAN/COBOL в Python | 2026 | AiManual
AiManual Logo Ai / Manual.
15 Мар 2026 Инструмент

GestaltSyntax - семантический пресс для старого кода: как впихнуть FORTRAN в контекстное окно AI

Открытый инструмент GestaltSyntax сжимает legacy-код до 12 раз для перевода AI-моделями. Возможности, сравнение с альтернативами, примеры использования.

Legacy-код, который никто не трогал 30 лет, вдруг понадобился

Представьте: где-то в подвале банка работает система на COBOL, написанная когда ваш отец был студентом. Или в научной лаборатории - десятитысячные строки FORTRAN, которые считают что-то важное, но уже никто не помнит, что именно. Мигрировать? В теории просто - дайте это нейросети. На практике - даже Claude 3.7 со 128K контекста не проглотит такой монолит.

Вот тут и появляется GestaltSyntax. Не очередной транскомпилятор, а инструмент, который сначала 'пережёвывает' код, уменьшая его в 12 раз, а потом кормит нейросети. Репозиторий на GitHub живой, обновлялся в феврале 2026.

Как это работает? Сначала сжать, потом спросить

GestaltSyntax не переводит код сам. Его задача - подготовить код так, чтобы современные LLM смогли с ним работать. Алгоритм в трёх шагах:

1 Семантический анализ и кластеризация

Инструмент проходит по коду, находит повторяющиеся паттерны, однотипные операции, избыточные проверки. Вместо 100 похожих циклов - оставляет один с комментарием 'повторить для всех массивов'. Это не просто удаление пробелов - это понимание структуры.

2 Абстракция и переименование

COBOL любит переменные вроде WS-INPUT-DATA-AREA-01. GestaltSyntax заменяет их на human-readable имена, сохраняя mapping. FORTRAN с его GOTO и COMMON blocks превращается в структурированное представление.

3 Интеграция с LLM через единый интерфейс

Сжатый код подаётся в выбранную модель - через OpenAI API, локально через Ollama (кстати, про сборку локального ассистента у нас есть отдельная статья), или даже в llama.cpp с грамматиками. Модель видит логику, а не шум.

💡
На март 2026 инструмент тестировали с GPT-4.5 Turbo (128K контекст) и Claude 3.7 Sonnet. Сжатый код занимает 8-12% от оригинала, что влезает даже в стандартные 32K окон.

Чем не угодили старые методы?

Раньше были два пути: писать транслятор (годы работы, миллионы долларов) или кормить LLM кусками (теряется контекст, результат нерабочий). GestaltSyntax - третий путь.

Метод Скорость Качество перевода Главная проблема
Ручной рефакторинг Месяцы/годы Идеально Дорого, нужны эксперты
Традиционные трансляторы Недели (настройка) Средне, нужна доработка Ломается на сложном коде
LLM без сжатия Минуты Низкое (потеря контекста) Контекстное окно маленькое
GestaltSyntax + LLM Часы Высокое Требует проверки (но меньше)

Ключевое отличие - инструмент не пытается понять бизнес-логику. Он только готовит код для того, кто поймёт (LLM). Это как перевести древнюю рукопись с сокращениями на современный язык перед тем, как дать историку.

Из коробки: что умеет последняя версия (2026)

  • Поддержка FORTRAN 77 и COBOL-85 - самых частых 'кандидатов' на миграцию
  • Плагины для VS Code и JetBrains IDEs - не надо прыгать в терминал
  • Конфигурационные пресеты для разных типов кода: научные вычисления, транзакционные системы
  • Экспорт в форматы, понятные LLM: markdown с аннотациями, JSON с метаданными
  • Обратное преобразование - если AI нагенерировала ерунду, можно вернуться к исходнику

Важный нюанс: инструмент открытый, но требует Python 3.11+. И да, он сам написан на Python - ирония в том, что мигрирует старый код на тот же язык, на котором написан.

Кому это реально нужно? (Спойлер: не всем)

Если у вас 500 строк FORTRAN - откройте ChatGPT и скопируйте кусками. GestaltSyntax для случаев, когда 'кусками' не получится.

Идеальные кандидаты:

  • Финансовые институты с COBOL-системами 80-х годов. Один банк в Европе с помощью GestaltSyntax перевёл модуль обработки платежей за 3 недели вместо запланированных 6 месяцев.
  • Научные проекты с legacy-кодом для моделирования. Физики, которые ненавидят Python, но вынуждены мигрировать - потому что студенты уже FORTRAN не учат.
  • Страховые компании с системами на мейнфреймах. Там даже документации нет - только код.

Не тратьте время, если:

  • Код уже частично на современном стеке - проще дописать.
  • Нет эксперта, который проверит результат. AI может сделать логичную, но неверную вещь.
  • Система должна работать с точностью до бита (например, аэрокосмические расчёты). Здесь лучше ручной перевод.

С чем сочетать? Экосистема для миграции

GestaltSyntax - не волшебная палочка. Это первый этап конвейера. Дальше нужны:

  1. Тесты - оригинальные, если есть. Запустить на старом и новом коде, сравнить результаты.
  2. Статический анализ переведённого Python. Инструменты вроде PythoC могут помочь найти узкие места.
  3. Документация - AI может сгенерировать комментарии, но проверять надо.

Интересно, что подход GestaltSyntax похож на то, как Cursor индексирует код - тоже семантическое сжатие, но для других целей. Или на Polyglot-r2 с его суффиксными преобразованиями.

Что будет дальше? (Спойлер: больше автоматизации)

Разработчики GestaltSyntax анонсировали на 2026 год интеграцию с агентскими системами. Представьте: инструмент сжимает код, передаёт агенту на основе Step 3.5 Flash, тот переводит, запускает тесты, исправляет ошибки - и всё без человека. Страшно? Зато эффективно.

💡
Мой совет: если у вас есть legacy-код, который ' когда-нибудь надо будет переписать ' - попробуйте GestaltSyntax сейчас. Через год AI станут умнее, но код не станет моложе. А инструмент уже сегодня даёт 80% результата за 20% усилий.

Кстати, о производительности: переведённый Python код часто тормозит. Но это уже другая история - про AOT-компиляцию и оптимизацию. Главное - сначала получить работающий Python, а потом уже его ускорять.

Подписаться на канал