Проблема: между «хочу изменить» и «могу изменить» лежит пропасть контекста

Вы нашли отличный open-source проект, но он не совсем соответствует вашим нуждам. Нужно добавить фичу, исправить баг под ваш кейс или адаптировать под другую ОС. Классический путь: изучать код, разбираться в архитектуре, писать патч... На это уходят часы, а иногда и дни. Но что если у вас есть персональный ассистент, который знает код лучше автора, работает в вашем окружении и никогда не отправит ваши данные в облако?

💡

Патинг-инженер (от англ. patch — заплатка) — специалист, который создает модификации для существующего ПО. В контексте этой статьи — это вы, вооруженные локальной LLM, способной анализировать код, предлагать изменения и даже генерировать готовые патчи.

Почему именно локальная LLM? Три кита приватного workflow

Облачные модели вроде ChatGPT прекрасно справляются с общими задачами по программированию. Но для модификации open-source есть три критических преимущества у локального подхода:

Полная приватность: Исходный код проекта, ваши модификации, бизнес-логика — всё остаётся на вашем железе. Никаких соглашений о конфиденциальности не нужно.
Работа с полным контекстом: Локальная модель может читать всю кодовую базу проекта (десятки мегабайт), а не ограничиваться окном в 128K токенов. Вы загружаете в контекст все исходники и получаете анализ, основанный на полной картине.
Интеграция с инструментами разработчика: Как мы писали в статье про идеальный стек, локальную LLM можно подключить напрямую к вашей IDE, системе контроля версий и CLI-инструментам.

Важно: не все локальные LLM одинаково полезны для этой задачи. Вам нужна модель с хорошим пониманием кода, поддержкой длинного контекста и желательно — способностью к Tool Calling для автоматизации рутинных действий.

Подготовка: выбираем инструменты для работы

Прежде чем начать, нужно собрать рабочий стек. Вот что я рекомендую после тестирования десятков комбинаций:

Выбор LLM: код — это язык, и модель должна его знать

Для задач патчинга я использую две категории моделей:

Модель	Сильные стороны	Рекомендуемый квант
DeepSeek-Coder-V2	Лучшее понимание архитектуры, работа с репозиториями	Q4_K_M
CodeQwen-1.5	Отличное следование инструкциям, генерация патчей	Q5_K_M
Llama-3.2-Coder	Баланс скорости и качества, стабильность	Q4_K_S

Как мы обсуждали в обзоре LLM с Tool Calling, именно эта технология превращает LLM из советчика в активного участника workflow. Модель с Tool Calling может самостоятельно запускать тесты, применять патчи и делать коммиты.

Инфраструктура: запуск и взаимодействие

Для запуска моделей я предпочитаю Ollama — она проста, но мощна. Альтернативы — LM Studio или прямой llama.cpp. Для взаимодействия:

Continue.dev — расширение для VS Code, которое превращает IDE в центр управления LLM.
Instructor — библиотека для структурированного вывода, идеальна для генерации патчей в формате diff.
Simple-llama-framework — минималистичный фреймворк для создания автономных агентов.

Workflow патчинга: от идеи до пул-реквеста

Вот как выглядит идеальный процесс модификации open-source проекта с локальной LLM:

Анализ кодовой базы: Загружаем весь проект в контекст LLM, получаем архитектурную сводку.
Спецификация изменений: Формулируем задачу на естественном языке, модель предлагает план реализации.
Генерация патча: Модель создает diff-файл с изменениями, объясняя каждую модификацию.
Тестирование: LLM запускает тесты (через Tool Calling) и анализирует результаты.
Итерация: При необходимости — уточняем, исправляем, перегенерируем.

Пошаговый план: модифицируем реальный проект

Давайте рассмотрим конкретный пример: добавим поддержку нового формата экспорта в утилиту для обработки текста.

1Подготовка окружения

Скачиваем проект и устанавливаем зависимости:

git clone https://github.com/example/text-processor.git
cd text-processor
pip install -r requirements.txt
# Запускаем Ollama с нужной моделью
ollama pull deepseek-coder:latest

2Анализ проекта

Создаем промпт для анализа структуры:

# prompt_analysis.py
prompt = """
Проанализируй структуру проекта text-processor:
1. Какие основные модули и их назначение?
2. Где находится логика экспорта данных?
3. Как добавлены существующие форматы экспорта?
4. Предложи архитектуру для добавления нового формата JSON Lines.

Проект:
"""
# Добавляем содержимое ключевых файлов
with open('src/exporter.py', 'r') as f:
    prompt += f"\n\nФайл exporter.py:\n{f.read()}"

3Генерация патча

Используем библиотеку Instructor для получения структурированного ответа:

from instructor import patch
from pydantic import BaseModel
import ollama

class CodePatch(BaseModel):
    description: str
    diff: str  # unified diff format
    files_affected: list[str]
    tests_needed: list[str]

# Патчим клиент Ollama
client = patch(ollama.Client())

response = client.chat.completions.create(
    model="deepseek-coder",
    response_model=CodePatch,
    messages=[{"role": "user", "content": prompt}]
)

print(f"Дифф:\n{response.diff}")
with open("jsonlines_export.patch", "w") as f:
    f.write(response.diff)

4Применение и тестирование

Применяем патч и запускаем тесты:

# Применяем патч
git apply jsonlines_export.patch

# Запрашиваем у LLM создать тест
ollama run deepseek-coder "Создай unit-тест для нового формата JSON Lines в exporter.py. Учти существующую структуру тестов в tests/" > test_jsonlines.py

# Запускаем тесты
python -m pytest test_jsonlines.py -v

5Итерация и рефакторинг

Если тесты не проходят, отправляем ошибку модели и просим исправить:

error_output = """
Тест test_jsonlines_export завершился с ошибкой:
AssertionError: Expected 10 records, got 9
"""

fix_prompt = f"""
Патч вызвал ошибку в тесте:\n{error_output}\n\nИсправь код в exporter.py, чтобы тест проходил.
Вот текущая реализация метода export_jsonlines:
"""

with open('src/exporter.py', 'r') as f:
    fix_prompt += f.read()

Нюансы и возможные ошибки

Даже с мощной LLM есть подводные камни:

Проблема	Решение	Профилактика
Модель "галлюцинирует" несуществующие методы	Всегда предоставляйте полный контекст файла, который меняется	Используйте RAG-подход: сначала поиск по кодовой базе
Патч ломает обратную совместимость	Явно указывайте в промпте требование совместимости	Запускайте существующие тесты перед применением изменений
Модель не понимает сложные архитектурные паттерны	Разбейте задачу на подзадачи, используйте chain-of-thought	Выбирайте специализированные код-модели (DeepSeek-Coder, CodeLlama)

Совет: Начинайте с малого. Сначала модифицируйте тестовые проекты или добавляйте простые фичи. По мере накопления опыта вы научитесь формулировать промпты так, чтобы модель понимала архитектурные тонкости.

FAQ: частые вопросы о патчинге с LLM

Какое железо нужно для такой работы?

Для моделей 7B-13B параметров достаточно 16-32GB RAM и современного CPU. Для более крупных моделей (34B+) потребуется GPU с 24GB+ памяти. В статье про оптимизацию железа есть подробности.

Как быть с лицензиями при модификации open-source?

Всегда проверяйте лицензию исходного проекта. LLM может помочь проанализировать лицензионные требования и сгенерировать правильные заголовки в файлах. Большинство open-source лицензий разрешают модификации для личного использования.

Можно ли полностью автоматизировать процесс?

Да, но с осторожностью. Вы можете создать агента с Tool Calling, который будет самостоятельно применять патчи и запускать тесты. Однако финальный код всегда должен проверять человек — LLM ещё не заменила критическое мышление разработчика.

Заключение: от потребителя к созидателю

Локальная LLM превращает вас из пассивного потребителя open-source в активного участника экосистемы. Вы больше не зависите от дорогих облачных сервисов или доступности авторов проекта. С правильным стеком инструментов и workflow вы можете адаптировать любой проект под свои нужды, сохраняя полный контроль и приватность.

Начните с малого: выберите простой проект, попробуйте добавить небольшую фичу или исправить баг. Как показывает наш опыт и обзор open-source инструментов, сегодняшние локальные модели уже достаточно мощны, чтобы стать вашим персональным патинг-инженером.

Следующий шаг — интегрировать этот workflow в вашу повседневную разработку. Удачи в модификациях!

Как локальная LLM может стать вашим личным патинг-инженером: опыт модификации open-source