Ты держишь в руках 7B модель. Она дешёвая, быстрая, но код генерирует так, будто её кормили только коммитами из легаси. Можно, конечно, дообучить — про это я писал в статье Zero-Shot Transferable Adapter, но если у тебя нет GPU или времени? Агента менять нельзя — он уже в продакшене, обвязан RAG, логами, тимлид не даст. Что остаётся? Только промпты.
Хорошая новость: я провёл серию экспериментов и нашёл методику, которая стабильно удваивает pass@k на HumanEval+ без единой строчки изменений в агенте. Как это работает? Никакой магии — системный подход к исследованию промптов, которому можно научиться за вечер.