Почему ваш AI-агент тупит? (И нет, это не баг в Claude 4.5)
Вы загружаете в агента 50-страничное ТЗ, ждете десять минут, а он выдает: "Я проанализировал требования и готов приступить". А приступить-то не к чему. Промпты длиннее «Войны и мира», контекст перегружен, а результат — случайная выборка из того, что модель смогла ухватить.
Проблема не в модели. Не в контекстном окне в 1 млн токенов у GPT-5. И даже не в ваших навыках промпт-инжиниринга. Проблема в хаосе на входе. AI-агент — не человек. Ему нельзя скинуть поток сознания продукт-менеджера и надеяться на чудо. Ему нужен паспорт требования.
Главный миф 2026 года: "Большие модели сами разберутся". Не разберутся. Чем мощнее LLM (Gemini 3.0, GPT-5, Claude 4.5), тем болезненнее она реагирует на противоречивые и неструктурированные входные данные. Мусор на входе — катастрофа на выходе.
Что такое паспорт требования и зачем он вам
Паспорт требования — это не документ. Это структурированный набор атомарных фактов, контекста и ограничений, отформатированный специально для потребления LLM. Он превращает "сделай что-то классное" в машиночитаемый план.
Представьте, что вы даете задание не AI, а новому сотруднику. Вы же не будете читать ему вслух переписку в Slack за год. Вы дадите четкий бриф, KPI, доступы и границы ответственности. Паспорт требования делает то же самое для агента.
1 Вытащите все. Абсолютно все.
Забудьте про красивые формулировки. Ваша цель — выудить у стейкхолдеров необработанные желания, страхи и неозвученные ограничения. Как это выглядит на практике:
- Запустите запись разговора (с согласия). Текст потом отдадите модели для анализа.
- Задавайте глупые вопросы: "Что будет, если агент сделает все идеально, но в два раза дороже?", "Какой один результат заставит вас праздновать?"
- Соберите всю сопутствующую дребедень: скриншоты старой системы, CSV-файлы, схемы в Miro, даже голосовые сообщения в Telegram.
2 Атомизируйте. Разрежьте на молекулы.
Атомарное требование — это утверждение, которое нельзя разделить без потери смысла для агента. Оно должно быть:
- Конкретным: Не "быстрый интерфейс", а "время отклика на действие пользователя < 100 мс".
- Проверяемым: Агент или система мониторинга должны однозначно определить, выполнено требование или нет.
- Изолированным: Не должно зависеть от других требований в формулировке.
// КАК НЕ НАДО:
{
"requirement": "Сделать удобный дашборд для анализа продаж"
}
// АТОМАРНЫЕ ТРЕБОВАНИЯ:
[
{
"id": "PERF-01",
"type": "performance",
"statement": "Дашборд должен загружаться менее чем за 2 секунды при 1000+ записях в источнике данных.",
"validation": "Замер времени от запроса до полной отрисовки последнего графика."
},
{
"id": "DATA-07",
"type": "data",
"statement": "Раздел 'Динамика продаж' должен содержать график с группировкой по неделям и месяцам за последний календарный год.",
"validation": "Наличие селектора группировки и временного диапазона с 01.01.2025 по 31.12.2025."
}
]
3 Определите контекст и границы. Жестко.
Агент должен знать не только ЧТО делать, но и в КАКОМ МИРЕ это делать. Здесь многие спотыкаются, думая, что навыки агента решат все. Навыки — это инструменты, а контекст — правила их применения.
| Элемент контекста | Пример (для агента по работе с клиентами) | Почему важно |
|---|---|---|
| Бизнес-правила | Скидка более 15% требует согласования с руководителем отдела. | Предотвращает нарушение процессов и финансовых лимитов. |
| Технические ограничения | Внешний API биллинга отвечает 3-5 секунд. Повторный запрос через 10 сек. | Избегает таймаутов и ложных ошибок в цепочках действий. |
| Правовые рамки | Персональные данные клиентов из ЕС нельзя отправлять на серверы вне EU-кластера. | Соблюдение GDPR и избегание юридических рисков. Критично для безопасности агентов. |
4 Упакуйте для LLM. Язык имеет значение.
Теперь нужно перевести наш структурированный паспорт на язык, который максимально эффективно потребляется моделью. Это не про шаблоны, это про архитектуру информации.
# passport_requirement.yaml
meta:
project_id: "prj-2026-ai-agent-onboarding"
created: "2026-03-12"
llm_target: ["gpt-5", "claude-4.5"] # Указываем целевые модели
version: "1.2"
context:
business_goal: "Автоматизация первичного технического собеседования кандидатов на junior DevOps."
hard_constraints:
- "Не запрашивать и не хранить паспортные данные кандидатов."
- "Длительность сессии агента с кандидатом не должна превышать 25 минут."
- "Использовать только утвержденный стек вопросов из базы знаний 'devops-interview-2026'."
atomic_requirements:
- id: "AR-101"
priority: "HIGH"
description: "Агент должен задать ровно 5 практических задач по теме 'CI/CD Pipeline'."
success_criteria: "В логах сессии зафиксированы 5 уникальных вопросов с тегом 'ci-cd-task'."
failure_action: "Если кандидат отвечает на 4 из 5 задач правильно, перейти к теме 'Мониторинг'. Иначе — завершить собеседование с оценкой 'не прошел'."
- id: "AR-102"
priority: "MEDIUM"
description: "После каждой задачи агент должен дать четкую обратную связь: объяснить, что было правильно, а где ошибка."
success_criteria: "Каждый ответ кандидата сопровождается LLM-генерируемым комментарием длиной 50-100 слов, сохраняемым в лог."
rag_config:
knowledge_sources:
- "vector_db://questions/devops-interview-2026"
- "git://internal/wiki/sre-guide"
retrieval_strategy: "hybrid" # semantic + keyword search
fallback_action: "Если релевантный ответ не найден в RAG, агент должен сказать 'У меня нет информации по этому вопросу, я его передам старшему инженеру' и записать вопрос в pending_issues."
Обратите внимание на поля failure_action и fallback_action. Они превращают агента из хрупкой цепочки промптов в устойчивую систему с обработкой краевых случаев. Это то, что отличает прототип от продакшена в 2026 году.
5 Тестируйте на идиотских сценариях. Итеративно.
Скормите паспорт агенту. Но не тому, для которого готовили. Возьмите другую модель (например, если паспорт для GPT-5, протестируйте на открытой Mixtral 2) или старую версию. Зачем? Чтобы найти скрытые неоднозначности.
Запустите симуляцию с абсурдными входными данными: "Кандидат отвечает стихами Есенина на все вопросы", "Внешняя система мониторинга возвращает статус 418 I'm a teapot". Если агент ломается, значит, в паспорте не хватает граничных условий.
Где паспорт требования ломается. Часто.
- Слишком много атомов. 500 атомарных требований превращаются в шум. Группируйте их в домены (например, «Авторизация», «Отчетность») и передавайте агенту частями, используя архитектуру без роутинга.
- Конфликт приоритетов. Что важнее: скорость ответа или полнота? Если в паспорте есть требования «Отвечать мгновенно» и «Давать максимально детальный ответ», агент застынет в параличе. Расставляйте числовые веса (priority_weight: 0.9).
- Тихие изменения. Паспорт — живой документ. Если бизнес-правило изменилось вчера, а паспорт лежит в гит-репозитории с коммитом месячной давности, агент натворит дел. Интегрируйте паспорт с системой управления фича-флагами или хотя бы с вебхуком на обновление Confluence.
Связь с RAG: Паспорт требования — это не замена векторной базе знаний. Это ее схема и инструкция по использованию. В паспорте вы определяете, КАКИЕ источники знаний использовать и ЧТО делать, если ответа нет. Сами же факты лежат в RAG, подготовленные по принципам из гида по упаковке знаний.
Вопросы, которые вы боитесь задать
Какой инструмент использовать для создания паспортов? JSON, YAML, XML?
Формат — вторичен. Выбирайте тот, который легко парсить и валидировать в вашем стеке. В 2026 году YAML и JSON правят бал. Главное — завести схему (JSON Schema) и автоматизировать проверку перед загрузкой в агента. И да, храните паспорта в Git.
А если у меня не один агент, а сотни, как в агентном хаосе?
Тогда паспорта становятся продуктом. Нужен реестр паспортов, система версионирования, канареечные развертывания изменений и A/B тестирование разных версий требований на подмножестве агентов. По сути, это CI/CD для знаний.
Паспорт — это окончательная истина? А если агент найдет более эффективный путь?
Нет. Это договор между людьми и машиной на данный момент. Включите в паспорт пункт "suggestion_channel", через который агент может предлагать улучшения требований. Но последнее слово — за человеком. Иначе вы получите технический долг, генерируемый со скоростью света.
Паспорт требования не гарантирует, что агент сделает все идеально. Но он гарантирует, что когда что-то пойдет не так, вы будете знать, какое именно атомарное требование было понято неправильно. А это в 2026 году и есть главная суть инженерии — не предотвращать все ошибки, а создавать системы, где каждая ошибка становится понятным уроком, а не магическим глюком.