Фантазии против тасок: откуда берутся 95% провалов
В 2023-2024 годах в AI влили около $330 млрд. Результат? Согласно свежим данным Gartner и BCG, 95% пилотных проектов на больших языковых моделях умирают, не дожив до стадии внедрения. Это не статистическая погрешность. Это система.
Типичная картина: компания слышит про ChatGPT. Руководитель отдает распоряжение «внедрить ИИ». Команда берет API от OpenAI или открытую модель, наскоро пилит демо для генерации отчетов или чат-бота для поддержки. Презентация блестит. Пилот признают успешным. А потом проект тихо умирает в каком-нибудь Confluence, потому что «масштабирование оказалось сложнее» или «не уложились в бюджет».
Проблема не в технологиях. LLM работают. Проблема в том, что бизнес пытается забить гвозди микроскопом, а потом удивляется, почему это дорого и неудобно.
Три смертельных диагноза для пилота
1Технологический фетишизм: «У нас же есть ИИ!»
Самый частый стартовый грех. Команда начинает с вопроса «Что можно сделать с GPT-4?», вместо того чтобы спросить «Какую конкретную бизнес-боль мы хотим решить и насколько она болезненна в деньгах?». Это приводит к созданию решений в поисках проблем.
- Пример провала: Пилот по автоматическому написанию коммерческих предложений. LLM генерирует красивый текст, но он не учитывает внутреннюю специфику сделок, историю переписки с клиентом и юридические нюансы. Результат — сотрудники тратят больше времени на правку, чем на написание с нуля. ROI отрицательный.
- Что сломано: Фокус на «магии ИИ», а не на интеграции в существующий workflow. Как правильно ставить задачи, мы разбирали в материале про ИИ как быстрого джуна.
2Нулевая экономика: когда пилот съедает все бюджеты
Пилотный проект часто рассматривают как «недорогой эксперимент». Но стоимость складывается не только из API-ключей.
| Статья расходов | Пилот (иллюзия) | Продакшн (реальность) |
|---|---|---|
| Модель (API/инфра) | $500 в месяц | $5,000–50,000+ |
| Инженерные часы | 1 разработчик, 20% времени | Команда из 3-5 инженеров, DevOps, MLops |
| Поддержка и дообучение | «Пока не нужно» | Постоянные затраты, ретиненинг моделей |
| Юридическая/этическая валидация | Игнорируется | Отдельный бюджет и команда |
Когда скрытые расходы всплывают на этапе масштабирования, проект упирается в финансовый потолок. Руководство видит, что для 10-кратного увеличения нагрузки нужны 50-кратные инвестиции, и закрывает инициативу. Об этом же кризисном несоответствии пишут в статье «95% компаний не видят отдачи от ИИ».
3Синдром «черного ящика»: доверие, которое невозможно проверить
LLM галлюцинируют. Это аксиома. В пилоте, который обрабатывает 100 запросов в день, с этим можно смириться. В продакшне, который обрабатывает 100 000 запросов и влияет на принятие решений, каждая галлюцинация — это финансовые или репутационные потери.
Пилоты часто не предусматривают системы мониторинга качества, механизмы human-in-the-loop для критических задач или подходы к работе с вероятностями, как в методе PMR. В результате при переходе на масштаб система начинает выдавать неприемлемый процент ошибок.
Как не попасть в 95%: антидот от провала
Стратегия выживания проста, но требует дисциплины. Нужно перевернуть процесс с головы на ноги.
- Начни с экономики, а не с модели. Сформулируй метрику успеха в деньгах или сэкономленном времени до начала разработки. «Сократить время обработки заявки в службе поддержки с 10 до 2 минут» — хорошо. «Сделать умного чат-бота» — плохо.
- Спроектируй пилот как скелет будущего продакшна. Сразу закладывай мониторинг, логирование, план масштабирования инфраструктуры и оценку полной стоимости владения (TCO). Если для пилота нужен один инженер, а для продакшна — пять, узнай это сейчас, а не через полгода.
- Тестируй на реальных, а не на вымышленных данных. Если модель будет работать с внутренними документами, корми ей эти документы, а не Википедию. Проблемы с контекстом, токенизацией и поиском всплывут сразу.
- Готовь людей, а не только код. Самый совершенный ИИ-ассистент умрет, если сотрудники не захотят или не смогут им пользоваться. Внедрение — это изменение процессов. Начни обучать команды параллельно с разработкой пилота.
Ирония в том, что самые успешные кейсы внедрения LLM часто наименее заметны. Это не публичные чат-боты, а внутренние инструменты, которые ускоряют написание технической документации, помогают проводить ревью кода или извлекают структурированные данные из тысяч писем. Они решают конкретную, узкую, измеримую задачу.
Прогноз: к 2026 году волна пилотного хайпа схлынет. Инвестиции сконцентрируются не вокруг «компаний с ИИ», а вокруг компаний, которые с помощью ИИ показали реальный рост маржи или сокращение издержек. Разрыв между 5% успешных и остальными 95% будет только увеличиваться.
Так что, если ваш пилотный проект на LLM сейчас выглядит как волшебная палочка, способная на все, — скорее всего, он уже мертв. Вы просто еще не получили счет. Настоящая магия начинается там, где заканчиваются фантазии и начинается тяжелая работа по интеграции технологии в ткань бизнес-процессов, со всеми их несовершенствами, legacy-системами и человеческим фактором. Именно об этом страхе перед реальным внедрением мы писали в статье «Почему корпорации до сих пор боятся ИИ».
Совет напоследок: следующий раз, когда вам предложат «быстро запустить пилот на GPT», спросите, сколько будет стоить его поддержка через год при нагрузке в 100 раз выше. Если ответа нет — берегите бюджет. Он вам еще понадобится для проектов, которые действительно выстрелят.