Еще один. Тихий пост на LinkedIn о "сложном решении", инвесторы с грустными смайликами в комментариях, а команда из трех человек уже ищет работу. Сценарий 2024-2025 годов повторяется в 2026-м с пугающей регулярностью. Волна ИИ-стартапов, построенных на обёртках над чужими моделями, окончательно разбивается о берега реальности. И в России этот тренд особенно заметен.
Три призрака российского AI: Оценка.рф, Ударник, FindTheJob
Возьмем три свежих примера. Все они громко заявляли о себе в 2024-2025, все получили посевные инвестиции и все закрылись или заморозились к началу 2026 года.
Оценка.рф: когда GPT-4 оценивает квартиру, но не ваш бизнес
Стартап предлагал автоматическую оценку недвижимости по фото и описанию. Красиво. Основа – тонкая обёртка над GPT-4 Vision API (на тот момент – последняя модель) и кастомный промпт. В теории – нейросеть анализирует снимки, читает планировку, делает вывод. На практике – стоило OpenAI в конце 2025 года обновить модель до GPT-4.5 и слегка изменить поведение API, как вся "логика" оценки поплыла. Система начала выдавать дикие цифры. Клиенты в ужасе. Команда не могла быстро исправить – ведь они не контролировали "мозг" системы, а лишь дирижировали им через промпты. Про ограничения промпт-инжиниринга мы уже писали.
Факт: К марту 2026 года средняя стоимость вызова GPT-4.5 API для анализа изображения выросла на 18% по сравнению с началом 2025-го. Для сервиса с тысячью оценок в день – это смерть маржи.
Ударник: ассистент, который не пережил обновления Gemini
Помощник для строителей, который по голосовому запросу искал СНиПы и давал советы. Внутри – комбинация speech-to-text от Google и Gemini Ultra 1.5 (а затем и 2.0) для семантического поиска по документам. Проблема №1: задержка. Запрос-ответ занимал 5-7 секунд из-за цепочки вызовов. Проблема №2: контекст. Модель не понимала узких строительных терминов без дообучения, а дообучить чужую модель через API – та еще задача. Когда Google в начале 2026 года изменил политику контекстного окна для Gemini API, сервис просто перестал обрабатывать длинные технические тексты. Это классическая история, описанная в нашем разборе почему ИИ-ассистенты ломаются в бизнес-среде.
FindTheJob: рекрутинг, который съел сам себя
Сервис для автоматического составления вакансий и screening резюме. Использовал Claude 3.5 Sonnet от Anthropic. Работало неплохо, пока не столкнулись с явлением model collapse. Нейросеть, обученная на тоннах интернет-текстов, начала генерировать вакансии, которые звучали шаблонно и "синтетически". Кандидаты жаловались. Но главный удар – юридический. При проверке выяснилось, что ИИ иногда "вспоминал" фразы из реальных вакансий конкурентов. Угроза суда за плагиат стала реальной. О рисках ИИ-плагиата мы предупреждали.
Технические ловушки: что конкретно ломается в обёртках
Проблема не в идее. Проблема в фундаменте. Вот четыре кита, которые рушатся один за другим.
| Ловушка | Последствия | Пример из практики (2025-2026) |
|---|---|---|
| Контроль качества | Невозможность точно управлять выводом модели. Обновление "черного ящика" ломает всю логику продукта. | Оценка.рф после апдейта GPT-4.5 |
| Экономика API-вызовов | Маржа стремится к нулю. Цены растут, конкуренция за токены обостряется. | Рост цен на OpenAI и Anthropic API на 15-25% за год |
| Производительность и latency | Цепочка вызовов к разным API создает задержки, неприемлемые для продакшена. | Ударник с его 7-секундным ответом |
| Технологический долг | Нет своей IP. Нет возможности кастомизировать модель под узкую задачу. Команда теряет экспертизу в ML. | Все три кейса: команды не смогли "починить" ядро продукта |
Звучит знакомо? Это именно тот феномен цифровых зомби, когда стартап выглядит живым, но его технологическое сердце уже не бьется.
Что видят инвесторы в 2026 году? Сдвиг парадигмы
Раньше сходило. В 2023-2024 можно было показать демку на ChatGPT API и собрать круг. Сегодня – нет. Инвестфонды, особенно в России, набили шишек. Теперь они смотрят глубже. Вопросы на питчах изменились:
- "Какая часть пайплайна – ваша собственная модель, а не вызов API?"
- "Покажите бенчмарки latency на вашем датасете. Не на COCO, а на вашем."
- "Как вы защищены от скачка цен на токены в 2 раза?"
- "Что вы будете делать, если завтра поставщик API заблокирует российские IP?" (Да, этот вопрос звучит все чаще).
Тренд 2026-го – гибридные архитектуры. Не "обёртка", а "гибрид". Часть задачи решается легкой локальной моделью (например, для классификации), часть – мощным внешним API (для генерации). Но ключевые компоненты, дающие конкурентное преимущество, должны быть своими. Как в истории с Virtual Try-On, где SOTA-модели не подошли для продакшена.
Что делать, если вы уже в этой ловушке? Инженерный чекап
Если ваш стартап построен на API, не паникуйте. Но действуйте быстро. Проведите технический аудит:
- Выявите точки отказа. Какие компоненты полностью зависят от внешнего API? Что сломается при изменении цены, latency или политики доступа?
- Посчитайте реальную себестоимость. Не по текущим ценам, а с прогнозом на 12 месяцев. Включите риски роста стоимости токенов на 30-50%.
- Начните эксперименты с open-source. Модели вроде Llama 3.2 (400B), вышедшей в 2025, или русскоязычной YaLM 3.0 дают уже приемлемое качество для многих задач. Развернуть свою инференс-инфраструктуру стало проще и дешевле.
- Инвестируйте в data engine. Ваши главные активы – не промпты, а данные и обратная связь от пользователей. Собирайте их агрессивно. Они понадобятся для fine-tuning своих моделей.
Самое опасное – это самообман. Нельзя думать, что сложный промпт – это "технология". Это временный костыль. Настоящая продуктовая разработка в AI начинается там, где вы берете под контроль качество, скорость и стоимость инференса. Иначе вы просто платите дань гигантам вроде OpenAI или Google, оставаясь вечным заложником их апдейтов. Как сказал один инвестор на недавней встрече: "Раньше я искал команды, которые умеют говорить с нейросетью. Теперь я ищу команды, которые умеют их строить".