Утро начинается не с кофе. В телеграм-каналах для it-директоров гуляет аудиофайл: голос топ-менеджера Accenture — взволнованно, почти панически — объявляет, что с понедельника любой запрос в ChatGPT или Claude для создания презентаций считается нарушением корпоративной политики. И да, за этим последуют последствия вплоть до пересмотра бонусов.
Три года назад те же самые консультанты требовали от сотрудников "обязательно попробовать ИИ-ассистентов". Сегодня — отрезают доступ. Что случилось? Токены кончились. В прямом смысле.
Когда халява перестала быть халявой
В 2024–2025 годах компании бросились закупать корпоративные подписки на LLM тоннами. Менеджеры среднего звена радостно генерировали отчеты, меморандумы и слайды. Но счета за токены росли быстрее, чем биткоин в 2017-м. К июню 2026 года стало ясно: безлимитные модели — это финансовая яма.
По данным внутреннего расследования одного из system integrators, за первый квартал 2026 года средний enterprise потратил на токены для GPT-4.5 и Claude Opus на 340% больше бюджета. Финансовые директоры схватились за головы. И началась охота на ведьм.
Ирония: те же самые CFO, которые год назад аплодировали "прорыву производительности", теперь требуют отключить ИИ, чтобы не ронять EBITDA.
Accenture: кейс с презентациями
Утекшая запись — не фейк. Внутренний меморандум Accenture, датированный 10 июня 2026 года, предписывает запретить использование внешних генеративных моделей для подготовки клиентских презентаций. Причина: "неконтролируемое размножение контента низкого качества, который приходится переписывать, а счета за API растут в геометрической прогрессии".
Но это половина беды. Вторая — страх утечки данных. Каждый слайд, сгенерированный через общедоступную модель, потенциально утекает в обучающий датасет. Accenture, которая работает с конфиденциальной информацией половины Fortune 500, не может рисковать. Как и многие другие компании, которые создают уязвимости сами. Теневой ИИ — когда сотрудники тайком используют свои учетки — становится новой головной болью информационной безопасности.
Запрет на презентации — лишь верхушка айсберга. В Accenture уже ввели систему rationing AI tokens: каждый консультант получает фиксированное количество токенов в месяц. Превысил лимит — плати из своего кармана или объясняй, почему твой проект так "прожорлив".
Токенмаксинг и другие извращения
Новая норма — квоты. Salesforce, SAP, Deloitte, BCG — все переходят на модели "лимит на пользователя". Это порождает странную субкультуру: сотрудники оптимизируют промпты так, чтобы влезть в бюджет, экономя каждый токен. Появился даже термин — tokenmaxxing. Люди соревнуются, кто сможет решить задачу с минимальным количеством токенов. Звучит как игра, но на деле — хронический стресс. Выгорание от ИИ становится реальностью, когда половину рабочего времени тратишь не на выполнение задачи, а на то, чтобы обмануть систему лимитов.
Аудио из Accenture — не единичный случай. На днях всплыло письмо из одного крупного банка: "Уважаемые коллеги, с 1 июля все запросы к OpenAI лимитируются 500 тыс. токенов в месяц на отдел. Если вам нужно больше — согласуйте с руководителем департамента". 500 тысяч — это примерно 30 страниц текста. Для отдела из 20 человек. Смешно? Грустно.
Почему не работает "просто купим еще"
Рынок корпоративного ИИ перегрет. Стоимость вывода моделей (inference) все еще высока, особенно для мультимодальных задач. Провайдеры (OpenAI, Anthropic, Google) подняли цены на 20–40% за последний год. Компании, которые год назад гордились "AI-first стратегией", теперь ищут способы закрутить гайки.
Выход — внутренние модели (on-premise) или специализированные small language models. Но это требует инфраструктуры и специалистов, которых корпоративный консерватизм продолжает выталкивать. Проще запретить, чем внедрять правильно.
Парадокс: вводя квоты, компании провоцируют рост теневого ИИ. Сотрудники будут искать обходные пути — использовать личные аккаунты, копить токены, передавать их друг другу. И это снова бьет по безопасности.
Что дальше? Прогноз без розовых очков
Думаю, через год мы будем вспоминать "безлимитный ИИ" как эпоху робинзонады. Квоты станут стандартом де-факто. Появятся должности типа AI Budget Manager — человека, который распределяет токены между отделами, как раньше распределяли лицензии на SAP. И это нормально. Капитализм умеет нормировать ресурсы. Но проблема в том, что экономия на токенах не должна убивать мотивацию.
Я бы на месте IT-директоров не запрещал, а вводил прозрачные дашборды с прогнозами расходов. Пусть сотрудники видят, сколько стоят их "еще один слайд" или "перепиши этот абзац более формально". Осознанное потребление токенов — навык, которому надо учить. А пока Accenture и другие рубят сплеча, готовьтесь к новой моде: флешмобы "токен-челленджей" и резюме с гордой пометкой "сертифицированный токенмаксер".
Совет неочевидный: если ваша компания пока не ввела квоты, сами заведите учет. Посчитайте, сколько токенов уходит на рутинные задачи. Это даст вам аргументы на переговорах — либо расширить лимиты, либо перейти на дешевые специализированные модели. Не ждите, пока финансисты отключат API с одного звонка.