Бесплатный сыр и платный доступ
Помните те времена, когда любой мог взять данные Википедии и сделать с ними что угодно? Google, Facebook, Amazon десятилетиями спокойно скрейпили её контент, не платя ни копейки. Даже первые модели ИИ учились на этих текстах. Но эпоха бесплатного сыра закончилась.
В 2026 году Wikimedia Foundation запустила Wikimedia Enterprise — коммерческий API, который продаёт структурированные, чистые и готовые к употреблению данные из Википедии. Не просто текст, а контент с разметкой, историей правок, метаданными. Идеальный корм для голодных ИИ-систем.
Wikimedia Enterprise — это не смена философии, а прагматичный ответ. Фонд тратит миллионы на серверы, а Big Tech зарабатывает триллионы на данных, которые волонтёры создают бесплатно. Теперь они платят.
Кто покупает и зачем?
Первыми в списке клиентов оказались те, кто больше всех зависит от качественных текстовых данных.
| Компания | Для чего | Статус сделки |
|---|---|---|
| Microsoft | Обновление знаний для Copilot, Bing AI, Azure AI | Подписано, объявлено |
| Meta | Факт-чекинг для Llama, улучшение Meta AI | Подписано, не афишируется |
| Perplexity | Основной источник для ответов с цитированием | Пилот, тестируется |
Microsoft особенно активна. После провала Copilot им срочно нужно было обновить знания своих моделей. Публичные данные устаревают за месяцы. Enterprise даёт доступ к последним правкам почти в реальном времени.
Perplexity строит на этом весь свой бизнес. Их поисковик с ИИ буквально питается Википедией. Бесплатный API ограничивал частоту запросов. Платный снимает все лимиты. Простая математика.
Что именно продают?
Не просто дампы статей. Это сервис уровня предприятия.
- Structured Content API: Статьи с семантической разметкой — абзацы, таблицы, цитаты, изображения с описаниями.
- Change Stream API: Поток всех правок в реальном времени. Идеально для отслеживания трендов и обновления фактов.
- Compliance & Attribution: Гарантия лицензионной чистоты и автоматическая генерация атрибуции (кто написал, когда изменил).
- Priority Support: Техподдержка 24/7 и доступ к бета-функциям.
Цена? Непубличная. Но инсайдеры говорят о шестизначных суммах в год для крупных игроков. Для стартапов есть тарифы от $5,000 в месяц. Дёшево, если альтернатива — нанимать команду инженеров для парсинга и очистки данных.
А как же свободная энциклопедия?
Волонтёры Википедии отреагировали неоднозначно. Кто-то кричит о предательстве идеалов. Кто-то спрашивает: «А нам что с этого?»
Wikimedia Foundation отвечает просто: все деньги от Enterprise идут на поддержку инфраструктуры. Серверы, пропускная способность, резервное копирование. Без этих сделок, утверждают они, Википедия могла бы не выдержать нагрузки от самих же ИИ-компаний, которые постоянно скрейпят сайт.
Парадокс в том, что ИИ, обученный на Википедии, теперь конкурирует с ней за внимание пользователей. Зачем читать статью, если можно спросить у ChatGPT? Но если ИИ-компании платят, то энциклопедия выживает. Циничный симбиоз.
Ситуация напоминает историю с SEO. Сначала поисковики бесплатно индексировали сайты. Потом заставили платить за ускоренную индексацию. Теперь Википедия делает то же самое с данными для ИИ.
Что будет с остальными?
OpenAI пока не в списке клиентов. Они либо договорились о сделке приватно, либо используют другие источники. Возможно, их не устраивают условия лицензии CC BY-SA, которая требует производные работы публиковать на тех же условиях. (Именно поэтому вы не увидите код GPT, обученный на Википедии, в открытом доступе.)
Для мелких игроков и исследователей остаётся бесплатный API. Но он ограничен по скорости и объёмам. Для обучения модели размером с Llama 2 через него — это месяцы работы. Enterprise даёт firehose — пожарный шланг данных.
Это ускоряет консолидацию рынка ИИ. У кого есть миллионы на данные, тот строит более умных ботов. Остальные довольствуются устаревшей информацией.
Что дальше? Прогноз от того, кто видел это раньше
Через год появятся клоны Enterprise от других открытых проектов. Медиа-архивы, научные репозитории, базы законодательства. Все поймут, что их данные — это нефть, а Big Tech — нефтяные вышки. И начнут продавать доступ в промышленных масштабах.
Сама Википедия может измениться. Волонтёры, узнав, что их правки продают Microsoft, потребуют долю. Или создадут альтернативную платформу с другим лицензированием. Уже сейчас есть проекты вроде Grokipedia, которые пытаются переосмыслить краудсорсинг знаний.
Совет для разработчиков ИИ? Не стройте бизнес на бесплатном API Википедии. Его условия могут измениться в любой момент. Либо готовьте бюджет на Enterprise, либо ищите альтернативные источники данных. Потому что эра дармовых тренировочных наборов для ИИ официально закончилась. Теперь за знания нужно платить. Или воровать. Но второй вариант становится всё дороже.