С какого числа обязательно маркировать AI-текст в ЕС?

С августа 2025 года. Требование вступило в силу год назад, и сейчас, в июне 2026 года, европейские регуляторы активно следят за его исполнением.

Какие технические решения для водяных знаков в тексте существуют?

Основные подходы: внедрение невидимых юникод-символов, статистические паттерны (редкие токены), генерация с искусственным шумом в выбор токенов, а также легковесные WASM-модули на стороне провайдера.

Какие штрафы грозят за отсутствие маркировки?

До 7% от глобального годового оборота или 35 миллионов евро — в зависимости от того, что больше. Первый случай касался Character.AI.

EU AI Act: водяное маркирование текста с августа 2025 — что делать

Август 2025-го: когда текст перестал быть просто текстом

Ровно год назад, в августе 2025-го, вступила в силу норма EU AI Act, которая обязывает всех провайдеров и дистрибьюторов маркировать сгенерированный ИИ-текст водяными знаками. Если тогда многие отмахивались — «технически невозможно», «это же просто буквы», — то сейчас, в июне 2026-го, иллюзии развеялись. Европейская комиссия следит за исполнением, а первые штрафы уже пошли.

Формально требование звучит так: любой «синтезированный текст» — от ответов чат-бота до автоматически сгенерированной новости — должен содержать техническую метку, позволяющую отследить его происхождение. Метод не указан, но водяные знаки признаны приоритетным.

Почему текст — это зона поражения

С изображениями всё проще: вшиваешь в пиксели шум, и хоть в какой-то степени это работает. Текст — дискретен. Любой AI-текст можно переписать, перефразировать, пропустить через синонимизатор — и следов не останется. Те разработчики, которые полагались на простые маркеры вроде [AI-generated] в теле ответа, быстро поняли: пользователи их просто удаляют. Технические решения, которые предлагают скрытые символы или статистические паттерны (например, использование редкого токена через определённые интервалы), ломаются о банальный перевод на другой язык.

Забавный факт: одну из первых «обманок» нашли в чате Llama 4 — модель вставляла невидимые юникод-символы в каждый ответ. Через три дня хакеры выпустили скрипт, который вырезал их за микросекунды. Водяные знаки в тексте — это гонка вооружений, и пока ИИ-провайдеры проигрывают.

Open-source под прицелом

Самая большая головная боль — open-source модели. Когда ты скачиваешь веса Llama 4, Mistral Large 2 или DeepSeek-V5, ты можешь дообучить их, удалив любую защиту. Европейский закон пытается закрыть эту лазейку через провайдеров: даже если ты раздаёшь модель бесплатно, ты обязан вшивать механизм маркировки. Но кто проконтролирует, что пользователь не пересоберёт модель без водяных знаков? Пока это серая зона.

В марте 2026 года Европарламент внёс поправку: если модель распространяется с открытыми весами, ответственность за маркировку ложится на того, кто её запускает в продакшн. Но не на автора. Пока это не решило проблему — цепочка поставок AI-моделей остаётся без контроля.

На этом фоне российским разработчикам приходится лавировать между двумя регуляторными огнями. С одной стороны — требования российского закона о маркировке, который обещает штрафы до 5 млн рублей. С другой — EU AI Act, который может ударить по тем, кто работает с европейскими партнёрами. О двойном ударе мы уже писали: EU AI Act и санкции: как не потерять рынок.

Штрафы: не отделаешься

Нарушения караются штрафом до 7% от глобального годового оборота или 35 миллионов евро — что больше. И первый громкий случай уже произошёл: в ноябре 2025 года Character.AI получила предупреждение за отсутствие маркировки в диалогах с подростками. Иск о гибели подростков только усилил давление. Теперь регулятор проверяет всех, кто использует AI-чатботы для общения с несовершеннолетними. Подробнее про иск Character.AI мы рассказывали.

Технические решения: что реально работает?

За год рынок адаптировался. Крупные провайдеры — OpenAI, Google, Anthropic — внедряют водяные знаки на уровне API. Например, синтезированный ответ Claude вшивает в свой ответ определённую последовательность токенов, которая распознаётся детектором. Но если ответ скопировать и переписать вручную, детектор упадёт. Хитрые стартапы предлагают «генерацию с проверкой на полезность» — модель на этапе инференса добавляет неотличимый для человека шум в выбор токенов, но это жутко замедляет работу.

Microsoft в прошлом году предложила свою карту верификации — набор API для проверки происхождения контента. Но, как мы писали, план может провалиться из-за отсутствия интеграции. Пока что самые надёжные схемы — те, что работают на уровне провайдера, а не файла. Например, WASM-модуль, который проверяет возраст, не касаясь данных (помните ту историю?). Похожий подход предлагают для атрибуции текста: лёгкий бинарный модуль, внедрённый в среду запуска модели, подписывает каждый ответ на лету. Это сложнее обойти, чем символы в строке.

А что насчёт open-source спокойной жизни?

Именно open-source модели вызывают больше всего споров. В январе 2026 года фонд Hugging Face выпустил рекомендации: все модели, распространяемые через платформу, должны включать слой маркировки в pipeline инференса. Но это рекомендация, а не закон. Пока разработчики находят лазейки: можно взять ту же Llama 3.1, дообучить её без маркировки, запустить на своём сервере в не-европейской юрисдикции — и теоретически не подпадать под закон. Однако если твой сервис доступен из Европы, риск колоссальный.

Аналитики прогнозируют, что к 2027 году Европа примет поправки, обязывающие все модели, распространяемые в EU, иметь встроенный ключ дешифровки для проверяющих органов. Это фактически убьёт анонимный open-source в Европе. Наши материалы про год расплаты для архитектуры данных и новый закон об ИИ в России показывают, что мир движется к фрагментации: в каждом регионе свои требования, и разработчикам придётся создавать несколько версий продуктов.

Что делать прямо сейчас

Не ждать, пока вас оштрафуют. Если ваш AI-сервис хотя бы теоретически доступен европейским пользователям, внедряйте маркировку. Лучший вариант на сегодня — комбинировать подходы: встраивать невидимые маркеры на уровне генерации и использовать проверку на стороне провайдера.

И ещё одна вещь: не полагайтесь на водяные знаки как на панацею. Закон требует «прозрачности», а не идеальной защиты. Поэтому даже минимальная маркировка, о которой вы публично заявляете, уже снижает риски. Покажите регулятору, что вы стараетесь — для первых проверок этого достаточно.

Хотите быстро адаптировать свой код к новым требованиям? Профессиональные AI-инженеры помогут внедрить маркировку за неделю — закажите консультацию на платформе.

Готовый WASM-модуль для атрибуции AI-текста: бесплатный open-source проект с инструкцией по интеграции. Скачайте на GitHub.

Подписаться на канал

EU AI Act: обязательное водяное маркирование текста с августа 2025 — что нужно знать разработчикам и провайдерам