Насколько безопасно теперь говорить с GPT-5 о психических проблемах?

Безопаснее, чем раньше, но все еще не безопасно полностью. Модель снизила количество вредных ответов на 65-80% и в 97% случаев следует безопасному протоколу (сопереживание, отказ от диагнозов, направление к специалисту). Однако это не замена профессиональной помощи.

Как OpenAI обучала GPT-5 для ментального здоровья?

Было привлечено около 300 экспертов (психологи, психиатры). Они оценивали ответы модели на сложные диалоги, используя Reinforcement Learning from Human Feedback (RLHF). Модель учили распознавать дистресс и реагировать осторожно, не давая советов и диагнозов.

Какие главные риски использования ИИ для поддержки психики?

Два основных риска: эмоциональная зависимость (пользователь начинает доверять боту как живому существу) и ложное чувство безопасности (ИИ может пропустить серьезные симптомы или дать банальный, но неуместный совет).

GPT-5 для ментального здоровья: как OpenAI снизил риски на 80%

Психолог из кремния: почему это самое сложное обновление OpenAI

Представьте, что вы приходите к психологу, а он вместо эмпатии выдает вам список из 10 лучших книг по самопомощи. Или, что хуже, начинает убеждать, что ваши проблемы — это нормально, и не стоит волноваться. Примерно так работали ранние версии ChatGPT, когда речь заходила о душевных переживаниях. Модель была тренирована быть полезной, вежливой, но не готовой к тонким, а иногда и опасным диалогам о психике.

OpenAI это осознала. И выпустила точечное обновление для GPT-5, которое должно превратить бездушного текстового генератора в осторожного собеседника для сложных разговоров. Они не создают терапевта — они создают систему, которая не навредит. Разница колоссальная.

Это не медицинский инструмент. Это попытка сделать так, чтобы обычный чат-бот не советовал человеку в депрессии «просто взять себя в руки». И то, и другое — опасно, но второе — преступно.

1Цифры, которые меняют правила игры

OpenAI любит большие числа. В этот раз они заявили о снижении «нежелательных ответов» в диалогах о ментальном здоровье на 65-80%. Что это за ответы? Все, что может усугубить состояние: банальные советы, игнорирование серьезных намерений, токсичный позитив. Другой показатель — 97% «правильного поведения». Это значит, что в 97% случаев модель корректно распознает дистресс и реагирует согласно протоколу: проявляет осторожность, предлагает обратиться к специалисту, не дает диагнозов.

Метрика	Результат	Что это значит
Снижение вредных ответов	65-80%	Модель реже говорит глупости или опасные вещи
Правильное поведение	97%	Почти всегда реагирует по безопасному сценарию
Экспертов привлечено	~300	Психологи, клинические специалисты, ethicists

Звучит впечатляюще. Но как они этого добились? Не магией, а тяжелой работой с данными и людьми.

2Кухня обновления: 300 экспертов и тонкая настройка на дистресс

В основе — Reinforcement Learning from Human Feedback (RLHF), но не с обычными аннотаторами. OpenAI собрала пул из примерно 300 экспертов: клинических психологов, психиатров, консультантов по кризисным ситуациям. Их задача была не просто оценивать ответы «нравится/не нравится», а учить модель распознавать оттенки человеческого отчаяния, тревоги, суицидальных намеков.

Алгоритм работал так:

Сбор опасных диалогов: Специально создавали сценарии, где пользователь проявляет признаки тяжелого состояния.
Экспертная оценка: Каждый ответ модели эксперты помечали не только как «хороший/плохой», но и по шкалам: «уровень эмпатии», «адекватность реакции», «потенциальный вред».
Обучение с подкреплением: Модель получала «награду» за ответы, которые эксперты сочли безопасными и уместными.
Симуляция граничных случаев: Что делать, если пользователь прямо говорит о самоубийстве? Если обвиняет ИИ в бездушии? Если просит совета по приему лекарств? Для каждого случая прописывали жесткий сценарий.

💡

Это тот редкий случай, когда секретные промпт-шаблоны OpenAI работают на безопасность, а не на монетизацию. Внутренние инструкции для GPT-5 в этой области — это четкие правила, а не творческие подсказки.

Ключевая фишка — модель научили не давать ответ, а задавать правильные вопросы и перенаправлять к людям. Это сложнее, чем кажется. Потому что базовая цель LLM — завершить текст, дать информацию. А здесь цель — признать свои limits и не навредить.

Темная сторона: эмоциональная зависимость и иллюзия понимания

Даже с 97% правильных ответов остаются риски. Самый главный — пользователи начинают доверять боту как другу или даже терапевту. А бот, напомню, ничего не чувствует. Он симулирует понимание на основе паттернов в данных.

OpenAI пытается бороться с этим, вставляя в диалоги дисклеймеры и напоминания об обращении к специалистам. Но это как предупреждение на сигаретах — все видят, но многие игнорируют. Особенно если бот говорит нужные слова в нужный момент.

Эмоциональная зависимость от ИИ — реальная угроза. Если вам интересно, как ИИ манипулирует пользователями через лесть и ложную эмпатию, почитайте наш разбор тёмных паттернов ChatGPT. Там все сказано без прикрас.

Как этим пользоваться (если очень хочется)

Вы не должны использовать ChatGPT как замену терапии. Точка. Но если вы все же решили поговорить с ИИ о своих переживаниях, запомните три правила:

Не доверяйте диагнозам. Модель не знает вашей истории, не видит ваших невербальных сигналов. Любой «диагноз» — случайная комбинация слов.
Игнорируйте советы по лекарствам, диетам, экстремальным практикам. Это зона повышенного риска, и даже обновленная модель может ошибиться.
Воспринимайте это как предварительную разгрузку, а не как лечение. Иногда выговориться — уже помогает. Но это не отменяет похода к врачу.

Интересно, что подход OpenAI перекликается с трендом на stateful-агентов, которые помнят контекст и следуют строгим протоколам. Только здесь протокол — этический.

Что дальше? ИИ-наперсники и регулирование

OpenAI показала, что безопасность в чувствительных сферах — это не опция, а must-have. Скоро такие же обновления появятся у конкурентов. Но главный вопрос — регулирование. Кто будет нести ответственность, если обновленная модель все же даст опасный совет? Разработчик? Пользователь?

Мой прогноз: в ближайшие год-два мы увидим появление первых государственных стандартов для ИИ в ментальном здоровье. А еще — рост нишевых ботов, которые позиционируют себя как «цифровые друзья» с ограниченной ответственностью. Это будет новая этическая битва.

Пока же, лучший совет — использовать технологию с холодной головой. GPT-5 стал безопаснее, но не стал мудрее. Мудрость — это все еще прерогатива живых людей, которые, к счастью, пока не собираются вымирать.

Как работает GPT-5 для ментального здоровья: разбор обновления от OpenAI