Что такое Local Personality Engine?

Экспериментальный фреймворк для создания модульных AI-агентов с характером, где личность агента описывается структурированным JSON-объектом, который можно менять во время работы (горячая замена).

Почему Local Personality Engine работает локально?

Фреймворк использует Ollama для запуска моделей на вашем компьютере. Это обеспечивает безопасность (данные не уходят в облако), конфиденциальность и отсутствие платы за API-вызовы.

Для чего можно использовать LPE?

В первую очередь для создания выразительных NPC в видеоиграх (интеграция через JSON API с Unreal Engine, Unity), а также для чат-ботов с устойчивым характером в обучающих симуляциях или социальных проектах.

Local Personality Engine - модульные AI-агенты с характером для игр и чатов | 2026

Куда пропал характер?

Запустите любую игру с ИИ-NPC или поговорите с продвинутым чат-ботом. Что вы получите? Вежливый, предсказуемый, скучный контур личности. Они забывают ваши шутки через пять минут. Не злятся, когда вы оскорбляете их маму. Не впадают в депрессию после провала миссии. Это не персонажи — это голосовые ассистенты в костюмах фэнтези.

Проблема не в моделях. Llama 3.2 70B или свежий Mistral 2 славно ругаются и плачут. Дело в архитектуре. Большинство фреймворков создают агентов как монолитные промпт-машины. Характер, память, поведение — всё вшито в один гигантский системный промпт. Изменить что-то на лету? Перезагрузите агента. Добавить новую черту? Перепишите весь промпт. Это как менять двигатель Ferrari, чтобы покрасить её в синий цвет.

💡

Local Personality Engine (LPE) — это эксперимент, который поставил вопрос по-другому. А что если агент — это не код, а структурированный payload? Набор данных, который можно подменить во время работы, не прерывая диалог?

Агент как LEGO: разберите и соберите заново

Ядро LPE — простая, но мощная идея. Каждый агент описывается JSON-объектом (они называют это "персональность"), который включает:

Черты характера (traits): не просто "добрый", а "циничный добряк, который помогает, но язвительно комментирует".
Состояния (states): настроение, уровень усталости, отношение к игроку. Динамические переменные, которые меняются от событий.
Навыки (skills): модули, которые агент может использовать. Например, "поиск в памяти", "анализ намерений", "генерация сарказма".
Контекст памяти: не просто хронологический лог, а граф значимых событий. Агент помнит не всё, но то, что эмоционально окрашено.

Этот payload живёт отдельно от рантайма. FastAPI-сервис (обёртка вокруг Ollama) загружает его, интерпретирует и кормит модель. Хотите, чтобы торговец стал параноиком после ограбления? Обновите payload — состояние `trust_level` упадёт до нуля. Агент тут же начнёт смотреть на вас косо. Без перезапуска. Без переписывания промптов.

Вот где проявляется магия модульности. LPE не создаёт одного супер-агента. Он создаёт экосистему микросервисов-навыков. Один модуль отвечает за эмоциональную окраску речи, другой — за поиск в векторной базе воспоминаний, третий — за планирование диалога. Собрали пазл под конкретную задачу. Напомнило статью про сборку агентов из LEGO? Тот же принцип, но заточенный под характер, а не функциональность.

Локально — значит безопасно и дёшево

Ollama в 2026 году — это не та игрушка, что была два года назад. Поддержка квантования Q4_K_M, эффективное распределение слоёв по GPU, оптимизация для новых архитектур вроде Gemma 3. LPE использует это по полной. Вы можете запустить на одном RTX 4090:

Главную модель для диалога (например, Llama 3.2 11B в 4-битном формате).
Отдельную маленькую модель для классификации намерений игрока (Phi-4-mini).
Микромодель для оценки эмоционального тона ответов.

Всё работает одновременно. И всё на вашем железе. Никаких ключей API, никаких счётов от OpenAI, никакой отправки диалогов игроков в чужие дата-центры. Для инди-разработчиков или студий, работающих с чувствительными сюжетами, это единственный путь. Если сомневаетесь в производительности, почитайте как выжимают максимум из локальных агентов.

Интеграция? Отправьте JSON

Вот что свело меня с ума в хорошем смысле. Чтобы подключить LPE-агента к игре на Unreal Engine или Unity, не нужно писать тонны C++ биндингов. Сервис предоставляет REST API. Игровой движок отправляет событие ("игрок сказал: 'Твои товары — гнильё!'") в виде простого JSON. Получает ответ с текстом и метаданными ("настроение ухудшилось", "воспоминание добавлено").

Фактически, вы отделяете логику персонажа от логики игры. Дизайнеры могут настраивать характеров в веб-интерфейсе, не трогая код. Система настолько универсальна, что её уже тестируют не только в играх, но и в интерактивных обучающих симуляциях и даже в чатах для социальной поддержки. Прямая эволюция идей из Personica AI, но с открытой архитектурой.

Что делает LPE	Что делает типичный фреймворк
Меняет личность агента «на лету» (горячая замена)	Требует перезапуска или переписывания промпта
Хранит память как граф эмоционально значимых событий	Хранит память как линейный лог последних N сообщений
Работает полностью локально с любыми моделями Ollama 2026	Часто завязан на облако или одну модель
Интегрируется через простой JSON API	Требует глубокой интеграции на уровне кода

Подводные камни, конечно, есть

Бесплатного сыра не бывает. LPE — экспериментальный проект. Документация отрывочная. Чтобы собрать рабочего агента, нужно понять основы архитектуры AI-агентов (спасибо, есть отличный материал по проектированию).

Латентность. Если вы используете несколько моделей, ответ может формироваться не за 200 мс, а за 700. Для пошаговой RPG — ок. Для динамичного шутера — нет. Производительность упирается в ваше железо и искусство квантования. И да, пока нет красивой панели управления. Конфиги правятся в JSON-файлах. Но для тех, кто устал от переусложнённых студийных решений, это даже плюс.

💡

Самый неочевидный совет? Не пытайтесь сразу создать глубокого философа с трагическим прошлым. Начните с мелкого вора на рынке. Дайте ему две черты: "жадность" и "трусость". Настройте, чтобы при упоминании стражи состояние "страх" увеличивалось. Получится живой, управляемый характер. Сложность придет позже.

Что дальше? Персонажи, которые переживают за нас

LPE — не готовый продукт. Это приглашение к эксперименту. Архитектура, где личность — это данные, открывает дикие возможности. Представьте, что характер NPC может эволюционировать на основе действий не одного игрока, а всей MMO-популяции. Или что терапевтический чат-бот будет не просто подбирать слова по шаблону, а искренне (насколько это возможно для ИИ) беспокоиться о вашем прогрессе, основываясь на истории ваших сессий.

Главный прогноз на 2026-2027 год? Мы увидим взрывное разнообразие в инди-играх именно потому, что такие инструменты как LPE снимут главный барьер — сложность создания живого, изменчивого ИИ. Персонажи перестанут быть декорацией. Они станут тем, ради чего мы играем и общаемся. Они наконец-то начнут помнить.

А если эта архитектура вас зацепила, посмотрите, как делают production-агентов с нуля — там другой подход, но много пересекающихся идей. И да, держите под рукой мощную видеокарту. Персонажи с характером жрут ресурсы не меньше, чем патчейй-трейлеры.

Подписаться на канал

Local Personality Engine: NPC, которые помнят, что вы им сказали вчера