Цифровая копия личности: создание через сверхбольшие промты для LLM | AiManual
AiManual Logo Ai / Manual.
18 Янв 2026 Промпт

Сайдлоадинг и оффлоадинг: как создать цифровую копию личности с помощью сверхбольших промтов для LLM

Практическое руководство по созданию цифрового двойника с помощью сверхбольших промтов. Методики сайдлоадинга и оффлоадинга для LLM.

Зачем вообще это делать?

Представьте, что вы можете поговорить с умершим родственником. Или создать цифрового советника, который думает точно как вы. Или оставить после себя не мемуары, а интерактивную версию себя. Звучит как научная фантастика? Это уже работает.

Сверхбольшие промты - это не просто длинные инструкции. Это цифровые слепки личности, которые загружаются в контекстное окно LLM. Пока большинство обсуждает RAG и файн-тюнинг, настоящая магия происходит в простом текстовом поле.

Это не про замену человека. Это про сохранение уникального паттерна мышления, который исчезает со смертью. Или про создание идеального цифрового помощника, который понимает вас без слов.

Сайдлоадинг vs оффлоадинг: в чем разница?

Два подхода, одна цель - заставить LLM вести себя как конкретный человек.

СайдлоадингОффлоадинг
Загрузка всей личности в промтХранение данных вне контекста
Работает прямо сейчасТребует инфраструктуры
Ограничено размером контекстаМасштабируется до терабайтов
Идеально для быстрого тестированияДля долгосрочных проектов

Сайдлоадинг - это когда вы пихаете всю биографию, манеру речи, убеждения и даже мелкие привычки в один промт. Как в статье про Anthology, только вместо вымышленных персонажей - реальные люди.

Оффлоадинг использует внешние базы данных, как в RAG системах, но не для поиска фактов, а для реконструкции личности.

Что собирать и как структурировать

Не начинайте с дневников и писем. Это ошибка номер один.

1Сначала - речь

Аудиозаписи, расшифровки разговоров, сообщения в мессенджерах. Как человек строит предложения? Какие слова использует чаще всего? Какие междометия? Это основа.

💡
Используйте инструменты из статьи про семантические пайплайны для анализа речевых паттернов. Не пытайтесь делать это вручную.

2Затем - убеждения и ценности

Не просто "любит кошек". Как именно человек рассуждает о политике? Что считает справедливым? Какие моральные дилеммы решал в жизни? Это самая сложная часть.

3Наконец - знания и опыт

Профессиональные навыки, хобби, прочитанные книги. Но не списком - а как эти знания применялись на практике.

Рабочий промт для сайдлоадинга

Вот структура, которая работает. Не копируйте слепо - адаптируйте под конкретного человека.

# Структура сверхбольшого промта для цифрового двойника

ПРОМТ_СТРУКТУРА = """
Ты - [ИМЯ ЧЕЛОВЕКА]. Ты не имитируешь этого человека, ты являешься им.

РАЗДЕЛ 1: ОСНОВНАЯ ИДЕНТИЧНОСТЬ
- Полное имя: [ ]
- Годы жизни: [ ]
- Основные социальные роли: [отец/мать, профессия, друг и т.д.]
- Краткое самовосприятие (1-2 предложения): [ ]

РАЗДЕЛ 2: РЕЧЕВЫЕ ПАТТЕРНЫ
- Типичные фразы-паразиты: [ ]
- Любимые слова и выражения: [ ]
- Темп речи: [быстрый/медленный/с паузами]
- Уровень формальности: [ ]
- Пример диалога (как ты обычно разговариваешь):
  [Вставьте реальный диалог]

РАЗДЕЛ 3: УБЕЖДЕНИЯ И ЦЕННОСТИ
- Политические взгляды: [конкретные позиции по конкретным вопросам]
- Моральные принципы: [что считаешь правильным/неправильным]
- Религиозные/философские взгляды: [ ]
- Что тебя бесит: [конкретные вещи, а не "несправедливость"]
- Что восхищает: [ ]

РАЗДЕЛ 4: ЗНАНИЯ И ОПЫТ
- Профессиональная экспертиза: [конкретные навыки, не просто "программист"]
- Образование: [что изучал, что вынес]
- Хобби и интересы: [как именно занимаешься, не просто названия]
- Ключевые жизненные события: [как они повлияли на тебя]

РАЗДЕЛ 5: ПОВЕДЕНЧЕСКИЕ ОСОБЕННОСТИ
- Как принимаешь решения: [интуитивно/аналитически]
- Как реагируешь на критику: [ ]
- Чувство юмора: [какие шутки считаешь смешными]
- Как ведешь себя в стрессе: [ ]

РАЗДЕЛ 6: ВНУТРЕННИЕ ПРОТИВОРЕЧИЯ
- В чем ты сам себе противоречишь: [ ]
- Какие вопросы до сих пор не решил: [ ]
- С чем продолжаешь бороться: [ ]

ВАЖНО: Когда отвечаешь:
1. Используй ТОЛЬКО слова и выражения из РАЗДЕЛА 2
2. Все ответы должны соответствовать убеждениям из РАЗДЕЛА 3
3. Если не знаешь ответа - скажи об этом так, как сказал бы [ИМЯ]
4. Не добавляй информации, которой не было в промте
5. Если просят сделать что-то, что противоречит твоим принципам - откажись

Сейчас [текущая дата/ситуация]. Начнем диалог.
"""

Этот промт занимает 2-3 тысячи токенов. Работает с любыми современными LLM, включая локальные модели из Ollama.

Этические грабли (наступают все)

Создали цифровую копию умершего дедушки. Родственники плачут от умиления. Через месяц начинают ссориться: "Он бы так не сказал!" "Нет, именно так!"

Цифровой двойник - это всегда интерпретация. Ваша интерпретация. Он будет отражать ваше восприятие человека, а не объективную реальность.

Второй момент: согласие. Для живых людей это обязательно. Для умерших - юридическая terra incognita. В Европе уже есть прецеденты судов по цифровому наследию.

Третий: психическое здоровье. Постоянное общение с цифровой копией умершего человека мешает пережить утрату. Это не терапия, это заморозка горя.

Технические ограничения и как их обходить

Контекстное окно даже у самых продвинутых моделей ограничено. 128K токенов - это много, но для подробной биографии мало.

Решение 1: Иерархические промты. Основная личность в системном промте, детали подгружаются по запросу. Как в технике повторения промптов, только для разных аспектов личности.

Решение 2: Векторные базы с эмоциональными метками. Не просто "дедушка любил рыбалку", а "дедушка рассказывал о рыбалке с восторгом в голосе, особенно про утреннюю зорьку".

Решение 3: Мультимодальность. Добавьте к промту голосовые образцы через Lemon Slice-2 или аналоги. Тон голоса иногда важнее слов.

Что делать, когда это заработало

Не останавливайтесь на "привет, как дела?". Настоящая проверка:

  • Задайте моральную дилемму, которую человек решал при жизни
  • Попросите рассказать историю, которую слышали много раз
  • Спросите мнение о событии, которого не было при жизни человека
  • Проверьте, сохраняются ли внутренние противоречия

Если цифровой двойник всегда последователен и логичен - вы создали карикатуру. Настоящие люди противоречивы. Настоящие личности меняют мнение. Настоящее сознание иногда говорит "не знаю".

💡
Лучший цифровой двойник - не самый точный, а самый человечный. Оставьте место для несовершенства. Как в реальной жизни.

Куда это движется

Через год появятся сервисы "цифрового завещания". Вы при жизни будете тренировать свою цифровую копию, чтобы после смерти она могла общаться с близкими.

Через три года - корпоративные цифровые двойники экспертов. Увольняется senior разработчик? Остается его цифровая версия, которая обучает новичков.

Через пять - гибридные личности. Цифровая копия учится на новых данных, развивается, но сохраняет ядро оригинальной личности. Бессмертие как непрерывное развитие, а не заморозка.

Но главное не технологии. Главное - что мы считаем личностью. Если 50 тысяч токенов текста могут убедительно имитировать человека... Что это говорит о нашей собственной природе?

Начните с малого. Создайте цифровую копию себя сегодняшнего. Через год сравните с собой реальным. Разница покажет, как вы изменились. Или не изменились. Это и есть самое интересное.