Тот самый момент, когда Sonnet 3.7 умирает
Вы сидите с пустым взглядом перед курсивом «Глава 17». ChatGPT выплёвывает три абзаца про «оторопевшего героя, который вглядывался в даль», а потом — тишина. Контекстное окно прожёвывает последние 8000 токенов и начинает забывать, что герой — левша, а антагонист боится пауков. Знакомо? Если да — встречайте PageStorm v2.0, модель, которую автор Vellium (тот самый, кто сделал писательский режим в Vellium) заточил под одну задачу: писать книги, а не отвечать на имейлы.
PageStorm — не очередной «универсальный помощник», который пытается быть и поэтом, и программистом. Это 13-миллиардная модель, дообученная исключительно на художественных текстах: от романов Толстого до современных веб-новелл. Она не умеет писать код, не цитирует Википедию — зато держит сюжет на 50 000 токенах и не сбивается на «с другой стороны» через три абзаца.
Важное уточнение: PageStorm не генерирует текст «за вас». Она — соавтор, который помнит, что в седьмой главе персонаж потерял ключи от машины, и может предложить, где они всплывут в финале.
Что под капотом: архитектура и «фишки», которых нет у других
Базовая архитектура — Transformer Decoder, но с двумя ключевыми модификациями:
- Scaffold Attention — механизм, который фиксирует «скелет» сюжета (ключевые точки, арки персонажей) и повторно подгружает его каждые 2048 токенов. Контекстное окно — 128k токенов, но модель «помнит» самые важные моменты даже при 200k.
- Narrative Consistency Head — дополнительный выход, который оценивает логику повествования. Если модель решает, что персонаж делает что-то нехарактерное, она не просто генерирует дальше, а подсвечивает это в логах.
Эти штуки работают только с PageStorm, и это сразу видно. Когда я попытался написать детектив, где сыщик теряет очки в первой главе, а в десятой они находятся — модель не забыла про очки ни разу. Сравните с Llama 3.1 70B, которая к пятой главе превратила сыщика в дальтоника.
Как настроить PageStorm: от установки до первого абзаца
В теории это open-source, но на практике нужен компьютер с 16 ГБ видеопамяти (на Quantized 4-bit). Если у вас Mac M2 Ultra с 192 ГБ памяти (как в этой истории про экстремум) — вообще сказка: модель летает.
1Установка через Ollama
Самый простой способ — уже готовые квантизованные версии:
ollama pull pagestorm:7b-q4_K_M # для 6-8 ГБ VRAM
ollama pull pagestorm:13b-q4_K_M # для 12-16 ГБ VRAM, рекомендуюЗатем запускаете с фиксированным seed, чтобы получать воспроизводимые результаты:
ollama run pagestorm:13b-q4_K_M --seed 422Промпт: как НЕ надо делать
Большинство ошибок — из-за того, что промпты скопированы из ChatGPT. PageStorm не терпит «будь вежливым» в системном сообщении. Он хочет структуру:
Ошибка: «Напиши главу 12, где герой встречает старого друга, используя яркие описания».
Результат — скучная вода. Правильный подход:
SYSTEM = """
Сюжетный скелет: герой (Пётр, 35 лет, бывший военный)
ищет пропавшую дочь. В главе 12 он находит старого друга —
Майю, которая работает в архиве. Дружба была разорвана 10 лет
назад из-за предательства.
Ключевая точка: Майя знает местонахождение дочери, но не
хочет говорить. Эмоциональная арка: от холодности до
вспышки гнева.
"""
USER = "Глава 12. Встреча в архиве. Напиши диалог, в котором
Пётр сначала притворяется, что забыл прошлое, но постепенно
срывается на крик. Используй дождь за окном как метафору
нарастающего напряжения."Результат — 4 страницы диалога с внутренними монологами, где каждая реплика двигает сюжет. Никаких «он вздохнул» без причины.
3Настройка параметров генерации
PageStorm любит высокую температуру (0.9-1.1) для диалогов и низкую (0.4-0.6) для описаний. Top-k = 40, top-p = 0.9. Частота штрафов — 0.15 (иначе начинает повторять «он подумал» каждые три строки).
Пример для llama.cpp:
./main -m pagestorm-13b-q4_K_M.gguf -p "[INST] ... [/INST]"
--temp 0.8 --repeat-penalty 1.15 --top-k 40 --top-p 0.9
--ctx-size 32000Звучит сложно? На самом деле один раз сохранили в скрипт — и забыли.
Сравнение с альтернативами: почему не ChatGPT, не Claude и даже не NovelAI
| Параметр | PageStorm 13B | Claude Sonnet 4.6 | NovelAI Kayra |
|---|---|---|---|
| Макс. контекст | 128k (эффективно ~80k) | 200k (но быстро забывает начало) | 8k |
| Стоимость | Бесплатно (open-source) | $20/мес + лимиты | $10-25/мес |
| Контроль сюжета | Высокий (Scaffold Attention) | Средний (теряет детали) | Низкий (не держит длинные арки) |
| Творческий стиль | Близок к классике, но гибкий | Корпоративно-вежливый | Специфический (аниме/фанфики) |
| Локальный запуск | Да (16 ГБ VRAM) | Нет | Нет |
Какую нейросеть выбрать для написания текста — вопрос, который мы разбирали отдельно. Если коротко: PageStorm — единственная бесплатная модель, которая не теряет нить повествования на дистанции в 10 глав. Claude 4.6 (по моему тесту) уже к 3-й главе «забывает», что герой — вегетарианец, и кормит его стейком.
Живой пример: сценарий финала детектива
Допустим, вы пишете детектив. Убийца — дворецкий, но читатель должен догадаться только в последней главе. PageStorm умеет держать «ложные следы» и выдавать их ровно в нужный момент. Я попросил модель написать сцену, где детектив впервые подозревает дворецкого, но не говорит об этом вслух:
prompt = """
Сюжетный скелет: убийца — дворецкий (Джеймс, 50 лет,
педантичный). Детектив Смит только что заметил, что
часы на камине показывают неправильное время — их
переводили, чтобы создать алиби. Джеймс входит в комнату
и предлагает чай. Смит должен скрыть подозрение, но
читатель ощущает напряжение.
"""
# Результат через PageStorm (отредактирован для краткости):
"""
Смит проследил, как пальцы Джеймса сжались на ручке
чайника чуть сильнее, чем нужно. Секунда — и он снова
расслабился. «С сахаром или без?» — голос был ровным,
даже ласковым. Но Смит уже видел, как дрожит край
фарфоровой чашки, когда дворецкий ставит её на стол.
«Без» — ответил детектив и улыбнулся, не разжимая зубов.
В комнате запахло бергамотом и ложью.
"""Модель не просто описывает действие — она выстраивает психологическое напряжение. Ни одна коробочная нейросеть (ChatGPT, Gemini) не даст такой плотности намеков без прямых указаний.
Кому PageStorm не подойдёт (честно)
- Если вам нужен «генератор текста» на 5000 знаков для блога — идите к GPT или Claude. PageStorm слишком медленный для коротких форм.
- Если пишете строго по плану и не хотите сюрпризов — модель может «выдумать» неожиданный поворот, который придётся править.
- Если нет GPU с 12+ ГБ — забудьте. CPU-инференс на 13B модели даёт 1-2 токена в секунду (это как писать вручную, только с лагом).
Но если вы готовы к экспериментам — это лучший бесплатный инструмент для длинных нарративов. А если добавить автоматическую иллюстрацию глав через этот пайплайн генерации, получится конвейер по производству книг.
Прогноз: PageStorm убьёт рынок «литературных ассистентов»?
Думаю да, но не сразу. Тренировать LLM на своих EPUB — уже реальность. PageStorm — следующий шаг: модель, которая не просто учится на книгах, а понимает, как работает драматургия. Через год-два подобные open-source модели смогут писать целые романы с минимальным контролем. Вопрос не в технологии, а в том, готовы ли читатели принять книгу, написанную в соавторстве с алгоритмом. Лично я — готов. Особенно если PageStorm запомнит, что в 23-й главе у героини сломался телефон — и не заставит её звонить в финале.