Какие минимальные требования для запуска PageStorm?

Для квантизованной версии 7B нужно 6-8 ГБ видеопамяти, для 13B — 12-16 ГБ. Можно использовать Ollama или llama.cpp.

Может ли PageStorm генерировать целые книги?

Да, с помощью Scaffold Attention модель удерживает сюжет до 80-100 тысяч токенов. Подходит для романов, серий книг.

Сколько стоит PageStorm?

Полностью бесплатно, открытый код (MIT лицензия). Работает локально, без подписок.

PageStorm v2.0: модель для написания книг — настройка, промпты, сравнение

Тот самый момент, когда Sonnet 3.7 умирает

Вы сидите с пустым взглядом перед курсивом «Глава 17». ChatGPT выплёвывает три абзаца про «оторопевшего героя, который вглядывался в даль», а потом — тишина. Контекстное окно прожёвывает последние 8000 токенов и начинает забывать, что герой — левша, а антагонист боится пауков. Знакомо? Если да — встречайте PageStorm v2.0, модель, которую автор Vellium (тот самый, кто сделал писательский режим в Vellium) заточил под одну задачу: писать книги, а не отвечать на имейлы.

PageStorm — не очередной «универсальный помощник», который пытается быть и поэтом, и программистом. Это 13-миллиардная модель, дообученная исключительно на художественных текстах: от романов Толстого до современных веб-новелл. Она не умеет писать код, не цитирует Википедию — зато держит сюжет на 50 000 токенах и не сбивается на «с другой стороны» через три абзаца.

Важное уточнение: PageStorm не генерирует текст «за вас». Она — соавтор, который помнит, что в седьмой главе персонаж потерял ключи от машины, и может предложить, где они всплывут в финале.

Что под капотом: архитектура и «фишки», которых нет у других

Базовая архитектура — Transformer Decoder, но с двумя ключевыми модификациями:

Scaffold Attention — механизм, который фиксирует «скелет» сюжета (ключевые точки, арки персонажей) и повторно подгружает его каждые 2048 токенов. Контекстное окно — 128k токенов, но модель «помнит» самые важные моменты даже при 200k.
Narrative Consistency Head — дополнительный выход, который оценивает логику повествования. Если модель решает, что персонаж делает что-то нехарактерное, она не просто генерирует дальше, а подсвечивает это в логах.

Эти штуки работают только с PageStorm, и это сразу видно. Когда я попытался написать детектив, где сыщик теряет очки в первой главе, а в десятой они находятся — модель не забыла про очки ни разу. Сравните с Llama 3.1 70B, которая к пятой главе превратила сыщика в дальтоника.

Как настроить PageStorm: от установки до первого абзаца

В теории это open-source, но на практике нужен компьютер с 16 ГБ видеопамяти (на Quantized 4-bit). Если у вас Mac M2 Ultra с 192 ГБ памяти (как в этой истории про экстремум) — вообще сказка: модель летает.

1Установка через Ollama

Самый простой способ — уже готовые квантизованные версии:

ollama pull pagestorm:7b-q4_K_M  # для 6-8 ГБ VRAM
ollama pull pagestorm:13b-q4_K_M # для 12-16 ГБ VRAM, рекомендую

Затем запускаете с фиксированным seed, чтобы получать воспроизводимые результаты:

ollama run pagestorm:13b-q4_K_M --seed 42

2Промпт: как НЕ надо делать

Большинство ошибок — из-за того, что промпты скопированы из ChatGPT. PageStorm не терпит «будь вежливым» в системном сообщении. Он хочет структуру:

Ошибка: «Напиши главу 12, где герой встречает старого друга, используя яркие описания».

Результат — скучная вода. Правильный подход:

SYSTEM = """
Сюжетный скелет: герой (Пётр, 35 лет, бывший военный) 
ищет пропавшую дочь. В главе 12 он находит старого друга — 
Майю, которая работает в архиве. Дружба была разорвана 10 лет 
назад из-за предательства. 
Ключевая точка: Майя знает местонахождение дочери, но не 
хочет говорить. Эмоциональная арка: от холодности до 
вспышки гнева.
"""
USER = "Глава 12. Встреча в архиве. Напиши диалог, в котором 
Пётр сначала притворяется, что забыл прошлое, но постепенно 
срывается на крик. Используй дождь за окном как метафору 
нарастающего напряжения."

Результат — 4 страницы диалога с внутренними монологами, где каждая реплика двигает сюжет. Никаких «он вздохнул» без причины.

3Настройка параметров генерации

PageStorm любит высокую температуру (0.9-1.1) для диалогов и низкую (0.4-0.6) для описаний. Top-k = 40, top-p = 0.9. Частота штрафов — 0.15 (иначе начинает повторять «он подумал» каждые три строки).

Пример для llama.cpp:

./main -m pagestorm-13b-q4_K_M.gguf -p "[INST] ... [/INST]" 
--temp 0.8 --repeat-penalty 1.15 --top-k 40 --top-p 0.9 
--ctx-size 32000

Звучит сложно? На самом деле один раз сохранили в скрипт — и забыли.

Сравнение с альтернативами: почему не ChatGPT, не Claude и даже не NovelAI

Параметр	PageStorm 13B	Claude Sonnet 4.6	NovelAI Kayra
Макс. контекст	128k (эффективно ~80k)	200k (но быстро забывает начало)	8k
Стоимость	Бесплатно (open-source)	$20/мес + лимиты	$10-25/мес
Контроль сюжета	Высокий (Scaffold Attention)	Средний (теряет детали)	Низкий (не держит длинные арки)
Творческий стиль	Близок к классике, но гибкий	Корпоративно-вежливый	Специфический (аниме/фанфики)
Локальный запуск	Да (16 ГБ VRAM)	Нет	Нет

Какую нейросеть выбрать для написания текста — вопрос, который мы разбирали отдельно. Если коротко: PageStorm — единственная бесплатная модель, которая не теряет нить повествования на дистанции в 10 глав. Claude 4.6 (по моему тесту) уже к 3-й главе «забывает», что герой — вегетарианец, и кормит его стейком.

Живой пример: сценарий финала детектива

Допустим, вы пишете детектив. Убийца — дворецкий, но читатель должен догадаться только в последней главе. PageStorm умеет держать «ложные следы» и выдавать их ровно в нужный момент. Я попросил модель написать сцену, где детектив впервые подозревает дворецкого, но не говорит об этом вслух:

prompt = """
Сюжетный скелет: убийца — дворецкий (Джеймс, 50 лет, 
педантичный). Детектив Смит только что заметил, что 
часы на камине показывают неправильное время — их 
переводили, чтобы создать алиби. Джеймс входит в комнату 
и предлагает чай. Смит должен скрыть подозрение, но 
читатель ощущает напряжение.
"""
# Результат через PageStorm (отредактирован для краткости):
"""
Смит проследил, как пальцы Джеймса сжались на ручке 
чайника чуть сильнее, чем нужно. Секунда — и он снова 
расслабился. «С сахаром или без?» — голос был ровным, 
даже ласковым. Но Смит уже видел, как дрожит край 
фарфоровой чашки, когда дворецкий ставит её на стол. 
«Без» — ответил детектив и улыбнулся, не разжимая зубов. 
В комнате запахло бергамотом и ложью.
"""

Модель не просто описывает действие — она выстраивает психологическое напряжение. Ни одна коробочная нейросеть (ChatGPT, Gemini) не даст такой плотности намеков без прямых указаний.

Кому PageStorm не подойдёт (честно)

Если вам нужен «генератор текста» на 5000 знаков для блога — идите к GPT или Claude. PageStorm слишком медленный для коротких форм.
Если пишете строго по плану и не хотите сюрпризов — модель может «выдумать» неожиданный поворот, который придётся править.
Если нет GPU с 12+ ГБ — забудьте. CPU-инференс на 13B модели даёт 1-2 токена в секунду (это как писать вручную, только с лагом).

Но если вы готовы к экспериментам — это лучший бесплатный инструмент для длинных нарративов. А если добавить автоматическую иллюстрацию глав через этот пайплайн генерации, получится конвейер по производству книг.

Прогноз: PageStorm убьёт рынок «литературных ассистентов»?

Думаю да, но не сразу. Тренировать LLM на своих EPUB — уже реальность. PageStorm — следующий шаг: модель, которая не просто учится на книгах, а понимает, как работает драматургия. Через год-два подобные open-source модели смогут писать целые романы с минимальным контролем. Вопрос не в технологии, а в том, готовы ли читатели принять книгу, написанную в соавторстве с алгоритмом. Лично я — готов. Особенно если PageStorm запомнит, что в 23-й главе у героини сломался телефон — и не заставит её звонить в финале.

Подписаться на канал

PageStorm: как локальная модель для книг заменяет ChatGPT и не боится тормозов