Domain-Specific Small Language Models: обзор книги для практиков 2026 | AiManual
AiManual Logo Ai / Manual.
26 Июн 2026 Новости

Обзор книги Domain-Specific Small Language Models: что нужно знать практикам

Разбираем книгу Guglielmo Iozzia про доменные SLM. Что работает в реальных проектах, а что — пыль в глаза. Ссылки на кейсы и инструменты.

Реклама
cliv2

Большие модели умерли? Не спешите хоронить GPT-5. Но бизнесу, которому нужен точный ответ, а не поэма о смысле жизни, давно понял: гиганты вроде Claude 4 или Gemini Ultra 2 годятся для развлечений и демонстраций. В продакшене правят маленькие, злые, заточенные под конкретную задачу модели. И книга Domain-Specific Small Language Models (Guglielmo Iozzia, 2025) — это не очередной учебник по трансформерам. Это карта местности для тех, кто устал от обещаний и хочет строить.

С чего все началось

Пока стартапы пилили очередной чат-бот на GPT-4o и удивлялись счетам за API, инженеры из банков, больниц и заводов тихо делали ML-системы, которые работают без интернета и укладываются в 2 ГБ RAM. Iozzia собрал этот опыт в книгу. Не академический талмуд, а артефакт инженерной культуры. Там нет лишних формул — зато есть ответы на вопросы: "Сколько нужно данных для fine-tuning на юридические документы?" или "Почему LoRA не спасет, если у вас битые лейблы?".

Если вы все еще выбираете модель по размеру контекста, а не по метрикам на вашем датасете — эта книга для вас. Или хотя бы почитайте нашу статью "LLM-лотерея: как не проиграть, выбирая языковую модель в 2025" — там те же грабли, но короче.

Почему SLM, а не GPT-5?

Книга бьет по самому больному: стоимость владения. Запустить GPT-5 на своих данных для медицинской диагностики — технически возможно, но экономически безумно. Iozzia показывает, как модель на 7 миллиардов параметров, обученная на 10 тысячах размеченных историй болезни, уделывает GPT-5 по F1 на внутреннем тесте. Без галлюцинаций, без API, без риска утечки данных. Звучит как магия? Нет, как правильная предобработка и выбор архитектуры. О том, как собирать такие датасеты, не сходя с ума, написано в нашем гайде "Тонкая настройка SLM на частных документах: практический гайд без галлюцинаций".

Что внутри книги: три инсайта, которые взбесят теоретиков

1. Размер имеет значение, но не так, как вы думаете

Iozzia предлагает не гоняться за State-of-the-Art на бенчмарках. Он учит выбирать минимально достаточную модель. Золотое правило: "Если ваша SLM решает задачу с точностью 98%, а гигант — 99%, но в 20 раз дороже — выкиньте гиганта". В книге есть таблицы сравнения TinyLlama, Phi-3.5, Qwen2.5-7B и Mistral 7B на доменных наборах. Спойлер: Phi-3.5 часто побеждает не потому, что умнее, а потому что ее легче адаптировать.

2. Данные — это 90% успеха, но не любые данные

Автор детально разбирает кейсы, когда SLM учили на корпоративных документах, и результаты были провальными. Причина — неучтенный дисбаланс классов и шум. Он предлагает конкретные техники очистки, синтетической генерации и активного обучения. Помните статью про то, как "Девять тысяч страниц интимного перевода" превратили обычную модель в писателя? Тот же принцип, только без эротики.

3. Fine-tuning — это не серебряная пуля

Iozzia открыто говорит: "Забудьте про LoRA, если ваш датасет меньше 500 примеров". Он разбирает, когда лучше использовать RAG, а когда — дообучение. И показывает, как комбинировать подходы. Для тех, кто хочет понять разницу на практике, рекомендуем посмотреть на SMART SLM с памятью для RAG — это прямая иллюстрация того, о чем пишет Iozzia.

Как это выглядит на практике: что раздражает

Книга не дает готовых скриптов. Вы не найдете там "бери и запускай". Iozzia — архитектор, а не кодер. Он рассказывает, что нужно сделать, но не показывает команды. Это бесит. Если вы привыкли к туториалам в стиле "скопируй код с GitHub" — эта книга разочарует. Но если вы умеете читать между строк и хотите понять, почему надо делать так, а не иначе — это goldmine.

Особенно ценно описание пайплайнов оценки. Iozzia убедительно доказывает, что стандартные метрики (perplexity) — мусор для доменных моделей. Нужны human evaluation или специфичные метрики вроде юридической точности цитирования. К слову, похожий подход использует проект AnyLanguageModel, где оценка идет на реальных сценариях, а не на искусственных датасетах.

Пять глав, которые стоит прочитать дважды

  1. Глава 3: Selection of Base Model — здесь разбирается, почему Qwen2.5-7B лучше Mistral 7B для китайского, но хуже для русского, и как это проверить до обучения.
  2. Глава 5: Data Preparation and Augmentation — техники синтеза данных, которые уже спасли проекты от голода. Отсылка к статье "Обучаем LLM с нуля для языка луганда" — здесь тот же подход, но для бизнеса.
  3. Глава 7: Fine-Tuning Strategies — разбор PEFT, QLoRA, DoRA. В свете новостей о смерти DPO и восходе GRPO (читайте наш репортаж с ICLR 2026), глава уже слегка устарела, но база остается.
  4. Глава 9: Deployment at Scale — автор в деталях описывает, как упаковать SLM в Docker и крутить на CPU с помощью llama.cpp и vLLM. Повторяет то, что мы собрали в обзоре фреймворков для локального запуска LLM, но с фокусом на бизнес.
  5. Глава 11: Case Studies — реальные истории из юридических фирм, банков и ретейла. Там есть пример, как SLM на 3B параметров заменила команду из 20 человек на обработке договоров. Кровь и плоть.

Что не так с книгой?

Главный минус — нет репликации экспериментов. Iozzia ссылается на внутренние бенчмарки, но не публикует датасеты. Для академического сообщества это плевок, для практиков — повод потратить месяц на воспроизведение. Второе: книга почти не касается мультимодальности. Если вам нужно анализировать медицинские снимки + текст — ищите другое. Третье: автору явно не хватает чувства юмора. Читать сухо, как руководство к стиральной машине.

Но! Если вы инженер, который устал от хайпа и хочет результата — это лучший компаньон. Особенно если параллельно следить за новыми техниками вроде Lookahead Sparse Attention из статьи "FlashMemory-DeepSeek-V4" — они прекрасно дополняют архитектурные решения из книги.

💡 Если вы хотите не читать, а сразу попробовать — запустите одну из SLM локально через продвинутые приложения для локальных LLM, а потом прочитайте книгу. С опытом восприятие будет в 10 раз глубже.

Вердикт: книга — не панацея, а компас. Куда плыть — решаете вы. Но без такого компаса вы рискуете заблудиться в море LLM и потратить миллионы на облачные инстансы. Берите, читайте, спорьте с автором. И не забывайте: к 2026 году ни одна теоретическая книга не заменит практики. Но эта — хотя бы не врет.

Подписаться на канал