Кто такой TheDrummer и зачем его модели?
TheDrummer - один из тех невидимых архитекторов, чьи модели регулярно взрывают рейтинги на HuggingFace. Если вы не следили за его работой, то март 2026 года - идеальный момент начать. На этой неделе он выкатил сразу четыре обновления: Skyfall 31B v4.1, Valkyrie 49B v2.1, Anubis 70B v1.2 и неожиданного карлика Anubis Mini 8B.
Что в них особенного? Все они - тонко настроенные версии популярных базовых моделей вроде Llama 3.3, Qwen 3.5 и Mistral 4. TheDrummer берет эти фундаменты и доучивает их на специфичных датасетах, выжимая максимум по конкретным задачам: от креативного письма до анализа кода.
Актуальность на 17.03.2026: все указанные версии - последние стабильные релизы от TheDrummer. Более новых патчей на момент публикации нет.
Skyfall 31B v4.1: снайпер для креативных задач
Предыдущая версия Skyfall уже гремела в чатах, но v4.1 - это эволюция. Модель построена на Llama 3.3 70B, но сжат до 31 миллиарда параметров через прогрессивное слияние и дообучение. TheDrummer утверждает, что сохранил 95% качества оригинала, но я бы сказал, что в креативном письме она даже превосходит базовую Llama.
Что умеет:
- Генерировать длинные связные тексты с минимальным повторением
- Понимать сложные инструкции с вложенными условиями
- Работать в ролевых сценариях, сохраняя консистентность персонажа
- Писать код на Python и JavaScript, хотя и с оговорками
Главный недостаток - жадность до памяти. Для комфортной работы в Llama.cpp потребуется минимум 24 ГБ оперативки или 16 ГБ VRAM. Если у вас меньше, лучше посмотреть на Loki-v2-70B, которая оптимизирована для ролевых игр.
Valkyrie 49B v2.1: универсальный солдат
Эта модель - гибрид Qwen 3.5 72B и Mistral 4 46B, доведенный до 49 миллиардов параметров. Звучит как франкенштейн, но работает на удивление слаженно. Valkyrie заточена под многозадачность: она одинаково хорошо справляется с анализом документов, переводом и ответами на вопросы.
Ключевые особенности v2.1:
- Улучшенное понимание контекста до 32 тысяч токенов
- Поддержка function calling для интеграции с внешними API
- Лучшая обработка неанглоязычных запросов, особенно русского и китайского
- Сниженный риск галлюцинаций в фактологических вопросах
Если вам нужна модель для бизнес-задач без специализации на чем-то одном - Valkyrie ваш выбор. Для сравнения, Apriel v1.6 легче, но и возможностей у нее меньше.
Anubis 70B v1.2: тяжелая артиллерия
Самая большая модель в подборке - 70 миллиардов параметров на базе Mistral 4. TheDrummer позиционирует ее как решение для сложных аналитических задач: финансовых отчетов, научных статей, юридических документов. И да, она справляется.
Новое в v1.2:
- Добавлена поддержка структурированного вывода (JSON, XML)
- Улучшена работа с табличными данными
- Исправлены проблемы с математическими выкладками
- Оптимизировано потребление памяти при использовании квантования
Минус очевиден: для запуска нужен серьезный железный ящик. Даже с квантованием до 4-бит модель занимает около 40 ГБ. Если у вас нет сервера с B200/H200, как в нашем гайде по vLLM, придется довольствоваться облачными инстансами.
Anubis Mini 8B: темная лошадка
Самое интересное обновление. TheDrummer внезапно выпустил уменьшенную версию Anubis - всего 8 миллиардов параметров. Модель обучена с нуля на датасете, имитирующем стиль большой Anubis, но с упором на эффективность.
Зачем это нужно?
- Запуск на ноутбуках с 8 ГБ ОЗУ без дискретной видеокарты
- Идеально для мобильных приложений и встраиваемых систем
- Скорость генерации в 5 раз выше, чем у 70B версии
- Качество, сопоставимое с 13B моделями, по заявлениям автора
Если вы хотите попробовать локальные LLM, но у вас слабое железо, начните с этого руководства. Anubis Mini может стать вашим первым успешным опытом.
Сравнение с альтернативами: что выбрать в 2026 году
Рынок локальных моделей перегружен. Каждый день появляются новые Merges и Fine-tunes. Чем TheDrummer лучше других?
| Модель | Параметры | Сильные стороны | Слабые стороны | Альтернативы |
|---|---|---|---|---|
| Skyfall 31B v4.1 | 31B | Креативность, связность текста | Высокие требования к памяти | Loki-v2-70B, Apriel v1.6 |
| Valkyrie 49B v2.1 | 49B | Универсальность, многозадачность | Средняя производительность в специализированных задачах | DeepSeek-V3.2, Qwen 3.5 72B |
| Anubis 70B v1.2 | 70B | Аналитика, работа с структурированными данными | Требует мощное железо | Mistral 4, Llama 3.3 70B |
| Anubis Mini 8B | 8B | Эффективность, скорость, низкие требования | Ограниченный контекст, меньшая глубина | Tiny Aya 3.35B, Falcon 90M |
Личный совет: если у вас есть возможность запускать большие модели, берите Anubis 70B для работы и Skyfall 31B для развлечения. Если ресурсы ограничены, Valkyrie 49B - лучший компромисс. Для мобильных сценариев присмотритесь к Tiny Aya или Anubis Mini.
Как загрузить и использовать: краткая инструкция
Все модели доступны на HuggingFace. TheDrummer выкладывает веса в форматах GGUF для llama.cpp и оригинальных трансформеров для тех, кто хочет доучивать.
1Скачивание весов
Перейдите на страницу модели на HuggingFace. Например, для Skyfall 31B v4.1: https://huggingface.co/TheDrummer/Skyfall-31B-v4.1-GGUF. Там вы найдете файлы .gguf разных уровней квантования. Для большинства сценариев подходит Q4_K_M - баланс качества и размера.
huggingface-cli для скачивания. Если у вас нет доступа к командной строке, качайте через браузер, но это дольше.2Запуск в llama.cpp
После скачивания GGUF-файла, используйте стандартную команду llama.cpp. Например:
./main -m skyfall-31b-v4.1-q4_k_m.gguf -p "Ваш промпт" -n 512Для более удобного интерфейса подключите модель к Open WebUI или SillyTavern. В Open WebUI поддерживается function calling, что особенно полезно для Valkyrie.
Внимание: Anubis 70B требует много памяти. Если у вас мало RAM, используйте квантование Q2_K или разделение слоев между GPU и CPU.
3Интеграция с другими инструментами
Модели TheDrummer работают в любом инструменте, поддерживающем GGUF: LM Studio, Ollama, KoboldCpp. Для Ollama нужно создать Modelfile. Для Anubis Mini есть готовые рецепты в сообществе.
Если вы хотите собрать мультимодальный хаб, как в этом гайде, используйте Valkyrie для текста и ACE-Step 1.5 для музыки.
Кому подойдут эти модели?
Ответ прост: всем, кто устал от ограничений облачных API и хочет контролировать свои данные. Конкретнее:
- Разработчикам - для генерации кода и документации. Skyfall и Anubis справляются лучше многих облачных аналогов.
- Писателям и сценаристам - Skyfall создает удивительно живые диалоги. Проверено на личном опыте.
- Аналитикам и исследователям - Anubis 70B разбирает сложные отчеты за минуты.
- Энтузиастам с ограниченным железом - Anubis Mini и Valkyrie запустятся даже на старом ноутбуке.
Если вы только начинаете путь в локальных LLM, не берите самое большое. Начните с Anubis Mini или Valkyrie, чтобы понять, как все работает. Потом уже апгрейджайте железо и качайте гигантов.
Что дальше?
TheDrummer не останавливается. В его Discord-канале уже мелькают намеки на модель с 120 миллиардами параметров, обученную на синтетических данных. Ждем анонса к лету 2026.
А пока - качайте, тестируйте, делитесь впечатлениями. И помните: лучшая модель та, которая решает вашу задачу, а не та, что занимает первое место в бенчмарке.