Обзор новых моделей TheDrummer: Skyfall 31B, Valkyrie 49B, Anubis 70B | AiManual
AiManual Logo Ai / Manual.
17 Мар 2026 Инструмент

Новые модели TheDrummer: обзор Skyfall 31B v4.1, Valkyrie 49B v2.1, Anubis 70B v1.2 и Anubis Mini 8B — как загрузить и использовать

Полный обзор последних моделей TheDrummer от HuggingFace: Skyfall 31B v4.1, Valkyrie 49B v2.1, Anubis 70B v1.2 и Anubis Mini 8B. Инструкция по загрузке и исполь

Кто такой TheDrummer и зачем его модели?

TheDrummer - один из тех невидимых архитекторов, чьи модели регулярно взрывают рейтинги на HuggingFace. Если вы не следили за его работой, то март 2026 года - идеальный момент начать. На этой неделе он выкатил сразу четыре обновления: Skyfall 31B v4.1, Valkyrie 49B v2.1, Anubis 70B v1.2 и неожиданного карлика Anubis Mini 8B.

Что в них особенного? Все они - тонко настроенные версии популярных базовых моделей вроде Llama 3.3, Qwen 3.5 и Mistral 4. TheDrummer берет эти фундаменты и доучивает их на специфичных датасетах, выжимая максимум по конкретным задачам: от креативного письма до анализа кода.

Актуальность на 17.03.2026: все указанные версии - последние стабильные релизы от TheDrummer. Более новых патчей на момент публикации нет.

Skyfall 31B v4.1: снайпер для креативных задач

Предыдущая версия Skyfall уже гремела в чатах, но v4.1 - это эволюция. Модель построена на Llama 3.3 70B, но сжат до 31 миллиарда параметров через прогрессивное слияние и дообучение. TheDrummer утверждает, что сохранил 95% качества оригинала, но я бы сказал, что в креативном письме она даже превосходит базовую Llama.

Что умеет:

  • Генерировать длинные связные тексты с минимальным повторением
  • Понимать сложные инструкции с вложенными условиями
  • Работать в ролевых сценариях, сохраняя консистентность персонажа
  • Писать код на Python и JavaScript, хотя и с оговорками

Главный недостаток - жадность до памяти. Для комфортной работы в Llama.cpp потребуется минимум 24 ГБ оперативки или 16 ГБ VRAM. Если у вас меньше, лучше посмотреть на Loki-v2-70B, которая оптимизирована для ролевых игр.

Valkyrie 49B v2.1: универсальный солдат

Эта модель - гибрид Qwen 3.5 72B и Mistral 4 46B, доведенный до 49 миллиардов параметров. Звучит как франкенштейн, но работает на удивление слаженно. Valkyrie заточена под многозадачность: она одинаково хорошо справляется с анализом документов, переводом и ответами на вопросы.

Ключевые особенности v2.1:

  • Улучшенное понимание контекста до 32 тысяч токенов
  • Поддержка function calling для интеграции с внешними API
  • Лучшая обработка неанглоязычных запросов, особенно русского и китайского
  • Сниженный риск галлюцинаций в фактологических вопросах

Если вам нужна модель для бизнес-задач без специализации на чем-то одном - Valkyrie ваш выбор. Для сравнения, Apriel v1.6 легче, но и возможностей у нее меньше.

Anubis 70B v1.2: тяжелая артиллерия

Самая большая модель в подборке - 70 миллиардов параметров на базе Mistral 4. TheDrummer позиционирует ее как решение для сложных аналитических задач: финансовых отчетов, научных статей, юридических документов. И да, она справляется.

Новое в v1.2:

  • Добавлена поддержка структурированного вывода (JSON, XML)
  • Улучшена работа с табличными данными
  • Исправлены проблемы с математическими выкладками
  • Оптимизировано потребление памяти при использовании квантования

Минус очевиден: для запуска нужен серьезный железный ящик. Даже с квантованием до 4-бит модель занимает около 40 ГБ. Если у вас нет сервера с B200/H200, как в нашем гайде по vLLM, придется довольствоваться облачными инстансами.

Anubis Mini 8B: темная лошадка

Самое интересное обновление. TheDrummer внезапно выпустил уменьшенную версию Anubis - всего 8 миллиардов параметров. Модель обучена с нуля на датасете, имитирующем стиль большой Anubis, но с упором на эффективность.

Зачем это нужно?

  • Запуск на ноутбуках с 8 ГБ ОЗУ без дискретной видеокарты
  • Идеально для мобильных приложений и встраиваемых систем
  • Скорость генерации в 5 раз выше, чем у 70B версии
  • Качество, сопоставимое с 13B моделями, по заявлениям автора

Если вы хотите попробовать локальные LLM, но у вас слабое железо, начните с этого руководства. Anubis Mini может стать вашим первым успешным опытом.

Сравнение с альтернативами: что выбрать в 2026 году

Рынок локальных моделей перегружен. Каждый день появляются новые Merges и Fine-tunes. Чем TheDrummer лучше других?

МодельПараметрыСильные стороныСлабые стороныАльтернативы
Skyfall 31B v4.131BКреативность, связность текстаВысокие требования к памятиLoki-v2-70B, Apriel v1.6
Valkyrie 49B v2.149BУниверсальность, многозадачностьСредняя производительность в специализированных задачахDeepSeek-V3.2, Qwen 3.5 72B
Anubis 70B v1.270BАналитика, работа с структурированными даннымиТребует мощное железоMistral 4, Llama 3.3 70B
Anubis Mini 8B8BЭффективность, скорость, низкие требованияОграниченный контекст, меньшая глубинаTiny Aya 3.35B, Falcon 90M

Личный совет: если у вас есть возможность запускать большие модели, берите Anubis 70B для работы и Skyfall 31B для развлечения. Если ресурсы ограничены, Valkyrie 49B - лучший компромисс. Для мобильных сценариев присмотритесь к Tiny Aya или Anubis Mini.

Как загрузить и использовать: краткая инструкция

Все модели доступны на HuggingFace. TheDrummer выкладывает веса в форматах GGUF для llama.cpp и оригинальных трансформеров для тех, кто хочет доучивать.

1Скачивание весов

Перейдите на страницу модели на HuggingFace. Например, для Skyfall 31B v4.1: https://huggingface.co/TheDrummer/Skyfall-31B-v4.1-GGUF. Там вы найдете файлы .gguf разных уровней квантования. Для большинства сценариев подходит Q4_K_M - баланс качества и размера.

💡
Используйте утилиту huggingface-cli для скачивания. Если у вас нет доступа к командной строке, качайте через браузер, но это дольше.

2Запуск в llama.cpp

После скачивания GGUF-файла, используйте стандартную команду llama.cpp. Например:

./main -m skyfall-31b-v4.1-q4_k_m.gguf -p "Ваш промпт" -n 512

Для более удобного интерфейса подключите модель к Open WebUI или SillyTavern. В Open WebUI поддерживается function calling, что особенно полезно для Valkyrie.

Внимание: Anubis 70B требует много памяти. Если у вас мало RAM, используйте квантование Q2_K или разделение слоев между GPU и CPU.

3Интеграция с другими инструментами

Модели TheDrummer работают в любом инструменте, поддерживающем GGUF: LM Studio, Ollama, KoboldCpp. Для Ollama нужно создать Modelfile. Для Anubis Mini есть готовые рецепты в сообществе.

Если вы хотите собрать мультимодальный хаб, как в этом гайде, используйте Valkyrie для текста и ACE-Step 1.5 для музыки.

Кому подойдут эти модели?

Ответ прост: всем, кто устал от ограничений облачных API и хочет контролировать свои данные. Конкретнее:

  • Разработчикам - для генерации кода и документации. Skyfall и Anubis справляются лучше многих облачных аналогов.
  • Писателям и сценаристам - Skyfall создает удивительно живые диалоги. Проверено на личном опыте.
  • Аналитикам и исследователям - Anubis 70B разбирает сложные отчеты за минуты.
  • Энтузиастам с ограниченным железом - Anubis Mini и Valkyrie запустятся даже на старом ноутбуке.

Если вы только начинаете путь в локальных LLM, не берите самое большое. Начните с Anubis Mini или Valkyrie, чтобы понять, как все работает. Потом уже апгрейджайте железо и качайте гигантов.

💡
Не гонитесь за последней версией. Иногда v1.1 работает стабильнее, чем v2.0. Скачайте несколько квантований и протестируйте на своих задачах.

Что дальше?

TheDrummer не останавливается. В его Discord-канале уже мелькают намеки на модель с 120 миллиардами параметров, обученную на синтетических данных. Ждем анонса к лету 2026.

А пока - качайте, тестируйте, делитесь впечатлениями. И помните: лучшая модель та, которая решает вашу задачу, а не та, что занимает первое место в бенчмарке.

Подписаться на канал