Где скачать модели TheDrummer?

Все модели доступны на HuggingFace в репозиториях пользователя TheDrummer. Ищите их по названиям, например, 'TheDrummer/Skyfall-31B-v4.1-GGUF'.

Какая модель TheDrummer лучше для креативного письма?

Skyfall 31B v4.1 специально заточена для креативных задач, таких как генерация рассказов, диалогов и сценариев. Она показывает отличные результаты в сохранении стиля и связности текста.

Как запустить Anubis 70B на слабом железе?

Используйте квантованную версию модели (например, Q2_K или Q3_K_S) в формате GGUF. Это значительно снизит требования к памяти. Также можно разделить слои между GPU и CPU в llama.cpp.

Обзор новых моделей TheDrummer: Skyfall 31B, Valkyrie 49B, Anubis 70B

Кто такой TheDrummer и зачем его модели?

TheDrummer - один из тех невидимых архитекторов, чьи модели регулярно взрывают рейтинги на HuggingFace. Если вы не следили за его работой, то март 2026 года - идеальный момент начать. На этой неделе он выкатил сразу четыре обновления: Skyfall 31B v4.1, Valkyrie 49B v2.1, Anubis 70B v1.2 и неожиданного карлика Anubis Mini 8B.

Что в них особенного? Все они - тонко настроенные версии популярных базовых моделей вроде Llama 3.3, Qwen 3.5 и Mistral 4. TheDrummer берет эти фундаменты и доучивает их на специфичных датасетах, выжимая максимум по конкретным задачам: от креативного письма до анализа кода.

Актуальность на 17.03.2026: все указанные версии - последние стабильные релизы от TheDrummer. Более новых патчей на момент публикации нет.

Skyfall 31B v4.1: снайпер для креативных задач

Предыдущая версия Skyfall уже гремела в чатах, но v4.1 - это эволюция. Модель построена на Llama 3.3 70B, но сжат до 31 миллиарда параметров через прогрессивное слияние и дообучение. TheDrummer утверждает, что сохранил 95% качества оригинала, но я бы сказал, что в креативном письме она даже превосходит базовую Llama.

Что умеет:

Генерировать длинные связные тексты с минимальным повторением
Понимать сложные инструкции с вложенными условиями
Работать в ролевых сценариях, сохраняя консистентность персонажа
Писать код на Python и JavaScript, хотя и с оговорками

Главный недостаток - жадность до памяти. Для комфортной работы в Llama.cpp потребуется минимум 24 ГБ оперативки или 16 ГБ VRAM. Если у вас меньше, лучше посмотреть на Loki-v2-70B, которая оптимизирована для ролевых игр.

Valkyrie 49B v2.1: универсальный солдат

Эта модель - гибрид Qwen 3.5 72B и Mistral 4 46B, доведенный до 49 миллиардов параметров. Звучит как франкенштейн, но работает на удивление слаженно. Valkyrie заточена под многозадачность: она одинаково хорошо справляется с анализом документов, переводом и ответами на вопросы.

Ключевые особенности v2.1:

Улучшенное понимание контекста до 32 тысяч токенов
Поддержка function calling для интеграции с внешними API
Лучшая обработка неанглоязычных запросов, особенно русского и китайского
Сниженный риск галлюцинаций в фактологических вопросах

Если вам нужна модель для бизнес-задач без специализации на чем-то одном - Valkyrie ваш выбор. Для сравнения, Apriel v1.6 легче, но и возможностей у нее меньше.

Anubis 70B v1.2: тяжелая артиллерия

Самая большая модель в подборке - 70 миллиардов параметров на базе Mistral 4. TheDrummer позиционирует ее как решение для сложных аналитических задач: финансовых отчетов, научных статей, юридических документов. И да, она справляется.

Новое в v1.2:

Добавлена поддержка структурированного вывода (JSON, XML)
Улучшена работа с табличными данными
Исправлены проблемы с математическими выкладками
Оптимизировано потребление памяти при использовании квантования

Минус очевиден: для запуска нужен серьезный железный ящик. Даже с квантованием до 4-бит модель занимает около 40 ГБ. Если у вас нет сервера с B200/H200, как в нашем гайде по vLLM, придется довольствоваться облачными инстансами.

Anubis Mini 8B: темная лошадка

Самое интересное обновление. TheDrummer внезапно выпустил уменьшенную версию Anubis - всего 8 миллиардов параметров. Модель обучена с нуля на датасете, имитирующем стиль большой Anubis, но с упором на эффективность.

Зачем это нужно?

Запуск на ноутбуках с 8 ГБ ОЗУ без дискретной видеокарты
Идеально для мобильных приложений и встраиваемых систем
Скорость генерации в 5 раз выше, чем у 70B версии
Качество, сопоставимое с 13B моделями, по заявлениям автора

Если вы хотите попробовать локальные LLM, но у вас слабое железо, начните с этого руководства. Anubis Mini может стать вашим первым успешным опытом.

Сравнение с альтернативами: что выбрать в 2026 году

Рынок локальных моделей перегружен. Каждый день появляются новые Merges и Fine-tunes. Чем TheDrummer лучше других?

Модель	Параметры	Сильные стороны	Слабые стороны	Альтернативы
Skyfall 31B v4.1	31B	Креативность, связность текста	Высокие требования к памяти	Loki-v2-70B, Apriel v1.6
Valkyrie 49B v2.1	49B	Универсальность, многозадачность	Средняя производительность в специализированных задачах	DeepSeek-V3.2, Qwen 3.5 72B
Anubis 70B v1.2	70B	Аналитика, работа с структурированными данными	Требует мощное железо	Mistral 4, Llama 3.3 70B
Anubis Mini 8B	8B	Эффективность, скорость, низкие требования	Ограниченный контекст, меньшая глубина	Tiny Aya 3.35B, Falcon 90M

Личный совет: если у вас есть возможность запускать большие модели, берите Anubis 70B для работы и Skyfall 31B для развлечения. Если ресурсы ограничены, Valkyrie 49B - лучший компромисс. Для мобильных сценариев присмотритесь к Tiny Aya или Anubis Mini.

Как загрузить и использовать: краткая инструкция

Все модели доступны на HuggingFace. TheDrummer выкладывает веса в форматах GGUF для llama.cpp и оригинальных трансформеров для тех, кто хочет доучивать.

1Скачивание весов

Перейдите на страницу модели на HuggingFace. Например, для Skyfall 31B v4.1: https://huggingface.co/TheDrummer/Skyfall-31B-v4.1-GGUF. Там вы найдете файлы .gguf разных уровней квантования. Для большинства сценариев подходит Q4_K_M - баланс качества и размера.

💡

Используйте утилиту huggingface-cli для скачивания. Если у вас нет доступа к командной строке, качайте через браузер, но это дольше.

2Запуск в llama.cpp

После скачивания GGUF-файла, используйте стандартную команду llama.cpp. Например:

./main -m skyfall-31b-v4.1-q4_k_m.gguf -p "Ваш промпт" -n 512

Для более удобного интерфейса подключите модель к Open WebUI или SillyTavern. В Open WebUI поддерживается function calling, что особенно полезно для Valkyrie.

Внимание: Anubis 70B требует много памяти. Если у вас мало RAM, используйте квантование Q2_K или разделение слоев между GPU и CPU.

3Интеграция с другими инструментами

Модели TheDrummer работают в любом инструменте, поддерживающем GGUF: LM Studio, Ollama, KoboldCpp. Для Ollama нужно создать Modelfile. Для Anubis Mini есть готовые рецепты в сообществе.

Если вы хотите собрать мультимодальный хаб, как в этом гайде, используйте Valkyrie для текста и ACE-Step 1.5 для музыки.

Кому подойдут эти модели?

Ответ прост: всем, кто устал от ограничений облачных API и хочет контролировать свои данные. Конкретнее:

Разработчикам - для генерации кода и документации. Skyfall и Anubis справляются лучше многих облачных аналогов.
Писателям и сценаристам - Skyfall создает удивительно живые диалоги. Проверено на личном опыте.
Аналитикам и исследователям - Anubis 70B разбирает сложные отчеты за минуты.
Энтузиастам с ограниченным железом - Anubis Mini и Valkyrie запустятся даже на старом ноутбуке.

Если вы только начинаете путь в локальных LLM, не берите самое большое. Начните с Anubis Mini или Valkyrie, чтобы понять, как все работает. Потом уже апгрейджайте железо и качайте гигантов.

💡

Не гонитесь за последней версией. Иногда v1.1 работает стабильнее, чем v2.0. Скачайте несколько квантований и протестируйте на своих задачах.

Что дальше?

TheDrummer не останавливается. В его Discord-канале уже мелькают намеки на модель с 120 миллиардами параметров, обученную на синтетических данных. Ждем анонса к лету 2026.

А пока - качайте, тестируйте, делитесь впечатлениями. И помните: лучшая модель та, которая решает вашу задачу, а не та, что занимает первое место в бенчмарке.

Подписаться на канал

Новые модели TheDrummer: обзор Skyfall 31B v4.1, Valkyrie 49B v2.1, Anubis 70B v1.2 и Anubis Mini 8B — как загрузить и использовать