Инструменты
Подборка AI-инструментов. Только то, что работает.
Hugging Face Kernels: репозитории, которые наконец-то объединили код и модель
Что такое Hugging Face Kernels, как они меняют рабочий процесс Data Science и кому стоит переходить на них прямо сейчас. Обзор актуальный на апрель 2026.
Off Grid: полный гайд по запуску Gemma 4 на смартфоне без облака и интернета
Полное руководство по установке и использованию Off Grid для запуска Gemma 4 на Android и iOS без интернета. Работа с документами и кодом оффлайн в 2026 году.
Как обновить Mamba 1 и 2 до Mamba 3: методология переноса весов и экономия VRAM
Практическое руководство по переносу весов между архитектурами Mamba без обучения с нуля. Экономия времени и VRAM до 12 GB.
Как Qwen 3.5-27B автоматически строит backend-системы: разбор AutoBe и экономия до 25 раз
Как инструмент AutoBe с моделью Qwen 3.5-27B автоматически создает backend. Разбор возможностей, сравнение с аналогами и реальная экономия до 25 раз на разработ
Исправленный Qwen3.5-35B-A3B-Uncensored: как установить и использовать с промптом для глубокого мышления
Пошаговый гайд: как скачать исправленные GGUF-файлы Qwen3.5-35B-A3B-Uncensored с Hugging Face, настроить llama.cpp и использовать мощный промпт для глубокого мы
Google AI Edge Eloquent: тестируем офлайн-диктовку на Gemma и сравнение с Wispr Flow
Обзор Google AI Edge Eloquent — офлайн-диктовка на Gemma ASR. Сравнение с Wispr Flow по точности, скорости и приватности.
Tensor Parallelism в ik_llama: подробный гайд по ускорению Gemma 4 31B на нескольких GPU
Полное руководство по настройке Tensor Parallelism в ik_llama для запуска Gemma 4 31B на нескольких видеокартах. Тесты PPL, сравнение производительности и пошаг
Асинхронные под-агенты в Deep Agents: как распараллелить долгие задачи и не сойти с ума
Как использовать асинхронные под-агенты в Deep Agents для распараллеливания длинных задач. Stateful агенты, удаленные агенты, гетерогенное развертывание.
SpectralQuant: революционный метод квантования LLM, который на 18% лучше TurboQuant — установка и бенчмарки
Обзор SpectralQuant — нового метода квантования LLM с открытым кодом. Сравнение с TurboQuant, установка и бенчмарки на 07.04.2026.
Auto-SKILLs: как Gemma 4 создаёт навыки для агентов, наблюдая за действиями на экране
Как Gemma 4 автоматически создает навыки для AI-агентов, наблюдая за действиями пользователя на экране. Обзор возможностей, сравнение с аналогами и примеры испо
InCoder-32B-Thinking: обзор открытой LLM для генерации кода под микроконтроллеры и GPU
Обзор InCoder-32B-Thinking — открытой модели для генерации кода на Verilog и CUDA. Возможности, сравнение с альтернативами, примеры использования.
FATE: как ускорить вывод MoE-моделей в llama.cpp с помощью кэша экспертов и prefetching
Обзор FATE - форка llama.cpp с кэшем экспертов и prefetching для ускорения вывода MoE-моделей. Примеры с Qwen3-30B.