Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

H

Hugging Face Kernels: репозитории, которые наконец-то объединили код и модель

Что такое Hugging Face Kernels, как они меняют рабочий процесс Data Science и кому стоит переходить на них прямо сейчас. Обзор актуальный на апрель 2026.

Обзор
O

Off Grid: полный гайд по запуску Gemma 4 на смартфоне без облака и интернета

Полное руководство по установке и использованию Off Grid для запуска Gemma 4 на Android и iOS без интернета. Работа с документами и кодом оффлайн в 2026 году.

Обзор
К

Как обновить Mamba 1 и 2 до Mamba 3: методология переноса весов и экономия VRAM

Практическое руководство по переносу весов между архитектурами Mamba без обучения с нуля. Экономия времени и VRAM до 12 GB.

Обзор
К

Как Qwen 3.5-27B автоматически строит backend-системы: разбор AutoBe и экономия до 25 раз

Как инструмент AutoBe с моделью Qwen 3.5-27B автоматически создает backend. Разбор возможностей, сравнение с аналогами и реальная экономия до 25 раз на разработ

Обзор
И

Исправленный Qwen3.5-35B-A3B-Uncensored: как установить и использовать с промптом для глубокого мышления

Пошаговый гайд: как скачать исправленные GGUF-файлы Qwen3.5-35B-A3B-Uncensored с Hugging Face, настроить llama.cpp и использовать мощный промпт для глубокого мы

Обзор
G

Google AI Edge Eloquent: тестируем офлайн-диктовку на Gemma и сравнение с Wispr Flow

Обзор Google AI Edge Eloquent — офлайн-диктовка на Gemma ASR. Сравнение с Wispr Flow по точности, скорости и приватности.

Обзор
T

Tensor Parallelism в ik_llama: подробный гайд по ускорению Gemma 4 31B на нескольких GPU

Полное руководство по настройке Tensor Parallelism в ik_llama для запуска Gemma 4 31B на нескольких видеокартах. Тесты PPL, сравнение производительности и пошаг

Обзор
А

Асинхронные под-агенты в Deep Agents: как распараллелить долгие задачи и не сойти с ума

Как использовать асинхронные под-агенты в Deep Agents для распараллеливания длинных задач. Stateful агенты, удаленные агенты, гетерогенное развертывание.

Обзор
S

SpectralQuant: революционный метод квантования LLM, который на 18% лучше TurboQuant — установка и бенчмарки

Обзор SpectralQuant — нового метода квантования LLM с открытым кодом. Сравнение с TurboQuant, установка и бенчмарки на 07.04.2026.

Обзор
A

Auto-SKILLs: как Gemma 4 создаёт навыки для агентов, наблюдая за действиями на экране

Как Gemma 4 автоматически создает навыки для AI-агентов, наблюдая за действиями пользователя на экране. Обзор возможностей, сравнение с аналогами и примеры испо

Обзор
I

InCoder-32B-Thinking: обзор открытой LLM для генерации кода под микроконтроллеры и GPU

Обзор InCoder-32B-Thinking — открытой модели для генерации кода на Verilog и CUDA. Возможности, сравнение с альтернативами, примеры использования.

Обзор
F

FATE: как ускорить вывод MoE-моделей в llama.cpp с помощью кэша экспертов и prefetching

Обзор FATE - форка llama.cpp с кэшем экспертов и prefetching для ускорения вывода MoE-моделей. Примеры с Qwen3-30B.

Обзор