Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

V

VibeVoice-ASR: когда обычной транскрипции недостаточно

Глубокий разбор VibeVoice-ASR — модели для транскрибации длинных аудио с диаризацией говорящих, таймстепми и поддержкой 50+ языков. Сравнение с Whisper, Parakee

Обзор
C

Craft: когда ваш AI-ассистент слишком умный для вашего же блага

Craft — локальная песочница для изоляции AI-ассистентов. Безопасный аналог Cowork с открытым исходным кодом. Установка, сравнение, примеры использования.

Обзор
N

NVIDIA Cosmos Policy: как новый подход к управлению роботами меняет архитектуру ИИ

Обзор NVIDIA Cosmos Policy — метода пост-обучения world foundation models для прямого кодирования действий робота. Сравнение с альтернативами, результаты на LIB

Обзор
M

Manus Agent Skills: бесплатный конструктор AI-воркфлоу, который не стыдно показать Claude Code

Как создавать и экспортировать переиспользуемые AI-воркфлоу в Manus. Бесплатные кредиты, SKILL.md и песочница для тестирования. Обзор на 29.01.2026.

Обзор
A

Arcee Trinity Large Preview: тестируем 400B-параметрическую модель с 13B активных параметров через OpenRouter

Тестируем Arcee Trinity Large Preview — 400B-параметрическую MoE модель с 13B активных параметров. Бесплатный доступ через OpenRouter API, Apache 2.0 лицензия.

Обзор
Q

Qwen3-ASR: 52 языка в одной модели и никаких облаков

Полный гайд по настройке Qwen3-ASR от Alibaba: 1.7B параметров, 52 языка, таймстампы, локальный запуск без интернета. Сравнение с Whisper и альтернативами.

Обзор
M

MOVA: открытый мультимодальный монстр, который генерирует видео и звук одновременно

Технический разбор MOVA: архитектура MoE, 18B активных параметров, поддержка SGLang-Diffusion. Сравнение с LTX-2 и другими. Примеры использования.

Обзор
P

Prismer: Как собрать open-source альтернативу OpenAI Prism у себя на ноутбуке

Полный гайд по установке и настройке Prismer — open-source альтернативы OpenAI Prism для научной работы с LaTeX и верификацией цитат. Работает локально.

Обзор
P

Parakeet Multitalk: как настроить быструю многопользовательскую транскрипцию аудио с тайм-кодами

Настройка Parakeet Multitalk для транскрипции речи нескольких говорящих с цветовой кодировкой и тайм-кодами. Локальная обработка аудио без облаков.

Обзор
M

Muna Transpile: как конвертировать Python-модели ИИ в C++ для максимальной производительности

Обзор Muna Transpile — инструмента для конвертации Python-моделей в C++ код. Ускорение инференса, примеры с Kokoro-TTS и Qwen3-TTS. Установка, сравнение с альте

Обзор
G

GitNexus: локальный движок для анализа кода, который понимает архитектуру лучше вас

Как настроить GitNexus — локальный движок анализа кода с поддержкой MCP. Архитектурные графы, blast radius detection и интеграция с Claude Code.

Обзор
A

ACE-Step 1.5: как запустить коммерческую генерацию музыки локально на 8 ГБ VRAM

Релиз ACE-Step 1.5 — open-source модель для генерации музыки, которая работает локально на видеокарте с 8 ГБ памяти. Полное руководство по установке, сравнение

Обзор