Инструменты
Подборка AI-инструментов. Только то, что работает.
VibeVoice-ASR: когда обычной транскрипции недостаточно
Глубокий разбор VibeVoice-ASR — модели для транскрибации длинных аудио с диаризацией говорящих, таймстепми и поддержкой 50+ языков. Сравнение с Whisper, Parakee
Craft: когда ваш AI-ассистент слишком умный для вашего же блага
Craft — локальная песочница для изоляции AI-ассистентов. Безопасный аналог Cowork с открытым исходным кодом. Установка, сравнение, примеры использования.
NVIDIA Cosmos Policy: как новый подход к управлению роботами меняет архитектуру ИИ
Обзор NVIDIA Cosmos Policy — метода пост-обучения world foundation models для прямого кодирования действий робота. Сравнение с альтернативами, результаты на LIB
Manus Agent Skills: бесплатный конструктор AI-воркфлоу, который не стыдно показать Claude Code
Как создавать и экспортировать переиспользуемые AI-воркфлоу в Manus. Бесплатные кредиты, SKILL.md и песочница для тестирования. Обзор на 29.01.2026.
Arcee Trinity Large Preview: тестируем 400B-параметрическую модель с 13B активных параметров через OpenRouter
Тестируем Arcee Trinity Large Preview — 400B-параметрическую MoE модель с 13B активных параметров. Бесплатный доступ через OpenRouter API, Apache 2.0 лицензия.
Qwen3-ASR: 52 языка в одной модели и никаких облаков
Полный гайд по настройке Qwen3-ASR от Alibaba: 1.7B параметров, 52 языка, таймстампы, локальный запуск без интернета. Сравнение с Whisper и альтернативами.
MOVA: открытый мультимодальный монстр, который генерирует видео и звук одновременно
Технический разбор MOVA: архитектура MoE, 18B активных параметров, поддержка SGLang-Diffusion. Сравнение с LTX-2 и другими. Примеры использования.
Prismer: Как собрать open-source альтернативу OpenAI Prism у себя на ноутбуке
Полный гайд по установке и настройке Prismer — open-source альтернативы OpenAI Prism для научной работы с LaTeX и верификацией цитат. Работает локально.
Parakeet Multitalk: как настроить быструю многопользовательскую транскрипцию аудио с тайм-кодами
Настройка Parakeet Multitalk для транскрипции речи нескольких говорящих с цветовой кодировкой и тайм-кодами. Локальная обработка аудио без облаков.
Muna Transpile: как конвертировать Python-модели ИИ в C++ для максимальной производительности
Обзор Muna Transpile — инструмента для конвертации Python-моделей в C++ код. Ускорение инференса, примеры с Kokoro-TTS и Qwen3-TTS. Установка, сравнение с альте
GitNexus: локальный движок для анализа кода, который понимает архитектуру лучше вас
Как настроить GitNexus — локальный движок анализа кода с поддержкой MCP. Архитектурные графы, blast radius detection и интеграция с Claude Code.
ACE-Step 1.5: как запустить коммерческую генерацию музыки локально на 8 ГБ VRAM
Релиз ACE-Step 1.5 — open-source модель для генерации музыки, которая работает локально на видеокарте с 8 ГБ памяти. Полное руководство по установке, сравнение