Инструменты
Подборка AI-инструментов. Только то, что работает.
Как запустить полностью локальный голосовой ИИ на iPhone с FluidAudio и llama.cpp
Запустите голосового ассистента на iPhone без интернета. Используйте FluidAudio 3.0 для аудио и llama.cpp 2.5 для ИИ. Полная приватность и скорость.
Детектор AI-контента на Android: как запустить оптимизированную ViT модель через ONNX Runtime в фоне
Локальный детектор AI-генеративных изображений на Android с Vision Transformer и ONNX Runtime. Работает в фоне через Quick Tile. Обзор технологии и примеры испо
Как портировать TurboQuant (QJL) на MLX: сжатие KV-кэша в 1 бит для Llama на Mac
Практическое руководство по портированию TurboQuant (QJL) на MLX для сжатия KV-кэша в 1 бит. Экономия памяти 41.8% для Llama 3.2 3B на Mac.
Как стабилизировать multi-agent циклы на локальных LLM: разбор архитектуры и промптов
Практический разбор EvidionAI для создания стабильных multi-agent систем на локальных LLM. Решение проблем doubt loops, skeptic agent и маршрутизации. Актуально
Полный обзор Nemotron-3 Nano 4B Uncensored: как удалить GenRM и использовать агрессивную версию
Пошаговая инструкция по удалению GenRM из Nemotron-3 Nano 4B для полного снятия цензуры. Технические детали, сравнение с аналогами и примеры использования на 20
CQ от Mozilla: обзор 'Stack Overflow для AI-агентов' и как это исправит устаревший код
Обзор CQ от Mozilla — системы обмена знаниями для AI-агентов, которая решает проблему устаревания знаний, экономит токены и исправляет устаревшие API.
Аудит OpenCode: как в «локальном» AI-инструменте нашли скрытые подключения к 7 внешним доменам
Подробный разбор аудита исходного кода OpenCode на 24.03.2026: нашли скрытые запросы к 7 внешним доменам, хотя он позиционируется как локальный инструмент. Риск
NoobScribe: локальная транскрипция встреч с памятью спикеров на стероидах
Обзор NoobScribe — open-source инструмента для локальной транскрипции аудио с диаризацией Pyannote, памятью спикеров на Chroma и API, совместимым с Whisper. Акт
DaVinci-MagiHuman: полный гайд по установке и генерации видео с аудио на одном GPU
Установите DaVinci-MagiHuman v3.2 для генерации синхронного видео и аудио. Открытая модель Apache 2.0, превосходит конкурентов по качеству речи. Работает на одн
Devstral-Small-2-24B + рассуждения Claude: как скачать и использовать fine-tuned модель для кода
Узнайте, как скачать и использовать fine-tuned модель Devstral-Small-2-24B с рассуждениями Claude для генерации кода. Сравнение с альтернативами, примеры и реко
SillyTavern AI Game Master: расширение для интеграции LLM в любую игру
Технический разбор SillyTavern AI Game Master - расширения для интеграции локальных LLM (Cydonia, Qwen 3.5) в любую игру. Архитектура, клонирование голоса, срав
NGT Memory: установка и использование open-source модуля персистентной памяти для LLM
Полный обзор NGT Memory — open-source модуля персистентной памяти для LLM. Установка через Docker, три механизма извлечения данных, сравнение с Mem0 и Mengram,