Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

П

Перплексия под микроскопом: как разобрать LLM по токенам с помощью Perplex

Практическое руководство по анализу перплексии LLM по каждому токену. Установка Perplex, работа с GGUF моделями, интерпретация результатов для разработчиков.

Обзор
H

Heretic 1.2: как снизить потребление VRAM на 70% для снятия цензуры с языковых моделей

Обзор Heretic 1.2 — инструмента для снятия цензуры с языковых моделей с экономией VRAM на 70%. Квантование bitsandbytes, LoRA, Magnitude-Preserving Orthogonal A

Обзор
N

Nemotron Nano 12B v2 VL: когда NVIDIA заставила маленькую модель понимать видео

NVIDIA выпустила коммерчески готовую мультимодальную модель для анализа видео и документов. Обзор возможностей, сравнение с альтернативами и примеры использован

Обзор
Y

Yttri: когда твои заметки живут в твоём компьютере, а не в чужом облаке

Полный обзор Yttri — приватной AI-системы для управления знаниями. Установка, сравнение с Notion и Obsidian, работа с локальными LLM.

Обзор
V

Vibe Coding без облаков: 7 инструментов для локальной разработки с AI на 2026 год

Сравнение 7+ инструментов для программирования с локальными AI-моделями. Возможности, настройка, рекомендации для разработчиков на 2026 год.

Обзор
Л

Лёгкие coding-агенты для локальных LLM: когда 4K контекста — это роскошь

Сравнение PocketCoder, TinyAgent и других инструментов для автономного программирования на локальных LLM с ограниченным контекстом. Практические примеры и реком

Обзор
B

BitNet в браузере: разбор PoC на WebGPU и WGSL для запуска 1-битных моделей на iPad

Технический разбор PoC BitNet b1.58 на WebGPU и WGSL для запуска 1-битных LLM на iPad M4 в 2026 году. WGSL шейдеры, оптимизации, реальные тесты.

Обзор
K

KaniTTS2: локальная TTS с качеством ElevenLabs и скоростью 0.2 RTF

Полный гайд по установке KaniTTS2, квантованию модели для 3GB VRAM и сравнению с ElevenLabs. Тесты скорости, качества и практическое применение.

Обзор
C

Claude Code глючит кэш? Отключаем x-anthropic-billing-header и возвращаем скорость

Пошаговое решение проблемы полной переобработки промпта в Claude Code. Отключаем заголовок x-anthropic-billing-header через переменные окружения и settings.json

Обзор
A

ARIA Protocol: запуск BitNet b1.58 на CPU через P2P-сеть — бенчмарки AMD vs Intel с AVX-512

Тестирование ARIA Protocol — P2P-сети для запуска 1-битных LLM на CPU. Сравнение производительности AMD Ryzen и Intel Xeon с AVX-512, энергопотребление, задержк

Обзор
Б

Браузер агента в Bedrock AgentCore: прокси, профили и расширения, которые наконец-то работают

Практическое руководство по настройке прокси, профилей и расширений для браузера агента в Amazon Bedrock AgentCore. Решаем проблемы сессий и аутентификации.

Обзор
G

GLM-5-744B: первый локальный LLM, впечатливший опытного разработчика (тест на создание игры)

Личный тест GLM-5-744B на создание игры с vLLM и квантованием IQ2_M. Сравнение с Qwen-72B и GPT-OSS, оценка скорости и практические выводы для разработчиков.

Обзор