Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

P

PromptPilot: настройка очереди задач и Telegram-бота для AI CLI (Claude Code, Codex)

Как настроить PromptPilot для управления промптами, обхода rate limit и экономии токенов в Claude Code и Codex. Актуально на 2026 год.

Обзор
L

Latent Reasoning Engine: Mamba-модель 2.8B для скрытого мышления без KV-cache на RTX 3060

Обзор Latent Reasoning Engine - Mamba-модели 2.8B для скрытого мышления на RTX 3060. Экономия памяти O(1), сравнение с альтернативами и примеры использования.

Обзор
O

Orthogonalized Representation Intervention для Gemma 4 31B: как использовать модифицированные квантования в GGUF

Пошаговый гайд по применению Orthogonalized Representation Intervention к квантованным версиям Gemma 4 31B в формате GGUF. Модифицируйте Q4_K_M, Q8_0 модели для

Обзор
К

Как запустить 1-битные модели Bonsai на CPU и AMD GPU: фиксы в llama.cpp и инструкции по ROCm

Подробное руководство по запуску 1-битных моделей Bonsai через исправленный форк llama.cpp. Инструкции для CPU с AVX512 и AMD GPU через ROCm на 02.04.2026.

Обзор
С

Сверхмалые эмбеддинги: семейство моделей от 700KB, которые не стыдно использовать

Полный обзор семейства статических эмбеддинг-моделей от 700KB до 125MB. Сравнение производительности на MTEB, интеграция с sentence-transformers и сценарии испо

Обзор
O

Open-Source агент «Союз»: ваш новый параноидальный друг на рабочем столе

Установка, настройка и использование open-source агента Союз. Сравнение с альтернативами, примеры автоматизации рабочих процессов на Kotlin. Безопасный десктопн

Обзор
К

Как обойти защиту Gemma 4 методом ARA (Arbitrary-Rank Ablation) — туториал по Heretic

Пошаговое руководство по снятию цензуры с Gemma 4 с помощью метода Arbitrary-Rank Ablation и инструмента Heretic. Обход alignment за 15 минут.

Обзор
К

Как запустить многомодальную Gemma 4 локально: обзор квантований и интеграции с llama.cpp, MLX и WebGPU

Полное руководство по запуску многомодальной Gemma 4 на своем устройстве. Обзор квантований, интеграция с llama.cpp, MLX и WebGPU. Примеры использования.

Обзор
G

Google Vids обновлён: как бесплатно генерировать видео (Veo 3.1), музыку (Lyria) и управлять аватарами через промпты

Полный обзор Google Vids. Как использовать 10 бесплатных генераций Veo 3.1 в месяц, создавать саундтреки Lyria 3 и управлять аватарами через промпты. Экспорт в

Обзор
B

Bonsai: тестирование 1-битной версии Qwen3 и форка llama.cpp - 107 токенов в секунду на RTX 4060

Тестирование Bonsai - 1-битной модели Qwen3 от PrismML. Рекорд 107 t/s на RTX 4060. Установка, сравнение с альтернативами, кому подойдет. Актуально на 02.04.202

Обзор
S

Sova AI: первый ИИ-агент на Android, который работает без ПК, ADB и root-прав

Обзор Sova AI — первого полностью автономного ИИ-агента на Android. Работает через Accessibility API, не требует ПК, ADB или root-прав. Примеры использования и

Обзор
m

mlx-tinker: локальное continual RL для Qwen3.5 на Apple Silicon — установка и использование

Обзор mlx-tinker: локальное continual reinforcement learning для Qwen3.5 на Apple Silicon. Установка, сравнение с mlx-tune, примеры использования на 02.04.2026.

Обзор