Инструменты
Подборка AI-инструментов. Только то, что работает.
PromptPilot: настройка очереди задач и Telegram-бота для AI CLI (Claude Code, Codex)
Как настроить PromptPilot для управления промптами, обхода rate limit и экономии токенов в Claude Code и Codex. Актуально на 2026 год.
Latent Reasoning Engine: Mamba-модель 2.8B для скрытого мышления без KV-cache на RTX 3060
Обзор Latent Reasoning Engine - Mamba-модели 2.8B для скрытого мышления на RTX 3060. Экономия памяти O(1), сравнение с альтернативами и примеры использования.
Orthogonalized Representation Intervention для Gemma 4 31B: как использовать модифицированные квантования в GGUF
Пошаговый гайд по применению Orthogonalized Representation Intervention к квантованным версиям Gemma 4 31B в формате GGUF. Модифицируйте Q4_K_M, Q8_0 модели для
Как запустить 1-битные модели Bonsai на CPU и AMD GPU: фиксы в llama.cpp и инструкции по ROCm
Подробное руководство по запуску 1-битных моделей Bonsai через исправленный форк llama.cpp. Инструкции для CPU с AVX512 и AMD GPU через ROCm на 02.04.2026.
Сверхмалые эмбеддинги: семейство моделей от 700KB, которые не стыдно использовать
Полный обзор семейства статических эмбеддинг-моделей от 700KB до 125MB. Сравнение производительности на MTEB, интеграция с sentence-transformers и сценарии испо
Open-Source агент «Союз»: ваш новый параноидальный друг на рабочем столе
Установка, настройка и использование open-source агента Союз. Сравнение с альтернативами, примеры автоматизации рабочих процессов на Kotlin. Безопасный десктопн
Как обойти защиту Gemma 4 методом ARA (Arbitrary-Rank Ablation) — туториал по Heretic
Пошаговое руководство по снятию цензуры с Gemma 4 с помощью метода Arbitrary-Rank Ablation и инструмента Heretic. Обход alignment за 15 минут.
Как запустить многомодальную Gemma 4 локально: обзор квантований и интеграции с llama.cpp, MLX и WebGPU
Полное руководство по запуску многомодальной Gemma 4 на своем устройстве. Обзор квантований, интеграция с llama.cpp, MLX и WebGPU. Примеры использования.
Google Vids обновлён: как бесплатно генерировать видео (Veo 3.1), музыку (Lyria) и управлять аватарами через промпты
Полный обзор Google Vids. Как использовать 10 бесплатных генераций Veo 3.1 в месяц, создавать саундтреки Lyria 3 и управлять аватарами через промпты. Экспорт в
Bonsai: тестирование 1-битной версии Qwen3 и форка llama.cpp - 107 токенов в секунду на RTX 4060
Тестирование Bonsai - 1-битной модели Qwen3 от PrismML. Рекорд 107 t/s на RTX 4060. Установка, сравнение с альтернативами, кому подойдет. Актуально на 02.04.202
Sova AI: первый ИИ-агент на Android, который работает без ПК, ADB и root-прав
Обзор Sova AI — первого полностью автономного ИИ-агента на Android. Работает через Accessibility API, не требует ПК, ADB или root-прав. Примеры использования и
mlx-tinker: локальное continual RL для Qwen3.5 на Apple Silicon — установка и использование
Обзор mlx-tinker: локальное continual reinforcement learning для Qwen3.5 на Apple Silicon. Установка, сравнение с mlx-tune, примеры использования на 02.04.2026.