Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

S

Steerling-8B: черный ящик ИИ взломали, и вот почему это изменит всё

Как архитектура Steerling-8B отслеживает каждый токен до обучающих данных. Сравнение с GPT-5 и Llama 4, примеры использования и кому подойдет в 2026 году.

Обзор
С

Создаем open-source оркестратор для AI-агентов на Rust: альтернатива Claude Code для локальных моделей

Обзор Rust SDK для оркестрации AI-агентов с локальными моделями через llamacpp, sandboxing и контролем доступа. Альтернатива Claude Code для embedded-приложений

Обзор
M

Mem0 vs OpenAI Memory, LangMem, MemGPT: полный бенчмарк систем памяти для AI-агентов с кодом

Сравнение систем памяти для AI-агентов по задержке и точности. Тесты Mem0, OpenAI Memory, LangMem и MemGPT с кодом для воспроизведения.

Обзор
T

TinyTeapot-77M: Революция в CPU-инференсе или просто игрушка?

Обзор TinyTeapot-77M — языковой модели на 77 млн параметров, работающей на CPU со скоростью 40 токенов в секунду. Сравнение с альтернативами, примеры использова

Обзор
N

NeuroStack: как собрать локального ИИ-ассистента уровня Gemini 3 Deep Think за вечер

Практический обзор фреймворка NeuroStack: настройка, сравнение с альтернативами и реальные примеры для замены облачных ИИ. Актуально на февраль 2026.

Обзор
C

Codex-lb: когда один аккаунт ChatGPT — это слишком мало, а платить за Enterprise — слишком много

Обзор Codex-lb — обратного прокси для обхода лимитов ChatGPT. Настройка Docker, сравнение с аналогами, примеры использования. Актуально на февраль 2026.

Обзор
Г

Голосовые эмбеддинги Qwen3: как клонировать и математически модифицировать голос с помощью векторов размерности 1024

Практическое руководство по работе с голосовыми эмбеддингами Qwen3-TTS 1.7B. Клонирование голоса, математические операции с векторами размерности 1024, создание

Обзор
C

Crane: Rust-движок для локального ИИ с поддержкой Qwen3-TTS — обзор и бенчмарки против PyTorch

Обзор Crane — Rust-движка для локального ИИ. Поддержка Qwen3-TTS, ускорение на Apple Silicon Metal. Сравнение с PyTorch: в 6 раз быстрее. Кому подойдет.

Обзор
M

MoOLE-T: когда ортогональные LoRA превращаются в модульный MoE-монстр

Обзор MoOLE-T - фреймворка смеси экспертов на основе O-LoRA для динамической подгрузки весов, экономии VRAM и создания специализированных моделей Gemma 3.

Обзор
S

Sparsity: как прототип для разреженных эмбеддингов экономит 15-50x памяти

Обзор прототипа Sparsity — разреженные эмбеддинги с декомпозицией матриц. Экономия 15-50x памяти для векторных БД и RAG. Актуально на февраль 2026.

Обзор
N

Nanollama: как за 30 минут обучить свою Llama 3 и получить GGUF

Пошаговый гайд по обучению Llama 3 с помощью Nanollama. Создайте свою модель, экспортируйте в GGUF формат и запустите локально за полчаса.

Обзор
C

Code-memory: MCP-сервер, который понимает ваш код лучше, чем вы сами (и не сожрет всю VRAM)

Инструкция по AST-парсингу и векторному поиску для экономии контекста в LLM. Локальные эмбеддинги, sqlite-vec, tree-sitter.

Обзор