Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

К

Как rotate activations в llama.cpp улучшает квантование: разбор метода и практическая настройка

Полный разбор метода rotate activations в llama.cpp. Как вращение активаций повышает качество квантованных моделей. Практическая настройка и сравнение с альтерн

Обзор
D

Darwin-35B-A3B-Opus: как работает техника Model MRI для слияния моделей и её установка

Обзор Darwin-35B-A3B-Opus и техники Model MRI для слияния нейросетей. Установка, сравнение с альтернативами, примеры использования.

Обзор
T

TurboQuant TQ3_1S: как 3.5 бита спасают 16-гигабайтные видеокарты от Qwen3.5

Новый формат TQ3_1S в форке llama.cpp с CUDA. Запускаем Qwen3.5-27B на 16 ГБ VRAM. Сравнение потерь качества и гайд по установке на 01.04.2026.

Обзор
F

Falcon-OCR и Falcon-Perception: локальное зрение, которое работает без интернета

Полный гайд по установке Falcon-OCR и Falcon-Perception, их запуску и интеграции с llama.cpp. Локальное компьютерное зрение без облаков и API.

Обзор
T

Turboquant на llama.cpp для Apple Silicon: устанавливаем и тестируем Rust-клиент для ускорения моделей на Metal

Практический обзор Turboquant — Rust-клиента для llama.cpp, который ускоряет запуск моделей вроде Qwen и Llama на Mac с помощью Metal. Установка, тесты, сравнен

Обзор
1

1-битные LLM на устройстве: запуск модели на iPhone, бенчмарки и энергоэффективность

Как 1-битное квантование позволяет запускать 8B-модели на iPhone. Тесты памяти (1.15 ГБ), скорости и влияние на батарею. Сравнение с 4-битными аналогами.

Обзор
A

Attn-rot (TurboQuant lite) в llama.cpp: разбор нового метода квантования KV-кэша и бенчмарки для Qwen3.5

Разбор Attn-rot (TurboQuant lite) в llama.cpp: как новый метод квантования KV-кэша снижает KLD и ускоряет инференс Qwen3.5. Бенчмарки и сравнения.

Обзор
C

CodonRoBERTa: обучаем mRNA языковые модели для 25 видов за $165 (и это работает)

Как обучать mRNA языковые модели для 25 биологических видов всего за $165. Архитектура CodonRoBERTa, сравнение с альтернативами и примеры использования в биоинф

Обзор
B

Bonsai-8B: первая 1-битная LLM с MMLU-R 65.7 — тесты, установка и возможности

Подробный обзор Bonsai-8B — прорывной 1-битной LLM от PrismML. Сравнение с альтернативами, тесты производительности и руководство по локальному запуску на слабо

Обзор
О

Обзор модели Liquid AI LFM2.5-350M: агенты и инструменты на слабом железе

Обзор LFM2.5-350M: 350M параметров, <500MB после квантования, обучение на 28T токенах. Запуск на CPU и мобильных. Сравнение с Qwen3.5-0.8B.

Обзор
К

Как настроить ИИ-агент для автономной работы в КОМПАС-3D: обзор MCP и практические примеры

Практическое руководство по настройке ИИ-агента для автономной работы в КОМПАС-3D через Model Context Protocol. Примеры использования, сравнение с Agent Skills.

Обзор
Q

Qwen 3.6 Plus Preview: Глубокий тест на агентском кодировании — как модель справилась с IDE и PATCH-командами

Глубокий практический тест новой модели Qwen 3.6 Plus (179B параметров) в задачах агентского кодирования с использованием IDE и PATCH-команд. Результаты и сравн

Обзор