Инструменты
Подборка AI-инструментов. Только то, что работает.
Как rotate activations в llama.cpp улучшает квантование: разбор метода и практическая настройка
Полный разбор метода rotate activations в llama.cpp. Как вращение активаций повышает качество квантованных моделей. Практическая настройка и сравнение с альтерн
Darwin-35B-A3B-Opus: как работает техника Model MRI для слияния моделей и её установка
Обзор Darwin-35B-A3B-Opus и техники Model MRI для слияния нейросетей. Установка, сравнение с альтернативами, примеры использования.
TurboQuant TQ3_1S: как 3.5 бита спасают 16-гигабайтные видеокарты от Qwen3.5
Новый формат TQ3_1S в форке llama.cpp с CUDA. Запускаем Qwen3.5-27B на 16 ГБ VRAM. Сравнение потерь качества и гайд по установке на 01.04.2026.
Falcon-OCR и Falcon-Perception: локальное зрение, которое работает без интернета
Полный гайд по установке Falcon-OCR и Falcon-Perception, их запуску и интеграции с llama.cpp. Локальное компьютерное зрение без облаков и API.
Turboquant на llama.cpp для Apple Silicon: устанавливаем и тестируем Rust-клиент для ускорения моделей на Metal
Практический обзор Turboquant — Rust-клиента для llama.cpp, который ускоряет запуск моделей вроде Qwen и Llama на Mac с помощью Metal. Установка, тесты, сравнен
1-битные LLM на устройстве: запуск модели на iPhone, бенчмарки и энергоэффективность
Как 1-битное квантование позволяет запускать 8B-модели на iPhone. Тесты памяти (1.15 ГБ), скорости и влияние на батарею. Сравнение с 4-битными аналогами.
Attn-rot (TurboQuant lite) в llama.cpp: разбор нового метода квантования KV-кэша и бенчмарки для Qwen3.5
Разбор Attn-rot (TurboQuant lite) в llama.cpp: как новый метод квантования KV-кэша снижает KLD и ускоряет инференс Qwen3.5. Бенчмарки и сравнения.
CodonRoBERTa: обучаем mRNA языковые модели для 25 видов за $165 (и это работает)
Как обучать mRNA языковые модели для 25 биологических видов всего за $165. Архитектура CodonRoBERTa, сравнение с альтернативами и примеры использования в биоинф
Bonsai-8B: первая 1-битная LLM с MMLU-R 65.7 — тесты, установка и возможности
Подробный обзор Bonsai-8B — прорывной 1-битной LLM от PrismML. Сравнение с альтернативами, тесты производительности и руководство по локальному запуску на слабо
Обзор модели Liquid AI LFM2.5-350M: агенты и инструменты на слабом железе
Обзор LFM2.5-350M: 350M параметров, <500MB после квантования, обучение на 28T токенах. Запуск на CPU и мобильных. Сравнение с Qwen3.5-0.8B.
Как настроить ИИ-агент для автономной работы в КОМПАС-3D: обзор MCP и практические примеры
Практическое руководство по настройке ИИ-агента для автономной работы в КОМПАС-3D через Model Context Protocol. Примеры использования, сравнение с Agent Skills.
Qwen 3.6 Plus Preview: Глубокий тест на агентском кодировании — как модель справилась с IDE и PATCH-командами
Глубокий практический тест новой модели Qwen 3.6 Plus (179B параметров) в задачах агентского кодирования с использованием IDE и PATCH-команд. Результаты и сравн