Инструменты
Подборка AI-инструментов. Только то, что работает.
Unsloth научился ускорять MoE-модели в 12 раз: как Triton kernels ломают физику VRAM
Обзор Triton оптимизаций Unsloth для MoE-моделей: 12x ускорение обучения, экономия 30% памяти, поддержка Qwen3 и DeepSeek на 10.02.2026
Gemini CLI Proxy: ваш личный шлюз к Google AI без головной боли
Пошаговый гайд по настройке Gemini CLI Proxy с OpenAI-совместимым API, дашбордом и управлением ключами. Запускаем прокси-сервер для Gemini 3 за 10 минут.
Tanaos Spam Detection: испанский спам-детектор, который работает там, где другие спотыкаются
Практическое руководство по использованию модели Tanaos Spam Detection для испанского языка. Установка, API, сравнение с альтернативами и реальные кейсы на 2026
Donna: как стейт-машины спасают AI-агентов от хаоса
Обзор Donna — инструмента для создания детерминированных AI-агентов через стейт-машины. Решает проблему накопления ошибок в многошаговых процессах.
Baichuan-M3-235B: как запустить медицинского монстра, который переиграл GPT-5.2
Пошаговый гайд по запуску Baichuan-M3-235B - медицинской модели, превзошедшей GPT-5.2. Архитектура, производительность, сравнение и реальные тесты на 10.02.2026
PromptForest: ансамбль трёх лёгких моделей, который ловит prompt injection без ложных срабатываний
Как PromptForest использует три специализированные модели для обнаружения prompt injection с минимальным числом ложных срабатываний. Обзор архитектуры на 2026 г
Qwen-Image-2.0: китайский карлик, который делает всё. Но есть нюанс
Обзор Qwen-Image-2.0: 7B мультимодальная модель для генерации и редактирования 2K изображений с рендерингом текста. Сравнение с альтернативами и примеры использ
OpenCode: визуализируй мышление AI-агентов в реальном времени, или Как перестать гадать, что у них в голове
Обзор OpenCode — инструмента для визуализации выполнения AI-агентов. Сравнение с LangSmith, примеры использования, для кого подходит. Актуально на 2026 год.
Nemotron ColEmbed V2: NVIDIA заставляет PDF и сканы говорить
Обзор Nemotron ColEmbed V2 от NVIDIA — модели для визуального поиска в документах. Сравнение версий 3B, 4B, 8B, тесты на ViDoRe V3, примеры кода и альтернативы.
IRIS 18B: Кастомная модель, которая заменит вам ассистента — если у вас есть 24 ГБ VRAM
Разбираем IRIS 18B — кастомную LLM на базе ERNIE с обучением на thinking traces, квантование в GGUF и интеграцию в локальные инструменты. Тесты, сравнения, уста
MiniCPM-o 4.5: как запустить 9B мультимодальную модель на телефоне
Полный гайд по установке мультимодальной модели MiniCPM-o 4.5 на смартфон. 9 млрд параметров, работа без интернета, билингуальные диалоги. Сравнение с Llama.cpp
Femtobot: 10MB Rust-агент, который заставит ваш Raspberry Pi работать как полноценный AI-сервер
Обзор Femtobot — 10MB Rust-агента для Raspberry Pi с векторным хранилищем и Telegram-ботом. Автономные AI workflow без облаков.