Инструменты
Подборка AI-инструментов. Только то, что работает.
MLX-Video и LTX-2: как запустить видео-модель на Mac и почему она весит 314 ГБ
Практический гайд по запуску LTX-2 через MLX-Video на Mac. Разбираемся, почему модель весит 314 ГБ и как её оптимизировать под Apple Silicon.
OLMo 3.5 Hybrid: как гибридная архитектура с линейным вниманием экономит память
Обзор OLMo 3.5 Hybrid: гибридная архитектура Gated Deltanet с линейным вниманием для работы с длинным контекстом при малых затратах памяти. Сравнение, примеры,
Falcon-H1-Tiny (90M): микро-модель, которая работает на чем угодно. Даже на холодильнике
Как запустить Falcon-H1-Tiny (90M) локально на слабом железе. Архитектура Mamba+Attention, Anti-curriculum обучение, интеграция с VS Code. Сравнение с Gemma 3 2
Новые короли без цензуры: GLM-4.7 Flash, GPT OSS и другие uncensored-модели на Hugging Face
Обзор самых актуальных uncensored моделей на Hugging Face на февраль 2026 года. GLM-4.7 Flash, GPT OSS, Gemma 3 и Qwen - прямые ссылки на GGUF-файлы, сравнение
Smolcluster: распределенный вывод LLM на Mac Mini и iPad — инструкция на 2026 год
Пошаговое руководство по настройке smolcluster для распределенного вывода LLM между Mac Mini M4 и iPad с A16 на Python в 2026 году.
Kakveda: когда ваш AI-агент начинает жаловаться до того, как сломается
Обзор Kakveda - open-source системы предупреждения ошибок для AI-агентов на Docker. Как работает failure intelligence и зачем она нужна в 2026 году.
PromptShrink: «беспощадное» сжатие промптов для локальных LLM без потери смысла
Полный обзор PromptShrink 2.1 — инструмента для агрессивного сжатия промптов. Как ускорить локальные модели, сэкономить память и снизить латентность. Актуальные
GoMCP: как заменить Python SDK от Anthropic и получить 100K tool calls/sec в production
GoMCP — production-grade сервер MCP на Go. Заменяет Python SDK, дает 100K вызовов в секунду, multi-tenancy, аудит. Полное руководство по миграции.
Multi Method RLHF Pipeline: как запустить 6 методов выравнивания ИИ в одном флаконе
Практическое руководство по запуску Multi Method RLHF Pipeline с 6 методами выравнивания ИИ. PPO, DPO, KTO, GRPO, RLVR и другие - все в одном open-source проект
Шепот в эфире: как NoChat с ML-KEM шифрует разговоры AI-агентов
Пошаговое руководство по настройке приватного зашифрованного канала между AI-агентами с помощью NoChat и постквантового шифрования ML-KEM (Kyber-1024).
Drift Cortex OSS: когда ваш AI-агент наконец-то запомнил, где лежат файлы
Обзор Drift Cortex OSS — локального «мозга» для AI-агентов с AST-парсером, MCP интеграцией и семантическим поиском. Индексирует 10к файлов за 2 секунды.
Qwen3-ASR в продакшене: Готовый Docker-сервис для транскрибации и субтитров
Пошаговое руководство по запуску Qwen3-ASR в Docker с FastAPI API для автоматической транскрибации аудио и генерации субтитров SRT/VTT. Продакшен-решение на 202