Инструменты для работы с AI

M

MLX-Video и LTX-2: как запустить видео-модель на Mac и почему она весит 314 ГБ

Практический гайд по запуску LTX-2 через MLX-Video на Mac. Разбираемся, почему модель весит 314 ГБ и как её оптимизировать под Apple Silicon.

Обзор

O

OLMo 3.5 Hybrid: как гибридная архитектура с линейным вниманием экономит память

Обзор OLMo 3.5 Hybrid: гибридная архитектура Gated Deltanet с линейным вниманием для работы с длинным контекстом при малых затратах памяти. Сравнение, примеры,

Обзор

F

Falcon-H1-Tiny (90M): микро-модель, которая работает на чем угодно. Даже на холодильнике

Как запустить Falcon-H1-Tiny (90M) локально на слабом железе. Архитектура Mamba+Attention, Anti-curriculum обучение, интеграция с VS Code. Сравнение с Gemma 3 2

Обзор

Н

Новые короли без цензуры: GLM-4.7 Flash, GPT OSS и другие uncensored-модели на Hugging Face

Обзор самых актуальных uncensored моделей на Hugging Face на февраль 2026 года. GLM-4.7 Flash, GPT OSS, Gemma 3 и Qwen - прямые ссылки на GGUF-файлы, сравнение

Обзор

S

Smolcluster: распределенный вывод LLM на Mac Mini и iPad — инструкция на 2026 год

Пошаговое руководство по настройке smolcluster для распределенного вывода LLM между Mac Mini M4 и iPad с A16 на Python в 2026 году.

Обзор

K

Kakveda: когда ваш AI-агент начинает жаловаться до того, как сломается

Обзор Kakveda - open-source системы предупреждения ошибок для AI-агентов на Docker. Как работает failure intelligence и зачем она нужна в 2026 году.

Обзор

P

PromptShrink: «беспощадное» сжатие промптов для локальных LLM без потери смысла

Полный обзор PromptShrink 2.1 — инструмента для агрессивного сжатия промптов. Как ускорить локальные модели, сэкономить память и снизить латентность. Актуальные

Обзор

G

GoMCP: как заменить Python SDK от Anthropic и получить 100K tool calls/sec в production

GoMCP — production-grade сервер MCP на Go. Заменяет Python SDK, дает 100K вызовов в секунду, multi-tenancy, аудит. Полное руководство по миграции.

Обзор

M

Multi Method RLHF Pipeline: как запустить 6 методов выравнивания ИИ в одном флаконе

Практическое руководство по запуску Multi Method RLHF Pipeline с 6 методами выравнивания ИИ. PPO, DPO, KTO, GRPO, RLVR и другие - все в одном open-source проект

Обзор

Ш

Шепот в эфире: как NoChat с ML-KEM шифрует разговоры AI-агентов

Пошаговое руководство по настройке приватного зашифрованного канала между AI-агентами с помощью NoChat и постквантового шифрования ML-KEM (Kyber-1024).

Обзор

D

Drift Cortex OSS: когда ваш AI-агент наконец-то запомнил, где лежат файлы

Обзор Drift Cortex OSS — локального «мозга» для AI-агентов с AST-парсером, MCP интеграцией и семантическим поиском. Индексирует 10к файлов за 2 секунды.

Обзор

Q

Qwen3-ASR в продакшене: Готовый Docker-сервис для транскрибации и субтитров

Пошаговое руководство по запуску Qwen3-ASR в Docker с FastAPI API для автоматической транскрибации аудио и генерации субтитров SRT/VTT. Продакшен-решение на 202

Обзор