Инструменты
Подборка AI-инструментов. Только то, что работает.
Nemotron 3 Super Uncensored для Mac: рекордные 96% на MMLU и установка с Hugging Face
Аблированная модель Nemotron 3 Super показывает рекордные 96% на MMLU. Как установить и использовать на Mac через Hugging Face. Сравнение с аналогами.
Как настроить vLLM для моделей Qwen3.5 на двух AMD Radeon 7900 XTX: секретные переменные окружения и бенчмарки
Полное руководство по запуску vLLM для Qwen3.5 на двух AMD RX 7900 XTX. Секретные флаги окружения, команды для бенчмаркинга и сравнение с llama.cpp. Актуально н
Секретные MoE-модели Microsoft: запускаем Phi-mini-MoE на ноутбуке с 8 ГБ ОЗУ
Пошаговый гайд: как найти и запустить скрытые MoE-модели Phi-mini-MoE и Phi-tiny-MoE от Microsoft на ноутбуке всего с 8 ГБ оперативной памяти.
Nemotron 3 Content Safety 4B: мультимодальная модерация контента от NVIDIA — обзор и применение
Обзор мультимодальной модели безопасности контента от NVIDIA для 2026 года: возможности, сравнение с альтернативами, сценарии использования для текста и изображ
Inline Visualizer: Интерактивные графики в чате с локальными LLM без облаков
Обзор Inline Visualizer — open-source инструмента для создания интерактивных диаграмм в чате с локальными LLM. Работает с любыми моделями, поддерживающими tool
Сравнение Mistral Small 4 и Qwen3.5-9B в понимании документов: детальный разбор бенчмарков
Полный разбор IDP leaderboard, OlmOCR и OmniDocBench. Какая модель — Mistral Small 4 или Qwen3.5-9B — реально работает с документами, а где вас обманут. Данные
Как запустить TinyLlama на PowerBook G4 2002 года: разбор платформы MacinAI Local, оптимизация AltiVec и квантование
Подробное руководство по запуску TinyLlama на PowerBook G4 2002 года с использованием MacinAI Local, оптимизацией AltiVec и квантованием Q8. Актуально на 20.03.
SeeQL: Как построить open-source интерфейс для общения с SQL-базой на естественном языке
Обзор SeeQL — локального интерфейса для запросов к SQL на русском языке. Технологии OpenUI Lang, MCP server и современные LLM. Установка и примеры.
Как управлять поведением LLM через активации: патч llama-server и Sparse Autoencoders
Полный разбор управления поведением Llama и Mistral через низкоуровневые активации. Патч для llama-server и Sparse Autoencoders для контроля сикофансии и креати
Qwen 3.5 397B на Mac: рекорд 93% на MMLU и квантование для MLX
Анонс Qwen 3.5 397B с рекордом 93% на MMLU. Квантование для MLX позволяет запустить гигантскую модель на Mac с Apple Silicon. Обзор, сравнение и примеры использ
TextRM-28M: тестируем крошечную модель для бизнес-писем с кодом на GitHub
Обзор TextRM-28M - модели на 28 миллионов параметров для генерации бизнес-писем. Тестируем возможности, сравниваем с альтернативами, примеры кода на Python.
LiteParse от LlamaIndex: локальный парсинг документов через CLI без облаков
Обзор LiteParse от LlamaIndex - open-source CLI для локального парсинга документов. Установка, примеры команд, сравнение с облачным LlamaParse. Анализ возможнос