Инструменты
Подборка AI-инструментов. Только то, что работает.
Как запустить MiMo-V2.5 с контекстом 1M на локальном ПК: тест производительности и настройка
Пошаговый гайд по запуску MiMo-V2.5 с контекстом 1M токенов. Оптимизация памяти, команды для llama-server, тесты скорости и реальные сценарии использования.
Caliby: новая open-source векторная БД для AI-агентов, превосходящая pgvector и FAISS
Обзор Caliby — встраиваемой векторной БД, которая обгоняет pgvector и FAISS по скорости и эффективности на диске. Примеры, сравнения, рекомендации.
CyberSecQwen-4B: маленькая, злая и полностью ваша. Локальная LLM для безопасности
CyberSecQwen-4B - 4-миллиардная модель для SOC и пентестеров. Работает офлайн, не сливает данные, понимает логи, атаки, уязвимости. Полный обзор и сравнение с а
EMO — новая MoE-модель с эмерджентной модульностью: обзор архитектуры и как использовать 12.5% экспертов
Разбираем архитектуру EMO от Allen AI: как модель сама выращивает модули из данных, почему достаточно 12.5% экспертов и как запустить веса с HuggingFace.
z-lab взял Gemma 4 и выжал из неё DFlash: обзор, установка и первые впечатления
Разбираем новое квантование DFlash для Gemma 4 26B: установка, тесты скорости, сравнение с IQ4_XS и Bartowski. Когда 4 активных миллиарда работают как 26.
DS4: новый инференс-движок для DeepSeek 4 Flash на MacBook с 128GB – обзор и установка
DS4 – специализированный движок для запуска DeepSeek 4 Flash на Mac с 128GB. Сравнение с MLX, llama.cpp, пошаговая установка и примеры использования.
Быстрее молнии: тестируем MLX-AgentCore 2.0 — новый AI-движок для Apple Silicon, разгоняющий агентов до 600 ток/с
Подробный обзор MLX-AgentCore 2.0 — быстрого локального AI-движка для Mac на Apple Silicon. Тесты производительности, сравнение с Ollama и vLLM-MLX, примеры аге
Natural Language Autoencoders от Anthropic: как заглянуть в голову Gemma 3
Natural Language Autoencoders от Anthropic: декодируем внутренние состояния Gemma 3 в текст. Примеры, сравнение с альтернативами, инструкция по запуску.
ZAYA1-8B: Острый скальпель вместо кувалды — обзор компактной LLM от Zyphra
Разбираем ZAYA1-8B: почему 8B модель от Zyphra обходит конкурентов, как запустить локально и стоит ли переходить с Llama 3. Тесты, архитектура, советы.
Как запустить модель 397B в 14 ГБ ОЗУ: реализация Paged MoE на Mac Studio
Подробный обзор реализации Paged MoE для запуска Qwen3-397B на Mac Studio с 14 ГБ ОЗУ. Сравнение с Flash-MoE и Apple LLM in a Flash, шаги и результаты.
Как создать AI-подкаст и загрузить в Spotify за 10 минут: разбираем новый CLI-инструмент PodAgent
Spotify выпустил PodAgent CLI для генерации подкастов через ИИ. Установка, пример промпта, сравнение с NotebookLM. Создайте свой первый AI-подкаст за 10 минут.
Codex CLI /goal: как работает автономный AI-агент на GPT-5.5 и сколько это реально стоит
Разбор команды /goal в Codex CLI с GPT-5.5: как работает Ralph loop, permission profiles, реальный расход токенов и стоимость. Сравнение с Claude Code и Cursor.