Инструменты для работы с AI

К

Как запустить MiMo-V2.5 с контекстом 1M на локальном ПК: тест производительности и настройка

Пошаговый гайд по запуску MiMo-V2.5 с контекстом 1M токенов. Оптимизация памяти, команды для llama-server, тесты скорости и реальные сценарии использования.

Обзор

C

Caliby: новая open-source векторная БД для AI-агентов, превосходящая pgvector и FAISS

Обзор Caliby — встраиваемой векторной БД, которая обгоняет pgvector и FAISS по скорости и эффективности на диске. Примеры, сравнения, рекомендации.

Обзор

C

CyberSecQwen-4B: маленькая, злая и полностью ваша. Локальная LLM для безопасности

CyberSecQwen-4B - 4-миллиардная модель для SOC и пентестеров. Работает офлайн, не сливает данные, понимает логи, атаки, уязвимости. Полный обзор и сравнение с а

Обзор

E

EMO — новая MoE-модель с эмерджентной модульностью: обзор архитектуры и как использовать 12.5% экспертов

Разбираем архитектуру EMO от Allen AI: как модель сама выращивает модули из данных, почему достаточно 12.5% экспертов и как запустить веса с HuggingFace.

Обзор

z

z-lab взял Gemma 4 и выжал из неё DFlash: обзор, установка и первые впечатления

Разбираем новое квантование DFlash для Gemma 4 26B: установка, тесты скорости, сравнение с IQ4_XS и Bartowski. Когда 4 активных миллиарда работают как 26.

Обзор

D

DS4: новый инференс-движок для DeepSeek 4 Flash на MacBook с 128GB – обзор и установка

DS4 – специализированный движок для запуска DeepSeek 4 Flash на Mac с 128GB. Сравнение с MLX, llama.cpp, пошаговая установка и примеры использования.

Обзор

Б

Быстрее молнии: тестируем MLX-AgentCore 2.0 — новый AI-движок для Apple Silicon, разгоняющий агентов до 600 ток/с

Подробный обзор MLX-AgentCore 2.0 — быстрого локального AI-движка для Mac на Apple Silicon. Тесты производительности, сравнение с Ollama и vLLM-MLX, примеры аге

Обзор

N

Natural Language Autoencoders от Anthropic: как заглянуть в голову Gemma 3

Natural Language Autoencoders от Anthropic: декодируем внутренние состояния Gemma 3 в текст. Примеры, сравнение с альтернативами, инструкция по запуску.

Обзор

Z

ZAYA1-8B: Острый скальпель вместо кувалды — обзор компактной LLM от Zyphra

Разбираем ZAYA1-8B: почему 8B модель от Zyphra обходит конкурентов, как запустить локально и стоит ли переходить с Llama 3. Тесты, архитектура, советы.

Обзор

К

Как запустить модель 397B в 14 ГБ ОЗУ: реализация Paged MoE на Mac Studio

Подробный обзор реализации Paged MoE для запуска Qwen3-397B на Mac Studio с 14 ГБ ОЗУ. Сравнение с Flash-MoE и Apple LLM in a Flash, шаги и результаты.

Обзор

К

Как создать AI-подкаст и загрузить в Spotify за 10 минут: разбираем новый CLI-инструмент PodAgent

Spotify выпустил PodAgent CLI для генерации подкастов через ИИ. Установка, пример промпта, сравнение с NotebookLM. Создайте свой первый AI-подкаст за 10 минут.

Обзор

C

Codex CLI /goal: как работает автономный AI-агент на GPT-5.5 и сколько это реально стоит

Разбор команды /goal в Codex CLI с GPT-5.5: как работает Ralph loop, permission profiles, реальный расход токенов и стоимость. Сравнение с Claude Code и Cursor.

Обзор