Инструменты для работы с AI

X

Xiaomi MiMo-V2.5: Sparse MoE 310B модель — запуск, квантование и производительность на обычном железе

Обзор Xiaomi MiMo-V2.5: разреженная MoE 310B с 15B активных параметров. Как запустить на RTX 4090, квантование, сравнение с DeepSeek и Qwen. Тесты производитель

Обзор

N

Nemotron Nano 3 Omni в llama.cpp: конвертируем мультимодальную модель NVIDIA своими руками

Полный гайд по конвертации Nemotron Nano 3 Omni (NVIDIA) в GGUF для llama.cpp. Поддержка текста, изображений, аудио. Инструкция, примеры, сравнение с альтернати

Обзор

K

KV cache бенчмарк Qwen 3.6-35B-A3B на M5 Max: f16, q8_0, turbo3 и turbo4 до 1M контекста

Тестируем KV cache квантование для Qwen 3.6-35B-A3B на Mac M5 Max. Сравнение f16, q8_0, TurboQuant 3/4bit. Замеры до 1M токенов. Рекомендации по выбору.

Обзор

L

Lemonade OmniRouter: Как объединить локальные AI-модели для работы с текстом, изображениями и аудио

Lemonade OmniRouter — инструмент для создания единого API из локальных LLM, генераторов изображений и распознавания речи. Как настроить и кому это нужно.

Обзор

P

Poolside Laguna XS.2: возможности 33B MoE модели с открытой лицензией

Обзор Poolside Laguna XS.2 — открытой 33B MoE модели, сравнимой с Qwen 3.5. Агентские бенчмарки, примеры использования, сравнение с аналогами.

Обзор

О

Отлавливаем NaN в PyTorch за 3 мс: forward hook для точной локализации первого NaN в слое

Как с помощью forward hook в PyTorch за 3 мс найти первый NaN в нейросети. Сравнение с detect_anomaly и torch.isnan. Пример кода и рекомендации.

Обзор

T

TRELLIS.2 от Microsoft: 4 миллиарда причин забыть о ручном моделировании

Microsoft открыла TRELLIS.2 — нейросеть, которая из одной картинки делает 3D-модель с PBR-текстурами. 4 миллиарда параметров, 16x сжатие и лицензия MIT.

Обзор

N

NV-Raw2Insights-US: как голая физика сигнала меняет УЗИ

NVIDIA и Siemens выпустили модель NV-Raw2Insights-US, которая анализирует необработанные ультразвуковые сигналы. Физически-информированное машинное обучение пов

Обзор

И

Инвертируй сигнал, грабь гринд: GitHub-репозиторий с ИИ для анализа ликвидности

Разбираем GitHub-репозиторий, который с помощью ИИ учится инвертировать манипулятивные сигналы ликвидности. Код, примеры, сравнение с альтернативами.

Обзор

3

309 правил, которые заставят ваш opencode работать как бронированный агент

Обзор плагина opencode-security: 309 детерминированных правил, установка за минуту, сравнение с PromptSec и AgentShield. Кому подходит и как настроить.

Обзор

С

Сверточный декодер vs Transformer: архитектура из России, которая посылает квадратичную сложность в утиль

Российский исследователь представил декодер на основе сверток — arXiv 2604.18580. Сравнение с Transformer, TAPE, Ouro. Эффективность, скорость, код.

Обзор

M

Mistral Small 4: французский эксперт на диете — 119B параметров, но активны только 20B

Разбираем Mistral Small 4: архитектура MoE с 128 экспертами, reasoning mode, мультимодальность. Сравнение с DeepSeek-V3, HyperNova-60B, Llama 4. Примеры кода и

Обзор