Инструменты
Подборка AI-инструментов. Только то, что работает.
Xiaomi MiMo-V2.5: Sparse MoE 310B модель — запуск, квантование и производительность на обычном железе
Обзор Xiaomi MiMo-V2.5: разреженная MoE 310B с 15B активных параметров. Как запустить на RTX 4090, квантование, сравнение с DeepSeek и Qwen. Тесты производитель
Nemotron Nano 3 Omni в llama.cpp: конвертируем мультимодальную модель NVIDIA своими руками
Полный гайд по конвертации Nemotron Nano 3 Omni (NVIDIA) в GGUF для llama.cpp. Поддержка текста, изображений, аудио. Инструкция, примеры, сравнение с альтернати
KV cache бенчмарк Qwen 3.6-35B-A3B на M5 Max: f16, q8_0, turbo3 и turbo4 до 1M контекста
Тестируем KV cache квантование для Qwen 3.6-35B-A3B на Mac M5 Max. Сравнение f16, q8_0, TurboQuant 3/4bit. Замеры до 1M токенов. Рекомендации по выбору.
Lemonade OmniRouter: Как объединить локальные AI-модели для работы с текстом, изображениями и аудио
Lemonade OmniRouter — инструмент для создания единого API из локальных LLM, генераторов изображений и распознавания речи. Как настроить и кому это нужно.
Poolside Laguna XS.2: возможности 33B MoE модели с открытой лицензией
Обзор Poolside Laguna XS.2 — открытой 33B MoE модели, сравнимой с Qwen 3.5. Агентские бенчмарки, примеры использования, сравнение с аналогами.
Отлавливаем NaN в PyTorch за 3 мс: forward hook для точной локализации первого NaN в слое
Как с помощью forward hook в PyTorch за 3 мс найти первый NaN в нейросети. Сравнение с detect_anomaly и torch.isnan. Пример кода и рекомендации.
TRELLIS.2 от Microsoft: 4 миллиарда причин забыть о ручном моделировании
Microsoft открыла TRELLIS.2 — нейросеть, которая из одной картинки делает 3D-модель с PBR-текстурами. 4 миллиарда параметров, 16x сжатие и лицензия MIT.
NV-Raw2Insights-US: как голая физика сигнала меняет УЗИ
NVIDIA и Siemens выпустили модель NV-Raw2Insights-US, которая анализирует необработанные ультразвуковые сигналы. Физически-информированное машинное обучение пов
Инвертируй сигнал, грабь гринд: GitHub-репозиторий с ИИ для анализа ликвидности
Разбираем GitHub-репозиторий, который с помощью ИИ учится инвертировать манипулятивные сигналы ликвидности. Код, примеры, сравнение с альтернативами.
309 правил, которые заставят ваш opencode работать как бронированный агент
Обзор плагина opencode-security: 309 детерминированных правил, установка за минуту, сравнение с PromptSec и AgentShield. Кому подходит и как настроить.
Сверточный декодер vs Transformer: архитектура из России, которая посылает квадратичную сложность в утиль
Российский исследователь представил декодер на основе сверток — arXiv 2604.18580. Сравнение с Transformer, TAPE, Ouro. Эффективность, скорость, код.
Mistral Small 4: французский эксперт на диете — 119B параметров, но активны только 20B
Разбираем Mistral Small 4: архитектура MoE с 128 экспертами, reasoning mode, мультимодальность. Сравнение с DeepSeek-V3, HyperNova-60B, Llama 4. Примеры кода и