Инструменты для работы с AI

N

Nemotron ColEmbed V2: как NVIDIA заново придумала мультимодальный поиск

Обзор новой мультимодальной модели NVIDIA для поиска по документам с изображениями и таблицами. Late-interaction архитектура, установка и практическое сравнение

Обзор

I

Intern-S1-Pro: Модель на триллионе параметров, которая заставит вас забыть про ChatGPT для науки

Обзор гигантской open-source модели Intern-S1-Pro на 1 триллион параметров для научного мышления. Тесты на vLLM и SGLang, сравнение с альтернативами.

Обзор

Q

Qwen Coders: когда картинка стоит тысячи бенчмарков

Обзор инструмента для визуального сравнения квантований Qwen Coder Next. Смотрим на IQ1, Q3, Q4 через lightshow-тесты и понимаем, какой квант реально работает в

Обзор

S

Step 3.5 Flash: быстрая, но нестабильная модель. Как исправить галлюцинации tool calls?

Практический обзор Step 3.5 Flash: как исправить галлюцинации tool calls, повторяющиеся reasoning traces и сравнение с GLM 4.7. Актуально на 04.02.2026.

Обзор

Y

Yuan 3.0 Flash 40B: китайский мультимодальный снайпер для RAG, который помещается в 8 ГБ VRAM

Тестируем Yuan 3.0 Flash 40B — китайскую мультимодальную модель 3.7B параметров, оптимизированную для RAG. Совместимость с llama.cpp, GGUF и сравнение с аналога

Обзор

G

Ghidra MCP Server: 110 инструментов для AI-реверса и поиска функций между версиями

Как подключить 110 инструментов Ghidra к Claude через MCP для анализа бинарников, нормализованного хеширования функций и поиска между версиями ПО.

Обзор

G

GGML реализация Qwen3-ASR: локальное распознавание речи с квантованием Q8 и forced alignment

Обзор GGML реализации Qwen3-ASR с квантованием Q8 для локального распознавания речи на 52 языках. Сравнение с Whisper, экономия памяти до 2 ГБ.

Обзор

Q

Qwen3-Coder-Next-NVFP4: как сжать модель с 149 ГБ до 45 ГБ с минимальной потерей качества

Технический разбор квантования Qwen3-Coder-Next в формат NVFP4. Сжатие с 149 ГБ до 45 ГБ при потере всего 1.63% на MMLU Pro+. Практическое руководство по запуск

Обзор

A

Alexandria: ваш личный режиссер аудиокниг, который раздает эмоции как конфеты

Полный гайд по установке и настройке Alexandria — локального генератора аудиокниг с эмоциональными метками, QWEN3 TTS и клонированием голоса. Работает без облак

Обзор

M

MiniCPM-o-4.5: Модель размером с кошку, но с мозгами слона

Полный обзор MiniCPM-o-4.5 - 9-миллиардной мультимодальной модели с речью, зрением и полным дуплексом для локального запуска. Сравнение, примеры, установка.

Обзор

H

Holo2-235B-A22B: как агентная локализация улучшает точность распознавания UI-элементов на 10-20%

Holo2-235B-A22B устанавливает новый стандарт распознавания UI-элементов. 78.5% на ScreenSpot-Pro, итеративное уточнение через агентную локализацию. Доступна на

Обзор

Q

Qwen3-Coder-Next 3B: как 3 миллиарда параметров переиграли гигантов кодинга

Анализ победы Qwen3-Coder-Next 3B в SWE-Bench Pro. Как многозадачный агентный подход позволил 3B модели обойти 70B конкурентов. Технические детали и практическо

Обзор