Инструменты для работы с AI

D

Derpy Turtle: бесплатный GUI для тренировки голосов Kokoro с RVC — наконец-то без танцев с бубном

Обзор бесплатного инструмента с открытым кодом для тренировки голосовых моделей на базе Kokoro TTS и RVC. Как работает, сравнение с альтернативами, примеры испо

Обзор

N

Needle: как 26 миллионов параметров заменяют гигантов при вызове функций

Модель Needle с 26M параметров, дистиллированная из Gemini, выполняет tool calling со скоростью 6000 tok/s prefill – идеально для мобильных AI-агентов. Сравнени

Обзор

Л

Локальный AI-кодинг на одной видеокарте: настройка автокомплита и агентного режима с Qwen моделями

Настройка Qwen2.5-Coder-7B и Qwen3.6-35B-A3B на одной видеокарте для автокомплита и агентного программирования без облачных API. Примеры, квантования, конфигура

Обзор

G

GGUF на стероидах: почему MagicQuant v2.0 сделает ваши модели умнее, не раздувая битность

Обзор MagicQuant v2.0 — инструмента для создания гибридных GGUF квантований с динамическими конфигурациями. Сравнение с Unsloth, примеры, бенчмарки, кому подойд

Обзор

Н

Новый инструмент llama-eval в llama.cpp: что это и как использовать

Новый встроенный инструмент для оценки моделей в llama.cpp от ggerganov. Запускайте MMLU, HellaSwag и другие тесты локально. Инструкция и сравнение с альтернати

Обзор

l

llama.cpp server: долгожданное исправление краша mmproj + MTP (speculative decoding)

Узнайте, как в llama.cpp server наконец починили краш при использовании mmproj с многотокенной спекуляцией. Практические советы и прогнозы.

Обзор

З

Запуск модели с 500k контекстом на 48GB VRAM: Nemotron-3-Super 64B-A12B и скорость 21 tok/s

Обзор модели Nemotron-3-Super 64B-A12B: 500k токенов контекста на 48GB VRAM, 21 токен/с. MoE, GGUF квантование, агентное кодирование. Сравнение с альтернативами

Обзор

К

Как локальные модели ломают JSON: каталог ошибок и библиотека для восстановления

Разбираем типичные сбои JSON-вывода у локальных моделей (Llama, Qwen, Mistral) и показываем, как библиотека Loot-JSN их чинит. Примеры, код, сравнение.

Обзор

C

Claude Platform on AWS: Полный гайд по настройке, IAM и биллингу

Как подключить Claude через AWS Marketplace, настроить IAM-аутентификацию, управлять агентами и отслеживать затраты. Полное руководство с примерами.

Обзор

M

MiniCPM-V 4.6: карманный осьминог, который видит больше, чем вы думаете

OpenBMB выпустила MiniCPM-V 4.6 — компактную мультимодальную модель с улучшенным OCR и пониманием сцен. Сравниваем с предшественником и конкурентами.

Обзор

E

ExLlamaV3 Major Updates: что нового, как обновить и почему это ускорит инференс

Разбираем крупное обновление ExLlamaV3: FP8, новый KV cache, скорость до 2x. Инструкция по обновлению и тесты на реальных моделях.

Обзор

T

TextWeb: Markdown-браузер для AI-агентов – альтернатива Vision моделям

TextWeb – open-source инструмент, который превращает веб-страницы в чистый Markdown. Экономит токены, работает локально, заменяет дорогие мультимодальные модели

Обзор