Инструменты
Подборка AI-инструментов. Только то, что работает.
Derpy Turtle: бесплатный GUI для тренировки голосов Kokoro с RVC — наконец-то без танцев с бубном
Обзор бесплатного инструмента с открытым кодом для тренировки голосовых моделей на базе Kokoro TTS и RVC. Как работает, сравнение с альтернативами, примеры испо
Needle: как 26 миллионов параметров заменяют гигантов при вызове функций
Модель Needle с 26M параметров, дистиллированная из Gemini, выполняет tool calling со скоростью 6000 tok/s prefill – идеально для мобильных AI-агентов. Сравнени
Локальный AI-кодинг на одной видеокарте: настройка автокомплита и агентного режима с Qwen моделями
Настройка Qwen2.5-Coder-7B и Qwen3.6-35B-A3B на одной видеокарте для автокомплита и агентного программирования без облачных API. Примеры, квантования, конфигура
GGUF на стероидах: почему MagicQuant v2.0 сделает ваши модели умнее, не раздувая битность
Обзор MagicQuant v2.0 — инструмента для создания гибридных GGUF квантований с динамическими конфигурациями. Сравнение с Unsloth, примеры, бенчмарки, кому подойд
Новый инструмент llama-eval в llama.cpp: что это и как использовать
Новый встроенный инструмент для оценки моделей в llama.cpp от ggerganov. Запускайте MMLU, HellaSwag и другие тесты локально. Инструкция и сравнение с альтернати
llama.cpp server: долгожданное исправление краша mmproj + MTP (speculative decoding)
Узнайте, как в llama.cpp server наконец починили краш при использовании mmproj с многотокенной спекуляцией. Практические советы и прогнозы.
Запуск модели с 500k контекстом на 48GB VRAM: Nemotron-3-Super 64B-A12B и скорость 21 tok/s
Обзор модели Nemotron-3-Super 64B-A12B: 500k токенов контекста на 48GB VRAM, 21 токен/с. MoE, GGUF квантование, агентное кодирование. Сравнение с альтернативами
Как локальные модели ломают JSON: каталог ошибок и библиотека для восстановления
Разбираем типичные сбои JSON-вывода у локальных моделей (Llama, Qwen, Mistral) и показываем, как библиотека Loot-JSN их чинит. Примеры, код, сравнение.
Claude Platform on AWS: Полный гайд по настройке, IAM и биллингу
Как подключить Claude через AWS Marketplace, настроить IAM-аутентификацию, управлять агентами и отслеживать затраты. Полное руководство с примерами.
MiniCPM-V 4.6: карманный осьминог, который видит больше, чем вы думаете
OpenBMB выпустила MiniCPM-V 4.6 — компактную мультимодальную модель с улучшенным OCR и пониманием сцен. Сравниваем с предшественником и конкурентами.
ExLlamaV3 Major Updates: что нового, как обновить и почему это ускорит инференс
Разбираем крупное обновление ExLlamaV3: FP8, новый KV cache, скорость до 2x. Инструкция по обновлению и тесты на реальных моделях.
TextWeb: Markdown-браузер для AI-агентов – альтернатива Vision моделям
TextWeb – open-source инструмент, который превращает веб-страницы в чистый Markdown. Экономит токены, работает локально, заменяет дорогие мультимодальные модели