Инструменты
Подборка AI-инструментов. Только то, что работает.
Исправление tool calling в Qwen 3.5: исчерпывающий Jinja-шаблон и разбор нативных тегов <think>
Полный гайд по починке сломанного tool calling в Qwen 3.5. Рабочий Jinja-шаблон, разбор нативных тегов <think> и сравнение с альтернативами на 11.04.2026.
Marco-Mini и Marco-Nano от Alibaba: Архитектура с низким активным параметром — тесты скорости и квантование
Marco-Mini и Marco-Nano от Alibaba: модели с 0.86B активных параметров из 17.3B. Тесты скорости inference, квантование, сравнение с аналогами. Кому подойдут в 2
Hugging Face Kernels: репозитории, которые наконец-то объединили код и модель
Что такое Hugging Face Kernels, как они меняют рабочий процесс Data Science и кому стоит переходить на них прямо сейчас. Обзор актуальный на апрель 2026.
Off Grid: полный гайд по запуску Gemma 4 на смартфоне без облака и интернета
Полное руководство по установке и использованию Off Grid для запуска Gemma 4 на Android и iOS без интернета. Работа с документами и кодом оффлайн в 2026 году.
Как обновить Mamba 1 и 2 до Mamba 3: методология переноса весов и экономия VRAM
Практическое руководство по переносу весов между архитектурами Mamba без обучения с нуля. Экономия времени и VRAM до 12 GB.
Как Qwen 3.5-27B автоматически строит backend-системы: разбор AutoBe и экономия до 25 раз
Как инструмент AutoBe с моделью Qwen 3.5-27B автоматически создает backend. Разбор возможностей, сравнение с аналогами и реальная экономия до 25 раз на разработ
Исправленный Qwen3.5-35B-A3B-Uncensored: как установить и использовать с промптом для глубокого мышления
Пошаговый гайд: как скачать исправленные GGUF-файлы Qwen3.5-35B-A3B-Uncensored с Hugging Face, настроить llama.cpp и использовать мощный промпт для глубокого мы
Google AI Edge Eloquent: тестируем офлайн-диктовку на Gemma и сравнение с Wispr Flow
Обзор Google AI Edge Eloquent — офлайн-диктовка на Gemma ASR. Сравнение с Wispr Flow по точности, скорости и приватности.
Tensor Parallelism в ik_llama: подробный гайд по ускорению Gemma 4 31B на нескольких GPU
Полное руководство по настройке Tensor Parallelism в ik_llama для запуска Gemma 4 31B на нескольких видеокартах. Тесты PPL, сравнение производительности и пошаг
Асинхронные под-агенты в Deep Agents: как распараллелить долгие задачи и не сойти с ума
Как использовать асинхронные под-агенты в Deep Agents для распараллеливания длинных задач. Stateful агенты, удаленные агенты, гетерогенное развертывание.
SpectralQuant: революционный метод квантования LLM, который на 18% лучше TurboQuant — установка и бенчмарки
Обзор SpectralQuant — нового метода квантования LLM с открытым кодом. Сравнение с TurboQuant, установка и бенчмарки на 07.04.2026.
Auto-SKILLs: как Gemma 4 создаёт навыки для агентов, наблюдая за действиями на экране
Как Gemma 4 автоматически создает навыки для AI-агентов, наблюдая за действиями пользователя на экране. Обзор возможностей, сравнение с аналогами и примеры испо