Инструменты для работы с AI

И

Исправление tool calling в Qwen 3.5: исчерпывающий Jinja-шаблон и разбор нативных тегов <think>

Полный гайд по починке сломанного tool calling в Qwen 3.5. Рабочий Jinja-шаблон, разбор нативных тегов <think> и сравнение с альтернативами на 11.04.2026.

Обзор

M

Marco-Mini и Marco-Nano от Alibaba: Архитектура с низким активным параметром — тесты скорости и квантование

Marco-Mini и Marco-Nano от Alibaba: модели с 0.86B активных параметров из 17.3B. Тесты скорости inference, квантование, сравнение с аналогами. Кому подойдут в 2

Обзор

H

Hugging Face Kernels: репозитории, которые наконец-то объединили код и модель

Что такое Hugging Face Kernels, как они меняют рабочий процесс Data Science и кому стоит переходить на них прямо сейчас. Обзор актуальный на апрель 2026.

Обзор

O

Off Grid: полный гайд по запуску Gemma 4 на смартфоне без облака и интернета

Полное руководство по установке и использованию Off Grid для запуска Gemma 4 на Android и iOS без интернета. Работа с документами и кодом оффлайн в 2026 году.

Обзор

К

Как обновить Mamba 1 и 2 до Mamba 3: методология переноса весов и экономия VRAM

Практическое руководство по переносу весов между архитектурами Mamba без обучения с нуля. Экономия времени и VRAM до 12 GB.

Обзор

К

Как Qwen 3.5-27B автоматически строит backend-системы: разбор AutoBe и экономия до 25 раз

Как инструмент AutoBe с моделью Qwen 3.5-27B автоматически создает backend. Разбор возможностей, сравнение с аналогами и реальная экономия до 25 раз на разработ

Обзор

И

Исправленный Qwen3.5-35B-A3B-Uncensored: как установить и использовать с промптом для глубокого мышления

Пошаговый гайд: как скачать исправленные GGUF-файлы Qwen3.5-35B-A3B-Uncensored с Hugging Face, настроить llama.cpp и использовать мощный промпт для глубокого мы

Обзор

G

Google AI Edge Eloquent: тестируем офлайн-диктовку на Gemma и сравнение с Wispr Flow

Обзор Google AI Edge Eloquent — офлайн-диктовка на Gemma ASR. Сравнение с Wispr Flow по точности, скорости и приватности.

Обзор

T

Tensor Parallelism в ik_llama: подробный гайд по ускорению Gemma 4 31B на нескольких GPU

Полное руководство по настройке Tensor Parallelism в ik_llama для запуска Gemma 4 31B на нескольких видеокартах. Тесты PPL, сравнение производительности и пошаг

Обзор

А

Асинхронные под-агенты в Deep Agents: как распараллелить долгие задачи и не сойти с ума

Как использовать асинхронные под-агенты в Deep Agents для распараллеливания длинных задач. Stateful агенты, удаленные агенты, гетерогенное развертывание.

Обзор

S

SpectralQuant: революционный метод квантования LLM, который на 18% лучше TurboQuant — установка и бенчмарки

Обзор SpectralQuant — нового метода квантования LLM с открытым кодом. Сравнение с TurboQuant, установка и бенчмарки на 07.04.2026.

Обзор

A

Auto-SKILLs: как Gemma 4 создаёт навыки для агентов, наблюдая за действиями на экране

Как Gemma 4 автоматически создает навыки для AI-агентов, наблюдая за действиями пользователя на экране. Обзор возможностей, сравнение с аналогами и примеры испо

Обзор