Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #3092 9 min

StepFun 3.5 Flash против MiniMax 2.1: когда «быстрая» модель думает медленнее

Практическое сравнение производительности StepFun 3.5 Flash и MiniMax 2.1 на AMD Ryzen с IQ4_XS и Q3_K_XL. Анализ VRAM, времени генерации и феномена «передумыва

Открыть документ
Manual #3090 7 min

Ubuntu не видит Radeon 9070XT: как вытащить видеокарту из чёрного списка amdgpu

Пошаговое решение проблемы, когда Ubuntu не видит видеокарту Radeon 9070XT после обновления. Чёрный список amdgpu, диагностика и исправление за 10 минут.

Открыть документ
Manual #3089 10 min

Почему ваша LoRA не учится: иллюзия потерь и как её сломать

Технический аудит проблемы стагнации LoRA при 4-bit квантовании. Практическое руководство по диагностике и исправлению иллюзии потерь при тонкой настройке.

Открыть документ
Manual #3087 8 min

Как запустить Qwen3-4B на Intel NPU: полный гайд по драйверам, OpenVINO и производительности

Подробное руководство по установке драйверов Intel NPU, настройке OpenVINO и запуску Qwen3-4B с реальными тестами производительности до 16 токенов в секунду.

Открыть документ
Manual #3082 10 min

Фронтенд без фронтендера: как я собрал Vue/TypeScript проект за неделю с AI-ассистентом

Практическое руководство по сборке фронтенда на Vue/TypeScript без фронтендера с помощью AI-ассистента. Дизайн-система, генерация интерфейса, ревью кода.

Открыть документ
Manual #3081 8 min

Docker + JupyterLab для живых семинаров по ML: как заставить студентов писать код, а не смотреть

Пошаговый гайд по созданию локальной образовательной среды для ML семинаров с Docker и JupyterLab. Установка, конфигурация, расширения и лучшие практики для вов

Открыть документ
Manual #3080 10 min

AI-агент за копейки: как Jetson Orin Nano Super жрёт 15 ватт вместо 800

Пошаговая сборка AI-агента на Jetson Orin Nano Super с энергопотреблением 15Вт. Настройка OpenClaw, аппаратный шлюз, экономия 80% на электричестве.

Открыть документ
Manual #3079 9 min

Квантование LLM: как сжать модель в 4 раза без потери качества (и когда это невозможно)

Исчерпывающее руководство по квантованию LLM: от основ до продвинутых техник. GGUF, INT4, Q4_K_M, FP16 - разбираем все форматы, сравниваем качество и скорость,

Открыть документ
Manual #3074 7 min

Тот самый баг в гибридном поиске, который все игнорируют: как Log-Odds Conjunction убивает ваши RAG-системы

Глубокий разбор фундаментальной ошибки гибридного поиска в RAG. Практическое исправление Conjunction Shrinkage через Bayesian BM25 с логарифмическими шансами.

Открыть документ
Manual #3072 9 min

Как настроить LoRA для Qwen3-VL 2B: оптимальные параметры для слабого GPU

Пошаговый гайд по настройке LoRA для Qwen3-VL 2B на GPU с 8-12 ГБ VRAM. Оптимальные параметры, команды, ошибки и экономия памяти.

Открыть документ
Manual #3071 8 min

Unsloth + Q4 квантование: как заставить 30B модель работать на 8 ГБ VRAM с оффлоадингом в RAM

Пошаговая инструкция по тонкой настройке больших языковых моделей с Unsloth, Q4 квантованием и оффлоадингом в RAM. Работаем с 30B моделями на 8 ГБ VRAM.

Открыть документ
Manual #3070 8 min

Почему LLM ломают JSON-парсеры: бенчмарк 672 вызовов и как это исправить

Реальный тест 8 моделей на 672 вызовах показал: 67% ответов ломают JSON-парсеры. Сравнение GPT-4o, Claude 3.7 Sonnet, Mistral Large 2, Llama 3.3 и других. Практ

Открыть документ