Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #3072 9 min

Как настроить LoRA для Qwen3-VL 2B: оптимальные параметры для слабого GPU

Пошаговый гайд по настройке LoRA для Qwen3-VL 2B на GPU с 8-12 ГБ VRAM. Оптимальные параметры, команды, ошибки и экономия памяти.

Открыть документ
Manual #3071 8 min

Unsloth + Q4 квантование: как заставить 30B модель работать на 8 ГБ VRAM с оффлоадингом в RAM

Пошаговая инструкция по тонкой настройке больших языковых моделей с Unsloth, Q4 квантованием и оффлоадингом в RAM. Работаем с 30B моделями на 8 ГБ VRAM.

Открыть документ
Manual #3070 8 min

Почему LLM ломают JSON-парсеры: бенчмарк 672 вызовов и как это исправить

Реальный тест 8 моделей на 672 вызовах показал: 67% ответов ломают JSON-парсеры. Сравнение GPT-4o, Claude 3.7 Sonnet, Mistral Large 2, Llama 3.3 и других. Практ

Открыть документ
Manual #3068 8 min

Локальные LLM в работе: реальные кейсы, которые меняют всё

Лучшие практики применения локальных LLM от разработчиков: кодинг, анализ данных, автоматизация. Полный гайд с примерами для Ollama, LM Studio.

Открыть документ
Manual #3067 6 min

Q4_K_M квантование: золотая середина или компромисс без выбора?

Полный разбор Q4_K_M квантования: что это такое, как влияет на качество ответов AI-моделей, сравнение с Q8_0 и Q2_K, практические рекомендации по выбору формата

Открыть документ
Manual #3065 10 min

Две карты, одна скорость: почему ваша LLM на двух GPU работает как на одной и как это исправить

Разбираем проблему неравномерной загрузки GPU в LM Studio и vLLM. Пошаговый гайд по диагностике, настройке tensor parallelism и оптимизации скорости генерации t

Открыть документ
Manual #3053 9 min

Totogi BSS Magic: как мы заменили 20 инженеров мультиагентным фреймворком на Amazon Bedrock

Реальный кейс Totogi: как автоматизировать обработку change request в телекоме с помощью мультиагентного фреймворка на Amazon Bedrock. Архитектура, онтологии, п

Открыть документ
Manual #3049 7 min

Google Drive в Amazon Quick Suite: Создаём кастомный коннектор через OpenAPI за 30 минут

Пошаговая инструкция по созданию кастомного коннектора для Google Drive в Amazon Quick Suite через OpenAPI спецификацию. Автоматизация загрузки файлов без глубо

Открыть документ
Manual #3047 6 min

Кейс Pushpay: Как построить надежный агентный ИИ-поиск для некоммерческих организаций на Amazon Bedrock

Реальный кейс Pushpay: как построить агентный ИИ для анализа данных сообщества в религиозных организациях на Amazon Bedrock. Архитектура, инструменты, ошибки.

Открыть документ
Manual #3046 9 min

Triton, Flash-attention и bitsandbytes на Windows с ROCm 7: как собрать то, что AMD не хочет поддерживать

Полное руководство по сборке Triton, Flash-attention 2 и bitsandbytes для AMD ROCm 7 в Windows. Команды Chocolatey, форки репозиториев, тесты с ComfyUI.

Открыть документ
Manual #3042 8 min

Агентное обучение с подкреплением (Agentic RL): как LinkedIn прокачивает GPT-OSS и почему ваш простой RAG уже устарел

Глубокий разбор Agentic RL от LinkedIn. Отличия от классического RL, итеративный цикл GRPO/PPO, практические шаги внедрения. Актуально на февраль 2026.

Открыть документ
Manual #3041 8 min

Механистическая интерпретируемость LLM: как заглянуть внутрь нейросети и понять её решения

Полное руководство по механистической интерпретируемости LLM: как анализировать активации, находить нейроны-триггеры и понимать внутренние механизмы нейросетей

Открыть документ