Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #2041 8 min

Как LLM управляют умными устройствами: технический разбор Function Calling, проблемы отказа и инженерные решения

Полный технический разбор как LLM управляют умными устройствами через Function Calling. Проблемы отказа моделей, инженерные решения, архитектура агентов и приме

Открыть документ
Manual #2040 7 min

Почему ваш AI-проект провалится: 5 фатальных ошибок в разработке приложений с генеративным ИИ

Типичные ошибки разработчиков при создании приложений с генеративным ИИ. Как избежать провала вашего AI-проекта в 2026 году.

Открыть документ
Manual #2039 9 min

Whisper.cpp в продакшене: как собрать локальный редактор субтитров с ручным выравниванием

Пошаговый гайд по сборке продакшен-редактора субтитров на Whisper.cpp с ручным выравниванием временных меток. Работает без интернета на CPU/GPU.

Открыть документ
Manual #2038 7 min

REAP-прунинг моделей: как он влияет на креативность и где искать компромисс

Глубокий анализ REAP-прунинга GLM4.7: как сжатие моделей убивает креативность и мультиязычность. Практические советы по выбору компромисса между скоростью и кач

Открыть документ
Manual #2037 6 min

Математический потолок RAG: почему embedding-модели не находят документы и как это обойти

Глубокий разбор фундаментальной проблемы современных RAG-систем: почему векторный поиск математически ограничен и как обойти эти ограничения на практике в 2026

Открыть документ
Manual #2033 8 min

Машинное сознание по рецепту Стивена Фитца: строим ИИ, который чувствует боль и радость

Разбираем революционную архитектуру Стивена Фитца для создания ИИ с настоящим сознанием. Клеточные автоматы, трансформеры и информационная геометрия - техническ

Открыть документ
Manual #2032 7 min

Titans и MIROS от Google: как работает архитектура для бесконечной памяти ИИ и можно ли её воспроизвести

Разбираем Titans и MIROS от Google на 2026 год: как работает архитектура для бесконечной памяти ИИ, принципы test-time training и можно ли её воспроизвести лока

Открыть документ
Manual #2031 8 min

Оптимизация AI-станции на Threadripper: как объединить NVIDIA и AMD, охладить память и настроить мощность

Практическое руководство по оптимизации AI-станции на Threadripper с гибридными GPU. Команды nvidia-smi, amd-smi, охлаждение оперативной памяти, компиляция llam

Открыть документ
Manual #2030 7 min

Qwen 3 235B против Devstral: когда RAM спасает от компромиссов в коде

Практический разбор: запускать ли огромную Qwen 3 235B в RAM+VRAM или довольствоваться маленькой Devstral в VRAM? Тесты на Python, Ansible, Terraform.

Открыть документ
Manual #2029 9 min

PCIe-шина — узкое горлышко для LLM: почему x4 на 3.0 убивает скорость вывода, а x16 на 4.0 спасает

Практический тест: как пропускная способность PCIe влияет на скорость инференса LLM. Сравниваем PCIe 3.0 x4 и 4.0 x16 на GLM 4.5 Air с vLLM и tensor parallel. Р

Открыть документ
Manual #2026 10 min

Zoof: от нуля до 394M — Как я предобучил и заставил слушаться языковую модель

Полный гайд по созданию своей языковой модели с нуля: от предобучения на текстах до инструктивного тюнинга. Код, данные, ловушки и репозиторий Zoof.

Открыть документ
Manual #2025 6 min

Тестирование анцензурированных LLM для хакерских задач: почему Gemma-3-Heretic не справляется и что искать

Практическое тестирование анцензурированных LLM для этичного хакинга. Почему Gemma-3-Heretic терпит неудачу и какие модели реально полезны для пентеста в 2026 г

Открыть документ