Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #4073 9 min

Claude Skills: инструкция по созданию переиспользуемых промптов и победа над рутиной

Полное руководство по Claude Skills от Anthropic. Узнайте, как создавать skill.md файлы для автоматизации рутинных задач с Claude 4.5. Примеры, ошибки, FAQ.

Открыть документ
Manual #4072 9 min

Как построить гибридного чат-бота с ИИ за 5000 руб. в месяц: обзор подходов и выбор стека

Практический гайд по архитектуре гибридного чат-бота. Детальный разбор затрат: SaaS, open-source, кастомные решения. Учет 152-ФЗ и выбор стека.

Открыть документ
Manual #4070 7 min

Оптимизация ML inference на Databricks: partitioned tables vs liquid clustering vs salting на боевом кейсе

Реальный кейс ускорения инференса с 24 до 6 часов: сравниваем partitioned tables, liquid clustering и salting на Databricks с метриками производительности.

Открыть документ
Manual #4069 8 min

Тест производительности Qwen3.5-35B в multi-agent задачах: почему он справился, а другие sub-100B модели — нет

Детальный разбор эксперимента: почему только Qwen3.5-35B справился с multi-agent workflow, а другие модели sub-100B провалились. Анализ reasoning effort, пошаго

Открыть документ
Manual #4066 7 min

Как включить обработку изображений в Qwen 3.5 через OpenCode и Llama.cpp: готовое решение

Полное руководство по активации многомодальности в Qwen 3.5. Готовая JSON-конфигурация для OpenCode и Llama.cpp, шаги установки и решение типичных ошибок.

Открыть документ
Manual #4064 5 min

RAG-бот для BIM на GigaChat: как архитектор без навыков кода автоматизировал работу с документами

История архитектора, который без программирования создал RAG-бота для работы с BIM-документами на GigaChat. Как он это сделал и какие результаты получил.

Открыть документ
Manual #4062 6 min

Как фрейминг системного промпта меняет энтропию генерации: исследование на 3830 запусков

Как формулировка системного промпта радикально меняет распределение вероятностей в LLM. 3830 запусков, метрики энтропии для Mistral-7B и Mamba, открытый код.

Открыть документ
Manual #4061 8 min

Почему Qwen 3.5 стал прорывом для локального AI-ассистента в коде: туториал по установке и тест против конкурентов

Полное руководство по установке Qwen 3.5 для локального coding assistant. Сравнение с Claude, DeepSeek и другими. Тесты производительности и автономной работы.

Открыть документ
Manual #4058 7 min

Тестирование Qwen3.5-122B-A10B-i1-GGUF на AMD 6000 Pro: как добиться 262K контекста и высокой скорости

Пошаговый гайд по запуску Qwen3.5-122B-A10B-i1-GGUF на AMD 6000 Pro с контекстом 262K токенов. Оптимизация производительности, бенчмарки и решение проблем.

Открыть документ
Manual #4046 7 min

Оптимизация vLLM: как обслуживать Qwen 3.5 в Thinking и Non-Thinking режимах без двойной загрузки в VRAM

Гайд по обслуживанию Qwen 3.5 в двух режимах через один экземпляр vLLM. Экономим видеопамять на 50% с помощью chat template kwargs.

Открыть документ
Manual #4042 8 min

DIY голосовой ассистент на Rockchip: решаем проблему нормализации текста для TTS (омонимы, числа, сокращения)

Практическое руководство по реализации нормализации текста для синтеза речи в голосовом ассистенте на платформе Rockchip. Решаем проблемы омонимов, чисел и сокр

Открыть документ
Manual #4041 8 min

Контекстный TTS для локального запуска: архитектура, требования к железу и методы оценки

Полное руководство по контекстному TTS для локального запуска. Архитектура на 520M параметров, требования к VRAM, методы оценки качества речи. Актуально на февр

Открыть документ