Гайды по AI и нейросетям - AiManual
AiManual Logo Ai / Manual.
Документация

Учебные материалы

Manual #5385 7 min

Confirmation Lock в LLM-агентах: почему ваш агент глупеет на ходу и как его разблокировать

Глубокий разбор ошибки Confirmation Lock, усиливающей предвзятость в LLM-агентах. Практическое руководство по архитектуре LOCK-R и реальные решения для продакше

Открыть документ
Manual #5383 8 min

Как реплицировать и улучшить модель детекции секретов локально: гайд с разметкой датасета и обучением

Пошаговый гайд по созданию модели детекции секретов локально. Разметка датасета с ИИ, обучение и улучшение коммерческих аналогов.

Открыть документ
Manual #5380 6 min

Разбор утечки Claude Code: архитектурные паттерны «ОС для ИИ» — самовосстановление, вычисления во сне и отсечение функций

Анализ 512 тыс. строк утекшего кода Claude Code. Раскрываем паттерны: самовосстановление ИИ, вычисления во сне, отсечение функций. Как Anthropic строит операцио

Открыть документ
Manual #5378 7 min

APEX vs K-кванты: в чём разница и почему APEX критически важен для больших MoE-моделей (на примере QWEN Coder 80B)

Глубокий разбор APEX квантования для MoE-архитектур. Почему старые методы не работают на QWEN Coder 80B и как оптимизировать память и скорость в 2026 году.

Открыть документ
Manual #5374 7 min

Сравнение локальных LLM для генерации кода: OpenCode с Qwen, Gemma, Nemotron и GLM

Практическое сравнение локальных LLM для генерации кода: тестируем Qwen 3.5, Gemma 4, Nemotron 3 и GLM-4.7 Flash в OpenCode. Результаты, требования к железу и в

Открыть документ
Manual #5373 9 min

Continuous batching для агентных роев: как ускорить исследования и кодирование в разы

Полное руководство по continuous batching для агентных роев. Ускоряем работу LLM-агентов в 3-5 раз с помощью vLLM и параллельной обработки. Примеры кода, настро

Открыть документ
Manual #5371 9 min

Развертывание NVIDIA Nemotron 3 Super 120B на одной видеокарте: полное руководство и тесты на реальных задачах

Пошаговое руководство по запуску MoE-модели Nemotron 3 Super 120B на одной RTX PRO 6000. Тесты производительности, интеграция с Luxms BI и расчет стоимости влад

Открыть документ
Manual #5369 6 min

Лайфхак: как увеличить контекстное окно Gemma 4 до 60K+ токенов с помощью Q8 mmproj

Практическое руководство по замене F16 mmproj на Q8_0 для экономии памяти и увеличения контекстного окна Gemma 4 до 60K+ токенов. Актуально на апрель 2026 года.

Открыть документ
Manual #5368 8 min

Архитектурный паттерн против галлюцинаций LLM: разделение анализа и генерации вместо усиления промптов

Глубокое руководство по архитектурному паттерну, который снижает галлюцинации LLM на 70-80% без дорогих моделей. Пошаговый план внедрения на 2026 год.

Открыть документ
Manual #5366 10 min

Архитектура системы из 11 AI-агентов для автоматизации тестирования: подробный кейс

Подробный кейс: как построить мультиагентную систему из 11 AI-агентов для автоматизации тестирования с интеграцией Jira, Figma, GitLab. Метрики и шаги.

Открыть документ
Manual #5365 7 min

Как удалить цензуру из MoE-моделей: техника abliteration для Qwen3.5-397B на Mac Studio

Пошаговое руководство по удалению цензуры из MoE-модели Qwen3.5-397B с помощью техники abliteration на Mac Studio. Работа с весами, кастомизация и нюансы.

Открыть документ
Manual #5363 8 min

Gemma4-31B против Gemini 3.1 Pro: как добиться рекордной производительности через Harness

Пошаговое руководство по настройке Gemma4-31B с помощью фреймворка Harness для достижения уровня производительности Gemini 3.1 Pro. Методы квантования, оптимиза

Открыть документ