Гайды по AI и нейросетям

Manual #6269 8 min

3 навыка Claude для Data Scientist в 2026: как создавать AI-дашборды и автоматизировать анализ

Научитесь создавать AI-дашборды с Claude 4 Opus, автоматизировать анализ данных и настраивать агентные пайплайны. Реальные промпты, ошибки и чек-лист.

Открыть документ

Manual #6265 10 min

LLM Planner: подбор железа и моделей для локального запуска — 60+ сборок, 50+ моделей и 130+ бенчмарков

Планировщик LLM: 50+ моделей, 60+ сборок, 130+ бенчмарков. Как выбрать ПК под нейросети или модель под свой компьютер. Реальные t/s и ссылки на тесты.

Открыть документ

Manual #6263 8 min

Генеративная модель персонализации ARGUS: как Яндекс переосмыслил рекомендательные системы

Глубокий технический разбор генеративной рекомендательной системы ARGUS от Яндекса: токенизация последовательностей, претрейн, каскадная фильтрация и кросс-серв

Открыть документ

Manual #6262 11 min

Как построить production-ready control layer для LLM: 8 компонентов с кодом и бенчмарками

Пошаговое руководство по построению control layer для LLM: InputGuard, TokenBudget, CircuitBreaker и другие. Код, бенчмарки, 0% → 100% pass rate.

Открыть документ

Manual #6260 6 min

Три критика и один судья: как мы строили multi-agent фидбек для художников (и во сколько это обошлось)

Разбор архитектуры multi-agent feedback для художников: 3 LLM-персоны + судья, компромиссы, стоимость токенов и реальные метрики. Опыт продакшна.

Открыть документ

Manual #6255 9 min

Как избежать роста latency и перегрева GPU: проектирование AI-сервисов с изолированным inference bundle

Практическое руководство по проектированию AI-сервисов с изолированным inference bundle. vLLM, SGLang, continuous batching — как избежать просадок производитель

Открыть документ

Manual #6254 8 min

Schema-enforced execution с tool_use: как повысить надежность структурированных ответов Claude до 95%

Гайд по schema-enforced execution и tool_use Claude: поднимаем надежность структурированных ответов с 65% до 95%+. Примеры кода, ловушки и evals.

Открыть документ

Manual #6253 9 min

AMD BC-250 для дешёвого локального LLM: разблокировка CUs через регистры amdgpu

Как превратить $30 карту на чипе PS5 в 36-ядерный AI-ускоритель. Регистр CC_GC_SHADER_ARRAY_CONFIG, прошивка VBIOS, сборка llama.cpp с Vulkan — полный гайд 2026

Открыть документ

Manual #6251 8 min

Развертывание real-time ASR с Voxtral-Mini-4B на Amazon SageMaker и vLLM: пошаговое руководство

Пошаговый гайд по запуску Voxtral-Mini-4B на SageMaker с vLLM: bidirectional streaming, WebSocket, настройка инстансов, типичные ошибки и их решение.

Открыть документ

Manual #6248 5 min

RAG failed: 3 причины плохого поиска и способы их исправления

Разбираем три основные причины провала RAG: чанкинг, эмбеддинги и ретривал. Практические советы с кодом и ссылками на актуальные исследования 2026 года.

Открыть документ

Manual #6246 6 min

24 ГБ ОЗУ на M4 и 64k контекст: какие LLM реально работают без тормозов?

Подробный гайд: какие модели LLM запускать на MacBook M4 с 24 ГБ RAM, чтобы получить 64k контекста и оставить место для браузера. Квантование, инструменты, ошиб

Открыть документ

Manual #6240 7 min

Как внедрить llms.txt на сайт: пошаговое руководство для SEO и AI-цитируемости

Пошаговое руководство по внедрению llms.txt: что это, зачем нужно и как настроить для AI-цитируемости. Примеры кода, ошибки и прогнозы на 2026 год.

Открыть документ

Учебные материалы

3 навыка Claude для Data Scientist в 2026: как создавать AI-дашборды и автоматизировать анализ

LLM Planner: подбор железа и моделей для локального запуска — 60+ сборок, 50+ моделей и 130+ бенчмарков

Генеративная модель персонализации ARGUS: как Яндекс переосмыслил рекомендательные системы

Как построить production-ready control layer для LLM: 8 компонентов с кодом и бенчмарками

Три критика и один судья: как мы строили multi-agent фидбек для художников (и во сколько это обошлось)

Как избежать роста latency и перегрева GPU: проектирование AI-сервисов с изолированным inference bundle

Schema-enforced execution с tool_use: как повысить надежность структурированных ответов Claude до 95%

AMD BC-250 для дешёвого локального LLM: разблокировка CUs через регистры amdgpu

Развертывание real-time ASR с Voxtral-Mini-4B на Amazon SageMaker и vLLM: пошаговое руководство

RAG failed: 3 причины плохого поиска и способы их исправления

24 ГБ ОЗУ на M4 и 64k контекст: какие LLM реально работают без тормозов?

Как внедрить llms.txt на сайт: пошаговое руководство для SEO и AI-цитируемости