Гайды по AI и нейросетям

Manual #1952 7 min

AI Gateway против кастомных решений: Vercel, LiteLLM и OpenRouter для продакшн-приложений

Полное техническое сравнение AI Gateway решений для продакшн-приложений. Vercel AI Gateway, LiteLLM и OpenRouter: архитектура, ограничения и streaming-консистен

Открыть документ

Manual #1951 8 min

Заклинание драконов: как заставить NVIDIA и Intel ARC работать вместе для LLM

Полное руководство по запуску LLM на смешанных GPU. Pipeline и tensor параллелизм, распределение нагрузки, оценка оверхеда, актуальные инструменты на 2026 год.

Открыть документ

Manual #1950 8 min

SGLang против vLLM: битва за миллисекунды в инференсе LLM

Полный разбор SGLang (RadixArk) и vLLM: архитектура, производительность, настройка для высоконагруженных LLM-систем. Актуально на январь 2026.

Открыть документ

Manual #1948 9 min

Ephemeral vs Ray: Сравнение подходов к загрузке моделей и утилизации GPU в продакшене

Глубокий разбор двух архитектур для AI-инференса: эфемерные модели против оркестрации Ray. Как поднять утилизацию GPU с 15% до 85% и убить холодные старты.

Открыть документ

Manual #1946 6 min

Тестирование RK3588 NPU vs Raspberry Pi 5: реальная производительность Llama 3.1, Qwen и DeepSeek

Сравнительный тест RK3588 NPU и Raspberry Pi 5 для запуска Llama 3.1, Qwen и DeepSeek. Реальные цифры токенов в секунду, проблемы конвертации и выбор платформы.

Открыть документ

Manual #1943 7 min

Карьера в Data Science в 2026: какие навыки действительно нужны, а какие — пустая трата времени

Практический гайд по карьере в Data Science на 2026 год. Фундаментальные знания против избыточных технологий. Основано на анализе 400 реальных вакансий.

Открыть документ

Manual #1942 9 min

Как создать самовосстанавливающийся ETL-пайплайн на Python с помощью LLM: полное руководство с кодом

Пошаговое руководство по созданию ETL-пайплайна с автоисправлением ошибок через LLM. Код на Python, архитектура Try-Heal-Retry Loop, обработка исключений pandas

Открыть документ

Manual #1940 8 min

IQ vs Q квантования: как не сжечь видеокарту и не убить качество модели

Полное руководство по выбору типа квантования (IQ vs Q) для локальных LLM. Таблицы сравнения, практические рекомендации под разный VRAM, анализ потерь качества.

Открыть документ

Manual #1939 9 min

Как победить контекстный блот и 'зону тупости' в агентах: архитектура subagents от Deep Agents

Глубокий разбор архитектуры subagents от Deep Agents для изоляции контекста и специализации агентов. Практическое руководство по борьбе с контекстным блотом и з

Открыть документ

Manual #1937 8 min

Self-hosted AI-ассистенты для разработки: Tabby, Continue.dev и другие в 2026 году

Полное сравнение self-hosted AI-ассистентов для разработки в 2026: Tabby, Continue.dev, Cody. Как выбрать, настроить и развернуть приватное решение.

Открыть документ

Manual #1936 10 min

Полный гайд для начинающих: как с нуля запустить локальную LLM с памятью чатов и RAG

Пошаговое руководство по установке Ollama, настройке векторной базы данных и созданию полноценного RAG-системы с чат-памятью на домашнем ПК. Все инструменты акт

Открыть документ

Manual #1935 7 min

Создание мультиагентной системы с Llama 4 и Amazon Bedrock: практическое руководство по Strands Agents

Пошаговое создание мультиагентной системы на Amazon Bedrock с Llama 4 и Strands Agents. Архитектура, масштабирование, отказоустойчивость.

Открыть документ

Учебные материалы

AI Gateway против кастомных решений: Vercel, LiteLLM и OpenRouter для продакшн-приложений

Заклинание драконов: как заставить NVIDIA и Intel ARC работать вместе для LLM

SGLang против vLLM: битва за миллисекунды в инференсе LLM

Ephemeral vs Ray: Сравнение подходов к загрузке моделей и утилизации GPU в продакшене

Тестирование RK3588 NPU vs Raspberry Pi 5: реальная производительность Llama 3.1, Qwen и DeepSeek

Карьера в Data Science в 2026: какие навыки действительно нужны, а какие — пустая трата времени

Как создать самовосстанавливающийся ETL-пайплайн на Python с помощью LLM: полное руководство с кодом

IQ vs Q квантования: как не сжечь видеокарту и не убить качество модели

Как победить контекстный блот и 'зону тупости' в агентах: архитектура subagents от Deep Agents

Self-hosted AI-ассистенты для разработки: Tabby, Continue.dev и другие в 2026 году

Полный гайд для начинающих: как с нуля запустить локальную LLM с памятью чатов и RAG

Создание мультиагентной системы с Llama 4 и Amazon Bedrock: практическое руководство по Strands Agents