Учебные материалы
Как запустить локальный GraphRAG без GPU: пошаговый гайд с Llama 3.1, Neo4j и LangChain
Полный пайплайн GraphRAG на локальной машине без видеокарты. Устанавливаем квантованную Llama 3.1, Neo4j и LangChain для извлечения графа знаний из документов.
Сборка корпоративного ИИ-сервера за $15 000: выбор GPU, моделей (Qwen 122B) и конфигурации для RAG, OCR и анализа данных
Полное руководство по сборке локального ИИ-сервера для бизнеса. Выбор между RTX Pro 6000 и двумя GPU, настройка Qwen 3.5 122B, RAG, OCR. Аппаратная конфигурация
RAG на практике: пошаговый туториал по созданию умного поиска по документам с LangChain и ChromaDB
Пошаговое руководство по созданию RAG-системы для поиска по документам. Установка, загрузка файлов, векторизация, семантический поиск с актуальными инструментам
Бенчмарки M5 Max vs M3 Max для локальных LLM: разбор ускорения Qwen 3.5, MoE и длинного контекста
Практическое сравнение Apple M5 Max и M3 Max для локальных LLM. Цифры по Qwen 3.5, MoE моделям, длинному контексту и agentic workloads. Помощь в выборе железа.
Полное руководство по созданию on-prem AI пайплайна для документов (OCR + RAG) без облака
Пошаговое руководство по развертыванию локального AI пайплайна для обработки конфиденциальных документов с использованием OCR и RAG. Без облачных API, с открыты
От одного агента к целой деревне: как построить саморазвивающуюся мультиагентную систему на Claude Code
Как построить саморазвивающуюся систему из множества AI-агентов Claude Code. Флаг --dangerously-skip-permissions, tmux, systemd, шина сообщений и веб-админка.
PyTorch DDP в продакшене: как заставить 64 GPU работать как один и не сойти с ума
Полное руководство по созданию отказоустойчивого пайплайна для многоузлового обучения на PyTorch DDP. Инициализация, data loading, логирование, checkpointing.
Настройка связки Dual RX 7900 XTX для запуска Qwen3.5-35B: полный гайд по Vulkan-бэкенду и распределению слоёв
Практический гайд по настройке двух видеокарт AMD RX 7900 XTX для запуска больших языковых моделей через Vulkan бэкенд llama.cpp. Рекордная скорость инференса.
Как заводы используют квантованные Llama и Mistral на Jetson Orin для анализа данных с датчиков
Практическое руководство по внедрению квантованных моделей Llama 3.1 и Mistral 7B на Jetson Orin для автономного анализа вибрации, температуры и других данных с
Проблема LoRA на FP8 оборудовании: как избежать потери 68% качества и исправить underflow
Полное руководство по решению underflow при обучении LoRA на FP8 (H200, A100). Как избежать потери 68% качества. Актуальные методы на март 2026 года.
Как сделать RAG-бота на YandexGPT без Python: кейс внедрения в медицине на PHP и WordPress
Практический гайд по созданию медицинского AI-ассистента с точными ответами на основе документов. Используем Yandex Cloud Agent, PHP и WordPress без сложных орк
Семантический поиск в Telegram: разбираем кейс с Habr и строим свой аналог
Практическое руководство по созданию семантического поиска в Telegram. Разбираем известный кейс с Habr, изучаем архитектуру и строим свою систему с актуальными