Учебные материалы
StepFun 3.5 Flash против MiniMax 2.1: когда «быстрая» модель думает медленнее
Практическое сравнение производительности StepFun 3.5 Flash и MiniMax 2.1 на AMD Ryzen с IQ4_XS и Q3_K_XL. Анализ VRAM, времени генерации и феномена «передумыва
Ubuntu не видит Radeon 9070XT: как вытащить видеокарту из чёрного списка amdgpu
Пошаговое решение проблемы, когда Ubuntu не видит видеокарту Radeon 9070XT после обновления. Чёрный список amdgpu, диагностика и исправление за 10 минут.
Почему ваша LoRA не учится: иллюзия потерь и как её сломать
Технический аудит проблемы стагнации LoRA при 4-bit квантовании. Практическое руководство по диагностике и исправлению иллюзии потерь при тонкой настройке.
Как запустить Qwen3-4B на Intel NPU: полный гайд по драйверам, OpenVINO и производительности
Подробное руководство по установке драйверов Intel NPU, настройке OpenVINO и запуску Qwen3-4B с реальными тестами производительности до 16 токенов в секунду.
Фронтенд без фронтендера: как я собрал Vue/TypeScript проект за неделю с AI-ассистентом
Практическое руководство по сборке фронтенда на Vue/TypeScript без фронтендера с помощью AI-ассистента. Дизайн-система, генерация интерфейса, ревью кода.
Docker + JupyterLab для живых семинаров по ML: как заставить студентов писать код, а не смотреть
Пошаговый гайд по созданию локальной образовательной среды для ML семинаров с Docker и JupyterLab. Установка, конфигурация, расширения и лучшие практики для вов
AI-агент за копейки: как Jetson Orin Nano Super жрёт 15 ватт вместо 800
Пошаговая сборка AI-агента на Jetson Orin Nano Super с энергопотреблением 15Вт. Настройка OpenClaw, аппаратный шлюз, экономия 80% на электричестве.
Квантование LLM: как сжать модель в 4 раза без потери качества (и когда это невозможно)
Исчерпывающее руководство по квантованию LLM: от основ до продвинутых техник. GGUF, INT4, Q4_K_M, FP16 - разбираем все форматы, сравниваем качество и скорость,
Тот самый баг в гибридном поиске, который все игнорируют: как Log-Odds Conjunction убивает ваши RAG-системы
Глубокий разбор фундаментальной ошибки гибридного поиска в RAG. Практическое исправление Conjunction Shrinkage через Bayesian BM25 с логарифмическими шансами.
Как настроить LoRA для Qwen3-VL 2B: оптимальные параметры для слабого GPU
Пошаговый гайд по настройке LoRA для Qwen3-VL 2B на GPU с 8-12 ГБ VRAM. Оптимальные параметры, команды, ошибки и экономия памяти.
Unsloth + Q4 квантование: как заставить 30B модель работать на 8 ГБ VRAM с оффлоадингом в RAM
Пошаговая инструкция по тонкой настройке больших языковых моделей с Unsloth, Q4 квантованием и оффлоадингом в RAM. Работаем с 30B моделями на 8 ГБ VRAM.
Почему LLM ломают JSON-парсеры: бенчмарк 672 вызовов и как это исправить
Реальный тест 8 моделей на 672 вызовах показал: 67% ответов ломают JSON-парсеры. Сравнение GPT-4o, Claude 3.7 Sonnet, Mistral Large 2, Llama 3.3 и других. Практ