Учебные материалы
Почему Ollama игнорирует вашу видеокарту: диагностика и принудительный запуск vision-моделей в 2026
Пошаговое руководство по диагностике и решению проблем, когда Ollama не задействует GPU для vision-моделей (Qwen2.5-VL). Конфигурация num_gpu, проверка VRAM, пр
RTX 5090: как прошить VBIOS MSI Lighting для снижения лимита мощности до 300W
Подробный гайд по прошивке VBIOS на RTX 5090 MSI Lighting для снижения лимита мощности до 300W. Инструкция, команды nvflash64, риски и решение проблем.
SOLARized-GraniStral-14B: Когда два метода слияния моделей лучше одного
Разбираем экспериментальное слияние Ministral 3 и SOLAR 10.7B методами HCT и YeAM. Полная инструкция по запуску SOLARized-GraniStral-14B с метриками и нюансами.
Почему GUI-агенты ломаются на чекбоксах: разбор архитектурных проблем и практическое решение
Глубокий разбор, почему GUI-агенты не справляются с чекбоксами. Архитектурные ошибки, практическое решение и пошаговый план от Senior DevOps. Актуально на 2026
OpenClaw 120B на трёх ноутбуках: как размазать гиганта по домашнему железу
Практический гайд по запуску модели OpenClaw 120B на нескольких компьютерах. Сравнение схем chunking, sliding window и MCP для распределённого inference.
Эксперимент с Exo: почему не удалось повторить гибридный кластер DGX Spark + Mac Studio и рабочие альтернативы
Глубокий разбор неудачного эксперимента с Exo для гибридного кластера DGX Spark + Mac Studio. NVRTC ошибки, проблемы с Blackwell, рабочие альтернативы llama.cpp
Как создать детерминированный kill-switch для автономных AI-агентов: техническое руководство
Пошаговое руководство по созданию детерминированного kill-switch для автономных AI-агентов. Архитектура, реализация, тестирование и deployment.
Web 4.0 и ИИ-агенты: как первый автономный ИИ-предприниматель выживает на 50 долларов
История Вилли ЛомАИ — первого ИИ-агента, который самостоятельно зарабатывает в Web 4.0. Как он выживает на 50 долларов и почему это меняет всё.
Mac M4 Pro 64GB против кодинговых монстров: как не ошибиться с выбором модели в 2026
Тесты памяти и производительности для агентного кодирования на Mac M4 Pro 64GB. Сравнение Qwen3-Coder-Next и 30B моделей, рекомендации по GGUF квантованию.
Как запустить LLM на слабом Android: практический гайд по оптимизации, выбору моделей и борьбе с крашами
Практический гайд по запуску языковых моделей на Android с 4 ГБ ОЗУ. Выбор моделей, оптимизация памяти, решение проблем с крашами приложений.
Qwen3-coder-next на Mac: превращаем LM Studio в локальный Anthropic за 15 минут
Пошаговая настройка Qwen3-coder-next в LM Studio на Mac. Конфигурация settings.json, MLX квантование, работа с Anthropic API. Полный гайд на 2026 год.
IQ2 квантование: 100 токенов в секунду на Qwen3-30B-A3B или как я обманул физику
Тестирование IQ2 квантования на Qwen3-30B-A3B: 100 TPS vs 20 TPS, 81/100 vs 92/100 на RX 9060 XT. Практический гайд по балансу размера и качества.