Учебные материалы
Когда Claude пишет CUDA-ядра за вас: как обучать маленькие модели создавать оптимизированные диффузоры
Практический гайд по использованию Claude для обучения маленьких моделей писать оптимизированные CUDA-ядра для диффузионных моделей. Экономия времени и ресурсов
Кэширование эмбеддингов: как ускорить индексацию кодовой базы в 7.6 раза
Полное руководство по кэшированию эмбеддингов для RAG-систем. Ускорьте индексацию кодовой базы в 7.6 раз с помощью семантического кэша, batch-запросов и правиль
Kimi K2.5 в vLLM и SGLang: как убить '(no content)' и утечку тегов на H200
Подробное решение проблем с ответами '(no content)' и утечкой XML-тегов при запуске Kimi K2.5 в vLLM и SGLang на H200 GPU. Настройка tool-call-parser и параметр
Когда номенклатура превращается в бардак: как LLM с Structured Output чистят корпоративные справочники
Практическое руководство по нормализации корпоративных справочников номенклатуры с помощью локальных LLM и Structured Output. Обработка Excel, Ollama, бизнес-ав
Сравнение генераторов изображений 2026: тест на странном промпте со стеклянным бегемотом
Сравнение 12 AI-моделей для генерации изображений в 2026 году. Тест на странном промпте "стеклянный бегемот". Результаты, анализ, выбор лучшего инструмента.
Kakugo: как выжать 120 миллиардов параметров в 3 миллиарда для своего языка
Полный пайплайн дистилляции GPT OSS 120B в 3B модель для низкоресурсного языка. Аппаратные требования, код, методика и подводные камни.
Как заменить мышь на жесты рук: создание управления ПК на Python с OpenCV и MediaPipe
Пошаговый гайд по созданию системы управления компьютером жестами рук на Python с OpenCV и MediaPipe. Замена мыши на жесты в реальном времени.
Агентный инжиниринг: от нуля до продакшена за один репозиторий
Полный гайд по агентному инжинирингу с разбором open-source репозитория. Архитектура, инструменты, внедрение в команде на 2026 год.
Архитектура MoE и экономия VRAM: как модель Kimi 2.5 меняет подход к локальным LLM
Подробный разбор архитектуры Mixture of Experts в Kimi 2.5: как запустить триллион параметров на потребительской видеокарте. Технический гайд по экономии VRAM и
От полицейских сводок до ИИ: строим систему, которая предсказывает опасность на улицах
Пошаговый разбор создания ИИ-сервиса оценки безопасности пеших маршрутов: сбор геоданных, моделирование временных рядов, графовые сети, интеграция с картами.
ИИ против юристов: как машины находят правки в договорах, которые пропускают люди
Пошаговое руководство по созданию системы ИИ для автоматического сравнения версий договоров и поиска скрытых правок. Актуальные модели и инструменты на 2026 год
Ling 17B: как скорость взлетела на 100% за 90 дней и почему это меняет правила игры
Полный обзор и бенчмарк Ling 17B моделей на январь 2026. Сравнение квантований Q6_K_L vs IQ4_XS, тесты скорости на RTX 4070, рекомендации по железу.