Учебные материалы
Тупой бенчмарк для LLM: как 76% моделей галлюцинируют на простейшем вопросе 'current date'
Эксперимент: 76% языковых моделей дают неверный ответ на вопрос 'current date'. Почему LLM галлюцинируют на простом и как это тестировать. Методика тупого бенчм
Per-row MSE quantization: практическое руководство по сжатию LLM до 15MB с минимальной потерей качества
Пошаговый гайд по per-row MSE quantization для сжатия больших языковых моделей. Код на PyTorch, сравнение BPB, оптимизация под edge-устройства.
Локальный Qwen 3.5 на 16 ГБ GPU против облачного Kimi K2.5: тест скорости и точности
Детальное сравнение локального запуска Qwen 3.5 с квантованием unsloth q2_k_xl на 16 ГБ GPU и облачного Kimi K2.5. Метрики скорости 120 t/s, настройка LM Studio
Компрометация LiteLLM 1.82.7 и 1.82.8: инструкция по проверке и срочному обновлению
Подробная инструкция по проверке и срочному обновлению LiteLLM после компрометации версий 1.82.7 и 1.82.8. Актуально на 24 марта 2026 года.
Agentic RAG Challenge 2026: разбор победного решения и метрик оценки (точность, скорость, токены)
Как победили в Agentic RAG Challenge 2026: разбор решения, метрики точности, скорости, токенов. Юридические документы DIFC, векторный поиск, практика для разраб
Автоматизация мультиагентных систем: пайплайны, триггеры и bounce-back для AI-воркеров
Пошаговое руководство по автоматизации мультиагентных систем с помощью пайплайнов, триггеров и bounce-back механизмов. Актуально на 2026 год.
Как защитить систему от AI: практическое руководство по sandboxing для локальных LLM
Практическое руководство по изоляции AI-агентов с Docker и виртуальными машинами. Защита от supply chain атак и вредоносного кода.
Ваш LLM сервер жрет память как не в себя? Виновник - фрагментация кучи glibc. Исправляем за 5 минут настройкой MALLOC_*
OOM-killed ваш сервер LLM? Это не утечка, а фрагментация кучи glibc. Глубокий разбор и пошаговое решение через настройку MALLOC_MMAP_THRESHOLD_ и MALLOC_TRIM_TH
Профессиональные практики AI-кодинга: как добиваться качественного кода (TDD, контекст, стек, риск-менеджмент)
Как использовать ИИ для написания качественного кода. Практические методы TDD, управления контекстом, выбора стека и риск-менеджмента. Обновлено на 2026.
Фреймворк офлайн-оценки для продакшен-готовых LLM-агентов: как тестировать недетерминированные системы
Полное руководство по созданию фреймворка офлайн-оценки для LLM-агентов. Тестируйте многоагентные и недетерминированные системы перед продакшеном с помощью прак
AI-агент для лингвистов: как за 1 минуту генерировать паттерны и тесты на JAICP DSL
Практический кейс создания AI-агента для генерации паттернов и автотестов на доменном языке JAICP. Сокращаем рутину с 6 часов до 1 минуты.
Полный гайд по горячим клавишам Claude Code: ускорьте работу в терминальном AI-инструменте
Исчерпывающий гайд по всем горячим клавишам и слэш-командам Claude Code. Установка, настройка и рабочие процессы для разработчиков в 2026 году.