Учебные материалы
Дистилляция навыков аудита безопасности в Qwen3-14B: тонкая настройка на трассах DeepSeek
Практическое руководство по дистилляции навыков аудита безопасности в Qwen3-14B. Тонкая настройка на трассах DeepSeek, снижение затрат на 70%, готовая модель на
Структура против хаоса: почему Entity Cards бьют полный контекст в RAG-системах
F1-метрики, HotpotQA тесты и неожиданный вывод: Entity Cards на 37% эффективнее полного контекста для AI-агентов. Практическое руководство с кодом.
128 ГБ ОЗУ на Strix Halo: какие модели для кодирования реально работают, а какие — маркетинг
Практический гайд по выбору моделей 30B-100B параметров для локального кодирования на Strix Halo с 128 ГБ ОЗУ. Сравнение GGUF, AWQ, тесты производительности, кв
Гибридный AI-поиск по книгам: двухконтурная архитектура, векторизация метаданных и семантическое ранжирование на практике
Разбор кейса red_mad_robot: как построить гибридный поиск по 500k книг с двухконтурной архитектурой, векторизацией метаданных и LLM-ранжированием на практике в
LLM забывают середину: как правильно сортировать списки от Bulk до TrueSkill
Почему LLM портят ранжирование длинных списков? Сравниваем 5 методов: от простого Bulk до алгоритма TrueSkill. Реальная задача с 164 постами.
GLM 4.7 против Gemini 3: Битва за HTML5 Pacman — тест, промпты и неожиданный результат
Тестируем GLM 4.7 и Gemini 3 в создании клона Pacman на HTML5. Готовые промпты, настройки temperature=0, пошаговый разбор кода и неожиданный победитель. Сравнит
LLM как подчиненный: субъектный подход в архитектуре агентов
Продвинутый архитектурный паттерн: stateful ядро, логический слой и инверсия управления LLM. Решаем проблему стохастики моделей через субъектный подход.
Арабский OCR 2026: полное тестирование VLM моделей, которые не умеют читать
Практическое сравнение VLM моделей для распознавания арабских документов. Gemini vs Qwen3-VL vs другие. Реальные результаты тестов, проблемы, выбор подходящей м
Adobe Acrobat AI: как редактировать PDF промптами и создавать презентации из документов
Полное руководство по AI в Adobe Acrobat: редактируйте PDF промптами, создавайте презентации, генерируйте подкаст-саммари. Актуальные функции 2026 года, сравнен
12 ГБ VRAM — не приговор: какой кодер и математик поместится в вашу видеокарту в 2026 году
DeepSeek Coder V2.5, OSS:20B, Qwen 2.5 — какие модели для кода и математики реально запустить на 12 ГБ VRAM в 2026. Сравнение квантований GGUF и AWQ.
Системы памяти для LLM — Graphiti vs MemGPT: как сравнивать и какие бенчмарки не врут
Практическое сравнение систем памяти для LLM: какие метрики использовать для Graphiti, MemGPT и других. Реальные бенчмарки, а не маркетинг.
Prompt injection: почему эта дыра в ИИ никогда не закроется
Почему prompt injection атаки всё ещё работают в 2026 году? Фундаментальная проблема LLM, которую нельзя исправить. Анализ от Senior DevOps.