Учебные материалы
6 ключевых решений AI-инженера: build vs buy, fine-tuning vs prompt, реальные цифры и фреймворки
Практический гайд по 6 дилеммам AI-инженера: build vs buy, fine-tuning vs prompt, throughput vs latency, RAG vs fine-tuning, automation vs oversight, cost vs qu
Programmatic Tool Calling на Amazon Bedrock: снижаем latency при многошаговых вызовах инструментов
Как Programmatic Tool Calling на Amazon Bedrock ускоряет многошаговые вызовы: генерация кода, песочница, снижение latency. Пошаговый гайд с примерами и разбором
ИИ-интерфейсы: как боковые панели и встроенные чаты меняют работу в браузерах и редакторах — 15 примеров
Обзор тренда сплит-вью с ИИ: Edge, Chrome, Яндекс, Perplexity, Figma, Adobe и другие. Как боковые панели и встроенные чаты меняют UX браузеров и редакторов.
Как ИИ восстанавливает аудио из спектрограмм: разбор скандала с голосами погибших пилотов и меры защиты данных
Разбор технологии реконструкции аудио из спектрограмм с помощью AI на примере скандала с голосами погибших пилотов. Пошаговый гайд с кодом на Python и меры защи
Claude Code выпиливают из Pro: как не остаться с пустым терминалом
Anthropic тестирует убирание Claude Code из Pro-плана. Разбираем 4 рабочих способа сохранить доступ: апгрейд Max, API, локальный запуск и форки. Инструкция на м
Локальный бухгалтер на Qwen 3.6: как прикрутить Anthropic Financial Services к своей базе данных и не сойти с ума
Пошаговое руководство по интеграции Qwen 3.6 с Anthropic Financial Services для локального бухгалтерского учёта. Код, SQLite, агенты и подводные камни.
Сравнение Needle 26M и Qwen3-0.6B для function calling на CPU: бенчмарк и рекомендации
Сравнение Needle 26M и Qwen3-0.6B для function calling на CPU. 50 запросов, 5 уровней сложности. Needle 26M оказывается в 4.4 раза быстрее и точнее. Практичные
Как сэкономить на API: роутинг запросов между дешевой MoE и дорогой моделью на vLLM
Пошаговый гайд по настройке умного роутинга запросов на vLLM 0.8: 95% легких задач уходят на дешевую MoE (Hunyuan Hy3), сложные — на премиум-модель. Экономьте б
Как переписать промпты для reasoning-моделей: крах классического промпт-инжиниринга и новые правила
Почему CoT-шаблоны убивают качество ответов в reasoning-моделях. Реальные примеры, таблица ошибок и пошаговый план адаптации промптов под GPT-5.5 High Thinking
Agentic GRPO: как RL с групповым преимуществом позволяет ИИ побеждать людей в соревнованиях по программированию
Разбор прорыва 2026: как Agentic GRPO с tool calling и поздней наградой позволил ИИ впервые обогнать людей на Codeforces. Полное руководство с кодом.
Как создать ИИ-агента для ЧС, работающего без интернета: опыт команды Сбера
Практическое руководство по созданию ИИ-агента экстренной помощи без интернета. Опыт Сбера: выбор модели, RAG-пайплайн, Docker на Raspberry Pi. Код и инструкции
Не ставьте 70B в оркестратор: как выбрать размер модели для ReAct-агента на llama.cpp
Практические советы по выбору LLM 2-7B для планирования ReAct-агентов. Настройка цикла, сравнение моделей, типичные ошибки для локального запуска через llama.cp