Учебные материалы
Как тестировать кодинг-агентов в 2026: обзор бенчмарков и создание своего
Полный гайд по тестированию AI-агентов: от SWE-bench и ABC-Bench до создания кастомного бенчмарка с песочницей. Подводные камни, метрики, код на Python.
Claude Code Ralph Wiggum: как зациклить работу агента до полного успеха
Плагин Ralph Wiggum для Claude Code зацикливает агента, пока задача не будет выполнена. Полный гайд с пошаговой настройкой, примерами и разбором ошибок.
Интеграция LLM с T-FLEX CAD: как избежать галлюцинаций и стабильно генерировать C#-код
Пошаговый гайд по интеграции LLM с T-FLEX CAD: разделение Python и C#, самопроверка моделей, антигаллюцинаторные техники. Реальные примеры и ошибки.
Создание AI research assistant с AWS Strands: туториал за 30 строк кода
Пошаговое руководство по созданию AI-агента-исследователя с AWS Strands и Kiro IDE. Минимум кода, максимум пользы. Реальный пример за 30 строк Python.
Как приручить недетерминизм LLM-агентов с помощью Event Sourcing: практическое руководство
Практическое руководство по приручению недетерминизма в AI-агентах с помощью Event Sourcing. Шаги, код, нюансы и ссылки на актуальные исследования.
Как собрать локальный второй мозг на Codex, Markdown и Obsidian: от GTD к AI-агенту
Как собрать AI-агента на Codex и Obsidian для GTD. Пошаговая настройка с примерами, ошибками и советами. Актуально на 2026 год.
Как запустить локальную речевую систему на Reachy Mini: пошаговое руководство с Gemma 4 и llama.cpp
Полный гайд по созданию офлайн-речевой системы на Reachy Mini: VAD, STT, Gemma 4 через llama.cpp, TTS. Команды, квантование, оптимизация. Работает без облаков.
Сколько стоит владеть локальным LLM-сервером за $6400? Сравнение с API и полный финансовый анализ
Детальный финансовый анализ локального LLM-сервера за $6400: CAPEX, OPEX, амортизация, стоимость электроэнергии. Сравнение с GPT-4.5, Claude 4 и Gemini 2.5. Ког
Как я обучил LLM для азербайджанского языка на SageMaker и сэкономил 58% памяти: гайд с Liger Kernels
Пошаговое руководство по обучению LLM для низкоресурсного азербайджанского языка: кастомный токенизатор, Liger Kernels на ml.p5.48xlarge, результаты: +23% throu
Mixture of Experts в Transformers: полное руководство по внедрению и оптимизации
Полный гайд по Mixture of Experts: как работает MoE, код на Hugging Face, балансировка нагрузки, инференс и дообучение. Практические советы инженера.
Сравнение характеристик GPU для локального LLM: почему пропускная способность — не всё (реалити-чек)
Разбираем мифы о выборе GPU для локальных LLM. Почему пропускная способность памяти — не единственный критерий, и как не попасться на маркетинговые уловки. Реал
М1 Max 64GB: какой движок инференции реально быстрее в 2026? Бенчмарк MLX, llama.cpp и RunAnywhere.ai
Сравнение производительности MLX, llama.cpp, RunAnywhere.ai и vLLM-MLX на M1 Max 64GB. Результаты тестов с MLX-Chronos, анализ скорости, контекста и квантования