Учебные материалы
Как заставить ИИ писать как ТАСС, Медуза или VC: полный разбор стилизации LLM через RAG и промпты
Пошаговый разбор: как научить GPT-4, Claude 3.5 или локальную модель писать в стиле конкретного издания. RAG против файн-тюнинга, промпты, корпус текстов, ошибк
Как создать стабильный runtime для AI-агентов: архитектура промежуточного слоя между ИИ и ОС
Глубокий разбор архитектуры runtime для AI-агентов: как создать стабильный промежуточный слой между LLM и операционной системой для детерминизма и безопасности.
Strix Halo для разработки: замена облачным ИИ-сервисам на примере Qwen3-Coder-Next 80B
Полный гайд по замене Claude Codex на локальный Qwen3-Coder-Next 80B на Strix Halo. Контекст 128K, реальные тесты, настройка, сравнение с RTX 3090.
Собираем ПК за $1300 для локального ИИ: разбираем сборку от Gemini и показываем реальные альтернативы
Подробный разбор сборки ПК за $1300 для запуска LLM локально. Анализируем рекомендации Gemini, проверяем совместимость на PCPartPicker, показываем реальные альт
MCP-сервер для проверки доменов: интеграция с Cursor и автоматизация подбора свободных имён
Пошаговый гайд по созданию MCP-сервера для проверки доменов через Cursor. Автоматизация WHOIS-запросов, подбор свободных имён, конфигурация mcp.json на 2026 год
Семантический граф знаний из юридических документов: от австралийского права до ваших данных
Пошаговый гайд по созданию семантического графа знаний из юридических документов с Kanon 2 Enricher и австралийским правом. Извлечение цитат, нормализация, эмбе
PDF-to-Markdown: итоги бенчмарка трёх инструментов на разных GPU (PaddleOCR-VL, Marker, PP-StructureV3)
Бенчмарк скорости и точности трёх инструментов для PDF-to-Markdown на GPU A100, V100, T4. Реальные цифры, проблемы установки, выбор лучшего решения.
От идеи к SaaS: как я автоматизировал создание флеш-карт с помощью ИИ-агентов и бросил Anki
Реальный кейс: как бэкенд-инженер создал SaaS для автоматического создания флеш-карт с помощью LLM-агентов. Архитектура, проблемы, решения и технические детали.
120GB VRAM и тишина: как разогнать гигантские LLM без сжигания денег
Полное руководство по выбору и запуску моделей типа Minimax 2.1 и Qwen3 на системах с 120GB+ VRAM. Квантование Q4, оптимизация памяти, реальные тесты.
Архитектура мультиагентных систем для юридических задач: практический разбор на примере Ken1.0 и SimCourt
Глубокий технический разбор архитектур мультиагентных систем для юридических задач. Сравнение SimCourt и практической реализации на Ken1.0. Решение проблемы гал
Inheritune: режем жир из LLM — вырезаем вырожденные слои внимания и получаем меньшие, но сильные модели
Полное руководство по Inheritune: как находить и удалять дегенеративные слои внимания в LLM для создания компактных моделей без потери качества. Код, примеры, о
LLM как судья: сравнительный тест GPT-5.2, Claude 4.6 и Gemini 3.1 для анализа судебных решений
Эксперимент: три топовые LLM анализируют арбитражные дела. Кто точнее предсказывает исход? Результаты теста на реальных данных.