Гайды по AI и нейросетям

Manual #4391 8 min

Скорость генерации LLM: почему 5 токен/с - не предел, и когда токены в секунду действительно важны

Глубокий разбор скорости генерации LLM: когда токен/с важен, как выжать максимум из железа и софта, и почему вы измеряете скорость неправильно. Актуально на мар

Открыть документ

Manual #4390 8 min

От OCR к ADE: полный гайд по автоматическому пониманию документов с помощью AI

Глубокий разбор эволюции обработки документов: от распознавания текста до понимания смысла AI. Практические шаги, актуальные модели и подводные камни.

Открыть документ

Manual #4389 9 min

Асинхронное обучение с подкреплением: сравнительный анализ 16 open-source библиотек и оптимизация пайплайна

Глубокий технический гайд по асинхронному обучению с подкреплением. Сравниваем 16 open-source библиотек, разбираем управление rollout buffer, staleness manageme

Открыть документ

Manual #4388 8 min

Распознавание рукописного текста на Qwen3.5-4B: полное руководство по настройке в llama.cpp

Пошаговое руководство по настройке Qwen3.5-4B для OCR рукописного текста в llama.cpp. Квантование GGUF, оптимизация скорости, решение ошибок.

Открыть документ

Manual #4387 5 min

Экономика AI: как считать реальную стоимость запроса к LLM с учётом кэша (формула effective cost)

Как считать реальную стоимость запроса к LLM с учетом кэширования. Формула effective cost, примеры расчетов для GPT-4.5 и Claude 3.7 на 2026 год.

Открыть документ

Manual #4386 8 min

Борьба с галлюцинациями Vision-моделей: как добавить Computer Vision для проверки геометрии (кейс PhotoMentor)

Кейс PhotoMentor: как мы победили галлюцинации Gemini в оценке композиции, добавив проверку геометрии через Computer Vision. Пошаговый план и код на 2026 год.

Открыть документ

Manual #4384 9 min

Как заставить Qwen 3.5 0.8B играть в DOOM: пошаговый туториал по созданию VLM-агента

Полный гайд по созданию VLM-агента на Qwen 3.5 0.8B для игры в DOOM через VizDoom. Установка, код, настройка LM Studio и решение ошибок.

Открыть документ

Manual #4383 6 min

Embedding-модели для малоресурсных языков: почему OpenAI и Cohere проигрывают бесплатным LaBSE и E5 (тест на армянском)

Почему коммерческие embedding-модели OpenAI и Cohere плохо работают на малоресурсных языках? Тест на армянском показывает преимущество бесплатных LaBSE и E5.

Открыть документ

Manual #4381 8 min

1-битное квантование — прорыв или провал? Реальные тесты Qwen3.5 и MiniMax в 2026 году

Проверяем миф об ультра-низкобитном квантовании. Сравниваем производительность и экономию памяти на моделях Qwen3.5 397B и MiniMax-M2.5. Практическое руководств

Открыть документ

Manual #4378 8 min

Тонкая настройка merged модели за 45 минут на T4 с Unsloth: пошаговый workflow

Пошаговый workflow быстрой тонкой настройки merged LLM на видеокарте T4 за 45 минут с использованием Unsloth. Снижаем стоимость и время обучения.

Открыть документ

Manual #4375 9 min

Ulysses Sequence Parallelism: как тренировать модели на контекстах в миллион токенов в Hugging Face

Практическое руководство по Ulysses Sequence Parallelism для тренировки моделей с контекстами до 1 миллиона токенов. Интеграция с Hugging Face, сравнение с Ring

Открыть документ

Manual #4367 9 min

Как построить benchmark для AI-поиска: методика, которая сэкономит $500K на интеграции

Пошаговая методика построения бенчмарка для AI-поиска. Узнайте, как оценить релевантность, стоимость и производительность, чтобы избежать дорогих ошибок интегра

Открыть документ

Учебные материалы

Скорость генерации LLM: почему 5 токен/с - не предел, и когда токены в секунду действительно важны

От OCR к ADE: полный гайд по автоматическому пониманию документов с помощью AI

Асинхронное обучение с подкреплением: сравнительный анализ 16 open-source библиотек и оптимизация пайплайна

Распознавание рукописного текста на Qwen3.5-4B: полное руководство по настройке в llama.cpp

Экономика AI: как считать реальную стоимость запроса к LLM с учётом кэша (формула effective cost)

Борьба с галлюцинациями Vision-моделей: как добавить Computer Vision для проверки геометрии (кейс PhotoMentor)

Как заставить Qwen 3.5 0.8B играть в DOOM: пошаговый туториал по созданию VLM-агента

Embedding-модели для малоресурсных языков: почему OpenAI и Cohere проигрывают бесплатным LaBSE и E5 (тест на армянском)

1-битное квантование — прорыв или провал? Реальные тесты Qwen3.5 и MiniMax в 2026 году

Тонкая настройка merged модели за 45 минут на T4 с Unsloth: пошаговый workflow

Ulysses Sequence Parallelism: как тренировать модели на контекстах в миллион токенов в Hugging Face

Как построить benchmark для AI-поиска: методика, которая сэкономит $500K на интеграции