Гайды по AI и нейросетям

Manual #6324 7 min

6 ключевых решений AI-инженера: build vs buy, fine-tuning vs prompt, реальные цифры и фреймворки

Практический гайд по 6 дилеммам AI-инженера: build vs buy, fine-tuning vs prompt, throughput vs latency, RAG vs fine-tuning, automation vs oversight, cost vs qu

Открыть документ

Manual #6321 9 min

Programmatic Tool Calling на Amazon Bedrock: снижаем latency при многошаговых вызовах инструментов

Как Programmatic Tool Calling на Amazon Bedrock ускоряет многошаговые вызовы: генерация кода, песочница, снижение latency. Пошаговый гайд с примерами и разбором

Открыть документ

Manual #6320 1 min

ИИ-интерфейсы: как боковые панели и встроенные чаты меняют работу в браузерах и редакторах — 15 примеров

Обзор тренда сплит-вью с ИИ: Edge, Chrome, Яндекс, Perplexity, Figma, Adobe и другие. Как боковые панели и встроенные чаты меняют UX браузеров и редакторов.

Открыть документ

Manual #6317 6 min

Как ИИ восстанавливает аудио из спектрограмм: разбор скандала с голосами погибших пилотов и меры защиты данных

Разбор технологии реконструкции аудио из спектрограмм с помощью AI на примере скандала с голосами погибших пилотов. Пошаговый гайд с кодом на Python и меры защи

Открыть документ

Manual #6316 5 min

Claude Code выпиливают из Pro: как не остаться с пустым терминалом

Anthropic тестирует убирание Claude Code из Pro-плана. Разбираем 4 рабочих способа сохранить доступ: апгрейд Max, API, локальный запуск и форки. Инструкция на м

Открыть документ

Manual #6314 8 min

Локальный бухгалтер на Qwen 3.6: как прикрутить Anthropic Financial Services к своей базе данных и не сойти с ума

Пошаговое руководство по интеграции Qwen 3.6 с Anthropic Financial Services для локального бухгалтерского учёта. Код, SQLite, агенты и подводные камни.

Открыть документ

Manual #6309 8 min

Сравнение Needle 26M и Qwen3-0.6B для function calling на CPU: бенчмарк и рекомендации

Сравнение Needle 26M и Qwen3-0.6B для function calling на CPU. 50 запросов, 5 уровней сложности. Needle 26M оказывается в 4.4 раза быстрее и точнее. Практичные

Открыть документ

Manual #6308 8 min

Как сэкономить на API: роутинг запросов между дешевой MoE и дорогой моделью на vLLM

Пошаговый гайд по настройке умного роутинга запросов на vLLM 0.8: 95% легких задач уходят на дешевую MoE (Hunyuan Hy3), сложные — на премиум-модель. Экономьте б

Открыть документ

Manual #6306 9 min

Как переписать промпты для reasoning-моделей: крах классического промпт-инжиниринга и новые правила

Почему CoT-шаблоны убивают качество ответов в reasoning-моделях. Реальные примеры, таблица ошибок и пошаговый план адаптации промптов под GPT-5.5 High Thinking

Открыть документ

Manual #6304 6 min

Agentic GRPO: как RL с групповым преимуществом позволяет ИИ побеждать людей в соревнованиях по программированию

Разбор прорыва 2026: как Agentic GRPO с tool calling и поздней наградой позволил ИИ впервые обогнать людей на Codeforces. Полное руководство с кодом.

Открыть документ

Manual #6302 7 min

Как создать ИИ-агента для ЧС, работающего без интернета: опыт команды Сбера

Практическое руководство по созданию ИИ-агента экстренной помощи без интернета. Опыт Сбера: выбор модели, RAG-пайплайн, Docker на Raspberry Pi. Код и инструкции

Открыть документ

Manual #6297 7 min

Не ставьте 70B в оркестратор: как выбрать размер модели для ReAct-агента на llama.cpp

Практические советы по выбору LLM 2-7B для планирования ReAct-агентов. Настройка цикла, сравнение моделей, типичные ошибки для локального запуска через llama.cp

Открыть документ

Учебные материалы

6 ключевых решений AI-инженера: build vs buy, fine-tuning vs prompt, реальные цифры и фреймворки

Programmatic Tool Calling на Amazon Bedrock: снижаем latency при многошаговых вызовах инструментов

ИИ-интерфейсы: как боковые панели и встроенные чаты меняют работу в браузерах и редакторах — 15 примеров

Как ИИ восстанавливает аудио из спектрограмм: разбор скандала с голосами погибших пилотов и меры защиты данных

Claude Code выпиливают из Pro: как не остаться с пустым терминалом

Локальный бухгалтер на Qwen 3.6: как прикрутить Anthropic Financial Services к своей базе данных и не сойти с ума

Сравнение Needle 26M и Qwen3-0.6B для function calling на CPU: бенчмарк и рекомендации

Как сэкономить на API: роутинг запросов между дешевой MoE и дорогой моделью на vLLM

Как переписать промпты для reasoning-моделей: крах классического промпт-инжиниринга и новые правила

Agentic GRPO: как RL с групповым преимуществом позволяет ИИ побеждать людей в соревнованиях по программированию

Как создать ИИ-агента для ЧС, работающего без интернета: опыт команды Сбера

Не ставьте 70B в оркестратор: как выбрать размер модели для ReAct-агента на llama.cpp