Гайды по AI и нейросетям

Manual #4509 8 min

Самохостируемый AI для кода вместо Claude: выбор модели, железа и гайд по fine-tuning под Laravel и VueJS

Практическое руководство по замене Claude на самохостируемый AI: выбор модели, подбор железа и fine-tuning под стек Laravel и VueJS для команды из 12 разработчи

Открыть документ

Manual #4503 9 min

Новый метод быстрого удаления механизмов отказа (refusal) из LLM с низкой дивергенцией KL: полный гайд и ожидание релиза

Как за минуты убрать цензуру и отказы из LLM, сохранив качество модели. Полный гайд по новому методу аблитерирования и подготовка к релизу на arXiv.

Открыть документ

Manual #4501 9 min

Исправление бага с повторной обработкой промптов в Qwen 3.5 для llama.cpp: подробный гайд

Глубокий разбор и пошаговое исправление критического бага с повторной обработкой промптов в Qwen 3.5 при использовании llama.cpp. Узнай, как починить Jinja chat

Открыть документ

Manual #4499 8 min

Как настроить llama.cpp и Qwen 3.5 27B для рекордной TPS при классификации документов

Детальное руководство по настройке llama.cpp сервера и Qwen 3.5 27B модели для обработки более 2000 документов в секунду. Оптимизация батчинга, контекста 128k и

Открыть документ

Manual #4493 7 min

Практическое руководство: Как обучить Qwen 2B для реальной задачи, обогнав 35B модель за £1

Пошаговый гайд по дообучению Qwen 2B для очистки диктовки. Сбор данных через reverse proxy, completions-only training, оценка. Затраты менее £1.

Открыть документ

Manual #4490 8 min

Сравнение локальных моделей Qwen3.5 для генерации баг-репортов: тест на Swift с оценкой от Claude Sonnet

Практическое сравнение квантованных Qwen3.5 моделей для генерации баг-репортов в iOS разработке. Оценка качества через Claude Sonnet, настройка LM Studio.

Открыть документ

Manual #4489 8 min

Архитектура Vision-Language моделей: как дообучить текстовую LLM для работы с изображениями

Пошаговый разбор архитектуры Vision-Language моделей 2026 года. Узнайте, как добавить image backbone и adapter layer к текстовой LLM. Практическое руководство.

Открыть документ

Manual #4486 9 min

Claude Cowork + Chrome: 10 сценариев автоматизации браузера

Полное руководство по настройке связки Claude Cowork и Chrome для автоматизации рутины. Конкретные сценарии, шаги установки и ошибки, которых стоит избегать. Ак

Открыть документ

Manual #4484 9 min

AI PDLC: как изменится работа разработчика, когда ИИ берёт на себя 80% задач (кейсы Сбера и Яндекса)

Шкала зрелости AI-driven разработки. Как изменится работа программиста, когда ИИ возьмёт 80% задач. Реальные кейсы трансформации в Сбере, Яндексе и red_mad_robo

Открыть документ

Manual #4482 7 min

Гибридный поиск в Agentic RAG: когда векторы и ключевые слова перестают спорить

Пошаговое руководство по внедрению гибридного поиска в Agentic RAG-системы. Комбинируем семантический поиск и BM25 для точного извлечения контекста.

Открыть документ

Manual #4473 9 min

Выбор железа для 24/7 агентов: CUDA на 6x RTX 3080 vs энергоэффективные Strix Halo и GB10

Практический гайд по выбору железа для круглосуточных AI агентов. Сравнение производительности, энергопотребления и экосистем CUDA и ROCm на примере 6x RTX 3080

Открыть документ

Manual #4471 8 min

Сжимаем Llama 8B до 2.5 ГБ: Экстремальный гайд для Jetson Orin Nano

Практический гайд по запуску 8-миллиардной модели Llama на Jetson Orin Nano с всего 2.5 ГБ памяти. Квантование, оптимизация, ошибки и реальные показатели.

Открыть документ

Учебные материалы

Самохостируемый AI для кода вместо Claude: выбор модели, железа и гайд по fine-tuning под Laravel и VueJS

Новый метод быстрого удаления механизмов отказа (refusal) из LLM с низкой дивергенцией KL: полный гайд и ожидание релиза

Исправление бага с повторной обработкой промптов в Qwen 3.5 для llama.cpp: подробный гайд

Как настроить llama.cpp и Qwen 3.5 27B для рекордной TPS при классификации документов

Практическое руководство: Как обучить Qwen 2B для реальной задачи, обогнав 35B модель за £1

Сравнение локальных моделей Qwen3.5 для генерации баг-репортов: тест на Swift с оценкой от Claude Sonnet

Архитектура Vision-Language моделей: как дообучить текстовую LLM для работы с изображениями

Claude Cowork + Chrome: 10 сценариев автоматизации браузера

AI PDLC: как изменится работа разработчика, когда ИИ берёт на себя 80% задач (кейсы Сбера и Яндекса)

Гибридный поиск в Agentic RAG: когда векторы и ключевые слова перестают спорить

Выбор железа для 24/7 агентов: CUDA на 6x RTX 3080 vs энергоэффективные Strix Halo и GB10

Сжимаем Llama 8B до 2.5 ГБ: Экстремальный гайд для Jetson Orin Nano