Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

L

LangSmith Sandboxes: Как запускать AI-агентов, не взрывая продакшен

Изолированные среды выполнения для AI-агентов. Сравнение с Docker, gVisor, Firecracker. Примеры использования и рекомендации.

Обзор
U

Unsloth Studio: когда fine-tuning LLM становится простым как клик

Полный обзор Unsloth Studio 2.0: новый веб-интерфейс для fine-tuning и запуска локальных LLM. Установка через pip, сравнение с LM Studio и Oobabooga, первые шаг

Обзор
Т

Тест мультимодальности Mistral Small 4: почему модель так плохо описывает изображения (с примерами промптов и ответов)

Реальный тест мультимодальности Mistral Small 4: примеры промптов и абсурдных ответов модели. Почему модель плохо описывает изображения и кому она не подходит.

Обзор
A

AVP (латентный трансфер): как заставить агентов ИИ работать в 5 раз быстрее и писать код лучше

Техника латентного трансфера для агентов ИИ: ускорение до 5.8x, +14.1% точности кода. Colab notebook, реализация на HuggingFace Transformers 5.0.0.

Обзор
B

Blackwell против Hopper: как новые GPU Nvidia переписывают правила игры в AI

Полный разбор архитектуры Nvidia Blackwell: характеристики B100, B200, B300, поддержка FP4, HBM3e память. Сравнение с H100 для сборки AI-серверов в 2026.

Обзор
К

Клиппи возвращается: как превратить Ollama в персонального AI-ассистента на рабочем столе

Готовый инструмент для создания персонального AI-ассистента на основе Ollama с визуальным интерфейсом в стиле Клиппи. Автоматизация файлов, почты и браузера.

Обзор
H

Holotron-12B: NVIDIA и H Company удваивают скорость ваших AI-агентов

Разбираем Holotron-12B от H Company и NVIDIA — open-source модель для компьютерных агентов с удвоенной пропускной способностью. Релиз март 2026.

Обзор
A

Abliterated Qwen 3.5 2B: как скачать и использовать модель с рекордно низким KL-расхождением

Как использовать Abliterated Qwen 3.5 2B с рекордно низким KL-расхождением для улучшения текстов и снятия цензуры. Полное руководство на 2026 год.

Обзор
И

Исправленный чат-шаблон для Qwen 3.5: полное руководство по настройке tool calling, агентских циклов и стриминга

Готовый инструмент с исправлениями багов Qwen 3.5. Настройка tool calling, агентских циклов, стриминга для llama.cpp, Open WebUI, vLLM. Руководство на 2026 год.

Обзор
M

Mistral-Small-4-119B-NVFP4: Зачем французы затачивают ИИ под чипы NVIDIA и как это использовать

Что такое формат NVFP4, как он ускоряет Mistral-Small-4-119B на GPU NVIDIA Blackwell и пошаговый гайд по запуску. Сравнение с INT4 и MXFP4.

Обзор
M

MaximusLLM: Тренируй гигантские модели на картошке — один T4 и никакого стресса

Как тренировать большие языковые модели на слабом железе с помощью MaximusLLM. Ghost Logit Loss, Kronecker Sketching и другие техники экономии VRAM.

Обзор
M

Mistral Small 4: Французский эксперт, который съедает 128 котлет, но переваривает только две

Полный разбор Mistral Small 4: архитектура MoE 128/4, 119B параметров, мультимодальность. API, сравнение с GPT-4.5 и Claude 3.5, кому подходит в 2026.

Обзор