Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

P

Polly от LangChain: когда ваш AI-агент получает собственного AI-терапевта

Polly от LangChain анализирует трейсы, находит паттерны сбоев и предлагает исправления. Бета-доступ, сравнение с LangSmith, примеры использования.

Обзор
М

Мультиагентная система SAARAM на Amazon Bedrock: как ускорить генерацию тест-кейсов с 1 недели до часов

Как SAARAM на Amazon Bedrock сокращает создание тест-кейсов с недели до часов. Обзор мультиагентной системы с Claude Sonnet для автоматизации QA.

Обзор
П

Проактивный слуховой помощник: как ИИ научился слышать голос в шуме лучше человека

Обзор технологии проактивного слухового помощника на ИИ для выделения голоса собеседника в шумной обстановке. Как работает, сравнение с аналогами.

Обзор
Y

Yume1.5: 12 FPS на A100 и бесконечные миры с WASD. Китайский ответ Genie

Тестируем Yume1.5 от Shanghai AI Lab: 12 кадров в секунду на A100, управление WASD, сравнение с Genie и GAIA-1. Практический гайд по запуску.

Обзор
П

Поиск по видео для геймдева: как Amazon Nova Multimodal Embeddings находит нужный кадр с точностью 96%

Как геймдев-студии используют Amazon Nova Multimodal Embeddings для поиска по сотням тысяч видео. Мультимодальный поиск, A/B тестирование креативов, точность 96

Обзор
W

Wan-Move против Kling 1.5 Pro: рисуем движение кистью в видео

Сравнение Wan-Move и Kling 1.5 Pro. Установка Wan-I2V-14B с контролем движения через Motion Brush. Image-to-video с траекториями точек.

Обзор
G

Gemini 3 от Google: разбор рекордных бенчмарков и нового кодирующего приложения

Анализ Gemini 3 от Google: рекорды в бенчмарках, запуск кодирующего приложения и исследовательская версия Deepthink. Сравнение с альтернативами на 2026 год.

Обзор
P

P1-235B-A22B: как использовать первую золотую медалистку IPhO для решения научных задач

Как использовать модель P1-235B-A22B, показавшую результат уровня GPT-5 на физических тестах, для решения научных задач. Обзор возможностей, сравнение и примеры

Обзор
L

LangSmith Fetch: отладка агентов прямо из терминала — установка и использование CLI

Установка и использование LangSmith Fetch CLI для отладки AI-агентов без переключения контекста. Полное руководство по работе с трейсами LangSmith из терминала.

Обзор
F

Flux.2 против Midjourney и Nano Banana Pro: тесты, промпты и где генерировать изображения дешевле

Тесты Flux.2, Midjourney и Nano Banana Pro на реальных промптах. Где дешевле генерировать изображения в 2026 году? Сравнение качества, скорости и стоимости.

Обзор
D

DeepAgents CLI: кодирующий агент, который работает в терминале. Тестируем на Terminal Bench 2.0 и сравниваем с Claude Code

Обзор DeepAgents CLI — автономного кодирующего агента для терминала. Установка через uvx, тест на Terminal Bench 2.0 (42.5%), сравнение производительности с Cla

Обзор
D

DeepEyesV2: когда картинки говорят, а модель их слушает и ищет

Как использовать DeepEyesV2 для анализа изображений и поиска информации. Сравнение с Qwen2.5-VL, инструкция по установке и примеры применения.

Обзор