Инструменты для работы с AI - AiManual
AiManual Logo Ai / Manual.

Инструменты

Подборка AI-инструментов. Только то, что работает.

L

LTX-2: открытая модель, которая генерирует видео и звук одновременно. И это работает

LTX-2 — первая полноценная open-source мультимодальная модель для одновременной генерации видео и аудио. Разбираем возможности, сравнение с аналогами и примеры

Обзор
G

Gemini Pro для разработчиков: возможности, архитектура и как начать использовать

Подробный обзор Gemini Pro от Google для разработчиков. Возможности, архитектура, сравнение с Flash и Ultra, инструкция по началу работы с API.

Обзор
D

DeepMath от Intel: как заставить маленькую модель решать сложную математику с помощью smolagents и GRPO

Как Intel заставил Qwen3-4B решать сложную математику с помощью агентов, Python-песочницы и GRPO. Сравнение с альтернативами и примеры использования.

Обзор
M

MiniMax-M2.1: как запустить новую open-source модель для кодинга (Rust, Java, Go)

Полное руководство по запуску MiniMax-M2.1 — open-source модели с 49.4% на Multi-SWE-bench. Установка через SGLang, vLLM, Transformers для Rust, Java, Go разраб

Обзор
G

Gemini Robotics 1.5: как AI-агенты начинают управлять роботами в реальном мире

Как Gemini Robotics 1.5 через API заставляет роботов искать в интернете, сортировать предметы и выполнять многошаговые задачи. Сравнение с Nvidia Isaac и Physic

Обзор
S

Swift-huggingface: полный клиент для iOS-разработчиков с надежными загрузками и общим кешем

Обзор swift-huggingface - Swift клиента для работы с Hugging Face Hub API. Надежные загрузки моделей, общий кеш, интеграция с iOS/macOS.

Обзор
G

GLM-4.7-REAP-268B-A32B: как Cerebras запихнула 268 миллиардов параметров в локальную память

Полный обзор GLM-4.7-REAP-268B-A32B от Cerebras - первой в мире 268-миллиардной модели для локального запуска. Тесты, требования, сравнения с альтернативами.

Обзор
G

Gemma 3 270M: Тестирование самой маленькой модели семейства на потребительском железе

Полный обзор Gemma 3 270M. Как запустить на слабом ноутбуке, тесты скорости, сравнение с Granite 4.0 Nano и LFM2.5. Кому подойдет самая компактная модель Google

Обзор
M

Mistral Devstral 2 и Vibe CLI: как запустить автономного AI-инженера в терминале

Запустите автономного AI-инженера Mistral Devstral 2 через Vibe CLI. Сканирование файлов, работа с Git, выполнение команд. Apache 2.0 лицензия.

Обзор
T

Transformers v5: Что сломали, что добавили и как не выбросить старый код

Полный гид по новым возможностям Hugging Face Transformers v5, миграции с v4, интеграции с vLLM и llama.cpp для продакшн-разработчиков.

Обзор
B

Brain-canvas: когда текстовый вывод LLM надоел до чертиков

npx brain-canvas — инструмент для визуализации JSON-вывода локальных LLM. HTML canvas, Ollama, llama.cpp, ноль зависимостей.

Обзор
G

GPT Image 1.5 против Nano Banana: кто переваривает фото лучше?

Технический разбор GPT Image 1.5 и Nano Banana Pro: нативная мультимодальность, токенизация изображений, качество редактирования, стоимость API. Кому что выбрат

Обзор