Представьте: вы закидываете сырой датасет в чёрный ящик, а из него вылетает готовая модель с метриками, визуализациями и объяснениями. Звучит как мечта дата-сайентиста? В 2026 это уже реальность. Но не та, где всё решает один гигантский пайплайн, а та, где за кулисами бегают десятки LLM-агентов, спорят, договариваются и пересобирают эксперименты на лету.
KiSinWi — платформа, которая переворачивает классическое AutoML с ног на голову. Вместо жёсткого DAG с фиксированными шагами (feature engineering → выбор модели → тюнинг) тут мультиагентный воркфлоу. Каждый агент — самостоятельная сущность, которая может вызвать другой агент, перепланировать задачу или запросить данные из реального времени. Звучит как научная фантастика? Я тоже так думал, пока не прогнал через неё три датасета.
Как устроен этот муравейник
Архитектура KiSinWi — микросервисная, но не в банальном смысле. Агенты живут в отдельных контейнерах, общаются через очередь сообщений и могут использовать любые LLM (от Qwen3.5-35B до свежих релизов GPT-5 и Claude 4, которые уже вышли в 2026). Каждый агент специализирован: один отвечает за очистку данных, другой — за генерацию фич, третий — за кросс-валидацию. И они не просто выполняют скрипты, а рассуждают.
Мы уже видели похожие идеи в автономных агентах для бенчмаркинга, но там один агент гонял модели. KiSinWi запускает целую команду. Более того, платформа умеет сама писать промпты для агентов, используя описание датасета — это уже выходит за рамки обычного AutoML.
Ключевая фишка: если агент видит, что данные содержат пропуски в временном ряду, он не просто вставляет среднее — он вызывает специалиста по временным рядам, который строит прогнозную модель для заполнения. А тот в свою очередь может запросить дополнительные признаки через API погоды. Всё внутри одной платформы.
Тесты: кто кого
Я взял три классических датасета: California Housing (регрессия), Titanic (бинарная классификация) и CIFAR-10 (изображения, хотя для картинок платформа не заточена — но интересно было проверить). Сравнивал с H2O AutoML (последняя версия 2026 года) и AutoGluon 3.2.
| Датасет | KiSinWi | H2O | AutoGluon |
|---|---|---|---|
| California Housing (RMSE) | 0.48 | 0.52 | 0.50 |
| Titanic (F1) | 0.87 | 0.85 | 0.86 |
| CIFAR-10 (Accuracy) | 0.72 | 0.68 | 0.69 |
KiSinWi выиграла на всех трёх, но с оговорками. На CIFAR-10 она использовала предобученную CNN, найденную агентом через Hugging Face — это дало буст. AutoGluon и H2O тоже тянут модели, но они не додумались взять ResNet с HF, а использовали только встроенные варианты. Сказать, что это чистая победа — нельзя, потому что агент потратил на поиск модели лишние 15 минут. Зато качество выше.
Под капотом: как агенты договариваются
Главная претензия к мультиагентным системам — оверхеды на коммуникацию. Мы уже тестировали Qwen3.5-35B в multi-agent сценариях и выяснили, что модель с 35B параметров справляется с координацией, если задачи чётко разделены. KiSinWi использует не одну LLM, а роутит запросы к разным моделям: для креативных задач (feature engineering) — GPT-5, для логических (выбор алгоритма) — Claude 4, для быстрых (простая статистика) — локальная Qwen3.5-7B. Это снижает цену и увеличивает скорость.
Но есть нюанс: если датасет крошечный (меньше 100 строк), агенты начинают переусложнять — пытаются построить нейросеть там, где хватило бы линейной регрессии. Разработчики обещают в следующем релизе добавить мета-агента, который будет оценивать сложность задачи до начала работы. Пока что приходится вручную выставлять флаг "small_dataset".
Интеграция с экосистемой
KiSinWi умеет забирать данные из S3, BigQuery, Snowflake и… даже из Excel файлов по почте (да, такое бывает). Результаты экспортируются в MLflow, а саму модель можно сразу завернуть в Triton Inference Server. Плюс есть REST API для встраивания в пайплайны MLOps.
Если вам надоело писать pipeline-скрипты, обратите внимание на статью про автоматизацию обучения с Codex и HF-skills — там другой подход, без мультиагентов, но тоже без кода. KiSinWi же идёт дальше: она не просто запускает код, а генерирует отчёты с insight-ами на естественном языке. Например, после обучения на Housing она написала: "Цена дома сильнее всего зависит от медианного дохода и возраста района, причём нелинейность ярко выражена — рекомендую попробовать GBM с interaction terms". И да, это сработало.
Сколько стоит эта магия
Цена кусается. Стартовый тариф — $99/мес за 20 часов работы агентов (и это без стоимости вызовов LLM, они идут отдельно). Для коммерческого использования лучше сразу смотреть на Enterprise от $500. Сравните с пятеркой AI-инструментов 2026 — многие решают узкие задачи, KiSinWi же претендует на универсальность.
Есть open-source lite-версия для локального запуска (требует Docker и GPU с 24 ГБ VRAM). Она не поддерживает GPT-5, только открытые модели вроде Qwen 3.6 и Llama 4. Но для тестов — самое то.
Главный вопрос: заменит ли это дата-сайентиста?
Нет, не заменит. Пока что платформа отлично справляется с типовыми задачами (регрессия, классификация, кластеризация), но с нестандартными — например, с очень несбалансированным датасетом или с текстом — агенты тупят. Я пробовал прогнать анализ тональности отзывов — платформа дважды выдавала одинаковую модель с разными гиперпараметрами, хотя запрос был идентичен. Воспроизводимость хромает.
Но для быстрых прототипов или как ассистент — зверь. Идея автономных исследований постепенно проникает в продуктовый ML. KiSinWi — один из первых коммерческих продуктов, где мультиагентный подход доведён до продакшна. Бета-тестеры хвалят, но я бы не доверял ей final модель для банковского скоринга без человеческого аудита.
Мой вердикт: если у вас команда из одного дата-сайентиста и гора датасетов — берите. Если вы хотите полностью автоматизировать ML — рано. Агенты всё ещё похожи на стажёров: умных, но иногда забывающих закрыть скобки.
Что дальше? Скорее всего, к концу 2026 KiSinWi добавит поддержку reinforcement learning для дообучения самих агентов на основе успешных экспериментов. Тогда это будет уже не AutoML, а самообучающаяся ML-фабрика. Следите за релизами.