Perplexity Comet MCP: браузерная автоматизация для локальных LLM | AiManual
AiManual Logo Ai / Manual.
10 Янв 2026 Инструмент

Perplexity Comet MCP: когда ваш браузер слушается локальную нейросеть

Полный гайд по настройке и использованию Comet MCP для автоматизации браузера через локальные языковые модели. Установка, примеры, сравнение с аналогами.

Браузер, который понимает вас с полуслова

Представьте: вы говорите своей локальной нейросети "найди последние новости о запуске Starship" — и через минута у вас на экране открывается нужная страница, данные извлечены и структурированы. Без API-ключей, без платных подписок, без отправки ваших запросов куда-то в облако. Звучит как фантастика? Это Perplexity Comet MCP.

Comet MCP — это open-source инструмент от Perplexity, который превращает любую локальную LLM в полноценного браузерного ассистента через Model Context Protocol. Он работает там же, где и ваша модель — на вашем компьютере.

Что умеет этот "комета"?

Не путайте с браузером Perplexity. Comet — совсем другая история. Это сервер MCP, который подключается к вашему браузеру Chrome или Edge через DevTools Protocol и выполняет команды от локальной LLM.

  • Открывает страницы по URL или поисковому запросу
  • Кликает по элементам, заполняет формы
  • Скроллит, делает скриншоты
  • Извлекает текст, ссылки, таблицы
  • Работает с JavaScript-приложениями
  • Хранит историю сессий

Все это — через простые текстовые инструкции вашей любимой модели. Запустили Llama 3.2 в Ollama или GPT-OSS 20B в LM Studio — и вперед.

Установка: быстрее, чем настроить VPN

1Ставим Python и зависимости

Comet требует Python 3.9+. Клонируем репозиторий с GitHub, устанавливаем зависимости через pip. Никаких сложных системных пакетов — все стандартно.

2Запускаем браузер с удаленной отладкой

Здесь первый подводный камень. Chrome нужно запустить с флагом --remote-debugging-port=9222. Если забыть этот шаг — Comet будет молча смотреть на вас пустым взглядом. (Как и большинство инструментов автоматизации, если честно.)

Важно: браузер с удаленной отладкой — это потенциальная дыра в безопасности. Не оставляйте его включенным на ночь и не открывайте доступ с других машин.

3Подключаем к MCP-клиенту

Запускаем Comet как MCP-сервер, подключаем его к вашему MCP-клиенту — тому же LM Studio, Continue.dev или любому другому, который поддерживает протокол. Если вы раньше работали с mcp-context-proxy, процесс будет знаком.

Чем Comet не похож на конкурентов?

ИнструментПлюсыМинусы
Comet MCPРаботает с любой локальной LLM, open source, только браузерТребует ручной настройки браузера
TabBrainРасширение браузера, простая установкаЗависит от облачных API, закрытый код
Playwright/SeleniumМощные, проверенные инструментыТребуют программирования, нет интеграции с LLM из коробки

Ключевое отличие: Comet — не автономный инструмент, а "мостик". Он не принимает решения сам, а лишь исполняет команды от вашей LLM. Это одновременно и сила, и слабость.

Практика: три реальных сценария

Сценарий 1: Мониторинг цен на авиабилеты

Вместо того чтобы каждый день заходить на сайты авиакомпаний, вы говорите модели: "Найди самые дешевые билеты из Москвы в Бангкок на следующие выходные". Comet открывает страницы, заполняет формы, собирает результаты. Ваша задача — только задать вопрос.

💡
Совет: используйте модели с хорошим контекстным окном. Некоторые сайты авиакомпаний генерируют много HTML, и маленькая модель может "потеряться" в данных.

Сценарий 2: Автоматизация рутинных задач на работе

Ежедневный отчет в корпоративной системе. Вместо 15 минут ручного заполнения — одна инструкция. Comet логинится, переходит в нужный раздел, заполняет поля, отправляет форму. Если система использует сложный JavaScript (React, Vue), Comet справляется лучше, чем простые парсеры.

Сценарий 3: Исследовательский скрапинг

Нужно собрать данные с десятка научных сайтов для анализа. Pagesource дает структуру, но Comet может пройти по цепочке ссылок, извлечь именно то, что нужно, и даже обработать динамический контент. Идеально для построения мультимодального краулера.

Где Comet спотыкается

Не все так гладко. Вот что бесит в текущей реализации:

  • CAPTCHA и сложная аутентификация — если сайт требует двухфакторку или сложную капчу, Comet не поможет. Это ограничение всех автоматизированных инструментов.
  • Нестабильность селекторов — если сайт меняет структуру, ваши инструкции могут сломаться. Нужно постоянно обновлять промпты.
  • Зависимость от качества LLM — если модель плохо понимает, что значит "нажми на третью кнопку справа", Comet сделает не то, что нужно.
  • Отсутствие встроенной обработки ошибок — если что-то пошло не так, вы узнаете об этом только по отсутствию результата.

Кому подойдет Comet MCP?

Исследователям и аналитикам, которым нужно регулярно собирать данные из открытых источников. Особенно если эти источники — современные веб-приложения с кучей JavaScript.

Разработчикам, которые хотят автоматизировать тестирование своих веб-приложений, но не хотят писать тонны кода на Playwright. Дайте инструкцию модели — и она все сделает.

Энтузиастам локальных LLM, которые устали от ограничений "просто чатов". Хотите, чтобы ваша модель действительно что-то делала в реальном мире? Вот инструмент.

Не подойдет тем, кто ищет готовое решение "из коробки". Comet требует технических навыков, понимания MCP и готовности разбираться с ошибками.

Что дальше?

Perplexity развивает проект активно. В планах — поддержка Firefox, более умная работа с динамическим контентом, интеграция с другими инструментами автоматизации. Если вы знакомы с обучением маленьких моделей управлению браузером, можете даже помочь с дообучением Comet под свои задачи.

Главное — не ждите от Comet чудес. Это инструмент, который расширяет возможности ваших локальных моделей, но не заменяет ни программирование, ни человеческое мышление. Зато он дает то, чего так не хватает в мире локальных LLM: связь с реальным миром через самый популярный интерфейс — браузер.

Попробуйте. Даже если просто ради эксперимента. Откройте браузер голосом своей локальной модели — это чувство стоит того.