Браузер, который понимает вас с полуслова
Представьте: вы говорите своей локальной нейросети "найди последние новости о запуске Starship" — и через минута у вас на экране открывается нужная страница, данные извлечены и структурированы. Без API-ключей, без платных подписок, без отправки ваших запросов куда-то в облако. Звучит как фантастика? Это Perplexity Comet MCP.
Comet MCP — это open-source инструмент от Perplexity, который превращает любую локальную LLM в полноценного браузерного ассистента через Model Context Protocol. Он работает там же, где и ваша модель — на вашем компьютере.
Что умеет этот "комета"?
Не путайте с браузером Perplexity. Comet — совсем другая история. Это сервер MCP, который подключается к вашему браузеру Chrome или Edge через DevTools Protocol и выполняет команды от локальной LLM.
- Открывает страницы по URL или поисковому запросу
- Кликает по элементам, заполняет формы
- Скроллит, делает скриншоты
- Извлекает текст, ссылки, таблицы
- Работает с JavaScript-приложениями
- Хранит историю сессий
Все это — через простые текстовые инструкции вашей любимой модели. Запустили Llama 3.2 в Ollama или GPT-OSS 20B в LM Studio — и вперед.
Установка: быстрее, чем настроить VPN
1Ставим Python и зависимости
Comet требует Python 3.9+. Клонируем репозиторий с GitHub, устанавливаем зависимости через pip. Никаких сложных системных пакетов — все стандартно.
2Запускаем браузер с удаленной отладкой
Здесь первый подводный камень. Chrome нужно запустить с флагом --remote-debugging-port=9222. Если забыть этот шаг — Comet будет молча смотреть на вас пустым взглядом. (Как и большинство инструментов автоматизации, если честно.)
Важно: браузер с удаленной отладкой — это потенциальная дыра в безопасности. Не оставляйте его включенным на ночь и не открывайте доступ с других машин.
3Подключаем к MCP-клиенту
Запускаем Comet как MCP-сервер, подключаем его к вашему MCP-клиенту — тому же LM Studio, Continue.dev или любому другому, который поддерживает протокол. Если вы раньше работали с mcp-context-proxy, процесс будет знаком.
Чем Comet не похож на конкурентов?
| Инструмент | Плюсы | Минусы |
|---|---|---|
| Comet MCP | Работает с любой локальной LLM, open source, только браузер | Требует ручной настройки браузера |
| TabBrain | Расширение браузера, простая установка | Зависит от облачных API, закрытый код |
| Playwright/Selenium | Мощные, проверенные инструменты | Требуют программирования, нет интеграции с LLM из коробки |
Ключевое отличие: Comet — не автономный инструмент, а "мостик". Он не принимает решения сам, а лишь исполняет команды от вашей LLM. Это одновременно и сила, и слабость.
Практика: три реальных сценария
Сценарий 1: Мониторинг цен на авиабилеты
Вместо того чтобы каждый день заходить на сайты авиакомпаний, вы говорите модели: "Найди самые дешевые билеты из Москвы в Бангкок на следующие выходные". Comet открывает страницы, заполняет формы, собирает результаты. Ваша задача — только задать вопрос.
Сценарий 2: Автоматизация рутинных задач на работе
Ежедневный отчет в корпоративной системе. Вместо 15 минут ручного заполнения — одна инструкция. Comet логинится, переходит в нужный раздел, заполняет поля, отправляет форму. Если система использует сложный JavaScript (React, Vue), Comet справляется лучше, чем простые парсеры.
Сценарий 3: Исследовательский скрапинг
Нужно собрать данные с десятка научных сайтов для анализа. Pagesource дает структуру, но Comet может пройти по цепочке ссылок, извлечь именно то, что нужно, и даже обработать динамический контент. Идеально для построения мультимодального краулера.
Где Comet спотыкается
Не все так гладко. Вот что бесит в текущей реализации:
- CAPTCHA и сложная аутентификация — если сайт требует двухфакторку или сложную капчу, Comet не поможет. Это ограничение всех автоматизированных инструментов.
- Нестабильность селекторов — если сайт меняет структуру, ваши инструкции могут сломаться. Нужно постоянно обновлять промпты.
- Зависимость от качества LLM — если модель плохо понимает, что значит "нажми на третью кнопку справа", Comet сделает не то, что нужно.
- Отсутствие встроенной обработки ошибок — если что-то пошло не так, вы узнаете об этом только по отсутствию результата.
Кому подойдет Comet MCP?
Исследователям и аналитикам, которым нужно регулярно собирать данные из открытых источников. Особенно если эти источники — современные веб-приложения с кучей JavaScript.
Разработчикам, которые хотят автоматизировать тестирование своих веб-приложений, но не хотят писать тонны кода на Playwright. Дайте инструкцию модели — и она все сделает.
Энтузиастам локальных LLM, которые устали от ограничений "просто чатов". Хотите, чтобы ваша модель действительно что-то делала в реальном мире? Вот инструмент.
Не подойдет тем, кто ищет готовое решение "из коробки". Comet требует технических навыков, понимания MCP и готовности разбираться с ошибками.
Что дальше?
Perplexity развивает проект активно. В планах — поддержка Firefox, более умная работа с динамическим контентом, интеграция с другими инструментами автоматизации. Если вы знакомы с обучением маленьких моделей управлению браузером, можете даже помочь с дообучением Comet под свои задачи.
Главное — не ждите от Comet чудес. Это инструмент, который расширяет возможности ваших локальных моделей, но не заменяет ни программирование, ни человеческое мышление. Зато он дает то, чего так не хватает в мире локальных LLM: связь с реальным миром через самый популярный интерфейс — браузер.
Попробуйте. Даже если просто ради эксперимента. Откройте браузер голосом своей локальной модели — это чувство стоит того.