Зачем платить Perplexity, если можно запустить своего агента?
Счет за Perplexity Computer в конце месяца напоминает ипотечный платеж. Каждый поисковый запрос, каждое исследование — это доллары, которые улетают в черную дыру облачных API. А еще эти лимиты, политики использования и полное отсутствие прозрачности в том, что именно делает агент в браузере.
Agent Browser Workspace — это плевок в лицо этой системе. Открытый инструмент, который ставит на ваш компьютер ту же самую мощь браузерной автоматизации, но без единого цента в карман Anthropic или OpenAI. Здесь все ваше: данные, логи, конфигурация.
На момент 04.03.2026 проект активно развивается, последний стабильный релиз — v0.3.2. Он использует Playwright 1.48.0 и поддерживает все современные браузерные движки.
Что под капотом у этого локального зверя?
Architecture прост до безобразия. В центре — управляемый кодом браузер на базе Playwright Chrome. Он исполняет команды локального LLM, например, Claude 3.5 Haiku (последняя версия на 2026 год) или любой другой модели, которую вы запустите через Ollama или LM Studio.
Фишка в JSON-профилях сайтов. Вместо того чтобы тупо парсить весь HTML, агент получает карту страницы: где заголовок, где основной текст, где навигация. Это как дать слепому подробную схему помещения. Точность извлечения данных взлетает до 95%.
- Полный контроль сессий: cookies, localStorage, сессионные данные сохраняются между запусками.
- Поддержка капч и JavaScript-тяжелых сайтов через встроенные обходные механизмы.
- Модуль извлечения данных понимает не только текст, но и таблицы, списки, вложенные структуры.
Perplexity vs Agent Browser Workspace: где реальная экономия?
| Критерий | Perplexity Computer | Agent Browser Workspace |
|---|---|---|
| Стоимость за 1000 запросов | ~$15-25 (зависит от модели) | $0 (локальная модель) |
| Задержка (latency) | 1200-3500 мс | 700-1500 мс (на локальной сети) |
| Контроль над данными | Нулевой. Все у них. | Полный. Даже логи можете шифровать. |
| Кастомизация | Только через API, ограниченно. | Меняйте что угодно: от парсера до логики навигации. |
Про сжатие латентности поиска для агентов мы уже писали — здесь тот же принцип, но примененный к рендерингу страниц.
Ставим за 5 минут. Серьезно.
1Клонируем и готовим окружение
git clone https://github.com/agent-browser/workspace.git
cd workspace
python -m venv venv
source venv/bin/activate # На Windows: venv\Scripts\activate
pip install -r requirements.txt
playwright install chromiumНа 04.03.2026 проект требует Python 3.10+. Если у вас стоит старье вроде 3.7, система просто откажется работать. Обновите, это не 2019 год.
2Настраиваем модель и профили
В файле config.yaml указываем, какую LLM использовать. Для скорости берем Claude 3.5 Haiku через Ollama (она идеально заточена под инструменты).
llm_provider: "ollama"
llm_model: "claude3.5-haiku:latest"
browser_headless: false # Первый запуск — с видимым браузером
site_profiles_dir: "./profiles"Профили сайтов — это JSON-файлы в папке profiles/. Вот пример для Hacker News:
{
"site": "news.ycombinator.com",
"selectors": {
"title": ".titleline > a",
"score": ".score",
"author": ".hnuser",
"main_content": ".athing"
},
"actions": ["scroll", "click_next_page"]
}3Первый запуск и проверка
python main.py --task "Найди три последние статьи про квантовые вычисления на arXiv"Если видите, как браузер открывается и начинает листать страницы — все работает. Первый запуск может занять минуту, дальше будет быстрее.
Не пугайтесь, если агент сначала поведет себя странно. Ему нужно «прогреться» и закэшировать сессию. Как и люди, ИИ-агенты тупят на холодном старте. Читайте про скиллы для агентов, чтобы исправить это.
Что можно делать с этим воркспейсом? Примеры из 2026 года
Сценарий 1: Академические исследования. Агент заходит на arXiv, Semantic Scholar, ищет статьи по вашей теме, вытаскивает аннотации, ссылки, данные о цитировании. Сохраняет в структурированный JSON. Все за один запуск.
Сценарий 2: Мониторинг цен и наличия. Настроили профиль для Amazon, eBay, Wildberries. Агент раз в час проверяет позиции, фиксирует изменения цен, отправляет алерт в Telegram. Никаких облачных сервисов за $200 в месяц.
Сценарий 3: Автоматизация рутинных задач в веб-интерфейсах. Знакомый пожаловался, что каждый день должен заходить в корпоративный портал и отмечать задачу? Напишите профиль для этого портала, и агент будет делать это за него. (Да, это серая зона, но технически возможно).
Для сложных агентов с кучей навыков посмотрите архитектуру сборки агентов из LEGO. Этот воркспейс отлично становится одним из таких блоков.
Кому заходить, а кому даже не смотреть?
Берите Agent Browser Workspace, если:
- Устали платить за каждый запрос к Perplexity или другим облачным агентам.
- Вам критична приватность данных (юристы, медики, журналисты).
- Хотите полный контроль над логикой браузерных действий и извлечения данных.
- Уже есть инфраструктура локальных LLM, как в этом гиде по мощным локальным агентам.
Даже не открывайте репозиторий, если:
- Вам нужна одна кнопка "сделать все". Тут придется копаться в конфигах.
- Нет времени разбираться с JSON-профилями. Хотя, честно, это самый интересный этап.
- Ваши задачи — разовые простые поиски. Тогда Perplexity, возможно, дешевле с учетом вашего времени.
Инструмент не панацея. Это скальпель, а не молоток. Если вам нужен супер-агент, который сам управляет другими ИИ, как Perplexity Computer, то здесь придется строить оркестрацию поверх. Но зато вашу, без роутинговых ошибок, о которых мы уже писали.
Прогноз на 2027 год? Такие локальные воркспейсы станут стандартом для корпоративных развертываний. Зачем арендовать облако, если можно поставить железо в своем дата-центре и запустить сотню таких агентов? Цена вопроса — электричество и железо. Контроль — абсолютный.
Совет напоследок: начните с одного профиля для любимого сайта. Посмотрите, как агент с ним взаимодействует. Отладьте логику. Потом масштабируйтесь. И не забудьте заглянуть в AgentCPM-Explore — возможно, вашему браузерному агенту понадобится компания в виде локального SOTA-агента для сложных рассуждений.