🧑💻 Карта рынка browser-агентов
В последние месяцы на рынке появилось множество browser-агентов, которые используют компьютер так же, как это делает человек. Это уже не только автоматизация заполнения форм, но и выполнение сложных задач для личных и корпоративных ассистентов.
Основные игроки, такие как OpenAI (Operator), AnthropicAI (Claude Computer Use) и GoogleDeepMind (Project Mariner), активно развивают свои направления. Open source-фреймворки вроде browser_use и Stagehanddev набирают популярность на Github, собирая десятки тысяч звезд.
Сейчас наибольший прогресс у вертикальных решений: специальные агенты для маркетинга, продаж, QA и HR (например, Astral, Spur, Unify, SonicJobs). Они работают надежнее благодаря фокусировке на узких сценариях, в отличие от универсальных моделей, которые часто оказываются "джек-оф-олл-трейдс, но мастер ни в чем".
Несмотря на быстрый прогресс, агенты пока далеки от автоматизации по-настоящему ценных задач. Например, ни один не набрал больше 9.2% на бенчмарке CUB (реальные рабочие процессы). Ограничения: слабая память, нестабильное выполнение длинных цепочек действий и проблемы с координацией между разными приложениями. Скорость и точность остаются компромиссом, что особенно важно для сложных корпоративных сценариев.
Источник: https://www.thetasoftware.ai/blog/the-browser-agent-landscape
