Browser Use:9.8 万 Star 的 AI 浏览器自动化库
2026-06-12 14:18:39
Browser Use 开源项目分析
仓库:github.com/browser-use/browser-use · License: MIT · ⭐ 98k+ · Cloud:cloud.browser-use.com
项目是什么
Browser Use 让网站对 AI Agent 可编程访问——用自然语言驱动 Chrome/Chromium 完成:
- 表单填写、求职申请
- 电商下单、比价
- 数据采集、多步导航
架构(v0.13 Beta):Python API → Rust 核心 → Browser Harness → 任务完成
核心能力
- Agent API:
from browser_use.beta import Agent,支持 GPT/Claude/Gemini 及自研bu-*优化模型 - CLI:
browser-use open/click/type/screenshot,浏览器会话持久化 - 自定义 Tools:扩展 Agent 能力
- Claude Code Skill:官方 SKILL.md 一键安装
- Benchmark:100 个真实浏览器任务开源评测(browser-use/benchmark)
开源 vs Cloud
| 模式 | 适合 |
|---|---|
| 开源自托管 | 深度定制、内网、配合自建代理 |
| Browser Use Cloud | 隐身指纹、Captcha、代理轮换、1000+ 集成、规模化并行 |
快速体验
pip install "browser-use[core]"
uvx browser-use init --template default
from browser_use.beta import Agent, ChatBrowserUse
agent = Agent(
task="Find stars of browser-use repo on GitHub",
llm=ChatBrowserUse(model='openai/gpt-5.5'),
)
await agent.run()
适用场景
- RPA 替代:无 API 的老系统自动操作
- Agent 工具链:与 LangChain/CrewAI 等组合
- 测试/QA:E2E 探索性测试
- 个人助理:订机票、填表等重复网页劳动
黑豹点评
Browser Use 是 Agent × RPA 交集处最活跃的开源项目之一。企业落地建议:内网用开源版 + 固定域名白名单;公网/Captcha 场景再评估 Cloud。与 Nanobot/Hermes 的 MCP 集成可组成「聊天触发 → 浏览器执行」完整链路。