SheepNav
OpenBrowser-AI

OpenBrowser-AI

producthunt.com

通过原始CDP连接AI代理与浏览器

今天制作者:Billy Enrizky

关于 OpenBrowser-AI

OpenBrowser-AI 是一款专为AI代理设计的浏览器控制工具,它通过原始Chrome DevTools Protocol(CDP)实现无缝连接,无需抽象层,让大语言模型能够直接、高效地操作浏览器。

核心功能

OpenBrowser-AI 的核心在于其直接使用原始CDP连接AI代理与浏览器,这意味着开发者可以绕过复杂的中间层,实现更精准、低延迟的浏览器控制。LLM通过Python在持久命名空间中编写代码,每次调用批量执行操作,页面状态信息被压缩至约450字符,极大提升了处理效率。

主要特性

  • 无抽象层设计:直接使用原始CDP,减少中间环节,确保操作精准高效。
  • 批量操作优化:LLM在持久命名空间中编写Python代码,支持批量执行,显著降低令牌使用和推理成本。
  • 高性能基准测试:在6项真实任务中,相比3个主流框架,实现100%准确率,令牌使用减少2.6倍,推理成本降低59%。
  • 开源与可复现:采用MIT许可证,方法论公开透明,支持社区验证和扩展。
  • 多平台支持:提供CLI和MCP服务器,兼容15个LLM提供商,并已发布两项关于浏览器控制的强化学习研究。

适用场景

OpenBrowser-AI 适用于自动化测试、数据抓取、网页交互模拟等场景,特别适合需要高精度浏览器控制的AI应用开发。其开源特性和可复现的方法论,使其成为研究和商业项目的理想选择。

相关工具