SheepNav
bouncy

bouncy

producthunt.com

小巧的Rust无头浏览器,专为爬虫而生

1个月前制作者:Maziar Zamani

关于 bouncy

bouncy 是一款基于 Rust 构建的微型无头浏览器,专为网页抓取场景设计。它体积小巧、运行快速,以单个二进制文件分发,无需安装 Node.js、Chrome 或 Python 等复杂依赖。只需在命令行中指定一个 URL,bouncy 就能立即返回页面的 HTML 源码、可见文本或所有链接。对于依赖 JavaScript 渲染的页面,bouncy 也能自动执行 JS 脚本,确保获取到完整的动态内容。你可以像使用 curl 一样从命令行调用它,也可以将其作为 Playwright 的后端集成到自动化流程中。

核心功能

  • 命令行抓取:通过简单的命令即可获取网页 HTML、纯文本或链接列表,支持管道和重定向。
  • JavaScript 渲染:自动执行页面中的 JavaScript,完美处理 SPA 等动态网站。
  • Playwright 后端:可作为 Playwright 的无头浏览器后端,提供轻量级替代方案。

主要特性

  • 极速启动:Rust 编译的单一二进制文件,毫秒级启动,无额外运行时开销。
  • 零依赖:无需安装浏览器、Node 或 Python,下载即用,环境配置零负担。
  • 资源高效:内存占用极低,适合在服务器或资源受限环境中大规模运行。
  • 简洁 API:命令行接口直观,输出格式清晰,易于集成到脚本或工作流中。
  • 跨平台支持:提供 Linux、macOS 和 Windows 的预编译二进制,开箱即用。

适用场景

  • 数据采集:快速抓取静态或动态网页内容,用于数据分析、监控或归档。
  • 自动化测试:作为轻量级浏览器引擎,辅助进行端到端测试或页面验证。
  • CI/CD 集成:在持续集成流水线中执行网页抓取任务,无需安装重型浏览器。
  • 原型开发:快速验证网页结构或提取特定信息,加速开发迭代。

相关工具