
bouncy
producthunt.com
小巧的Rust无头浏览器,专为爬虫而生
1个月前制作者:Maziar Zamani
关于 bouncy
bouncy 是一款基于 Rust 构建的微型无头浏览器,专为网页抓取场景设计。它体积小巧、运行快速,以单个二进制文件分发,无需安装 Node.js、Chrome 或 Python 等复杂依赖。只需在命令行中指定一个 URL,bouncy 就能立即返回页面的 HTML 源码、可见文本或所有链接。对于依赖 JavaScript 渲染的页面,bouncy 也能自动执行 JS 脚本,确保获取到完整的动态内容。你可以像使用 curl 一样从命令行调用它,也可以将其作为 Playwright 的后端集成到自动化流程中。
核心功能
- 命令行抓取:通过简单的命令即可获取网页 HTML、纯文本或链接列表,支持管道和重定向。
- JavaScript 渲染:自动执行页面中的 JavaScript,完美处理 SPA 等动态网站。
- Playwright 后端:可作为 Playwright 的无头浏览器后端,提供轻量级替代方案。
主要特性
- 极速启动:Rust 编译的单一二进制文件,毫秒级启动,无额外运行时开销。
- 零依赖:无需安装浏览器、Node 或 Python,下载即用,环境配置零负担。
- 资源高效:内存占用极低,适合在服务器或资源受限环境中大规模运行。
- 简洁 API:命令行接口直观,输出格式清晰,易于集成到脚本或工作流中。
- 跨平台支持:提供 Linux、macOS 和 Windows 的预编译二进制,开箱即用。
适用场景
- 数据采集:快速抓取静态或动态网页内容,用于数据分析、监控或归档。
- 自动化测试:作为轻量级浏览器引擎,辅助进行端到端测试或页面验证。
- CI/CD 集成:在持续集成流水线中执行网页抓取任务,无需安装重型浏览器。
- 原型开发:快速验证网页结构或提取特定信息,加速开发迭代。