
DeciBench
unfork.in
语音AI代理的本地优先测试框架
13天前制作者:unfork
关于 DeciBench
DeciBench 是一款专为语音 AI 代理打造的本地优先、开源测试框架,旨在帮助开发者高效评估和优化语音交互系统的性能。它通过模拟真实通话场景,自动向您的代理发送音频流(支持 WebSocket、Twilio、ElevenLabs 等协议),并转录响应内容,最终从 10 个关键指标(如延迟、幻觉、中断等)进行评分。
核心功能
DeciBench 的核心在于其端到端测试能力:它能够模拟呼叫者与您的语音代理进行完整对话,并自动收集性能数据。您无需修改现有代码,即可快速集成并运行测试。
主要特性
- 本地优先:完全离线运行,支持 Ollama 和本地 Whisper 模型,确保数据隐私。
- 全面评分:覆盖延迟、幻觉、中断等 10 项指标,提供量化评估。
- 隐私保护:内置 PII 脱敏引擎,100% 私有化部署,零遥测。
- 开源免费:基于 Apache 2.0 协议,无 SDK 依赖,即插即用。
- 多协议支持:兼容 WebSocket、Twilio、ElevenLabs 等主流音频传输方式。
适用场景
DeciBench 适用于语音 AI 代理的开发测试、性能调优和回归验证。无论是构建客服机器人、语音助手还是实时翻译系统,它都能帮助您快速定位问题、提升用户体验。尤其适合对数据隐私要求严格的企业或团队。