用Amazon Nova 2 Sonic构建医疗预约语音助手
快速上手:用 Amazon Nova 2 Sonic 打造医疗预约语音助手
医疗行业长期受困于患者爽约问题——美国医疗机构的平均失约率在 5% 到 30% 之间,每个空缺席位都意味着收入损失、医生闲置以及患者治疗延误。传统的逐个电话确认方式难以规模化。现在,借助 Amazon Nova 2 Sonic 的语音到语音能力与 Amazon Bedrock AgentCore,你可以构建一个能够自主处理预约提醒对话的语音助手。
核心功能与工作流程
该语音助手能够完成以下关键任务:
- 患者身份验证:通过语音对话确认患者身份
- 预约管理:支持确认、取消或重新安排预约
- 健康信息收集:在通话中采集访前健康数据
- 人工转接:在需要时无缝转接给人类工作人员
整个系统采用 无服务器架构 部署,基于 Amazon Bedrock AgentCore,使用 Amazon Cognito 进行身份验证,Amazon DynamoDB 存储数据,Amazon SNS 发送通知。前端是一个基于 React 的浏览器界面,通过经过身份验证的 WebSocket 连接实现双向音频流传输。
技术亮点:告别传统级联延迟
传统方案通常需要串联三个独立服务:语音转文本模型(ASR)、文本大语言模型(LLM)、文本转语音模型(TTS)。每一次交接都会引入延迟并丢失上下文。尤其是 ASR 阶段会丢弃语调、犹豫、紧迫感等声音线索,LLM 只能看到患者说了什么,却不知道他们是怎么说的。在医疗场景中,患者的焦虑或困惑本应改变对话策略,但传统的级联架构无法捕捉这些信号。
Amazon Nova 2 Sonic 的 语音到语音能力 直接解决了这一问题:它不再依赖中间文本表示,而是直接在语音层面理解并生成回应,保留了语调和情感信息,同时大幅降低延迟。
实际落地:从测试到生产
当前示例包含一个浏览器测试界面,方便开发者快速验证对话流程。要连接真实电话线路进行外呼,可以集成 Amazon Connect 等电信服务。整个构建过程涵盖了从工具开发到部署的完整步骤,包括使用 Strands Agents SDK 构建的七个医疗专用工具,用于患者身份验证、排程和转接。
这一方案的核心价值在于:规模化处理常规通话,降低失约率,释放医护人员精力,同时通过保留语音中的非语言信息提升患者体验。
