新上线昨天0 投票
OpenAI 发布 API 新语音智能功能,支持实时对话、翻译与转录
OpenAI 于周四宣布,其 API 将新增多项语音智能功能,旨在帮助开发者构建能够与用户进行对话、转录和翻译的应用程序。新推出的 GPT-Realtime-2 模型基于 GPT-5 级推理能力,可处理更复杂的用户请求,提供逼真的语音交互体验。同时发布的 GPT-Realtime-Translate 支持超过 70 种输入语言和 13 种输出语言的实时翻译,而 GPT-Realtime-Whisper 则提供实时语音转文本能力。这些功能主要面向客户服务系统,但也适用于教育、媒体、活动及创作者平台等多个领域。OpenAI 表示已内置安全防护机制,防止滥用。

