谷歌在Gboard中加入Gemini驱动的语音听写功能,或对听写初创公司构成威胁
谷歌在周二上午的Android Show: I/O Edition 2026活动中宣布,为其广泛使用的Android键盘应用Gboard推出名为Rambler的全新AI语音听写功能。此举使谷歌直接与Wispr Flow、Typeless等近年来在桌面和移动端积累了大量用户的AI听写应用展开竞争——其中多数尚未在Android上建立稳固地位。
与其它听写应用类似,Rambler可以去除“嗯”、“啊”等填充词,还能理解诸如“我周三下午3点,嗯,2点,在常去的咖啡店见你”这样的句中修正。谷歌表示,该功能基于Gemini多语言模型,支持代码切换——用户可在句中切换语言(例如从英语切换到印地语),Rambler会保持上下文连贯。这一能力反映了多语言使用者的实际交流方式,而大多数西方听写应用对此支持缓慢。
谷歌强调,Gboard会清晰标示Rambler功能正在使用,且不会存储任何语音录音,仅用于实时转写。在隐私方面,Android核心体验总监Ben Greenwood表示,谷歌结合了设备端和云端处理,并多年持续投入以确保功能安全私密——这显然是针对用户权衡Rambler与第三方听写应用数据处理的信号。
过去几年,Wispr Flow、Willow、SuperWhisper、Monoglogue、Handy和Typeless等听写应用纷纷涌现,但多数活动集中在桌面和iOS平台,Android相对未被充分开发。谷歌上月在iOS上发布了由设备端Gemma AI模型驱动的离线优先听写应用AI Edge Eloquent,而Rambler是其缩小这一差距的最明确举措。
这些新功能初期将在夏季限Samsung Galaxy和Google Pixel手机上推出,随后逐步覆盖其他Android设备。其核心优势在于分发:Gboard是全球绝大多数Android用户的默认键盘,这意味着Rambler将预装于数亿台设备上,无需用户额外下载。
对于听写初创公司而言,这无疑是个严峻挑战。尽管它们在桌面和iOS上积累了一定用户基础,但谷歌的规模效应和系统级集成能力难以匹敌。不过,部分初创公司可能通过专注专业领域(如医疗、法律)或提供差异化功能(如更强的离线能力、自定义词汇)来寻找生存空间。
总体而言,Rambler的发布标志着AI语音交互在移动端的进一步普及,也预示着听写市场即将迎来新一轮洗牌。
