
苹果正将庞大 Gemini 模型塞进 iPhone,为全新 Siri 注入 AI 灵魂
苹果正与 Google 合作,计划将 Gemini 模型集成到 iPhone 中,以大幅提升 Siri 的智能水平。然而,由于本地运行 AI 面临参数规模、内存和精度等硬性限制,苹果可能不得不依赖云端计算,这与它一贯强调的本地隐私优先策略形成矛盾。
本地 AI 的物理瓶颈
尽管苹果在每一代芯片中都强调 Neural Engine 的 AI 优化,但智能手机的物理限制依然难以突破。现代 AI 模型动辄拥有数十亿甚至万亿参数,而手机 NPU 设计更侧重低功耗、上下文感知的轻量处理,无法承载大模型的完整推理。即使是专用 GPU,其算力和内存带宽也不足以实时运行万亿参数级模型。
以 Google 的 Gemini 为例,其云端版本参数规模达到万亿级别,而手机本地运行的 Gemini Nano 仅数亿参数,且经过量化(quantization)压缩,虽然提升了速度,但牺牲了生成精度。这意味着本地 AI 在复杂对话、多轮推理等场景下,智能程度远不及云端版本。
从本地到云端的策略转变
The Information 报道指出,苹果正为 Gemini 驱动的 Siri 规划“本地+云端”混合架构。这一策略实际上偏离了苹果此前力推的“端侧 AI 隐私优先”路线。即便苹果宣称 Neural Engine 升级带来了更强的本地 AI 能力,但面对 Siri 作为“对话式助手”的定位——需要理解上下文、生成自然回复、执行复杂指令——纯粹的端侧模型显然力不从心。
事实上,多数手机的 GPU 在处理 AI token 时反而比 NPU 更高效,但 RAM 容量依然是瓶颈。即便是当前最大的本地 AI 模型,在对话能力上也仅算“中等水平”。因此,苹果被迫引入云端组件,借助 Google 和 Nvidia 的算力,为 Siri 提供更强大的推理能力。
对用户意味着什么?
对于注重隐私的苹果用户而言,这一转变可能令人失望。苹果曾多次强调本地 AI 能避免数据上传云端,保护用户隐私。如今 Siri 的 Gemini 升级若依赖云端,用户数据将不可避免地经过 Google 服务器,隐私风险随之增加。不过,苹果可能会采用联邦学习或差分隐私等技术来缓解担忧。
另一方面,云端加持后的 Siri 有望实现更自然的对话、更精准的意图识别,甚至支持多模态交互。这与苹果在 WWDC 上展示的 AI 愿景一致——让 Siri 成为真正的智能助手,而不仅仅是语音命令执行器。
行业影响
苹果与 Google 的合作,标志着移动端 AI 竞赛进入新阶段。此前,三星已与 Google 合作在 Galaxy 设备上部署 Gemini 模型。苹果的加入将进一步巩固 Google 在移动 AI 生态系统中的地位,同时给其他芯片厂商(如高通、联发科)带来压力,推动它们加速研发更强大的端侧 AI 硬件。
但长期来看,纯端侧 AI 与云端 AI 的界限可能逐渐模糊。未来手机或许会采用“端侧处理敏感数据 + 云端处理复杂任务”的混合模式,这既是技术妥协,也是现实选择。