OpenAI发布首款定制AI推理芯片“Jalapeño”,与博通联合打造
核心要点
OpenAI于本周三正式发布其首款自研推理处理器,代号“Jalapeño”。该芯片由OpenAI与博通(Broadcom)联合设计制造,专为OpenAI推理系统量身定制。OpenAI表示,其自有的AI模型参与了芯片开发过程。目前芯片仍处于测试阶段,但早期结果显示,其每瓦性能显著优于当前最先进的替代方案。
战略背景:降低对英伟达依赖
OpenAI的芯片计划此前已传闻多时,核心动因在于减少对英伟达GPU的依赖。谷歌和亚马逊早已通过自研AI加速器实现了类似目标——即专门为加速机器学习工作负载而设计的硅芯片。2024年10月,OpenAI与博通的合作正式官宣,此次发布的Jalapeño正是该合作的成果。
OpenAI总裁格雷格·布罗克曼(Greg Brockman)在合作宣布后的内部播客中解释了公司的芯片开发思路:“我们对工作负载有深刻理解……我们一直在寻找那些未被充分服务的工作负载,思考如何构建能加速可能性的东西。”
技术特性:聚焦推理效率
Jalapeño专为推理(inference)设计,即运行预训练AI模型以响应用户指令的过程。在公告中,OpenAI特别强调了该芯片在运行实时编程模型时的低运营成本。可以预见,预训练等计算密集型任务可能仍将依赖英伟达硬件,但即便只是推理成本的微降,也能显著改善公司利润。
优化推理系统正成为AI经济学的关键变量,且这种优化将发生在技术栈的每一层。OpenAI已在构建Codex等智能体产品、支撑这些产品的模型,以及运行模型的算力中心。进军定制芯片,使得OpenAI能将优化推进到更底层。
全栈整合:从模型到芯片
OpenAI在公告中强调:“OpenAI不仅开发前沿模型或在之上构建产品;它正在设计底层的整套基础设施:芯片架构、内核、内存系统、网络、调度、部署系统以及产品体验。”由于OpenAI横跨整个技术栈,每一层都可以围绕“让模型更快、更可靠、更实惠”这一统一目标进行优化。
Jalapeño的发布标志着OpenAI从AI模型提供商向全栈AI基础设施公司的转型迈出关键一步。在推理成本日益成为AI规模化瓶颈的当下,自研芯片有望为OpenAI带来显著的竞争优势。

