OpenAI发布首款定制AI推理芯片Jalapeño，与博通联合打造

核心要点

OpenAI于本周三正式发布其首款自研推理处理器，代号“Jalapeño”。该芯片由OpenAI与博通（Broadcom）联合设计制造，专为OpenAI推理系统量身定制。OpenAI表示，其自有的AI模型参与了芯片开发过程。目前芯片仍处于测试阶段，但早期结果显示，其每瓦性能显著优于当前最先进的替代方案。

战略背景：降低对英伟达依赖

OpenAI的芯片计划此前已传闻多时，核心动因在于减少对英伟达GPU的依赖。谷歌和亚马逊早已通过自研AI加速器实现了类似目标——即专门为加速机器学习工作负载而设计的硅芯片。2024年10月，OpenAI与博通的合作正式官宣，此次发布的Jalapeño正是该合作的成果。

OpenAI总裁格雷格·布罗克曼（Greg Brockman）在合作宣布后的内部播客中解释了公司的芯片开发思路：“我们对工作负载有深刻理解……我们一直在寻找那些未被充分服务的工作负载，思考如何构建能加速可能性的东西。”

技术特性：聚焦推理效率

Jalapeño专为推理（inference）设计，即运行预训练AI模型以响应用户指令的过程。在公告中，OpenAI特别强调了该芯片在运行实时编程模型时的低运营成本。可以预见，预训练等计算密集型任务可能仍将依赖英伟达硬件，但即便只是推理成本的微降，也能显著改善公司利润。

优化推理系统正成为AI经济学的关键变量，且这种优化将发生在技术栈的每一层。OpenAI已在构建Codex等智能体产品、支撑这些产品的模型，以及运行模型的算力中心。进军定制芯片，使得OpenAI能将优化推进到更底层。

全栈整合：从模型到芯片

OpenAI在公告中强调：“OpenAI不仅开发前沿模型或在之上构建产品；它正在设计底层的整套基础设施：芯片架构、内核、内存系统、网络、调度、部署系统以及产品体验。”由于OpenAI横跨整个技术栈，每一层都可以围绕“让模型更快、更可靠、更实惠”这一统一目标进行优化。

Jalapeño的发布标志着OpenAI从AI模型提供商向全栈AI基础设施公司的转型迈出关键一步。在推理成本日益成为AI规模化瓶颈的当下，自研芯片有望为OpenAI带来显著的竞争优势。

OpenAI发布首款定制AI推理芯片“Jalapeño”，与博通联合打造

核心要点

战略背景：降低对英伟达依赖

技术特性：聚焦推理效率

全栈整合：从模型到芯片

延伸阅读

相关资讯