OpenAI 发布 GPT-5.4:专为专业工作设计的顶尖高效前沿模型
OpenAI 发布 GPT-5.4:专业工作场景的 AI 新标杆
2026 年 3 月 5 日,OpenAI 正式发布了 GPT‑5.4,这是该公司专为专业工作场景设计的“最强大、最高效的前沿模型”。该模型已在 ChatGPT(作为 GPT‑5.4 Thinking)、API 和 Codex 中上线。同时,针对需要极致性能处理复杂任务的用户,OpenAI 还推出了 GPT‑5.4 Pro 版本,在 ChatGPT 和 API 中提供。
核心能力升级:整合推理、编码与智能体工作流
GPT‑5.4 并非简单的迭代,而是将 OpenAI 近期在推理、编码和智能体工作流方面的多项突破性进展整合到了一个统一的模型中。它继承了 GPT‑5.3‑Codex 行业领先的编码能力,并显著改进了模型在跨工具、软件环境以及涉及电子表格、演示文稿和文档的专业任务中的表现。其目标是让模型能够准确、有效且高效地完成复杂的实际工作,减少来回沟通,直接交付用户所需的结果。
ChatGPT 体验革新:透明化思考与深度研究
在 ChatGPT 中,GPT‑5.4 Thinking 功能带来了全新的交互体验。它现在能够预先展示其思考计划,使用户能够在模型执行过程中实时调整方向,从而在无需多次来回对话的情况下,获得更贴合需求的最终输出。
此外,该模型在深度网络研究方面也有所提升,尤其擅长处理高度具体的查询,并能更好地维持需要长时间思考的问题的上下文连贯性。这些改进共同带来了更高质量、更快速且更贴合任务的答案。
API 与 Codex 的突破:原生计算机使用与超长上下文
在 Codex 和 API 层面,GPT‑5.4 标志着一次重大飞跃。它是 OpenAI 发布的首个具备原生、顶尖计算机使用能力的通用模型。这意味着基于此模型的智能体(Agents)能够直接操作计算机,并在不同应用程序间执行复杂的工作流程。
支持高达 100 万令牌(1M tokens)的上下文长度是另一项关键特性,使得智能体能够规划、执行和验证跨越长时间跨度的任务。
工具生态与效率优化
GPT‑5.4 还通过 工具搜索(tool search) 功能,改进了模型在庞大的工具和连接器生态系统中的工作方式,帮助智能体更高效地发现和使用合适的工具,而无需牺牲智能水平。
在效率方面,GPT‑5.4 被宣称为 OpenAI 迄今为止令牌效率最高的推理模型。与 GPT‑5.2 相比,它使用显著更少的令牌来解决问题,这直接转化为更低的令牌使用成本和更快的响应速度。
性能基准数据
根据 OpenAI 公布的数据,GPT‑5.4 在多项基准测试中表现优异:
- GDPval(胜率或平局率):83.0%(对比 GPT‑5.3-Codex 的 70.9% 和 GPT‑5.2 的 70.9%)
- SWE-Bench Pro(公开版):57.7%(对比 GPT‑5.3-Codex 的 56.8% 和 GPT‑5.2 的 55.6%)
- OSWorld-Verified:75.0%(对比 GPT‑5.3-Codex 的 74.0%* 和 GPT‑5.2 的 47.3%)
总结:迈向更可靠的 AI 工作伙伴
综合来看,GPT‑5.4 的发布,结合其在通用推理、编码和专业知识工作方面的进步,旨在实现三大目标:构建更可靠的智能体、加速开发者工作流程,以及在 ChatGPT、API 和 Codex 中产出更高质量的输出。这标志着 AI 模型正从通用对话工具,向能够深度嵌入并赋能专业工作流的智能伙伴坚实迈进。


