ChatGPT Images 2.0 深度评测：文字准确、品牌匹配，但仍需人工审核

OpenAI 于本周推出了 ChatGPT Images 2.0，这是其图像生成引擎的重大升级。ZDNET 资深编辑 David Gewirtz 在正式发布后进行了深度测试，发现该工具在品牌风格匹配、文字渲染和信息图制作方面取得了显著进步，但偶尔仍会出现错误，需要人工审核。

品牌风格匹配：从失误到精准

在早期测试中，Images 2.0 在处理 ZDNET 标志时频繁出错。但正式版发布后，情况大为改观。通过单独上传标志图片并配合提示词，模型能够准确复制 ZDNET 的品牌配色和标志细节。例如，输入“使用 ZDNET 品牌风格和附带的 ZDNET 标志创建本文的详细信息图”，生成的图像不仅标志正确，色彩也完美契合，甚至小字部分都准确无误。

文字渲染：从“装饰”到实用

OpenAI 将 Images 2.0 的核心改进描述为从“装饰性”图像跃升至包含详细文字的完整页面图形。测试表明，模型在信息图中能正确处理大量文字，包括标题、副标题和说明文字，且排版清晰。这使其在制作演示文稿、报告封面和社交媒体素材时具备了实际生产力价值。

仍需谨慎：错误并未完全消失

尽管进步巨大，Images 2.0 仍非完美。在部分复杂场景中，模型会生成拼写错误的单词或扭曲的图形。David 指出，这要求用户在使用生成内容进行正式发布前，必须进行人工校对。尤其是涉及数字、专有名词和精确数据时，错误率会上升。

行业背景与可用性

Images 2.0 面向所有 ChatGPT 用户开放，但高级语言功能（如“思考”模式）仅对付费用户可用。测试使用的是 ChatGPT Plus 账户并开启“思考”模式。值得注意的是，由于 Ziff Davis（ZDNET 母公司）对 OpenAI 提起了版权诉讼，ZDNET 页面未被允许用于训练，因此测试中采用了截屏方式让模型读取内容。

总体而言，Images 2.0 代表了 AI 图像生成从“玩具”向“工具”的重要转变。对于需要快速生成品牌一致、文字准确的视觉内容的工作者，它提供了强大的辅助能力，但人类监督仍是保证质量的关键环节。

我试了ChatGPT Images 2.0：有趣、巨大的飞跃——而且对实际工作出奇地有用

品牌风格匹配：从失误到精准

文字渲染：从“装饰”到实用

仍需谨慎：错误并未完全消失

行业背景与可用性

延伸阅读

相关资讯