SheepNav
新上线今天0 投票

我试了ChatGPT Images 2.0:有趣、巨大的飞跃——而且对实际工作出奇地有用

OpenAI 于本周推出了 ChatGPT Images 2.0,这是其图像生成引擎的重大升级。ZDNET 资深编辑 David Gewirtz 在正式发布后进行了深度测试,发现该工具在品牌风格匹配、文字渲染和信息图制作方面取得了显著进步,但偶尔仍会出现错误,需要人工审核。

品牌风格匹配:从失误到精准

在早期测试中,Images 2.0 在处理 ZDNET 标志时频繁出错。但正式版发布后,情况大为改观。通过单独上传标志图片并配合提示词,模型能够准确复制 ZDNET 的品牌配色和标志细节。例如,输入“使用 ZDNET 品牌风格和附带的 ZDNET 标志创建本文的详细信息图”,生成的图像不仅标志正确,色彩也完美契合,甚至小字部分都准确无误。

文字渲染:从“装饰”到实用

OpenAI 将 Images 2.0 的核心改进描述为从“装饰性”图像跃升至包含详细文字的完整页面图形。测试表明,模型在信息图中能正确处理大量文字,包括标题、副标题和说明文字,且排版清晰。这使其在制作演示文稿、报告封面和社交媒体素材时具备了实际生产力价值。

仍需谨慎:错误并未完全消失

尽管进步巨大,Images 2.0 仍非完美。在部分复杂场景中,模型会生成拼写错误的单词或扭曲的图形。David 指出,这要求用户在使用生成内容进行正式发布前,必须进行人工校对。尤其是涉及数字、专有名词和精确数据时,错误率会上升。

行业背景与可用性

Images 2.0 面向所有 ChatGPT 用户开放,但高级语言功能(如“思考”模式)仅对付费用户可用。测试使用的是 ChatGPT Plus 账户并开启“思考”模式。值得注意的是,由于 Ziff Davis(ZDNET 母公司)对 OpenAI 提起了版权诉讼,ZDNET 页面未被允许用于训练,因此测试中采用了截屏方式让模型读取内容。

总体而言,Images 2.0 代表了 AI 图像生成从“玩具”向“工具”的重要转变。对于需要快速生成品牌一致、文字准确的视觉内容的工作者,它提供了强大的辅助能力,但人类监督仍是保证质量的关键环节。

延伸阅读

  1. 韩国男子用AI生成逃跑狼假照片,面临5年监禁
  2. 苹果下任CEO的使命:推出一款杀手级AI产品
  3. 微软 Surface Pro 在百思买打六折,我们强烈推荐
查看原文