
谷歌推出最快最便宜的图像模型 Nano Banana 2 Lite:4秒出图,成本减半
谷歌 DeepMind 近日发布了一款名为 Nano Banana 2 Lite 的全新图像生成模型,号称是其最快、最便宜的图像模型。该模型是 Gemini 3.1 系列的一部分,正式名称为 Gemini 3.1 Flash Lite Image,旨在以极低的成本实现快速图像生成,特别适合快速原型设计和创意探索场景。
速度与成本的革命性提升
Nano Banana 2 Lite 最大的亮点在于速度。在默认的低思考模式下,从文本到图像仅需约 4 秒,而标准版 Nano Banana 则需要约 20 秒。这种速度的提升直接转化为成本优势:API 调用费用平均为 每千张图像 0.034 美元,输入 token 价格为每百万 0.25 美元,输出 token 为每百万 1.50 美元。相比之下,Nano Banana 2 的输出价格是其两倍,而旗舰版 Nano Banana Pro 的输出价格高达每百万 12 美元,是 Lite 版的八倍。
质量与场景的取舍
当然,速度与低价的背后是质量的妥协。谷歌坦言,Nano Banana 2 Lite 在处理小文字和信息图表时表现不佳,容易出现错误数据或不一致。人物和角色的一致性在多次迭代中也较差。但谷歌提供的 Arena.ai Elo 评分显示,用户对 Lite 版本输出质量的评价几乎与标准版持平,尽管这些基准测试可能忽略细节瑕疵。
适用场景与潜在影响
谷歌建议,对于需要高精度文本或逼真照片效果的任务,仍应使用 Flash 或 Pro 版本。但 Nano Banana 2 Lite 的快速迭代能力使其成为设计师和开发者探索创意、快速验证想法的理想工具。这种“快速射击”式生成也可能带来更多低质量 AI 内容(即“AI 垃圾”)的泛滥,这并非谷歌一家公司面临的问题。
行业背景
在 AI 图像生成市场,平衡质量、速度和成本一直是核心挑战。谷歌此举直接瞄准了那些对成本敏感、需要大量试错的应用场景,如早期概念设计、广告创意素材生成等。与此同时,开源模型和竞品(如 Midjourney、Stable Diffusion)也在持续优化效率,谷歌通过 Gemini 生态的整合与定价策略,试图在开发者市场中抢占份额。
总体而言,Nano Banana 2 Lite 并非为追求极致画质的用户设计,而是为那些需要“足够好”且“足够快”的实用主义者提供了一个极具性价比的选择。