SheepNav
Gemini 3.5 Flash:快得让生成式AI终于“算得过账”了
新上线昨天0 投票

Gemini 3.5 Flash:快得让生成式AI终于“算得过账”了

谷歌在今年的I/O大会上正式推出 Gemini 3.5 Flash,并宣称这款模型在保持前沿智能水平的同时,大幅提升了效率,有望让复杂的智能体(Agentic)任务真正实现规模化落地。

速度与智能兼得

Gemini 3.5 Flash 的输出速度达到 近300 tokens/秒,而基准测试成绩与上一代旗舰模型 Gemini 3.1 Pro 相当——后者的输出速度仅为前者的四分之一。这意味着开发者可以用更低的成本、更短的时间获得同等质量的推理结果,尤其对需要长时间运行的智能体场景至关重要。

效率突破:从“烧钱”到“划算”

生成式AI目前普遍面临成本高昂的困境,而智能体任务(如自动编程、多步骤工具调用)会进一步放大这一问题。Gemini 3.5 Flash 通过 预训练和后训练的双重优化 实现了效率飞跃。谷歌产品管理高级总监 Tulsee Doshi 透露,团队从开发者使用反馈中获得了关键洞察,特别是在代码生成和工具使用方面。

“后训练阶段真正解锁了用户反馈的价值,比如来自 Antigravity 的反馈。你看到的代码性能和工具使用性能的提升,正是这些反馈的体现。”

代码能力跃升,对标GPT-5.5

谷歌此次重点强化了模型的代码生成能力,这是智能体方向的核心应用。在 Terminal BenchSWE-Bench Pro 等专业基准测试中,Gemini 3.5 Flash 不仅大幅超越前代 Flash 模型,还小幅领先 Gemini 3.1 Pro,得分与 OpenAI 更大、更昂贵的 GPT-5.5 处于同一区间。

产品落地:从今天开始

Gemini 3.5 Flash 即日起将陆续集成到谷歌的多个产品中。Doshi 强调,这只是开始,未来 3.5 Pro 将进一步提升性能,并延续“Flash 追上 Pro”的迭代节奏。

对于开发者而言,这一更新意味着:更快的响应、更低的推理成本,以及更可靠的智能体能力。如果效率优势能够持续,谷歌或许真的找到了让 AI 从“炫技”走向“实用”的关键路径。

延伸阅读

  1. 掩码离散序列模型中成对互信息的神经估计:让AI学会“读懂”变量关系
  2. GraphDiffMed:融合药理图先验与差分注意力机制,实现更可靠的药物推荐
  3. TabPFN-MT:专为表格数据设计的原生多任务上下文学习器
查看原文