Gemini 3.5 Flash：速度提升4倍，智能体AI规模化有望

谷歌在今年的I/O大会上正式推出 Gemini 3.5 Flash，并宣称这款模型在保持前沿智能水平的同时，大幅提升了效率，有望让复杂的智能体（Agentic）任务真正实现规模化落地。

速度与智能兼得

Gemini 3.5 Flash 的输出速度达到 近300 tokens/秒，而基准测试成绩与上一代旗舰模型 Gemini 3.1 Pro 相当——后者的输出速度仅为前者的四分之一。这意味着开发者可以用更低的成本、更短的时间获得同等质量的推理结果，尤其对需要长时间运行的智能体场景至关重要。

效率突破：从“烧钱”到“划算”

生成式AI目前普遍面临成本高昂的困境，而智能体任务（如自动编程、多步骤工具调用）会进一步放大这一问题。Gemini 3.5 Flash 通过 预训练和后训练的双重优化 实现了效率飞跃。谷歌产品管理高级总监 Tulsee Doshi 透露，团队从开发者使用反馈中获得了关键洞察，特别是在代码生成和工具使用方面。

“后训练阶段真正解锁了用户反馈的价值，比如来自 Antigravity 的反馈。你看到的代码性能和工具使用性能的提升，正是这些反馈的体现。”

代码能力跃升，对标GPT-5.5

谷歌此次重点强化了模型的代码生成能力，这是智能体方向的核心应用。在 Terminal Bench 和 SWE-Bench Pro 等专业基准测试中，Gemini 3.5 Flash 不仅大幅超越前代 Flash 模型，还小幅领先 Gemini 3.1 Pro，得分与 OpenAI 更大、更昂贵的 GPT-5.5 处于同一区间。

产品落地：从今天开始

Gemini 3.5 Flash 即日起将陆续集成到谷歌的多个产品中。Doshi 强调，这只是开始，未来 3.5 Pro 将进一步提升性能，并延续“Flash 追上 Pro”的迭代节奏。

对于开发者而言，这一更新意味着：更快的响应、更低的推理成本，以及更可靠的智能体能力。如果效率优势能够持续，谷歌或许真的找到了让 AI 从“炫技”走向“实用”的关键路径。

Gemini 3.5 Flash：快得让生成式AI终于“算得过账”了

速度与智能兼得

效率突破：从“烧钱”到“划算”

代码能力跃升，对标GPT-5.5

产品落地：从今天开始

延伸阅读

相关资讯