
Gemini 3.5 Flash:快得让生成式AI终于“算得过账”了
谷歌在今年的I/O大会上正式推出 Gemini 3.5 Flash,并宣称这款模型在保持前沿智能水平的同时,大幅提升了效率,有望让复杂的智能体(Agentic)任务真正实现规模化落地。
速度与智能兼得
Gemini 3.5 Flash 的输出速度达到 近300 tokens/秒,而基准测试成绩与上一代旗舰模型 Gemini 3.1 Pro 相当——后者的输出速度仅为前者的四分之一。这意味着开发者可以用更低的成本、更短的时间获得同等质量的推理结果,尤其对需要长时间运行的智能体场景至关重要。
效率突破:从“烧钱”到“划算”
生成式AI目前普遍面临成本高昂的困境,而智能体任务(如自动编程、多步骤工具调用)会进一步放大这一问题。Gemini 3.5 Flash 通过 预训练和后训练的双重优化 实现了效率飞跃。谷歌产品管理高级总监 Tulsee Doshi 透露,团队从开发者使用反馈中获得了关键洞察,特别是在代码生成和工具使用方面。
“后训练阶段真正解锁了用户反馈的价值,比如来自 Antigravity 的反馈。你看到的代码性能和工具使用性能的提升,正是这些反馈的体现。”
代码能力跃升,对标GPT-5.5
谷歌此次重点强化了模型的代码生成能力,这是智能体方向的核心应用。在 Terminal Bench 和 SWE-Bench Pro 等专业基准测试中,Gemini 3.5 Flash 不仅大幅超越前代 Flash 模型,还小幅领先 Gemini 3.1 Pro,得分与 OpenAI 更大、更昂贵的 GPT-5.5 处于同一区间。
产品落地:从今天开始
Gemini 3.5 Flash 即日起将陆续集成到谷歌的多个产品中。Doshi 强调,这只是开始,未来 3.5 Pro 将进一步提升性能,并延续“Flash 追上 Pro”的迭代节奏。
对于开发者而言,这一更新意味着:更快的响应、更低的推理成本,以及更可靠的智能体能力。如果效率优势能够持续,谷歌或许真的找到了让 AI 从“炫技”走向“实用”的关键路径。