SheepNav
新上线今天0 投票

Gemma 4 模型登陆 Amazon Bedrock:Google DeepMind 开源新作,兼顾智能与部署灵活性

Google DeepMind 的开源模型家族 Gemma 4 现已正式登陆 Amazon Bedrock,为开发者和企业在云端提供更灵活的 AI 模型选择。本次发布的 Gemma 4 系列包含三个指令微调版本:Gemma 4 31B(300 亿参数密集型)、Gemma 4 26B-A4B(260 亿参数混合专家模型,每次推理仅激活 40 亿参数)以及 Gemma 4 E2B(20 亿有效参数紧凑型)。这些模型均基于 Apache 2.0 开源许可发布,强调“每参数智能”的设计理念,旨在覆盖从边缘设备到大规模云部署的多种场景。

核心能力与基准表现

Gemma 4 系列在架构上覆盖了密集模型混合专家(MoE)模型两种路线,其中 MoE 变体在推理时仅激活部分参数,从而在保持高性能的同时降低计算成本。所有变体均支持:

  • 内置推理模式:可处理复杂逻辑和多步骤推理任务
  • 原生函数调用:便于构建智能体工作流
  • 多模态输入:支持文本与图像混合输入
  • 多语言支持:预训练覆盖 140+ 种语言,开箱支持 35 种以上

独立基准测试显示,Gemma 4 在“每参数智能”指标上表现突出。根据 Artificial Analysis 的评估,Gemma 4 31B 的 Intelligence Index 达到 39,远超同类 4B-40B 参数开源模型的中位数 15。这意味着在同等参数规模下,Gemma 4 能够提供更高的智能密度。

Amazon Bedrock 上的部署优势

对于希望采用开源基础模型的企业而言,数据安全、监管合规和运营控制始终是核心考量。Amazon Bedrock 作为全托管服务,允许用户通过 API 直接调用 Gemma 4 模型,所有推理均在 AWS 基础设施上运行,并继承 Bedrock 原有的安全与隐私保护机制。关键特性包括:

  • 数据不用于训练:用户的提示词和生成内容不会被用于模型训练
  • 内容不共享:与第三方隔离,保障企业数据隐私
  • 弹性扩展:按需推理服务可自动扩缩以应对工作负载变化

应用场景与上手路径

借助 Gemma 4 模型,开发者可以在 Bedrock 上构建多种应用:

  • 多模态智能体:结合图像与文本输入,实现视觉问答、文档理解等任务
  • 轻量级应用:Gemma 4 E2B 紧凑模型适合资源受限的移动端或边缘设备
  • 文档处理管线:利用函数调用能力自动化文档分类、信息提取流程
  • 软件工程工作流:支持代码生成、调试建议等开发辅助任务

如何快速开始? 用户可通过 Amazon Bedrock 控制台、AWS CLI 或 SDK 访问 Gemma 4 模型。在 Bedrock 的模型目录中搜索“Gemma 4”即可找到对应变体,选择后创建推理端点即可通过 API 调用。由于模型为开源权重,企业也可独立评估其架构与训练方法,并在自有数据上进行微调。

总结

Gemma 4 的入驻进一步丰富了 Amazon Bedrock 的开源模型生态。对于追求高性能与低成本平衡的团队,MoE 变体提供了极具吸引力的选择;而对数据主权有严格要求的企业,Bedrock 的全托管模式则消除了后顾之忧。随着多模态和智能体工作流的普及,Gemma 4 有望成为开发下一代 AI 应用的重要基石。

延伸阅读

  1. 谷歌CEO Sundar Pichai在斯坦福毕业典礼遭嘘声与退场抗议,因谷歌涉以色列及ICE合同
  2. 美国政府要求 Anthropic 下架模型,并非单纯的“越狱”事件
  3. Meta CTO 承认公司 AI 重组“糟糕透顶”
查看原文