新上线今天0 投票

安全地向客户发布前沿模型：AWS的平衡之道

AWS近日宣布，Anthropic的Claude Fable 5模型将于明天起在Amazon Bedrock上重新上线，并配备了更强的防护措施以防止滥用。这一消息凸显了前沿模型发布中安全与可用性之间的关键平衡。

安全基石上的AI服务

自AWS成立20多年来，安全一直是其核心投资领域。Amazon Bedrock等AI服务正是建立在这一安全基础之上，秉承相同的理念。Bedrock为客户提供世界级的性能、安全性和隐私保护，以及最广泛的模型选择。去年推出的Bedrock Mantle在模型权重保护方面实现了行业领先的隐私与安全保障。

快速交付与责任并重

客户希望在新模型发布后尽快获得访问权限，Bedrock满足了这一需求，同时提供企业级功能。AWS强调，在发布模型时，不仅考虑对客户的责任，还兼顾对互联网和整个社会的影响。最新一代前沿模型（如Anthropic的Claude Mythos）拥有强大的新能力，尤其在网络安全领域。

Project Glasswing：防御者的机会

通过Project Glasswing，AWS亲身体验了这些模型的能力，并渴望将Mythos级模型交到防御者手中。防御者可以利用这些模型使关键系统更加安全，但同时必须确保不给攻击者提供显著的超前可见性和能力，而不给企业、政府和学术机构保护自身资产的机会。

平衡挑战与防护措施

实现这一平衡是广泛模型发布的关键挑战。AWS与Anthropic及其他行业合作伙伴在Project Glasswing中密切合作，为这类新模型完善防护措施。各方一致认为，防止攻击者获得深度漏洞研究能力是这些防护措施的最重要目标。

展望未来

AWS认为，在安全且隐私保护的环境中，让所有客户都能使用这些先进模型的能力，对于确保他们获得诸多好处而不制造安全风险至关重要。这是一个激动人心的AI时代，新能力几乎每天都在交付，而安全释放这些能力是行业共同的责任。

延伸阅读

相关资讯

可预测的GRPO：训练动力学的闭合形式模型

ReactionAtlas：机器学习从头探索化学反应网络

层级全局注意力（HGA）：无需重训即可扩展长上下文Transformer，单卡RTX 5090运行64K token

为什么少步文本潜在空间生成会失败，而图像潜在空间却能成功？尖锐类别读出时的“非承诺”问题