AI 资讯

每日聚合最新人工智能动态

用 Amazon Nova 自动对图像中的 PII 进行脱敏处理

新上线

在跨团队、跨组织的数据共享或用于模型训练等场景中，包含个人身份信息（PII）的图像数据面临着严格的合规要求。传统脱敏工具往往难以应对边缘案例，例如出现在画面边缘的模糊人脸、汽车漆面反射出的面部、部分可见的街牌或办公桌上散落的证件。本文介绍一种由 **Amazon Nova** 驱动的多步骤脱敏流水线，利用其强大的上下文视觉推理能力，协调 **Meta 的开源 SAM 3**（部署于 Amazon SageMaker AI）进行像素级分割，以及 **Amazon Textract** 进行光学字符识别（OCR），从而实现对指纹、身份证、车牌等复杂 PII 的精准自动脱敏。 ## 核心思路：Nova 作为“智能协调者” 传统方案往往依赖单一模型或规则，难以覆盖 PII 在图像中出现的各种形态。Amazon Nova 作为多模态基础模型，能够**整体理解图像内容**，并基于上下文判断哪些元素构成 PII。例如，它可以识别出反射在汽车表面的人脸、部分被遮挡的证件号码，或者一张桌上文件中的姓名和地址。这种“理解”能力让 Nova 能够精准识别需要脱敏的目标，而无需人工逐张标注。 ## 流水线架构：三阶段协同整个脱敏流程分为三个关键步骤： 1. **视觉推理与目标定位**：Nova 2 Lite（高效低成本的多模态模型）分析图像，通过自然语言指令输出需要脱敏区域的边界框描述，例如“识别图像中所有人脸和身份证件”。 2. **像素级分割**：将 Nova 输出的边界框信息传递给 **SAM 3**，由该模型对指定区域进行精确到像素的分割，生成掩码。SAM 3 部署在 Amazon SageMaker AI 上，可弹性扩展推理资源。 3. **OCR 与文本脱敏**：对于包含文字的 PII（如证件号、地址），调用 **Amazon Textract** 提取文本内容，并配合 Nova 的上下文判断，决定是否需要遮盖或替换。最终通过图像处理工具将掩码区域置为纯色或模糊。 ## 应对边缘案例：从反射到指纹该流水线在以下典型困难场景中表现突出： - **镜面反射**：人脸或证件出现在汽车、玻璃等光滑表面的反射中，Nova 仍能通过整体场景理解识别出这些“非直接拍摄”的 PII。 - **部分遮挡**：被手指、物品遮挡一半的身份证号码，或只露出角落的街牌，Nova 结合上下文推断其可能包含位置信息。 - **非正射角度**：任意旋转的车牌、倾斜摆放的文档，通过 SAM 3 的旋转不变性分割与 Textract 的多方向 OCR 能力得到处理。 ## 部署与成本优势该方案全部基于 AWS 云服务构建，无需自建基础设施。Nova 2 Lite 的低成本特性使得大规模图像脱敏成为可能；SageMaker AI 提供按需推理端点，仅在处理时计费。用户可以通过简单的 API 调用启动整个流水线，并集成到现有数据处理流程中。 ## 行业意义在 GDPR、PCI DSS 等法规日益严格的今天，自动化的 PII 脱敏工具对于医疗影像、金融单据、安防监控等领域的合规数据共享至关重要。Amazon Nova 的引入，使得脱敏工作从“逐规则硬编码”转向“基于理解的自适应处理”，显著降低人工审核成本，同时减少漏脱敏风险。未来，该方案还可扩展至视频流的实时脱敏，进一步拓宽应用场景。

AWS ML9天前原文

Amazon SageMaker AI 与 MLflow 集成：实时流式传输基准测试和推理推荐结果

新上线

在生成式 AI 模型的部署过程中，团队常常需要评估数十种 GPU 实例类型、推理容器、并行策略以及推测解码等优化技术。这种复杂性催生了 Amazon SageMaker AI 的优化推理推荐功能，旨在将手动试错转变为数据驱动的优化。如今，AWS 进一步引入了与 MLflow 的原生集成，允许团队将基准测试和推理推荐结果自动流式传输到统一的实验跟踪平台中。 ## 核心功能通过这一集成，当您提交优化推理推荐作业或基准测试作业时，Amazon SageMaker AI 会自动将结果流式传输到您指定的 SageMaker MLflow 应用中。这意味着**指标、参数和图表**会实时更新，无需手动整理数据。您可以向同一个 MLflow 实验提交多个作业，并在实验视图中进行**并排对比**，从而快速识别最优配置。 ## 实现步骤要启用此功能，您需要执行以下三步： 1. **创建 MLflow 应用**：在 AWS 账户中打开 Amazon SageMaker Studio，进入 MLflow 页面并创建新的 MLflow 应用。 2. **授予权限**：在作业的执行角色中添加 `sagemaker-mlflow:*` 权限，并指定 MLflow 应用的 ARN。 3. **配置作业**：在创建基准测试或推荐作业时，传入 `MlflowConfig` 参数，指定目标实验名称。 ## 核心优势 - **消除数据孤岛**：多个作业的结果自动归集到同一实验名称下，无需手动合并数据。 - **加速迭代周期**：实时可见性让团队能快速比较不同配置，缩短从实验到部署的周期。 - **完全可复现**：每个实验的参数、指标和图表都被记录，确保后续可以追溯和复现。 ## 行业背景在大模型部署领域，实验管理一直是痛点。团队往往需要维护多个电子表格或自定义数据库来记录不同实例类型、优化技巧和性能指标。MLflow 作为开源实验跟踪平台，已成为行业标准，而 AWS 此次的原生集成直接解决了数据碎片化问题。对于使用 SageMaker 进行模型优化的团队来说，这无疑是一个**提升效率的关键功能**。 ## 小结 Amazon SageMaker AI 与 MLflow 的集成，为生成式 AI 的部署优化提供了一个统一、实时的实验管理方案。无论是进行大规模基准测试还是寻求最佳推理配置，这一功能都能显著减少手动工作，让团队更专注于模型性能的提升。

AWS ML9天前原文

Amazon Bedrock 如何拦截 AI 生成的钓鱼邮件

新上线

网络钓鱼依然是发动网络攻击最常用的手段之一，而 AI 生成的钓鱼邮件正给安全团队带来全新挑战。攻击者利用生成式 AI 和开源情报（OSINT）能够批量生成语法完美、语境恰当、高度个性化的邮件，传统基于语法错误、通用称呼等特征的过滤机制已难以招架。Amazon Bedrock 作为全托管服务，将领先的基础模型与安全、隐私和负责任的 AI 能力结合，为检测这类新型钓鱼攻击提供了新思路。本文深入分析 AI 钓鱼的演变、技术原理，并探讨 Amazon Bedrock 如何通过模型能力识别异常，帮助安全团队应对这一不断升级的威胁。

AWS ML13天前原文

Amazon SageMaker AI 多轮强化学习最佳实践

新上线

在 Amazon SageMaker AI 中训练多轮智能体来处理工单或内容审核，意味着处理一系列相互依赖的步骤，而非单一响应。这些智能体读取指令、调用工具、读取结果、决定下一步行动，并在做出最终回答前从错误中恢复。这种灵活性也使得智能体强化学习（RL）充满挑战：行动方式越多，意味着在不完成任务的情况下满足奖励的方式也越多，而且训练环境可能会悄然污染训练信号。本文分享了可靠的多轮 RL 训练最佳实践，涵盖如何构建可信的训练环境、设置外部评估、设计与最终任务对齐的奖励、管理智能体运行多轮后的变化，以及监控指示迭代时机的指标。文中的示例来自 SOP-Bench 数据集（Amazon Science 基准测试），该基准评估智能体在 12 个业务领域基于复杂标准操作程序（SOP）完成任务的能力。 ## 构建可信的训练环境训练环境是 RL 的基石。一个不可靠的环境会导致智能体学到错误的行为。建议对环境的每次交互进行日志记录和验证，确保工具调用的输入输出格式正确，并引入外部评估器来检查中间步骤的合理性。例如，在工单处理场景中，可以验证智能体是否真的查询了正确的数据库，而不是通过捷径获得奖励。 ## 设计奖励函数奖励函数必须与最终任务目标紧密对齐。在多轮场景中，稀疏奖励（仅在任务完成时给予奖励）可能导致学习缓慢，而过于密集的奖励（每一步都给予奖励）可能引发奖励黑客行为。建议采用 **混合奖励**：对关键中间步骤（如成功调用工具）给予少量奖励，并在任务完成时给予大额奖励。同时，设置惩罚机制来抑制错误行为（如重复调用同一工具）。 ## 管理多轮变化智能体运行多轮时，其行为策略可能发生偏移。需要监控策略的稳定性，并定期进行外部评估。使用 **SageMaker AI MTRL** 提供的异步 rollout 和轨迹收集功能，可以在不显著偏离当前策略的情况下并行生成和梯度更新，从而加速训练。此外，原生算法库（如 PPO、CISPO、IS 损失函数）以及多种基于组的优势估计器（GRPO、RLOO 等）为不同场景提供了灵活选择。 ## 监控关键指标应重点关注以下指标： - **成功率**：任务完成的比例。 - **平均回合长度**：智能体完成任务所需的步骤数。 - **奖励趋势**：训练过程中奖励值的变化，判断是否收敛。 - **策略熵**：衡量策略的探索程度，避免过早陷入局部最优。通过这些最佳实践，你可以更高效地在 SageMaker AI 中训练出可靠的多轮 RL 智能体。

AWS ML13天前原文

在 AWS GovCloud (US) 上通过 Amazon Bedrock 运行 NVIDIA Nemotron 和 OpenAI GPT OSS 模型

新上线

美国联邦政府机构现在可以在 AWS GovCloud (US) 环境中使用前沿的开放权重基础模型。亚马逊云科技宣布，Amazon Bedrock 现已支持 OpenAI 的 GPT OSS 模型（120B 和 20B）以及 NVIDIA 的 Nemotron 系列模型（Nano 9B v2、Nano 12B v2、Nano 30B、Super 120B），所有推理均在 AWS GovCloud 隔离边界内完成。 ## 安全合规与数据驻留 AWS GovCloud (US) 专为托管敏感数据和受监管工作负载而设计，其区域位于美国境内，由美国公民管理，支持 FedRAMP High、DoD SRG Impact Levels 2/4/5、ITAR 和 CJIS 等合规框架。通过 Amazon Bedrock，机构可以在不将敏感数据移出合规边界的前提下，调用高性能 AI 模型，满足情报分析、任务规划、合同审查、安全日志分析等关键任务需求。 ## 模型能力与灵活性此次新增的模型覆盖了从 9B 到 120B 参数规模的多种选择，兼顾效率与性能。**OpenAI GPT OSS 模型**（120B 和 20B）适用于复杂推理与文本生成；**NVIDIA Nemotron 系列**则提供从轻量级 Nano 到高性能 Super 的多种规格，适配不同计算约束场景。通过统一的 API，用户无需修改代码即可在多个模型间切换，选择最适合特定用例的模型。 ## 统一的推理体验 Amazon Bedrock 作为完全托管服务，所有推理均在 AWS 基础设施上运行，确保性能与安全。用户可以通过单一 API 访问包括 OpenAI、NVIDIA 在内的多种模型，简化 AI 应用开发与部署流程。这一发布标志着 AWS GovCloud 在支持前沿 AI 能力方面迈出重要一步，为政府机构提供了兼顾创新与合规的 AI 基础设施。

AWS ML14天前原文

构建无服务器 A2A 网关：实现智能体发现、路由与访问控制

新上线

随着企业跨团队、供应商和基础设施部署 AI 智能体，管理智能体之间的通信正成为日益增长的运营负担。没有集中式层，每个新智能体集成都会增加点对点连接、独立凭证和自定义路由逻辑。团队花费工程周期建立连接，而不是构建智能体能力。访问控制变得分散，没有单一位置来强制执行哪些客户端可以访问哪些智能体。其结果是新智能体工作流上市速度变慢，来自不一致身份验证策略的安全风险增加，以及运营开销随网络中每个新智能体的加入而呈二次方增长。 **网关模式**通过在智能体前放置单个入口点来解决这一问题，无论它们是在 Amazon Elastic Container Service (Amazon ECS)、AWS Lambda、Amazon Bedrock AgentCore Runtime、非 AWS 云还是混合环境中运行。它集中处理路由并强制执行细粒度权限，而不会将团队绑定到特定的运行时、框架或编排层。此模式基于 **Agent-to-Agent (A2A) 协议**，该协议标准化了智能体之间的通信方式。没有中央编排器，20 个智能体的部署需要多达 190 个点对点连接。在这篇文章中，您将学习如何在 AWS 上构建一个无服务器 A2A 网关，该网关使用基于路径的路由 (`/agents/{agentId}`) 在单个域后面托管多个智能体。标准的 A2A 客户端无需修改即可工作。该解决方案具有三层： - **管理层**：集中式智能体注册表，支持发现和语义搜索。 - **控制层**：使用 JSON Web Token (JWT) 范围和 Lambda 授权器进行细粒度访问控制。 - **执行层**：具有 OAuth 后端身份验证和服务器发送事件 (SSE) 流式传输支持的单域路由。按照本文操作，您将部署一个由 Terraform 配置的网关，A2A 兼容的智能体可以连接到该网关。 ## 架构概览下图显示了网关的组件以及请求如何流经系统。Amazon API Gateway (REST API) 作为单入口点。该架构使用 REST API，因为 REST API 支持响应流式传输。流式传输对于基于 SSE 的实时智能体响应是必需的。Lambda 授权器检查 JWT 范围并生成 AWS Identity and Access Management (IAM) 策略。

AWS ML14天前原文

AgentCore Memory 元数据过滤：为 AI 代理检索精度提效 64%

新上线

## 元数据过滤：让 AI 代理的记忆更精准当你的客户支持代理询问“账单问题”时，却返回了技术支持工单、销售对话中的收据问题以及账单纠纷——这是团队在代理积累数周交互历史后常遇到的**检索精度瓶颈**。仅靠语义相似性搜索会找到所有语义相近的结果，却无法按问题类型、状态或时间等关键维度进行限定。 **Amazon Bedrock AgentCore Memory** 是一项全托管记忆服务，支持 AI 代理跨对话记录和回忆信息。它通过**命名空间**（如 `clients/client-123`）隔离不同实体的数据。但随着记忆增长，相关信号会被语义相似但上下文不相关的结果淹没，仅靠命名空间无法区分。 ### 元数据过滤如何工作？现在，你可以在命名空间隔离之上叠加细粒度的**基于属性的过滤器**，在相似性搜索之前按业务维度（如优先级、部门、时间范围）限定检索范围。在基于长期记忆基准（LoCoMo 风格的多会话对话）构建的 **151 个问题测试集** 上，启用元数据过滤后，整体问答准确率从 **40% 提升至 64%**。对于依赖上下文边界的问题（如时间限定查询、优先级过滤、部门范围搜索），准确率从 **16% 跃升至 69%**。 ### 关键概念与配置命名空间提供基础隔离，元数据则添加业务属性标签。例如，可以为每个记忆记录附加 `priority: high`、`department: billing`、`timestamp: 2025-03-01` 等键值对。 **配置步骤：** 1. **定义元数据 schema**：明确预期的属性名称和类型（如字符串、数字、日期）。 2. **在记忆注入时附加元数据**：当代理存储新记忆时，同时提供元数据。 3. **在检索时指定过滤条件**：查询时通过条件表达式（如 `department == "billing" AND priority == "high"`）缩小范围。 ### 企业用例：多代理与多租户架构 - **多代理场景**：不同代理（如客服、销售、技术）共享同一记忆库，但通过 `agent_type` 元数据过滤，确保每个代理只访问相关记忆。 - **多租户场景**：在命名空间隔离基础上，添加 `tenant_id` 元数据，实现租户内的精细权限控制。 - **时间敏感查询**：通过 `timestamp` 元数据，代理可只检索最近 7 天的记录，避免旧数据干扰。 ### 最佳实践 - **元数据与命名空间互补**：命名空间用于粗粒度隔离，元数据用于细粒度筛选，两者结合而非替代。 - **避免冗余元数据**：不要在每条记录上重复命名空间已有的信息（如客户 ID），而是添加业务相关的维度。 - **合理设计索引**：高频过滤字段应建立索引以提升性能。 - **测试过滤覆盖率**：确保过滤条件覆盖所有关键查询维度，避免遗漏。 ### 小结元数据过滤解决了 AI 代理记忆检索中的关键痛点——在语义相似但上下文无关的结果中精准定位。通过将准确率从 40% 提升至 64%，它为企业级多代理、多租户系统提供了可落地的精度保障。如果你正在构建需要长期记忆的代理，不妨从命名空间和元数据的组合设计入手。

AWS ML14天前原文

HippoRAG：基于神经生物学启发的RAG，结合Amazon Bedrock、Neptune和个性化PageRank

新上线

大型语言模型（LLM）在处理和生成信息方面已取得显著进展，但在跨多源知识整合方面仍存在不足，尤其是面对需要连接不同文档信息的多跳推理任务时，标准检索增强生成（RAG）方法往往力不从心。受人类海马体记忆系统启发，HippoRAG 提出了一种新型RAG框架，通过构建知识图谱并利用个性化PageRank算法实现单步多跳检索，显著提升了复杂推理能力。本文展示了如何在AWS基础设施上完整实现HippoRAG，核心组件包括： - **Amazon Bedrock**：提供LLM能力，用于知识图谱三元组提取、问答和命名实体识别。 - **Amazon Neptune Database**：存储知识图谱结构，支持基本图操作。 - **Amazon Neptune Analytics**：执行高级图算法，特别是**个性化PageRank**用于相关性排序。 - **Amazon Titan Embeddings**：生成文本的向量表示，用于相似度匹配。 ### 神经生物学灵感与背景 HippoRAG 借鉴了人类长期记忆的海马体索引理论：新皮层处理感知输入，而海马体建立记忆之间的关联索引。这种双组件系统使人类能够高效整合不同经历中的信息。标准RAG将每个文档独立处理，难以回答需要跨文档连接信息的问题。HippoRAG 通过以下方式解决： 1. 构建**知识图谱**，表示实体间关系。 2. 使用**个性化PageRank**算法进行高效的图遍历和相关性排序。 3. 实现**单步多跳检索**，无需多次迭代。 ### 解决方案架构 AWS实现包含四个主要部分，如上所述。该架构充分利用了个性化PageRank的威力，同时保持了企业级应用所需的可扩展性。通过将知识图谱与向量检索相结合，HippoRAG 在需要连接分散信息的场景中表现出色，例如多文档问答、研究报告综合等。 ### 应用与展望 HippoRAG 适用于企业级知识管理、智能客服、法律文档分析等领域。其神经生物学启发的设计使其在处理复杂、关联性强的信息时具有天然优势。未来，随着图算法和LLM的进一步发展，此类框架有望成为下一代RAG系统的核心范式。

AWS ML14天前原文

用Amazon Bedrock秒杀文件欺诈：Inscribe如何将检测时间缩短20倍

新上线

金融文件欺诈正以惊人速度增长——根据Inscribe《2026年文件欺诈报告》，每16份文件中就有1份存在欺诈，AI生成的伪造文件在2025年4月至12月间增长了5倍。面对每天处理数千份申请的金融机构，传统人工审核每份需30分钟，不仅效率低下，更难以识别深度伪造和AI生成的欺诈文件。自2017年起专注AI反欺诈的Inscribe，借助Amazon Bedrock构建了一套**智能体AI系统**，模仿资深欺诈分析师的多文档推理逻辑，将检测时间从30分钟压缩至**90秒以内**，实现20倍效率提升，同时保持金融监管所需的准确性和可解释性。 ### 挑战：三重困境以中型银行的贷款申请为例：客户提交银行流水、工资单、税单和身份证明，分析师需逐一验证真伪、交叉核对信息、识别篡改与深度伪造，并调查雇主和地址。这一过程面临三重挑战： - **规模瓶颈**：申请量增长迫使机构成比例增加人力，成本攀升但检测精度未提升。 - **适应不足**：传统规则系统难以应对AI生成的动态伪造手法，欺诈者利用生成式AI快速迭代攻击方式。 - **速度与精度矛盾**：快速审批与严格风控难以兼顾，延迟导致客户流失。 ### 解决方案：智能体AI + Amazon Bedrock Inscribe的方案核心是**多智能体协作架构**，每个智能体专精于特定任务：文档真实性验证、跨文档信息比对、异常模式识别等。这些智能体通过Amazon Bedrock调用高性能基础模型（如Claude等），自主推理并交换结论。关键优势包括： 1. **专家级推理**：系统模拟人类分析师的多步骤验证逻辑，而非简单规则匹配。 2. **秒级响应**：端到端检测在90秒内完成，满足实时业务需求。 3. **可解释性**：每个决策步骤可追溯，符合金融监管对审计追踪的要求。 4. **持续进化**：利用Amazon Bedrock的模型灵活性，快速集成最新AI能力以应对新型欺诈。 ### 行业影响 Inscribe的案例表明，**智能体AI正在重塑金融风控范式**。传统上，反欺诈需要在速度与深度之间取舍，而智能体架构通过分工协作实现了“既要又要”。对于银行和金融科技公司，这意味着： - 在不增加人力的情况下处理数倍申请量 - 识别人工难以发现的AI生成伪造文件 - 保持监管合规的透明决策链 Amazon Bedrock作为底层平台，提供了安全、可扩展的模型调用和治理能力，使Inscribe能专注于业务逻辑而非基础设施。 ### 展望随着AI欺诈手段持续进化，静态规则系统终将失效。Inscribe的实践为行业指明方向：结合智能体AI与托管基础模型服务，金融机构能够建立**自适应反欺诈体系**。未来，这种模式或将从文档审核扩展到身份验证、交易监控等更多场景，成为金融安全的基础设施。

AWS ML14天前原文

开源工具 Model Profiler 简化 Amazon Bedrock 模型选择流程

新上线

随着生成式 AI 在各行各业加速落地，Amazon Bedrock 作为托管服务平台，提供了超过 100 个来自 Anthropic、OpenAI、Meta、Mistral AI、Cohere 和亚马逊等厂商的基础模型。然而，模型选择并非易事——能力、定价、区域可用性、上下文窗口限制和吞吐量等信息分散在控制台页面、文档和区域 API 调用中，给团队评估新工作负载、优化成本或从其他 AI 系统迁移带来了巨大障碍。针对这一痛点，AWS 发布了开源工具 **Amazon Bedrock Model Profiler**。该工具将来自多个 AWS API 和外部来源的模型元数据聚合到一个统一、可搜索的界面中，支持高级筛选、并排比较和详细模型卡，帮助团队快速浏览整个 Bedrock 模型目录并做出数据驱动的决策。 ## 核心功能与架构 Model Profiler 是一个 Web 应用，用户无需在多个控制台页面和文档站点间来回切换，即可在一个界面中获取模型卡、并排比较、区域可用性地图和每日更新的定价信息。其背后是一套完全自动化的无服务器流水线，从 **7 个数据源** 收集和处理信息，包括 5 个 AWS API（如 ListFoundationModels、Price List、Service Quotas 等）和 2 个公共 URL。这些数据源涵盖模型规格、能力、模态、在 33 个区域的可用性、按需/批处理/预留层定价、每分钟令牌数（TPM）限制等关键指标，且无需手动干预即可保持目录准确。 ## 实际应用场景 Model Profiler 在多个真实场景中能显著提升效率： - **新工作负载评估**：团队需要对比不同模型的上下文窗口、支持语言和模态，以找到最适合特定任务的模型。通过筛选和排序，几分钟内即可缩小候选范围。 - **成本优化**：结合定价和 TPM 限制，开发者可以快速找到性价比最高的模型，避免过度配置或预算超支。 - **迁移规划**：从其他 AI 平台迁移到 Bedrock 时，Model Profiler 帮助识别功能对等的模型，并比较区域可用性和定价差异。 ## 快速部署根据官方说明，用户可以在 **5 分钟以内** 在自己的环境中完成部署。工具以开源形式提供，代码托管在 GitHub 上，支持通过 AWS CDK 或 SAM 快速启动。部署后，团队即可获得一个私有的模型探索门户，无需依赖外部服务。 ## 行业意义模型选择是生成式 AI 落地中的关键瓶颈之一。Bedrock 虽然提供了丰富的模型选择，但信息分散增加了决策摩擦。Model Profiler 的出现填补了这一空白，通过自动化数据聚合和直观的比较界面，降低了实验成本，加速了从评估到生产的周期。对于正在构建多模型应用或需要持续优化成本的组织来说，这是一个实用且及时的工具。

AWS ML14天前原文

借助 BoltzGen 在 Amazon SageMaker AI 上加速蛋白质设计

新上线

蛋白质设计正从实验室走向工业化，但 GPU 基础设施的管理常常成为瓶颈。本文将展示如何利用 Amazon SageMaker AI 部署 BoltzGen——一个基于扩散模型的蛋白质生成工具，实现从快速验证到批量生产的设计流程。 ## 蛋白质设计的算力挑战在蛋白质 binder 设计中，每个候选分子都需要经过**骨架生成、逆向折叠、结构验证和候选排序**等多个 GPU 密集型步骤。以 1000 个样本为例，在 4 卡 GPU 实例（ml.g5.12xlarge）上运行约需 **375 小时**。传统方式下，研究人员需要自行管理实例生命周期、构建 CUDA 环境、协调步骤间数据流转，并处理长时间运行任务的故障恢复，这些运维工作消耗了大量精力。 ## SageMaker AI 的自动化方案 Amazon SageMaker AI 通过端到端托管解决了上述痛点： - **自动资源编排**：提交任务后，SageMaker AI 自动配置 GPU 实例，运行 BoltzGen 容器，结果写入 Amazon S3，任务完成后释放实例。 - **按秒计费**：无闲置成本，例如在 ml.g4dn.xlarge 上运行 2 小时设计任务，按需费用仅约 **1.5 美元**。 - **多 GPU 支持**：可扩展至多卡并行，加速大规模候选筛选。 - **步骤级缓存**：迭代工作流中重复使用中间结果，进一步降低计算开销。 ## 两种执行模式适配不同阶段该方案提供两种运行模式：**快速验证模式**适用于小批量测试和算法调优，**生产批量模式**则面向大规模筛选任务。研究人员可以根据实验阶段灵活切换，无需额外配置基础设施。 ## 应用场景与价值这套方案主要面向学术实验室、生物科技初创公司、制药研发团队以及教育机构，覆盖蛋白质 binder 设计、治疗性蛋白质工程和从头蛋白质架构等方向。通过将基础设施管理交给 SageMaker AI，团队可以专注于设计迭代本身，加速从概念到候选分子的转化。 ## 小结 BoltzGen 与 Amazon SageMaker AI 的结合，为蛋白质设计提供了一条低门槛、高可扩展的路径。它解决了 GPU 资源的弹性供给、成本控制和流程自动化问题，使得大规模蛋白质设计不再是算力密集型团队的专属。

AWS ML14天前原文

安全地向客户发布前沿模型：AWS的平衡之道

新上线

AWS近日宣布，Anthropic的Claude Fable 5模型将于明天起在Amazon Bedrock上重新上线，并配备了更强的防护措施以防止滥用。这一消息凸显了前沿模型发布中安全与可用性之间的关键平衡。 ## 安全基石上的AI服务自AWS成立20多年来，安全一直是其核心投资领域。Amazon Bedrock等AI服务正是建立在这一安全基础之上，秉承相同的理念。Bedrock为客户提供世界级的性能、安全性和隐私保护，以及最广泛的模型选择。去年推出的Bedrock Mantle在模型权重保护方面实现了行业领先的隐私与安全保障。 ## 快速交付与责任并重客户希望在新模型发布后尽快获得访问权限，Bedrock满足了这一需求，同时提供企业级功能。AWS强调，在发布模型时，不仅考虑对客户的责任，还兼顾对互联网和整个社会的影响。最新一代前沿模型（如Anthropic的Claude Mythos）拥有强大的新能力，尤其在网络安全领域。 ## Project Glasswing：防御者的机会通过Project Glasswing，AWS亲身体验了这些模型的能力，并渴望将Mythos级模型交到防御者手中。防御者可以利用这些模型使关键系统更加安全，但同时必须确保不给攻击者提供显著的超前可见性和能力，而不给企业、政府和学术机构保护自身资产的机会。 ## 平衡挑战与防护措施实现这一平衡是广泛模型发布的关键挑战。AWS与Anthropic及其他行业合作伙伴在Project Glasswing中密切合作，为这类新模型完善防护措施。各方一致认为，防止攻击者获得深度漏洞研究能力是这些防护措施的最重要目标。 ## 展望未来 AWS认为，在安全且隐私保护的环境中，让所有客户都能使用这些先进模型的能力，对于确保他们获得诸多好处而不制造安全风险至关重要。这是一个激动人心的AI时代，新能力几乎每天都在交付，而安全释放这些能力是行业共同的责任。

AWS ML15天前原文

Claude Sonnet 5 登陆 AWS：Anthropic 最强 Sonnet 模型登场

新上线

Anthropic 今日宣布，其新一代 Sonnet 模型 **Claude Sonnet 5** 已在 **Amazon Bedrock** 和 **Claude Platform on AWS** 上正式可用。这是 Anthropic 最新系列的首次 Sonnet 发布，在编码、智能体任务和专业工作方面带来显著提升，同时保持了 Sonnet 级别的定价与速度优势。 ## 性能飞跃：接近 Opus 的智能，Sonnet 的价格 Claude Sonnet 5 被定位为“最强大的 Sonnet 模型”，在推理、编码和智能体可靠性上接近旗舰模型 Opus 的水平，但成本远低于 Opus。这意味着团队可以在日常大规模任务中依赖 Sonnet，而将 Opus 留给最复杂、最需要顶级推理的场景。具体能力提升包括： - **多阶段规划**：模型能够跨阶段保持计划，跟踪已完成和待办事项，减少修正轮次。 - **编码能力增强**：针对真实代码库设计，支持多文件变更、长序列调试和重构，输出更干净、更易维护的代码。 - **智能体可靠性**：作为自主代理的骨干，能处理复杂依赖链和多步骤工具调用，适合客户服务与内部自动化场景。 - **专业工作**：可将长篇幅、复杂、非结构化信息合成结构化产出，如简报、分析和报告。 ## 在 AWS 上的部署优势通过 Amazon Bedrock 使用 Claude Sonnet 5，企业可以： - 在现有 AWS 环境中构建，维持企业级安全和区域数据驻留。 - 扩展推理规模，享受统一的账单和认证体系。 - 通过 Claude Platform on AWS 获得 Anthropic 原生平台体验，包括相同的 API、功能和控制台操作。 ## 开发者实操指南对于 AI 工程师而言，Sonnet 5 的部署重点在于将其集成到智能体系统和生产推理工作流中。官方建议： - 在需要强推理、编码和智能体可靠性的规模化场景中优先使用 Sonnet 5。 - 对于要求最高推理精度的任务，仍可选择 Claude Opus。 - 利用 Bedrock 的托管功能简化模型管理和监控。 ## 行业意义 Claude Sonnet 5 的发布标志着 Anthropic 在“性能-成本”平衡上的一次关键突破。此前，Sonnet 系列主要面向日常任务，而 Opus 则专攻高端推理。Sonnet 5 的“接近 Opus”表现，可能促使更多企业将核心工作负载迁移至 Sonnet 层级，从而降低整体 AI 部署成本。同时，其在编码和智能体领域的强化，直接呼应了当前企业对自动化开发和多步骤任务处理的迫切需求。随着 Claude Sonnet 5 在 AWS 上的落地，开发者可以更便捷地利用这一模型构建下一代 AI 应用。更多详情可参阅 AWS 官方文档。

AWS ML15天前原文

在 Amazon Bedrock AgentCore 上使用 AG-UI 协议为 AI 智能体构建生成式用户界面

新上线

AI 智能体早已不止于聊天。借助合适的协议，智能体可以在对话中直接渲染交互式图表、实时更新共享画布，或在执行中途暂停并请求用户批准。这些交互——生成式 UI、共享状态和人在回路——需要一种标准方式让智能体后端将动态事件传达给前端。 **AG-UI（Agent-User Interaction Protocol）** 正是为此而生的开放协议。它定义了这一标准，并与多种智能体框架（如 Strands Agents、LangGraph、CrewAI）及前端库（React、Angular、Vue）兼容。使用 AG-UI，你的智能体代码和前端代码保持解耦，你可以为后端选择最合适的框架，为前端选择最合适的库，AG-UI 则负责连接它们。 **Amazon Bedrock AgentCore** 是 Amazon Bedrock 系列服务的一部分，专为生成式 AI 打造。AgentCore 是一个智能体平台，用于安全地大规模构建、部署和运行 AI 智能体，支持任何框架和任何模型。本篇文章将详细说明 AG-UI 如何集成到 **Fullstack AgentCore Solution Template (FAST)** 中，从而在 Amazon Bedrock AgentCore 上构建交互式智能体前端。随后，我们将展示 **CopilotKit** 如何通过生成式 UI、共享状态和人在回路交互进一步扩展能力，所有这些都部署在 Amazon Bedrock AgentCore 上。 ## 解决方案概述 Amazon Bedrock AgentCore Runtime 提供了一个安全、无服务器且专为托管环境设计的环境，用于部署和运行 AI 智能体或工具。AgentCore Runtime 支持多种智能体协议： - **Model Context Protocol (MCP)**：连接智能体与工具 - **Agent2Agent (A2A)**：连接智能体与其他智能体 - **AG-UI**：连接智能体与用户当你使用 AG-UI 协议标志部署智能体容器时，AgentCore 充当透明代理。它处理身份验证（通过 SigV4 或 Amazon Cognito 的 OAuth 2.0）、会话隔离、扩展和可观测性。你的容器需在端口 8080 上暴露 `POST /invocations` 用于 AG-UI 请求，以及 `GET /ping` 用于健康检查。AgentCore 会将请求原封不动地传递。 FAST 是一个可直接部署的起始项目。它将 AgentCore Runtime、Gateway、Identity、Memory 和 Code Interpreter 与 React 前端及 Amazon Cognito 身份验证连接起来，所有资源均通过 AWS CDK 定义。 ## 实际意义与展望 AG-UI 协议的出现，为 AI 智能体与用户之间的交互提供了一种标准化的通信方式，打破了后端框架与前端库之间的耦合。结合 Amazon Bedrock AgentCore 的企业级托管能力，开发者可以更专注于业务逻辑和用户体验，而无需担心底层基础设施。CopilotKit 的加入则进一步丰富了交互形态，使得智能体不仅能“说”，还能“做”和“问”，从而显著提升复杂任务场景下的协作效率。对于希望构建下一代 AI 应用的团队而言，这套方案提供了从协议到部署的完整链路，有望加速生成式 UI 在企业级应用中的落地。

AWS ML15天前原文

Amazon Bedrock 托管授权：简化多账户模型访问的新方案

新上线

随着企业对 AI 模型的需求增长，跨多个 AWS 账户管理第三方模型（如 Anthropic Claude、Cohere）的访问权限成为一项挑战。传统做法要么为每个工作负载账户授予 AWS Marketplace 权限（增加治理风险），要么手动为每个账户订阅模型（操作繁琐）。针对这一痛点，AWS 推出了 **Amazon Bedrock 托管授权（Managed Entitlements）** 功能，允许组织从一个中央账户订阅模型，然后通过 AWS License Manager 将访问权限分发到整个组织的成员账户，而无需在工作负载账户中授予 AWS Marketplace 权限。 ## 为什么需要托管授权？要理解托管授权的价值，首先需要区分 Amazon Bedrock 上不同模型的获取方式。目前模型分为三类： - **Amazon 自研模型（如 Amazon Nova）**：可直接通过 Amazon Bedrock 权限调用，无需额外订阅。 - **Amazon 代销模型（如 Meta、Mistral、DeepSeek）**：同样可直接调用，无需额外步骤。 - **AWS Marketplace 第三方模型（如 Anthropic Claude、Cohere、Stability AI）**：每个账户需要单独订阅 AWS Marketplace 后才能调用。对于前两类模型，AWS 近期已简化访问流程，用户可立即使用。但对于第三方模型，多账户场景下，要么为每个账户开放 Marketplace 权限（带来安全风险），要么由管理员逐个手动启用（效率低下）。托管授权正是为解决这一矛盾而生。 ## 四步工作流托管授权的使用流程分为四个步骤： 1. **中央账户订阅**：在中央管理账户中，通过 AWS Marketplace 订阅所需的第三方模型。 2. **创建授权**：在 AWS License Manager 中创建托管授权，指定要分发的模型和接收账户。 3. **分配权限**：将授权分配给组织内的成员账户或 OU（组织单元）。 4. **成员账户使用**：成员账户无需任何 Marketplace 权限，即可直接通过 Bedrock 控制台或 API 调用已授权的模型。 ## 实际应用场景 - **大型企业**：拥有数百个 AWS 账户，需要集中管控 AI 模型订阅费用和访问权限，同时确保各团队能快速获取最新模型。 - **合规要求严格的组织**：不希望在工作负载账户中开放 Marketplace 权限，以减少攻击面和审计复杂度。 - **跨区域部署**：托管授权支持跨区域分发，但需注意不同区域的市场可用性差异。 ## 重要注意事项 - **私有产品（Private Offers）**：如果模型是通过私有协议购买的，托管授权的行为可能有所不同，建议先测试。 - **区域限制**：某些模型仅在特定区域可用，授权分发时需确认目标区域是否支持。 - **成本归属**：订阅费用仍由中央账户承担，但可通过成本标签进行内部分摊。 ## 与 Bedrock 其他能力的协同托管授权并非孤立功能，它与 Amazon Bedrock 的 **模型评估**、**护栏（Guardrails）** 等能力互补。通过集中授权，企业可以更高效地实施统一的模型治理策略——例如，在中央账户配置护栏规则后，所有通过授权访问模型的成员账户都会自动遵循这些规则。 ## 小结 Amazon Bedrock 托管授权为多账户环境下的第三方模型管理提供了优雅的解决方案。它平衡了安全性与效率，让组织既能保持中央治理，又能灵活赋能各业务团队。对于正在扩张 AI 应用规模的企业而言，这一功能值得优先评估。

AWS ML15天前原文

利用 Amazon Bedrock 与 LLM 网关实现弹性推理模式

新上线

随着生成式 AI 工作负载从实验阶段进入大规模生产，大语言模型推理的弹性设计变得至关重要。现有弹性最佳实践（如静态稳定性、退避重试）仍然适用，但生成式 AI 带来了新的挑战：模型可用性、快速变化的配额、跨提供商的 Token 限制，以及新发布模型的版本一致性。 **四个核心维度**指导推理架构决策：可用性、响应时间、成本、吞吐量。可用性指在模型、区域或提供商中断时维持推理；响应时间关注首 Token 延迟和末 Token 延迟；成本涉及每 Token 和每次请求开销；吞吐量衡量系统能支撑的并发请求和每秒 Token 数。这些维度相互关联——例如跨区域路由提升可用性和吞吐量，但可能增加响应时间。本文聚焦于**可用性**，介绍了五种实用模式，从原生 Amazon Bedrock 功能到基于 LLM 网关的多模型编排： 1. **原生 Bedrock 重试与退避**：利用 Bedrock SDK 内置的重试机制，配合指数退避处理临时配额耗尽。适用于单区域、单模型场景，实现成本最低。 2. **跨区域推理**：利用 Bedrock 的跨区域推理功能，将请求路由到多个区域。当主区域配额耗尽或服务中断时，自动故障转移到备用区域，提升整体可用性。 3. **多模型故障转移**：在 Bedrock 之上叠加 LLM 网关，配置主模型和备用模型。当主模型返回配额错误或超时时，网关自动切换到备用模型（如从 Claude 切换到 Llama），避免单点依赖。 4. **多提供商路由**：通过 LLM 网关同时接入 Bedrock、Anthropic、OpenAI 等多个提供商。根据实时可用性、成本或延迟将请求路由到最优提供商，实现最大弹性。 5. **租户隔离与配额管理**：在多租户环境中，为每个租户分配独立的配额池或模型实例，防止“吵闹邻居”问题。结合 LLM 网关实现基于租户的限流、优先级和成本归属。这些模式遵循“爬、走、跑”的渐进式策略：从简单重试开始，逐步引入跨区域、多模型、多提供商，最终实现精细化的租户隔离。实际部署时需根据应用成熟度、预算和延迟要求选择合适模式。未来文章将深入探讨响应时间优化和成本感知路由。

AWS ML15天前原文

Outpost VFX 借助 AWS 将 AI 模型训练速度提升 8 倍：视觉特效行业的技术突破

新上线

在视觉特效（VFX）制作中，AI 模型训练通常需要数周时间，成为生产流程的瓶颈。Outpost VFX 通过在 AWS 上实施多 GPU 训练架构，成功将人脸替换工作流的训练速度提升了 **8 倍**，大幅缩短了迭代周期。本文将解析其技术挑战、架构设计及实际成效。 ## 单 GPU 瓶颈：从 5 天到数周的等待传统 VFX 的人脸替换流程高度依赖人工合成或美容/去龄特效，单次初版制作需 **超过 5 天**，且后续迭代漫长。Outpost VFX 开发了基于 AI 的人脸替换模型，可在现场拍摄素材上训练，但受限于单 GPU 计算能力——模型只能利用一块 GPU，视频随机存取内存（VRAM）和处理容量严重不足，导致训练周期长达数周，无法满足客户交付时间。 ## 架构设计：安全与性能并重 Outpost VFX 提出三大关键需求： 1. **计算可扩展性**——必须将训练并行化到多 GPU，消除单 GPU 瓶颈。 2. **基础设施安全**——作为自 2022 年就全面虚拟化技术栈的 AWS 客户，需严格保护敏感的制作数据。 3. **性能优化**——支持更大数据集和更高分辨率图像，提升输出质量。最终方案基于 **Amazon EC2 P4d 实例**（配备 8 块 NVIDIA A100 GPU），结合 **Amazon FSx for Lustre** 高性能文件系统，实现数据快速加载。网络层面采用 **Elastic Fabric Adapter (EFA)** 降低延迟，确保多 GPU 间高效通信。 ## 实测结果：8 倍加速与质量提升通过将训练任务从单 GPU 迁移到多 GPU 集群，Outpost VFX 取得了显著成果： - **训练速度提升 8 倍**：原本需要数周的模型训练缩短至几天。 - **迭代周期从周级降至天级**：导演反馈循环大幅加速，项目交付更加灵活。 - **支持更高分辨率**：多 GPU 架构允许处理 4K 甚至更高分辨率的素材，输出细节更丰富。 ## 行业启示：AI 与云原生的融合 Outpost VFX 的案例展示了云原生基础设施如何释放 AI 在 VFX 领域的潜力。传统工作室往往受限于本地算力，而 AWS 提供的弹性 GPU 集群让中小型工作室也能获得顶级计算能力。随着生成式 AI 在影视制作中的渗透，类似的多 GPU 训练架构将成为标配。对于 VFX 从业者而言，这不仅是速度的提升，更是创作流程的变革——更快的训练意味着更多创意试错空间，最终推动视觉特效行业进入“AI 辅助创作”的新阶段。

AWS ML15天前原文

用 Amazon Bedrock 打造双语 NER，为货运物流提效 14 倍

新上线

## 当货运邮件遇上双语 NER：IBS Software 的实战经验在全球化货运物流中，每天有成千上万封夹杂着英语和日语的关键信息邮件需要处理。**IBS Software** 的货运系统正是面临这一挑战：需要从两种语言的邮件中准确提取 **23 种实体类型**，包括运单号、航班信息、重量、尺寸、特殊处理代码等。 ### 挑战：精度、成本与延迟的三重博弈最初，IBS Software 尝试了多种方案。手动处理效率低下，而直接调用大模型虽然精度高，但推理成本在规模化后难以承受。团队需要在保持高准确率的同时，将成本控制在可接受范围，并满足实时处理延迟要求。 ### 解法：基于 Amazon Bedrock 的知识蒸馏 IBS Software 最终采用了 **Amazon Bedrock 的托管蒸馏能力**。核心思路是：将 **Amazon Nova Pro**（教师模型）的知识“蒸馏”到更轻量的 **Amazon Nova Lite**（学生模型）中。具体技术路径是 **基于 token 的蒸馏**——教师模型在标注数据上生成软标签，学生模型学习这些分布，同时保留对关键实体的硬标签学习。这种方法让学生模型在参数量大幅缩减的情况下，依然能捕捉到双语间的语义差异和上下文依赖。 ### 成果：95% 精度 + 14 倍成本优化经过 9 位研究人员和工程师的协作，最终部署的模型取得了**95.085% 的 F1 分数**，同时**运营成本降低了 14 倍**。整个工作流在 AWS 上实现端到端自动化：邮件进入后，由 Amazon Bedrock 调用的蒸馏模型实时提取结构化信息，再写入下游系统。 ### 架构亮点 - **教师-学生蒸馏**：利用 Nova Pro 的高精度指导 Nova Lite 训练，平衡了精度与效率。 - **双语对齐**：针对英语和日语在词法、句法上的差异，蒸馏过程特别设计了跨语言 token 对齐策略。 - **实时处理**：轻量模型使得单条邮件处理延迟控制在毫秒级，满足生产环境要求。 ### 给类似场景的启示如果你也在构建双语或多语种 NER 系统，IBS Software 的经验值得参考： 1. **不要盲目追求大模型**：通过蒸馏，小模型可以在特定任务上达到接近大模型的精度。 2. **成本与精度可以兼得**：本案例中 14 倍的成本降低并未以牺牲核心指标为代价。 3. **托管服务降低工程门槛**：Amazon Bedrock 的蒸馏能力让团队无需自建复杂的训练流水线。 ## 小结 IBS Software 的成功落地证明，在垂直领域（如货运物流）中，结合知识蒸馏与托管 AI 服务，是构建高精度、低成本、低延迟 NLP 解决方案的有效路径。对于正在探索类似双语 NER 场景的团队，这无疑是一个值得参考的标杆。

AWS ML15天前原文

微调 Amazon Nova 模型，实现精准邮件数据提取：准确率高达 94.77%，成本降低 50%

新上线

在电商物流领域，每天处理数百万封邮件并从中提取结构化数据是一项艰巨的任务。不同邮件格式（从简单通知到包含大量 JavaScript 元素的复杂 HTML 文档）给自动化提取带来了巨大挑战。模型幻觉、相似字段混淆（如订单号与追踪号）以及高昂的 Token 成本是常见痛点。 ## 微调方案：Amazon Nova + SageMaker AI AWS 的 **Amazon SageMaker AI** 提供了对 **Amazon Nova Micro** 和 **Nova Lite** 模型进行微调的能力。通过 **监督式微调 (SFT)** 与 **参数高效微调 (PEFT)** 技术（如低秩适应），可以在不牺牲性能的前提下大幅降低计算资源消耗。 ## 合作伙伴案例：Parcel Perform 电商物流体验平台 **Parcel Perform** 与 AWS 生成式 AI 创新中心 (GenAIIC) 合作，针对其邮件数据提取场景进行了模型优化。他们从业务问题出发，通过多种定制技术和参数优化，同时提升了准确性、延迟和成本三大指标。 ### 关键成果 - **提取准确率高达 94.77%**，相比基线提升了 **16.6 个百分点**。 - 微调后的 Nova Micro 模型推理延迟降低了 **30% 以上**。 - **成本减半**，同时性能与微调后的 Nova Lite 模型相当甚至更优。 Parcel Perform 已将该方案投入生产，用于改善其电商物流运营。 ## 技术要点与价值该方案的核心在于教会模型识别特定数据模式、区分相似字段（如订单号与追踪号），并更高效地处理信息。与从头训练或使用大型通用模型相比，微调 Nova 模型在保持高精度的同时，显著降低了推理成本和幻觉风险。对于每日处理海量邮件的企业而言，这种定制化微调提供了一条从“昂贵且不可靠”到“经济且精准”的路径。它不仅提升了自动化水平，还直接降低了运营成本，是 AI 落地实际业务的典型案例。

AWS ML15天前原文

为 Amazon Quick Sight BI 资产实施备份策略

新上线

在数据驱动的商业环境中，BI（商业智能）资产如仪表板、分析、数据集和数据源是企业决策的核心。Amazon Quick Sight 作为 Amazon Quick 中的 AI 驱动 BI 功能，支持自然语言查询和嵌入式分析，其资产的安全至关重要。本文介绍如何利用 **AssetsAsBundle API** 实施备份策略，防止意外删除、修改或区域中断。 ## 为什么需要备份？在金融、医疗、能源等高度监管行业，备份策略尤为关键： - **防止数据丢失**：抵御人为错误、误删或勒索软件攻击。 - **满足恢复目标**：帮助实现恢复点目标（RPO）和恢复时间目标（RTO）。 - **审计与报告**：跟踪资产生命周期（创建、更新、删除）。 - **提高工作负载弹性**：快速恢复系统，减少停机时间，符合 AWS Well-Architected Framework 的可靠性支柱。 - **灾难恢复准备**：为业务连续性计划（BCP）奠定基础。 ## 备份策略的核心步骤 1. **资产选择**：确定需要备份的 BI 资产类型，如仪表板、数据集等。 2. **使用 AssetsAsBundle API**：通过 API 将资产导出为可恢复的捆绑包。API 提供灵活的资产选择，支持细粒度控制。 3. **自动化工具**：本文提供示例代码，帮助快速启动备份流程。该工具可定期执行备份，并将资产存储在 Amazon S3 或其他持久化存储中。 ## 最佳实践建议 - **定期备份**：根据数据变更频率设置备份计划（如每日或每周）。 - **版本管理**：保留多个备份版本，以便回滚到特定时间点。 - **跨区域冗余**：将备份存储在多个 AWS 区域，防范区域性故障。 - **测试恢复**：定期演练恢复流程，确保备份可用。 ## 后续步骤本文是系列文章的第一部分，重点介绍备份。第二部分将详细说明如何利用备份进行恢复，包括完整恢复和选择性恢复。对于依赖 Quick Sight 支持关键业务决策的团队，一个精心设计的备份计划是必不可少的。立即开始评估你的资产，并采用 AssetsAsBundle API 构建备份自动化。

AWS ML16天前原文