AI 资讯

每日聚合最新人工智能动态

全部 🔥 精选 🆕 新上线 🔄 更新

来源：AWS ML清除筛选 ×

21

Amazon Nova Act 获得 HIPAA 合规资格，助力医疗 AI 自动化

新上线

Amazon Nova Act 现已符合 HIPAA 合规要求，可在医疗保健和生命科学领域处理受保护的健康信息（ePHI）。该服务支持部署自主浏览器 AI 代理，自动化复杂的工作流程，如理赔处理和转诊协调。本文介绍了 Nova Act 的核心功能、HIPAA 合规对代理型 AI 的重要性以及如何快速上手。 ## Amazon Nova Act 是什么？ Amazon Nova Act 是一项 AWS 服务，用于构建和管理可靠的 AI 代理集群，以大规模自动化生产环境中的 UI 工作流。Nova Act 能够在浏览器中完成重复性 UI 任务，并在适当时升级给人工监督员。它通过 API 调用、远程 Model Control Protocol（MCP）或代理框架（如 Strand Agents）与外部工具集成。用户可以通过自然语言和 Python 代码的组合来定义工作流。对于医疗组织而言，这意味着更少的行政负担、更快的理赔周转以及更一致的流程执行。 ## 为什么 HIPAA 合规对代理型 AI 至关重要？与仅生成文本的模型不同，代理型 AI 系统会与实时系统交互、访问数据并执行可能涉及受保护健康信息（PHI）的工作流。根据 AWS 的**责任共担模型**，AWS 负责底层基础设施的安全，而客户仍需负责配置控制措施以确保其部署符合 HIPAA 要求。 ## 医疗用例借助 HIPAA 合规资格，您现在可以自动化以下任务： - **预约安排**：在提供者和支付方门户中自动安排预约。 - **保险验证**：自动验证患者保险资格。 - **事先授权**：自动处理事先授权流程。 - **理赔管理**：在支付方网站上检查理赔状态、提交上诉并跟踪报销。 - **转诊跟踪**：在提供者之间发送和跟踪转诊。 - **合规报告**：从多个系统收集数据以进行合规报告。 ## 如何开始？要开始使用 Amazon Nova Act，请访问 AWS 管理控制台，创建代理并定义工作流。AWS 提供了详细的文档和示例代码，帮助您快速集成。请注意，HIPAA 合规需要您与 AWS 签订商业伙伴协议（BAA），并确保您的部署配置满足安全要求。 ## 总结 Amazon Nova Act 的 HIPAA 合规资格为医疗行业利用代理型 AI 自动化关键工作流打开了大门。通过减少手动操作，组织可以提高效率、降低成本并减少错误。随着 AI 在医疗领域的应用不断深入，合规性将成为推动广泛采用的关键因素。

AWS ML10天前原文

22

AI 代理驱动的智能放射科工作流优化

新上线

## 从规则引擎到智能代理：放射科工作流的范式转变传统放射科工作列表系统依赖僵化的规则引擎，无法考虑关键上下文——如放射科医生的专长、当前工作量、疲劳程度以及病例复杂性。这导致了一个普遍问题：医生倾向于挑选简单、高价值的病例，而回避复杂研究，造成诊断延迟和成本增加。一项涵盖 62 家医院、分析 220 万项研究的数据显示，低效的病例分配导致紧急病例平均延迟 **17.7 分钟**，并在医院网络中造成 **210 万至 420 万美元** 的额外成本。 ### 传统系统的三大缺陷 1. **静态专业匹配**：仅根据预设规则分配病例，忽略医生连续处理复杂病例数小时后的疲劳状态。 2. **被动负载均衡**：仅响应当前队列深度，而非根据病例复杂度、预计解读时间或医生疲劳模式进行前瞻性调度。 3. **缺乏学习能力**：当规则产生次优分配时，系统不会自动改进，低效模式会持续重复，直到人工更新逻辑。 ### AI 代理如何破局基于 **Amazon Bedrock AgentCore** 和 **Strands Agents SDK** 构建的 AI 代理系统，能够实时推理以下因素： - **团队专长**：动态匹配病例与最适合的亚专科医生。 - **工作负载与疲劳**：考虑医生连续工作时长和当前任务量，避免疲劳诊断。 - **病例复杂性**：根据影像类型、历史数据和紧急程度分配优先级。这种 **Agentic AI** 方案将放射科工作流从简单的任务管理提升为真正的自主编排——在正确的时间，将正确的病例无缝分配给正确的亚专科医生，让医生专注于诊断质量而非排队。 ### 行业实践与前景 **Radiology Partners** 已将此视为关键工作流能力，并与 AWS 合作推进落地。未来，此类系统有望显著减少诊断延迟、优化资源利用率，并降低医疗成本。对于医疗 IT 决策者而言，从规则引擎向智能代理的迁移，将是提升放射科运营效率的下一个突破口。

AWS ML10天前原文

23

用 Amazon Bedrock AgentCore Runtime 集成 AWS API MCP Server 与 Amazon Quick，打造自然语言 AI 运维助手

新上线

随着 AWS 基础设施的扩展，运维工作流日益复杂。SRE 和 DevOps 工程师常常需要在 AWS 管理控制台、CLI 文档和多个服务仪表盘之间频繁切换，手动将业务问题翻译成正确的 API 语法，并在不同服务间串联调用。这种摩擦在事故排查、容量规划和安全审计等场景中尤为突出。本篇文章介绍如何利用 **Amazon Bedrock AgentCore Runtime** 对 **Model Context Protocol (MCP)** 的支持，将 **Amazon Quick** 与 AWS 服务通过 **AWS API MCP Server** 连接起来，构建一个能够将自然语言直接转化为 AWS CLI 命令的对话式 AI 助手，从而减少关键时刻的工具切换。 ### 解决方案概览借助 Amazon Bedrock AgentCore Runtime 和 MCP，用户可以用自然语言提问，例如“显示 us-east-1 区域所有正在运行的 EC2 实例”，系统即可直接调用 AWS API 返回结果，无需记忆复杂的 CLI 语法。所有请求都运行在现有 IAM 权限范围内，并通过 Amazon CloudWatch 保留完整的审计轨迹，便于合规。架构流程如下： 1. **用户提问**：在 Amazon Quick 中以自然语言输入问题。 2. **身份认证**：Amazon Cognito 通过 OAuth 2.0 客户端凭证流程获取 JWT 令牌。 3. **智能代理**：Amazon Quick 的自定义代理解析用户意图。 4. **连接 AWS API MCP Server**：认证后的请求通过 Amazon Bedrock AgentCore Runtime 发送至 AWS API MCP Server，执行相应的 API 调用。 ### 实际应用场景 - **日常运维**：快速查询资源状态、日志或策略配置。 - **故障排查**：跨服务关联分析，无需手动拼接数据。 - **容量规划**：自动汇总多个服务的指标。 - **安全审计**：标准化 API 调用序列，提升可重复性。 ### 关键优势 - **降低认知负荷**：用自然语言代替复杂命令，减少上下文切换。 - **安全可控**：严格遵循 IAM 权限，审计日志完整。 - **可复用集成**：通过统一的 MCP 标准，避免为每个工作流重复构建连接逻辑。这一方案为 AWS 运维团队提供了一种更高效、更智能的工作方式，让 AI 真正成为运维流程中的得力助手。

AWS ML10天前原文

24

使用 Amazon Bedrock AgentCore 构建多租户智能体：设计考与架构指南

新上线

随着 SaaS 提供商加速将 AI 智能体（Agent）融入产品，多租户架构的复杂性成为从原型到生产的关键瓶颈。近日，AWS 官方博客发布系列文章，深入探讨如何利用 **Amazon Bedrock AgentCore** 构建安全、高效的多租户智能体应用。本文为系列第一篇，聚焦核心设计考量与隔离模式选择。 ## 多租户智能体的三大挑战与传统 SaaS 应用不同，多租户智能体系统除了要解决安全、治理和响应准确性等常规问题，还必须应对**租户隔离**、**租户身份**、**可观测性**、**数据隔离**、**成本归属**以及**噪声邻居（noisy neighbor）** 缓解等独特挑战。这些因素直接决定了系统能否在生产环境中稳定运行。 Amazon Bedrock AgentCore 是一项托管的无服务器服务，专门用于构建、部署和运营智能体应用。它内置了身份管理、记忆、可观测性和评估等能力，旨在简化多租户架构的搭建。 ## 核心设计考量：三大隔离模式文章提出了多租户智能体架构中需要权衡的关键组件，并围绕三种隔离模式展开：**Silo（竖井）**、**Pool（池化）** 和 **Bridge（桥接）**。 - **Silo 模式**：为每个租户部署独立的运行时环境，提供最强的噪声邻居防护和合规审计能力，但成本较高。 - **Pool 模式**：所有租户共享同一容器镜像和进程池，降低基础设施开销，但要求严格的进程内租户上下文传递。 - **Bridge 模式**：介于两者之间，通过部分共享实现成本与隔离的平衡。 ## Agent 运行时部署：专属 vs 共享一个关键决策点是 Agent 运行时的部署方式。**专属运行时**为每个租户实例化独立的执行环境，拥有自己的容器镜像、进程空间和生命周期；**共享运行时**则将所有租户的 Agent 置于同一进程池中。Amazon Bedrock AgentCore 通过 **会话管理** 机制解决了这一矛盾——它允许在共享基础设施上实现逻辑隔离，同时保持高性能和低延迟。 ## 租户身份与数据隔离在多租户智能体中，**租户身份**必须贯穿整个请求链路。AgentCore 支持将租户 ID 嵌入每个请求，确保下游服务（如知识库、API 调用）能够正确区分数据归属。**数据隔离**则通过分层存储策略实现：敏感数据按租户加密存储，共享数据通过访问控制列表（ACL）限制。 ## 可观测性与成本归属 **可观测性**是多租户系统的难点。AgentCore 集成了 AWS CloudWatch，能够按租户维度记录调用次数、Token 消耗、错误率等指标，帮助运营商快速定位问题。**成本归属**则通过标签（Tagging）机制实现，每个租户的推理和存储消耗都能精确追踪，便于计费分摊。 ## 总结与展望构建生产级多租户智能体应用，必须从设计之初就考虑隔离、身份和可观测性。Amazon Bedrock AgentCore 通过托管运行时、内置会话管理和细粒度监控，大幅降低了实现难度。本文为系列开篇，后续文章将进一步探讨具体实现模式与最佳实践。

AWS ML10天前原文

25

突破上下文窗口限制：用 Amazon Bedrock AgentCore 处理超长文档

新上线

在处理数百万字符的文档时，传统大语言模型（LLM）的上下文窗口往往成为瓶颈。即使是最长的上下文窗口，也可能因输入过长而拒绝请求，或产生基于不完整信息的回答。本文介绍了如何利用 **Amazon Bedrock AgentCore Code Interpreter** 和 **Strands Agents SDK** 实现**递归语言模型（RLM）**，从而突破这一限制。 ## 为什么上下文窗口不够用？以金融分析为例，比较一家公司两年年报中的指标。每份报告 300–500 页，加上分析师报告、SEC 文件等，总字符数可达数百万。直接输入模型时，要么超出上下文窗口限制而失败，要么虽然“塞入”但模型难以关注中间部分的信息——这就是著名的 **“lost in the middle”** 问题。上下文窗口大小是一个硬限制，单纯通过提示工程无法解决。我们需要一种将文档大小与模型上下文窗口解耦的方法。 ## RLM：将上下文视为环境 RLM 由 Zhang 等人在 arXiv:2512.24601 中提出，它重新定义了问题：不将整个文档喂给模型，而是将输入视为一个**外部环境**，模型通过编程方式与之交互。模型只接收查询和环境描述，然后编写代码来搜索、切片、迭代分析文档。当需要理解某个特定部分的语义时，模型会委托给**子 LLM 调用**，并将结果保存在工作记忆中。 ## 实现方式通过 **Bedrock AgentCore Code Interpreter**，你可以： - 处理任意长度的文档，无上下文窗口上限。 - 将 Code Interpreter 作为**持久工作记忆**，进行迭代式文档分析。 - 在沙盒化 Python 环境中编排子 LLM 调用，分析特定文档片段。具体流程如图 1 所示：根 LLM 生成代码探索文档环境，将语义分析委托给子 LLM，并将结果累积在工作记忆中，然后优化下一步操作。 ## 实际价值这种递归方法不仅突破了上下文窗口的硬限制，还避免了“lost in the middle”问题。对于金融、法律、学术研究等需要处理超长文档的领域，RLM 提供了一种可扩展的解决方案。Amazon Bedrock AgentCore 和 Strands Agents SDK 的组合，让开发者能够快速构建这类应用，而无需从头实现复杂的工作流。 ## 小结上下文窗口不再应该是文档分析的瓶颈。通过递归语言模型和 Amazon Bedrock AgentCore，你可以将文档处理能力提升到新的水平。无论是百万字符的报告还是多文件集合，RLM 都能让你在不丢失信息的前提下进行深入分析。

AWS ML10天前原文

26

用 Amazon Bedrock AgentCore 构建商业智能 AI 代理：OPLOG 的实践与成效

新上线

## 从数据孤岛到实时洞察：OPLOG 的 AI 代理实践在电商与物流行业，数据碎片化是普遍挑战。土耳其科技驱动型履约公司 OPLOG 每月处理数百万件商品，服务横跨土耳其、英国和德国的多个品牌与全球市场。然而，其业务数据分散在 Hubspot CRM、通信系统、Microsoft Teams 以及 Databricks 数据仓库中，导致传统商业智能（BI）系统难以提供及时、全面的洞察。为破解这一困局，OPLOG 基于 **Amazon Bedrock AgentCore** 构建了一套由 AI 代理驱动的生产级 BI 系统。该系统利用 **Strands Agents SDK** 开发了三个专用 AI 代理，分别负责**销售管道管理**、**数据质量管控**和**潜在客户调研**，并集成了 **Anthropic 的 Claude Sonnet** 模型与 **Amazon Bedrock Knowledge Bases** 实现检索增强生成（RAG）。 ### 核心架构与实现三个 AI 代理分工明确： - **销售管道代理**：自动从 Hubspot CRM 抓取销售阶段数据，结合客户沟通记录与团队聊天上下文，自动更新交易状态、识别瓶颈，并生成每周预测报告。 - **数据质量代理**：持续监控 CRM 中的字段完整性、重复记录和异常值，自动触发数据清洗工作流，将数据完整度从 70% 提升至 91%。 - **调研代理**：针对潜在客户，自动从公开数据源和内部知识库中提取公司背景、行业趋势和竞品信息，生成结构化的客户画像，将人工调研时间缩短 98%。所有代理通过 **Amazon Bedrock AgentCore** 统一管理，利用 Claude Sonnet 的推理能力进行任务分解与决策，并通过 **RAG** 机制从 Amazon Bedrock Knowledge Bases 中检索最新的业务文档和交易记录，确保输出基于实时数据。 ### 业务成效：数据驱动决策的闭环 OPLOG 的实践证明了 AI 代理在 BI 场景中的巨大价值： - **销售周期缩短 35%**：代理实时更新管道状态，销售团队能立即跟进高价值机会，避免因信息滞后导致的丢单。 - **CRM 数据完整性提升 91%**：自动化数据校验与补全大幅减少了人工录入错误，为后续分析提供可靠基础。 - **人工调研时间减少 98%**：调研代理将原本需要数小时的客户背景调查压缩至几分钟，让销售团队专注于高价值互动。 ### 行业启示：AI 代理重塑 BI 范式 OPLOG 的案例并非孤例。随着企业数据量激增，传统 BI 工具（如报表与仪表盘）已难以满足实时、交互式的决策需求。AI 代理通过**自主感知、推理与行动**，能够主动发现数据异常、触发工作流并生成可执行的洞察，将 BI 从“被动查询”升级为“主动服务”。结合 **Amazon Bedrock AgentCore** 的托管能力，企业无需自建复杂的代理编排系统，即可快速集成大语言模型、知识库和业务 API。对于面临类似数据碎片化问题的 B2B 组织而言，这一架构提供了一条低门槛、高回报的落地路径。 > 提醒：本文基于 AWS 官方博客内容整理，所有数据均来自 OPLOG 的实际运营结果。

AWS ML10天前原文

27

用 Amazon Bedrock 打造 AI 招聘助手：简历解析、智能评分与面试题生成

新上线

## 当招聘变成“体力活”：AI 如何破局？一份针对 748 名 HR 领导者的调查显示，招聘人员平均在每个职位空缺上花费 **17.7 小时** 处理行政事务——相当于两个多工作日。另一项 2024 年的 SmartRecruiters 调查发现，**45% 的人才招聘负责人** 超过一半的工作时间花在可自动化的任务上。这种行政负担导致简历筛选流于表面，大量合格候选人被忽略，而匹配结果往往取决于简历格式和关键词密度，而非真实能力。 ## 架构解析：Serverless + 大模型 + 安全护栏 AWS 近期发布了一篇技术博客，详细展示了如何利用 **Amazon Bedrock** 构建一套 AI 驱动的招聘助手。这套参考架构（非生产就绪方案）整合了多个 AWS 服务，形成一个协同工作的无服务器系统： - **Amazon Bedrock Converse API + Amazon Nova Pro**：负责核心的 AI 推理，包括简历解析、候选人评分、技能评估和面试题生成。 - **AWS Lambda**：处理业务逻辑，串联各个模块。 - **Amazon API Gateway**：提供 API 路由。 - **Amazon DynamoDB & Amazon S3**：分别存储结构化数据（如评分结果）和原始简历文件。 - **Amazon Bedrock Guardrails**：提供 **PII 匿名化、提示词攻击检测和偏见内容过滤**，确保 AI 应用负责任地运行。前端方面，使用 **AWS Amplify** 托管 Web 应用，**Amazon Cognito** 处理用户认证与 JWT 令牌管理。 ## 核心能力：从简历到面试题的全链路智能化 1. **简历解析与多维评分**：AI 不仅提取基本信息，还能基于职位要求计算 **多维度兼容性分数**，避免“关键词堆砌”式的误判。 2. **个性化面试题生成**：根据候选人的背景和岗位需求，动态生成有针对性的面试问题，帮助面试官深入考察真实能力。 3. **数据驱动的洞察**：所有评估结果以结构化数据存储，方便后续分析和决策。 ## 行业背景与思考当前，AI 在招聘领域的应用已从简单的关键词匹配走向 **深度语义理解与推理**。Amazon Bedrock 提供的托管大模型服务，让企业无需自建基础设施即可调用前沿模型，同时通过 Guardrails 解决合规与伦理问题——这对处理敏感个人数据的 HR 场景尤为重要。不过，博客也明确指出，这套架构仅用于 **学习目的**，并非生产就绪方案。实际落地时，企业需要根据自身需求调整，例如增加更严格的隐私保护措施、优化成本控制，或与现有 ATS（申请人追踪系统）集成。 ## 小结 AI 招聘助手并非要取代人类面试官，而是将 HR 从繁琐的行政工作中解放出来，让他们专注于更有价值的决策——比如判断候选人的文化契合度、软技能和发展潜力。随着 Amazon Bedrock 等平台降低了大模型的使用门槛，这类智能化工具将加速进入中小企业，改变整个招聘行业的效率格局。

AWS ML10天前原文

28

在 Amazon Bedrock AgentCore 上用 NLP 构建 AI 驱动的仪表板自动化代理

新上线

## 概述传统上，业务分析师在调整仪表板以响应变化的需求时，往往需要等待数天。典型的流程涉及向 IT 团队提交修改请求，由 IT 人员解读需求、查阅 API 文档、理解表结构并部署变更。虽然这种方式能保证适当的监督和质量控制，但在需要快速更新仪表板时，可能导致数天的周转时间。本文介绍的方案结合了 **Amazon Bedrock AgentCore**、**Strands Agents** 和 **Amazon QuickSight** 的强大功能，构建了一个安全、可扩展且智能的系统，用于创建和运行 AI 代理，同时将数据转化为可执行的业务洞察。 ## 解决方案架构该方案采用基于 Amazon Bedrock AgentCore 和 Strands 框架的多智能体架构。Amazon Bedrock AgentCore 是一个智能体平台，用于安全地大规模构建、部署和运行高效代理，无需管理基础设施。Strands Agents 是一个代码优先的框架，用于构建与 AWS 服务集成的代理。Amazon QuickSight 则提供 AI 驱动的 BI 能力，将分散的数据转化为战略洞察。架构由三个专门代理协作组成： - **查找仪表板代理**：执行发现操作，包括搜索仪表板、检索仪表板和数据集中的列元数据。 - **修改仪表板代理**：执行配置变更，如验证列、更新表格视觉效果以及创建新的仪表板版本。 - **编排代理**：根据意图分类，将用户请求路由到相应的专门代理。 ## 工作流程编排代理作为用户交互的入口。当用户提交自然语言查询（例如“将 lastname 添加到测试仪表板”）时，Amazon Nova 将请求分类为对话型或操作型。对话型查询直接利用 Nova 的大语言模型能力进行响应；操作型请求则通过 Strands 框架路由到相应的专门代理进行处理。 ## 行业背景与价值在 AI 行业，将自然语言处理与智能代理结合，正在重新定义企业与数据交互的方式。这一方案不仅缩短了仪表板修改的周期，还降低了非技术用户的使用门槛。业务分析师无需掌握技术细节，即可通过自然语言指令完成复杂的仪表板操作，从而加速决策过程。该方案体现了 **Agentic AI** 在商业智能领域的落地潜力：通过多代理协作，将意图识别、任务分解与执行自动化融为一体。Amazon Bedrock AgentCore 提供的安全性和动态扩展能力，确保了生产级部署的可靠性。 ## 关键优势 - **效率提升**：将仪表板修改时间从天级缩短至分钟级。 - **自然语言交互**：用户无需学习特定命令或 API。 - **安全可控**：代理访问权限和数据操作受到严格管理。 - **可扩展性**：基于微服务架构，易于添加新的代理或功能。 ## 总结通过 Amazon Bedrock AgentCore、Strands Agents 和 Amazon QuickSight 的组合，企业可以构建一个智能的仪表板自动化系统，让数据分析师和业务用户都能以更自然、更高效的方式获取洞察。这不仅是技术上的进步，更是企业数据文化向自助式、即时响应方向转型的重要一步。

AWS ML10天前原文

29

亚马逊 SageMaker AI 端点现支持 OpenAI 兼容 API，无缝对接现有 AI 应用

新上线

亚马逊云科技今日宣布，Amazon SageMaker AI 实时推理端点正式支持 OpenAI 兼容 API。这意味着使用 OpenAI SDK、LangChain 或 Strands Agents 等框架的开发者，只需修改端点 URL，即可直接调用 SageMaker AI 上托管的模型，无需编写自定义客户端、SigV4 签名包装器或重写代码。 ## 核心变化：一条 /openai/v1 路径打通壁垒 SageMaker AI 端点现在暴露一个 **/openai/v1** 路径，原生接受 Chat Completions 格式的请求，并返回包含流式响应在内的标准回复。该功能对所有使用标准 SageMaker AI API 创建的端点和推理组件自动生效。SageMaker AI 会根据 URL 中的端点名称进行路由，因此任何 OpenAI 兼容的客户端都能即插即用。此外，用户现在可以为端点创建**限时 bearer 令牌**，直接用于 OpenAI 客户端，进一步简化了认证流程。 ## 三大典型应用场景 ### 1. 自有基础设施上的智能体工作流如果你使用 Strands Agents 或 LangChain 构建多步骤 AI 智能体，现在可以将这些工作流完全运行在自己的 SageMaker AI 端点上。智能体调用模型时沿用同一套 OpenAI 兼容接口，但推理实际运行在用户账户内的专用 GPU 实例上，兼顾性能与数据安全。 ### 2. 多模型统一托管，单一接口调用如果需要运行多个模型——例如 Llama 处理通用任务、微调版 Mistral 处理领域问题、小模型做分类——可以将它们全部托管在单个 SageMaker AI 端点上，通过推理组件分配独立资源。每个模型都可通过同一个 OpenAI SDK 调用，应用代码中无需维护多套 API 客户端或路由逻辑。 ### 3. 微调模型零代码改造上线针对特定场景微调的开源模型，可直接部署到 SageMaker AI 并通过 OpenAI 兼容接口调用。应用程序只需修改端点 URL，无需任何代码改动，即可享受微调模型的定制能力。 ## 行业视角：降低云上推理的迁移成本长期以来，AWS 用户若想将 OpenAI 生态中开发的应用迁移到自托管模型，往往需要额外开发 SigV4 签名层或适配自定义 SDK。此次更新直接消除了这一障碍，使得 **SageMaker AI 成为 OpenAI 生态系统的“一等公民”**。对于已投资 Agent 框架和 LLM 网关的企业，这意味着可以在不改变架构的前提下，灵活切换底层推理供应商，或将部分工作负载迁入自有账户以控制成本与延迟。 Caffeine.AI 的 AI/ML 工程师 Giorgio Piatti 在公告中表示：“我们运行 AI 编码智能体，通过一个兼容 OpenAI 聊天补全协议的 LLM 网关使用多个提供商。bearer 令牌功能让我们能将 SageMaker 作为即插即用的 OpenAI 兼容推理端点加入，无需自定义 SigV4 签名，原生适配我们的网关、Vercel AI SDK 和标准 OpenAI 客户端。” ## 快速上手 AWS 官方提供了配套 Jupyter Notebook（[GitHub 仓库](https://github.com/aws-samples/)），演示从部署到调用的完整流程。用户可以通过标准 SageMaker API 创建端点，获取 bearer 令牌后，在 OpenAI 客户端中将 `base_url` 设置为 `https://<endpoint-url>/openai/v1` 即可开始使用。此次更新标志着 AWS 在**模型服务兼容性**上的重要一步——不强迫用户锁定在特定 SDK，而是主动适配业界最广泛使用的接口标准。对于正在构建多模型、多提供商 AI 系统的团队来说，这无疑降低了架构复杂度与运维成本。

AWS ML11天前原文

30

多模态评估器：用 MLLM 作为裁判评估图像到文本任务

新上线

在构建视觉购物、图像或文档理解、图表分析等应用时，如何验证模型输出是否真正基于源图像是一大挑战。纯文本评估器无法判断描述是否忠实反映图像、提取的发票金额是否与文档一致，或屏幕摘要是否虚构了不存在的按钮。Gartner 预测，到 2030 年，80% 的企业软件将具备多模态能力，而 2024 年这一比例还不足 10%。缺乏自动化多模态评估，企业只能在昂贵的人工审核和不可靠的纯文本代理之间左右为难。如今，AWS 在 Strands Evals SDK 中推出了四种新的多模态大语言模型（MLLM）作为裁判的评估器，专门用于图像到文本任务：**Overall Quality**（整体质量）、**Correctness**（正确性）、**Faithfulness**（忠实性）和 **Instruction Following**（指令遵循）。每个评估器都会根据源图像对模型输出进行评分。评估器将图像直接发送给多模态裁判模型，同时附上查询、响应以及可选的参考答案。裁判模型返回基于图像的分数以及推理过程字符串，便于调试。这些评估器可以无缝替换现有 Strands Evals 工作流中的纯文本评估器，并集成到持续集成（CI）中，自动捕捉视觉幻觉、事实错误和指令违规。本文将介绍如何设置这四种多模态评估器并运行图像到文本任务；如何在有参考和无参考评估之间切换；如何为特定领域标准编写自定义多模态评估标准；如何在 Amazon Bedrock 上选择平衡准确性、成本和延迟的裁判模型；以及如何应用提示设计选择来提升评估器与人类判断的一致性。 ## 设置与使用首先，确保已安装 Python 3.10 或更高版本。通过 Strands Evals SDK 可以快速调用这些评估器。示例代码如下： ```python from strands_evals import MultimodalEvaluator evaluator = MultimodalEvaluator( judge_model="anthropic.claude-3-sonnet-20240229-v1:0", evaluator_type="faithfulness" ) result = evaluator.evaluate( image_path="invoice.jpg", query="提取发票总金额", response="总金额为 $123.45", reference="$123.45" # 可选 ) print(result.score, result.reasoning) ``` ## 自定义多模态评估标准若需针对特定领域制定标准，可编写自定义评估标准。例如，在医疗影像报告中，可以定义“报告必须描述病变位置和大小”等规则，评估器将据此打分。 ## 选择裁判模型 Amazon Bedrock 提供了多种多模态模型，如 Claude 3 Sonnet、Claude 3 Haiku 等。**Claude 3 Sonnet** 在准确性和延迟之间取得了良好平衡，适合大多数场景；而 **Claude 3 Haiku** 则更注重成本效益。用户可根据任务需求灵活选择。 ## 提示设计技巧实验表明，在提示中加入“逐步推理”指令（如“请先描述图像内容，再评估回答”）可以显著提升评估器与人类判断的一致性。此外，明确要求模型输出评分理由，有助于调试和审计。通过引入多模态评估器，开发者可以更可靠地自动化评估图像到文本任务的输出质量，减少人工干预，加速 AI 应用的落地。

AWS ML11天前原文

31

使用 Amazon SageMaker AI 和 vLLM 构建实时语音应用

新上线

实时语音转写是语音助手、直播字幕、联络中心分析和无障碍工具等应用的核心能力。传统请求-响应推理需要等待完整音频上传后才能开始转写，这引入的延迟破坏了实时体验。从 2025 年 11 月起，Amazon SageMaker AI 支持双向流式推理，允许客户端与模型容器之间持续双向传输数据。同时，vLLM 通过其 Realtime API（基于 WebSocket 的双向流）支持实时音频转写。本文将两者结合，展示如何使用 SageMaker AI 的 vLLM 容器部署 Mistral AI 的 Voxtral-Mini-4B-Realtime-2602 模型，构建一个完全托管的实时语音转文本服务。 ## 关键特性构建生产级语音 AI 应用需要多个基础设施组件紧密配合，并满足严格的延迟要求。SageMaker AI 和 vLLM 各自解决了不同部分的问题： - **实时语音模型与高效 GPU 服务**：核心是能够增量处理音频的 ASR 模型，vLLM 通过其 Realtime API（原生 WebSocket 端点 `/v1/realtime`）提供支持，并采用分段 CUDA 图执行减少 GPU 内核启动开销，从而降低流式转写中的每 token 延迟。 - **双向流式推理**：SageMaker AI 支持双向流，客户端可同时发送音频并接收转写结果，无需等待完整音频。 - **完全托管与可扩展**：SageMaker AI 负责基础设施管理，包括自动缩放、监控和安全性。 ## 部署步骤 1. **准备模型**：从 Hugging Face 获取 Voxtral-Mini-4B-Realtime-2602 模型，并将其打包为适用于 vLLM 的格式。 2. **创建 SageMaker 端点**：使用 SageMaker SDK 创建一个启用了双向流的端点，指定 vLLM 容器镜像。 3. **配置 WebSocket 客户端**：客户端通过 WebSocket 连接到端点，持续发送音频数据并接收实时转写结果。完整示例代码可在 [GitHub 仓库](https://github.com/aws-samples/amazon-sagemaker-ai-vllm-realtime) 中找到。 ## 性能与优势相比传统方法，该方案显著降低了端到端延迟。例如，在语音助手场景中，用户说话后几乎立即看到转写文本，交互更加自然。此外，SageMaker AI 的托管特性减少了运维负担，而 vLLM 的开源特性允许用户灵活调整模型配置、量化和编译设置。 ## 应用场景 - **语音助手**：实时理解用户指令并快速响应。 - **直播字幕**：为直播视频生成实时字幕。 - **联络中心分析**：实时转写客户通话，进行情感分析或合规检查。 - **无障碍工具**：帮助听障人士实时获取语音信息。这一组合为开发者提供了构建实时语音应用的高性能、低成本方案，推动了 AI 语音技术的普及。

AWS ML11天前原文

32

使用 Amazon Nova Sonic 打造可扩展语音代理：多代理、工具与会话分割设计模式

新上线

在构建语音代理时，延迟、实时音频管理以及多代理协调是常见挑战。本文介绍了如何利用 **Amazon Nova Sonic**、**Amazon Bedrock AgentCore** 和 **Strands BidiAgent** 来设计可扩展且低延迟的语音代理系统。文章重点探讨了三种主流架构模式：**工具模式**、**代理即工具（子代理）模式** 和 **会话分割模式**，并分析了各自的权衡与最佳实践。 ## 关键组件概览 - **Amazon Nova Sonic**：一种基础模型，支持实时、自然的语音到语音对话，能理解语气并保持流畅交互。 - **Amazon Bedrock AgentCore Runtime**：无服务器托管环境，提供双向 WebSocket 流、微 VM 级会话隔离（避免“吵闹邻居”延迟尖峰）、基于 MCP 协议的共享工具托管以及持久化内存。 - **Strands BidiAgent**：开源框架中的集成类，负责管理双向流生命周期、路由工具调用和处理会话管理，简化与 Nova Sonic 的对接。 ## 三种架构模式详解 ### 1. 工具模式（Tool Pattern）将功能封装为独立工具，代理通过调用工具执行具体任务。这种模式适合功能明确、调用链简单的场景，易于维护和测试。 ### 2. 代理即工具模式（Agent-as-Tool / Sub-Agent）将子代理作为工具集成到主代理中。每个子代理拥有独立的提示词、记忆和权限，适合处理复杂子任务（如订单查询、退款处理）。主代理负责路由请求，子代理专注执行，从而降低单个代理的复杂度。 ### 3. 会话分割模式（Session Segmentation）通过隔离不同会话的提示词、内存和权限，避免上下文污染和权限泄露。AgentCore 的微 VM 隔离天然支持此模式，确保每个会话独立运行，提升安全性与并发性能。 ## 最佳实践：降低延迟 - **使用 WebSocket 流**：避免 HTTP 轮询，减少往返时间。 - **微 VM 隔离**：防止高负载代理影响其他会话。 - **工具预加载**：通过 AgentCore Gateway 共享工具实例，减少冷启动。 - **异步处理**：非关键操作（如日志记录）异步执行，不阻塞对话流。 ## 小结通过组合这三种模式，团队可以构建出既灵活又高性能的语音代理系统。Amazon Nova Sonic 提供实时语音能力，Bedrock AgentCore 解决托管和隔离问题，Strands BidiAgent 简化集成。对于需要处理复杂工作流的企业，这些设计模式是实现规模化语音交互的关键。

AWS ML12天前原文

33

在Kiro CLI中通过Amazon Bedrock AgentCore Memory扩展对话记忆能力

新上线

## 当终端遇上记忆：Kiro CLI如何借助Amazon Bedrock实现上下文感知对话在AI Agent快速迭代的当下，**对话记忆**已成为衡量智能助手成熟度的关键指标。近日，AWS发布了一项技术实践：通过自定义**模型上下文协议（MCP）** 服务器，将**Amazon Bedrock AgentCore Memory**与**Kiro CLI**深度集成，让终端内的AI对话不再“失忆”。 ### 痛点：终端里的“金鱼记忆” Kiro CLI作为一款命令行工具，允许开发者直接与Kiro的AI Agent交互。然而，传统CLI模式下的会话往往是“一次性”的——每次对话都被视为独立事件，无法保留上下文。例如，当用户询问“刚才提到的那个API端点是什么？”时，Agent可能一脸茫然。这种**无状态交互**严重限制了复杂任务链的构建，比如多轮调试、配置迭代或跨会话项目管理。 ### 解法：MCP服务器与托管记忆的联姻 Amazon Bedrock AgentCore Memory是AWS推出的**全托管记忆服务**，专为AI Agent设计。它能够自动存储、检索和更新来自历史对话的关键信息，使Agent具备“长期记忆”。而MCP则是一种标准化协议，用于定义Agent与外部工具或数据源之间的交互方式。在这套方案中，开发者需要做的是： 1. **构建一个自定义MCP服务器**，作为Kiro CLI与Bedrock AgentCore Memory之间的桥梁。 2. 在MCP服务器中实现**记忆读写接口**，将Kiro CLI生成的对话内容同步至Bedrock的托管记忆存储。 3. 当新对话开始时，Agent通过MCP服务器自动检索相关历史记忆，实现上下文延续。 ### 落地价值：从“单次问答”到“持续协作” 集成后，Kiro CLI的使用体验将发生本质变化： - **跨会话连贯性**：用户可以在不同时间点继续同一话题，Agent能准确引用之前的结论或代码片段。 - **任务断点续传**：若调试过程中终端意外关闭，重新启动后Agent仍能“记住”之前的错误日志和修复步骤。 - **个性化适应**：Agent能根据用户长期的使用习惯（如偏好某种代码风格、常用命令组合）给出更贴切的建议。 ### 行业视角：记忆是Agent走向“智能体”的必由之路当前，AI Agent正从“工具调用者”向“自主工作者”演进，而**持久化记忆**正是这一跃迁的核心基础设施。无论是OpenAI的Assistants API中的线程机制，还是LangChain的记忆模块，业界都在试图解决同一个问题：如何让AI在长时间跨度内保持一致的“人格”与知识状态。 AWS此次通过MCP协议将托管记忆能力开放给Kiro CLI，本质上是在**降低记忆功能的集成门槛**——开发者无需自建向量数据库或管理会话状态，即可为命令行工具赋予企业级的记忆能力。这对于运维自动化、DevOps流水线、以及需要长期上下文支持的开发辅助场景，具有显著的实际意义。 ### 总结 Kiro CLI + Amazon Bedrock AgentCore Memory的组合，展示了**托管服务+标准化协议**在AI工程化中的典型应用模式。对于追求高效与智能的开发者而言，让终端记住每一次对话，或许就是下一轮生产力提升的起点。

AWS ML12天前原文

34

Amazon SageMaker Feature Store 新能力加速机器学习特征管道

新上线

亚马逊云科技今日宣布，**SageMaker Python SDK v3.8.0** 为 SageMaker Feature Store 带来三项新能力，旨在帮助数据科学家和工程师更高效地构建、管理和使用机器学习特征管道。这些新功能聚焦于简化特征工程工作流、增强数据治理以及提升查询性能。 ### 新能力一：与 AWS Lake Formation 集成，强化数据治理第一项新能力是 **SageMaker Feature Store 与 AWS Lake Formation 的深度集成**。通过这一集成，用户可以在特征组（Feature Group）级别应用细粒度的访问控制策略。Lake Formation 提供基于属性的访问控制（ABAC）和行级安全，使得团队能够安全地共享特征数据，同时遵守合规要求。例如，数据管理员可以设定规则，仅允许特定用户或角色访问包含敏感信息的特征列，而其他列则对更广泛的团队开放。 ### 新能力二：支持 Apache Iceberg 表属性，优化存储与查询第二项能力是 **SageMaker Feature Store 现在支持 Apache Iceberg 表属性**。Iceberg 是一种开源表格式，专为大规模数据分析设计，支持 ACID 事务、快照和模式演进。通过在 Feature Store 中启用 Iceberg 表属性，用户可以享受以下好处： - **更快的查询性能**：Iceberg 的分区修剪和列式存储优化可显著减少扫描数据量。 - **时间旅行查询**：能够回溯到特定时间点的特征数据版本，便于模型调试和重现。 - **自动表维护**：Iceberg 的压缩和清理机制减少了存储成本并提高了查询效率。 ### 新能力三：增强的 Python SDK 功能，简化开发体验第三项新能力体现在 **SageMaker Python SDK v3.8.0 的更新**，包括更简洁的 API、更好的错误处理以及更丰富的文档。例如，现在可以通过更少的代码行创建和管理特征组，并直接与 Iceberg 表交互。此外，SDK 还支持将特征数据直接写入 S3 中的 Iceberg 格式，无需额外配置。 ### 实际应用场景与价值这些新能力对机器学习团队意味着什么？以金融风控场景为例，特征工程团队需要频繁更新欺诈检测模型的特征，同时确保敏感客户数据不被滥用。通过 Lake Formation 集成，可以轻松定义哪些分析师能访问哪些特征；而 Iceberg 支持则让历史特征回滚变得简单，便于模型审计。对于希望快速上手的用户，亚马逊云科技提供了 **完整的端到端示例笔记本**（位于 SageMaker Python SDK 仓库中），涵盖 Lake Formation 治理配置和 Iceberg 表属性设置。开发者可以直接克隆这些笔记本，在自己的 AWS 环境中进行测试。 ### 小结此次更新标志着 **SageMaker Feature Store 在数据治理和性能优化上迈出重要一步**。随着机器学习模型对特征质量和时效性的要求日益提高，这些工具能帮助团队减少基础设施管理负担，将更多精力投入到特征创新和模型迭代中。建议用户升级到最新 SDK，并参考官方笔记本探索新功能。

AWS ML12天前原文

35

在 Amazon Bedrock 上实现编程式工具调用

新上线

在 AI 应用开发中，让大语言模型（LLM）能够自主调用外部工具是释放其能力的关键。Amazon Bedrock 近期推出的编程式工具调用（Programmatic Tool Calling, PTC）功能，正为开发者提供了一条更灵活、可控的路径。本文将通过三种实现方式，展示如何利用 PTC 构建可执行代码的 AI 代理。 ## 什么是编程式工具调用？传统的工具调用中，模型仅返回工具名称和参数，由应用层负责执行。而 **PTC 允许模型直接生成可执行的代码片段（如 Python 脚本）**，并在安全沙箱中运行，从而实现更复杂的逻辑，比如数据处理、API 调用链或动态决策。 ## 三种实现路径对比 ### 1. 自托管 Docker 沙箱（ECS） - **适用场景**：需要完全控制执行环境、网络策略或使用自定义运行时。 - **实现方式**：在 Amazon ECS 上部署 Docker 容器作为沙箱，通过 Bedrock 的响应触发容器内的代码执行。 - **优势**：最大灵活性，可集成私有库、GPU 资源等。 - **代价**：需自行维护基础设施，处理安全隔离和扩缩容。 ### 2. 托管解决方案（Bedrock AgentCore Code Interpreter） - **适用场景**：希望快速集成，无需管理底层环境。 - **实现方式**：直接使用 Bedrock 内置的 **AgentCore Code Interpreter**，模型生成的代码在 AWS 托管的沙箱中自动执行。 - **优势**：零运维，自动安全隔离，支持 Python 标准库。 - **限制**：无法安装第三方包或访问外部网络（默认配置）。 ### 3. Anthropic SDK 兼容代理 - **适用场景**：团队已使用 Anthropic SDK（如 Claude API），希望迁移到 Bedrock 但保持开发体验一致。 - **实现方式**：通过一个轻量级代理层，将 Bedrock 的 PTC 响应转换为 Anthropic SDK 格式，使得现有代码无需大改即可接入。 - **优势**：降低迁移成本，复用已有工具链。 - **注意**：代理层需自行维护，可能引入额外延迟。 ## 实践建议与思考从行业趋势看，**PTC 正在模糊“模型”与“应用”的边界**。过去，LLM 仅作为推理引擎，现在它开始直接操控计算资源。这种转变对安全性和可观测性提出了更高要求： - **安全隔离**：无论采用哪种方式，代码执行环境必须与生产环境隔离。Docker 沙箱或托管解释器都应限制文件系统、网络和系统调用。 - **错误处理**：模型生成的代码可能出错，需设计重试、回退或人工审核机制。 - **成本控制**：代码执行消耗算力，尤其是长时间运行的任务，建议设置超时限制。对于大多数团队，**推荐从托管 Code Interpreter 开始**，快速验证 PTC 在业务场景中的价值。当需求超出托管环境的能力（如需要 GPU 或私有包）时，再迁移到自托管方案。而 Anthropic 兼容代理更适合已有深度绑定 Anthropic 生态的团队。 ## 小结 Amazon Bedrock 的 PTC 功能为 AI 代理的开发提供了更多选择。从自托管到托管，再到兼容代理，开发者可以根据安全、成本和运维偏好灵活设计架构。随着 LLM 编码能力的提升，这种“模型即执行者”的模式将成为构建智能应用的重要范式。

AWS ML12天前原文

36

用 Amazon Nova 2 提示工程实现内容审核：从MLCommons标准到自定义策略

新上线

内容审核系统需要在“放过有害内容”和“误伤正常内容”之间取得平衡，而不同平台又有各自的审核标准。Amazon Nova 2 Lite 提供了一种灵活的解决方案：通过提示工程（Prompt Engineering）即可调整审核策略，无需重新训练模型。本文基于 MLCommons AILuminate 评估标准，展示了如何使用结构化提示和自由形式提示来驱动 Nova 2 Lite 进行内容审核，并提供了性能基准对比。 ## 审核策略的灵活性传统上，内容审核依赖固定分类器，一旦政策更新就需要重新训练。Amazon Nova 2 Lite 的提示工程方法将策略定义从模型训练中解耦——你只需修改提示中的类别描述，模型就能按新标准判断。例如，MLCommons AILuminate 标准定义了 **12 类危害分类**，涵盖物理危害（如暴力犯罪）、非物理危害（如仇恨言论）和情境危害（如专业建议）三大类。你可以直接使用这套分类，也可以替换为自己的自定义策略。 ## 两种提示方式文章介绍了两种提示方法： - **结构化提示**：使用 JSON 或表格格式明确列出危害类别、定义和判定规则。模型按字段逐一检查内容是否匹配。 - **自由形式提示**：用自然语言描述审核要求，适合快速迭代或非技术人员操作。两种方式都保持相同的底层提示结构，仅替换类别定义部分即可。 ## 性能基准 Amazon Nova 2 Lite 在三个公开数据集上与其他基础模型进行了对比。作为一款 **极低成本的 multimodal 模型**，它在高吞吐场景下表现突出。尽管具体数字未在摘要中展开，但文章强调 Nova 2 Lite 在速度和成本上的优势使其成为内容审核管线的理想选择。 ## 典型工作流文章附带的架构图展示了一个基于 **Amazon Bedrock** 的审核管线：用户上传内容后，Nova 2 Lite 按提示规则分类，标记违规项，再由人工或自动策略决定处理方式。整个过程无需微调，策略更新只需编辑提示文件。 ## 小结对于需要频繁调整审核策略或资源有限的团队，Amazon Nova 2 结合提示工程提供了一个实用的路径。它降低了内容审核系统的维护成本，同时保持了较高的准确性和可定制性。 > 注：本文基于 AWS 官方博客，所有数据与引用均源自原文。

AWS ML13天前原文

37

Aderant借助Amazon Quick实现云运营转型：搜索速度提升90%，文档处理提速75%

新上线

在法律行业，数据分散于多个系统是常见痛点。Aderant作为全球领先的法律业务管理软件提供商，近期通过引入 **Amazon Quick** 的AI驱动能力，成功实现了跨六个供应商系统的统一搜索，并自动化了文档工作流。结果令人瞩目：**搜索时间缩短90%**，**文档处理速度提升75%**。这一案例展示了企业如何利用AI工具优化运营效率，并提供了可复用的方法论。 ## 痛点：碎片化的系统与低效的搜索 Aderant的运营团队长期面临一个典型挑战：信息散落在六个不同的供应商系统中。律师和工作人员在查找案件资料、客户信息或内部文档时，往往需要逐一登录各系统，手动输入查询条件，再跨平台整合结果。这种碎片化模式不仅耗时，还容易出错，直接影响决策效率和客户响应速度。 ## 解决方案：Amazon Quick的统一搜索与自动化 Amazon Quick是AWS推出的一项AI增强型搜索服务，能够连接多个数据源，并提供自然语言查询能力。Aderant利用其核心功能： - **统一索引**：将六个供应商系统的数据汇总至单一搜索入口，无需改变原有数据存储结构。 - **智能文档处理**：通过AI自动提取、分类和归档文档，减少人工介入。 - **自然语言查询**：用户可用日常语言提问（如“上季度约翰逊案的账单记录”），系统直接返回精准结果。 ## 成效：90%与75%的量化飞跃实施后，Aderant的运营数据发生了质变： - **搜索效率**：平均搜索时间从数分钟降至数秒，加速幅度达90%。律师和行政人员不再为找文件而中断工作流。 - **文档自动化**：文档创建、审批和归档流程中，人工步骤减少75%，错误率同步下降。 ## 启示：企业如何复制这一成功？ Aderant的实践为其他企业提供了清晰路径： 1. **识别核心痛点**：优先解决跨系统数据孤岛问题，而非盲目部署AI。 2. **选择可扩展工具**：Amazon Quick这类服务支持快速集成现有系统，降低迁移成本。 3. **持续优化**：利用AI的反馈机制，根据使用数据调整搜索权重和自动化规则。在AI重塑行业运营的浪潮中，Aderant的案例证明：**精准的AI工具应用，能大幅释放企业潜能**。未来，随着Amazon Quick等服务的迭代，类似转型将更加普及。

AWS ML13天前原文

38

无缝集成：将Atlassian Confluence Cloud与Amazon Quick连接起来

新上线

在企业日常工作中，文档与数据往往分散在不同的系统中——技术文档存放在Confluence，业务数据则在Amazon S3或JIRA中。频繁切换工具不仅打断工作流，还容易导致信息孤岛。Amazon Quick推出的Confluence Cloud集成正是为了解决这一痛点，让用户无需离开Quick界面，即可通过自然语言查询、检索和管理Confluence内容。 ## 集成方式：不止一种选择 Quick提供了三种集成路径，以适应不同技术栈和团队需求： - **内置连接器**：针对Confluence Cloud、Jira、Salesforce等流行工具，提供预配置的驱动式集成，无需编写代码。 - **自定义REST API**：通过OpenAPI规范连接自有或第三方API，灵活性更高。 - **Model Context Protocol (MCP) 服务器**：基于开放标准，支持动态工具发现，适合复杂或定制化场景。本次重点介绍的是内置连接器方案，它最直接且易于上手。 ## 核心功能：知识库与Actions Quick的集成能力分为三大类： 1. **知识库（Knowledge Bases）**：对非结构化内容（如文档、Wiki）进行索引，支持语义搜索。用户提问时，Quick能自动检索相关Confluence页面并返回精准答案。 2. **Actions**：在提示或查询时连接外部系统，实现读取、写入和自动化任务。例如，直接通过Quick更新Confluence页面内容，或从JIRA拉取工单状态。 3. **Topics和Datasets**：针对结构化数据源（如Amazon Redshift）提供自然语言查询能力。本次教程聚焦于知识库和Actions的设置。 ## 设置步骤概览要实现Confluence Cloud与Quick的集成，主要分为以下几步： 1. **创建知识库**：将Confluence空间中的页面索引到Quick，使内容可被语义搜索。 2. **配置Actions**：通过内置连接器授权Quick访问Confluence，并定义可执行的操作（如查询页面、创建或更新文档）。 3. **组织资源**：在Quick Spaces中对集成资源进行分组管理，方便团队协作。 ## 实际价值：减少上下文切换，加速决策集成之后，团队可以在一个界面内完成跨系统操作。例如： - 当需要了解某个项目的技术方案时，直接在Quick中提问，系统会从Confluence检索相关文档并给出摘要。 - 如果发现文档需要更新，可直接通过Quick的Action修改Confluence页面，无需切换浏览器标签页。 - 结合其他数据源（如S3中的日志、JIRA中的工单），Quick能提供更全面的上下文，帮助快速做出决策。这种集成不仅减少了手动检索和重复登录的麻烦，更重要的是打破了信息壁垒，让知识真正流动起来。对于使用Atlassian生态并已上云的企业来说，这是一个值得关注的能力升级。 ## 小结 Amazon Quick与Confluence Cloud的集成，是AI助手与现有工作流深度融合的典型案例。它不再是一个孤立的对话工具，而是成为连接企业知识库和业务系统的中枢。随着更多内置连接器和MCP生态的完善，这类集成将越来越成为企业级AI应用的标配。

AWS ML13天前原文

39

在 Amazon Bedrock AgentCore 中构建自定义代码评估器

新上线

将原型智能体投入生产时，需要在多个维度上评估其质量。Amazon Bedrock AgentCore Evaluations 提供 LLM-as-a-Judge 检查以及可扩展的代码评估器，以捕获特定领域的评估需求。本文以金融市场情报智能体为例，展示了如何实现四个基于 Lambda 的自定义代码评估器，涵盖股价实时波段验证、经纪人身份强制校验、工具输出 JSON Schema 合规性以及 PII 脱敏检查。 ## 为什么需要代码评估器？在金融服务等专业领域，关键质量维度往往超出语言范畴。例如，一个市场情报智能体必须： - 在可配置的实时波段内引用股价 - 在访问财务档案前遵循强制经纪人身份识别流程 - 返回符合严格 JSON Schema 的工具输出 - 拒绝泄露个人身份信息这些检查需要确定性代码——相同输入产生相同结果。若用 LLM-as-a-Judge 执行这些检查，不仅成本高昂，而且对于客观逻辑而言并非最优选择。**自定义代码评估器** 允许将 AWS Lambda 函数作为评估引擎，完全控制评分逻辑：正则表达式、结构验证、外部数据查询、调用其他服务或业务规则。 ## 评估器的工作模式自定义代码评估器支持两种运行模式： - **按需评估**：在开发工作流和 CI/CD 流水线中充当质量门禁 - **在线评估**：对生产实时流量进行评分即使追踪来自不同的智能体框架，也可以通过 Lambda 函数一致地评估智能体质量。 ## 实现四个自定义评估器文中实现了以下四个评估器： 1. **股价实时波段验证器**：确保智能体引用的股价在预设的实时浮动范围内，避免过时数据误导决策。 2. **经纪人身份强制校验器**：在访问客户财务档案前，检查是否已完成 Broker-ID 的确认流程，符合合规要求。 3. **工具输出 Schema 合规性检查器**：验证智能体返回的 JSON 结构是否严格匹配预定义的 Schema，防止下游解析错误。 4. **PII 脱敏检测器**：扫描智能体的输入和输出，检测并屏蔽身份证号、电话号码等敏感信息。 ## 结合内置评估器与其他 AWS 服务自定义评估器可以与 AgentCore 内置的 LLM-as-a-Judge 评估器组合使用。例如，用内置评估器评估回答的流畅性和相关性，用自定义评估器处理硬性合规检查。此外，Lambda 函数可以调用其他 AWS 服务： - **Amazon Comprehend** 进行实体识别和情感分析 - **Amazon SageMaker** 部署的专用模型进行事实核查 - **Amazon SNS** 发送实时告警 ## 注册与运行评估器通过 AgentCore 的控制台或 API 注册，指定 Lambda ARN 和评估维度。按需评估可在开发阶段手动触发；在线评估则配置为在智能体每次响应后自动执行。评估结果会聚合到 Amazon CloudWatch，方便监控和告警。 ## 小结自定义代码评估器为智能体质量评估提供了**确定性强、成本可控、高度可定制**的解决方案。对于金融、医疗、法律等对合规性和准确性要求极高的领域，代码评估器是 LLM-as-a-Judge 的有力补充。通过 Lambda 的灵活性，可以将任何业务规则转化为自动化的评估关卡，加速智能体从原型到生产的进程。

AWS ML13天前原文

40

在 Amazon S3 的 Amazon Quick 知识库中限制敏感文档访问

新上线

## 概述在 AI 驱动的企业应用中，知识库的权限管理是数据安全的关键环节。**Amazon Quick** 近期为基于 **Amazon S3** 的知识库引入了**文档级访问控制列表（ACL）**，让企业能够精细化管理文档访问权限，确保敏感信息仅对授权用户可见。这一更新对于需要严格控制知识库内容访问的场景（如内部合规文档、客户隐私数据等）尤为重要。 ## 核心功能：文档级 ACL 传统上，知识库的权限往往停留在知识库或目录层级，难以实现文档级别的细粒度控制。Amazon Quick 的新功能允许管理员为 S3 知识库中的每个文档设置独立的 ACL 规则。这意味着，即使多个文档存储在同一 S3 路径下，系统也能根据用户身份或角色，动态决定哪些文档可以被检索、引用或展示。 **配置流程**包括： - 在 S3 存储桶中为文档附加 ACL 元数据（如通过标签或自定义属性）。 - 在 Amazon Quick 知识库中关联 ACL 配置，并映射到用户或群组。 - 通过聊天或自动化工作流测试权限效果，确保非授权用户无法获取受限文档。 ## 行业背景与价值随着生成式 AI 在企业中的普及，**知识库安全**已成为企业采纳技术的核心顾虑之一。传统 RAG（检索增强生成）方案中，模型可能因检索到敏感内容而输出不合规信息。文档级 ACL 直接解决了这一痛点，允许企业在不牺牲 AI 能力的前提下，满足 GDPR、HIPAA 等合规要求。 ## 应用场景 - **内部知识管理**：不同部门只能访问其相关的文档，如 HR 政策仅对人力资源团队可见。 - **客户支持**：基于客户等级或订阅类型，提供差异化的知识库内容。 - **合规审计**：敏感法律文档仅限法务部门访问，并记录所有查询日志。 ## 小结 Amazon Quick 的文档级 ACL 功能，为 S3 知识库提供了一种灵活且强大的权限控制手段。企业无需重构现有存储架构，即可实现对 AI 应用输出内容的精准管控。对于正在构建企业级 AI 助手的团队来说，这是一个值得关注的重要更新。

AWS ML16天前原文

上一页2 / 11下一页