AI 资讯

每日聚合最新人工智能动态

全部 🔥 精选 🆕 新上线 🔄 更新

来源：AWS ML清除筛选 ×

161

用 Amazon Bedrock 打造 AI 招聘助手：简历解析、智能评分与面试题生成

新上线

## 当招聘变成“体力活”：AI 如何破局？一份针对 748 名 HR 领导者的调查显示，招聘人员平均在每个职位空缺上花费 **17.7 小时** 处理行政事务——相当于两个多工作日。另一项 2024 年的 SmartRecruiters 调查发现，**45% 的人才招聘负责人** 超过一半的工作时间花在可自动化的任务上。这种行政负担导致简历筛选流于表面，大量合格候选人被忽略，而匹配结果往往取决于简历格式和关键词密度，而非真实能力。 ## 架构解析：Serverless + 大模型 + 安全护栏 AWS 近期发布了一篇技术博客，详细展示了如何利用 **Amazon Bedrock** 构建一套 AI 驱动的招聘助手。这套参考架构（非生产就绪方案）整合了多个 AWS 服务，形成一个协同工作的无服务器系统： - **Amazon Bedrock Converse API + Amazon Nova Pro**：负责核心的 AI 推理，包括简历解析、候选人评分、技能评估和面试题生成。 - **AWS Lambda**：处理业务逻辑，串联各个模块。 - **Amazon API Gateway**：提供 API 路由。 - **Amazon DynamoDB & Amazon S3**：分别存储结构化数据（如评分结果）和原始简历文件。 - **Amazon Bedrock Guardrails**：提供 **PII 匿名化、提示词攻击检测和偏见内容过滤**，确保 AI 应用负责任地运行。前端方面，使用 **AWS Amplify** 托管 Web 应用，**Amazon Cognito** 处理用户认证与 JWT 令牌管理。 ## 核心能力：从简历到面试题的全链路智能化 1. **简历解析与多维评分**：AI 不仅提取基本信息，还能基于职位要求计算 **多维度兼容性分数**，避免“关键词堆砌”式的误判。 2. **个性化面试题生成**：根据候选人的背景和岗位需求，动态生成有针对性的面试问题，帮助面试官深入考察真实能力。 3. **数据驱动的洞察**：所有评估结果以结构化数据存储，方便后续分析和决策。 ## 行业背景与思考当前，AI 在招聘领域的应用已从简单的关键词匹配走向 **深度语义理解与推理**。Amazon Bedrock 提供的托管大模型服务，让企业无需自建基础设施即可调用前沿模型，同时通过 Guardrails 解决合规与伦理问题——这对处理敏感个人数据的 HR 场景尤为重要。不过，博客也明确指出，这套架构仅用于 **学习目的**，并非生产就绪方案。实际落地时，企业需要根据自身需求调整，例如增加更严格的隐私保护措施、优化成本控制，或与现有 ATS（申请人追踪系统）集成。 ## 小结 AI 招聘助手并非要取代人类面试官，而是将 HR 从繁琐的行政工作中解放出来，让他们专注于更有价值的决策——比如判断候选人的文化契合度、软技能和发展潜力。随着 Amazon Bedrock 等平台降低了大模型的使用门槛，这类智能化工具将加速进入中小企业，改变整个招聘行业的效率格局。

AWS ML1个月前原文

162

在 Amazon Bedrock AgentCore 上用 NLP 构建 AI 驱动的仪表板自动化代理

新上线

## 概述传统上，业务分析师在调整仪表板以响应变化的需求时，往往需要等待数天。典型的流程涉及向 IT 团队提交修改请求，由 IT 人员解读需求、查阅 API 文档、理解表结构并部署变更。虽然这种方式能保证适当的监督和质量控制，但在需要快速更新仪表板时，可能导致数天的周转时间。本文介绍的方案结合了 **Amazon Bedrock AgentCore**、**Strands Agents** 和 **Amazon QuickSight** 的强大功能，构建了一个安全、可扩展且智能的系统，用于创建和运行 AI 代理，同时将数据转化为可执行的业务洞察。 ## 解决方案架构该方案采用基于 Amazon Bedrock AgentCore 和 Strands 框架的多智能体架构。Amazon Bedrock AgentCore 是一个智能体平台，用于安全地大规模构建、部署和运行高效代理，无需管理基础设施。Strands Agents 是一个代码优先的框架，用于构建与 AWS 服务集成的代理。Amazon QuickSight 则提供 AI 驱动的 BI 能力，将分散的数据转化为战略洞察。架构由三个专门代理协作组成： - **查找仪表板代理**：执行发现操作，包括搜索仪表板、检索仪表板和数据集中的列元数据。 - **修改仪表板代理**：执行配置变更，如验证列、更新表格视觉效果以及创建新的仪表板版本。 - **编排代理**：根据意图分类，将用户请求路由到相应的专门代理。 ## 工作流程编排代理作为用户交互的入口。当用户提交自然语言查询（例如“将 lastname 添加到测试仪表板”）时，Amazon Nova 将请求分类为对话型或操作型。对话型查询直接利用 Nova 的大语言模型能力进行响应；操作型请求则通过 Strands 框架路由到相应的专门代理进行处理。 ## 行业背景与价值在 AI 行业，将自然语言处理与智能代理结合，正在重新定义企业与数据交互的方式。这一方案不仅缩短了仪表板修改的周期，还降低了非技术用户的使用门槛。业务分析师无需掌握技术细节，即可通过自然语言指令完成复杂的仪表板操作，从而加速决策过程。该方案体现了 **Agentic AI** 在商业智能领域的落地潜力：通过多代理协作，将意图识别、任务分解与执行自动化融为一体。Amazon Bedrock AgentCore 提供的安全性和动态扩展能力，确保了生产级部署的可靠性。 ## 关键优势 - **效率提升**：将仪表板修改时间从天级缩短至分钟级。 - **自然语言交互**：用户无需学习特定命令或 API。 - **安全可控**：代理访问权限和数据操作受到严格管理。 - **可扩展性**：基于微服务架构，易于添加新的代理或功能。 ## 总结通过 Amazon Bedrock AgentCore、Strands Agents 和 Amazon QuickSight 的组合，企业可以构建一个智能的仪表板自动化系统，让数据分析师和业务用户都能以更自然、更高效的方式获取洞察。这不仅是技术上的进步，更是企业数据文化向自助式、即时响应方向转型的重要一步。

AWS ML1个月前原文

163

亚马逊 SageMaker AI 端点现支持 OpenAI 兼容 API，无缝对接现有 AI 应用

新上线

亚马逊云科技今日宣布，Amazon SageMaker AI 实时推理端点正式支持 OpenAI 兼容 API。这意味着使用 OpenAI SDK、LangChain 或 Strands Agents 等框架的开发者，只需修改端点 URL，即可直接调用 SageMaker AI 上托管的模型，无需编写自定义客户端、SigV4 签名包装器或重写代码。 ## 核心变化：一条 /openai/v1 路径打通壁垒 SageMaker AI 端点现在暴露一个 **/openai/v1** 路径，原生接受 Chat Completions 格式的请求，并返回包含流式响应在内的标准回复。该功能对所有使用标准 SageMaker AI API 创建的端点和推理组件自动生效。SageMaker AI 会根据 URL 中的端点名称进行路由，因此任何 OpenAI 兼容的客户端都能即插即用。此外，用户现在可以为端点创建**限时 bearer 令牌**，直接用于 OpenAI 客户端，进一步简化了认证流程。 ## 三大典型应用场景 ### 1. 自有基础设施上的智能体工作流如果你使用 Strands Agents 或 LangChain 构建多步骤 AI 智能体，现在可以将这些工作流完全运行在自己的 SageMaker AI 端点上。智能体调用模型时沿用同一套 OpenAI 兼容接口，但推理实际运行在用户账户内的专用 GPU 实例上，兼顾性能与数据安全。 ### 2. 多模型统一托管，单一接口调用如果需要运行多个模型——例如 Llama 处理通用任务、微调版 Mistral 处理领域问题、小模型做分类——可以将它们全部托管在单个 SageMaker AI 端点上，通过推理组件分配独立资源。每个模型都可通过同一个 OpenAI SDK 调用，应用代码中无需维护多套 API 客户端或路由逻辑。 ### 3. 微调模型零代码改造上线针对特定场景微调的开源模型，可直接部署到 SageMaker AI 并通过 OpenAI 兼容接口调用。应用程序只需修改端点 URL，无需任何代码改动，即可享受微调模型的定制能力。 ## 行业视角：降低云上推理的迁移成本长期以来，AWS 用户若想将 OpenAI 生态中开发的应用迁移到自托管模型，往往需要额外开发 SigV4 签名层或适配自定义 SDK。此次更新直接消除了这一障碍，使得 **SageMaker AI 成为 OpenAI 生态系统的“一等公民”**。对于已投资 Agent 框架和 LLM 网关的企业，这意味着可以在不改变架构的前提下，灵活切换底层推理供应商，或将部分工作负载迁入自有账户以控制成本与延迟。 Caffeine.AI 的 AI/ML 工程师 Giorgio Piatti 在公告中表示：“我们运行 AI 编码智能体，通过一个兼容 OpenAI 聊天补全协议的 LLM 网关使用多个提供商。bearer 令牌功能让我们能将 SageMaker 作为即插即用的 OpenAI 兼容推理端点加入，无需自定义 SigV4 签名，原生适配我们的网关、Vercel AI SDK 和标准 OpenAI 客户端。” ## 快速上手 AWS 官方提供了配套 Jupyter Notebook（[GitHub 仓库](https://github.com/aws-samples/)），演示从部署到调用的完整流程。用户可以通过标准 SageMaker API 创建端点，获取 bearer 令牌后，在 OpenAI 客户端中将 `base_url` 设置为 `https://<endpoint-url>/openai/v1` 即可开始使用。此次更新标志着 AWS 在**模型服务兼容性**上的重要一步——不强迫用户锁定在特定 SDK，而是主动适配业界最广泛使用的接口标准。对于正在构建多模型、多提供商 AI 系统的团队来说，这无疑降低了架构复杂度与运维成本。

AWS ML1个月前原文

164

多模态评估器：用 MLLM 作为裁判评估图像到文本任务

新上线

在构建视觉购物、图像或文档理解、图表分析等应用时，如何验证模型输出是否真正基于源图像是一大挑战。纯文本评估器无法判断描述是否忠实反映图像、提取的发票金额是否与文档一致，或屏幕摘要是否虚构了不存在的按钮。Gartner 预测，到 2030 年，80% 的企业软件将具备多模态能力，而 2024 年这一比例还不足 10%。缺乏自动化多模态评估，企业只能在昂贵的人工审核和不可靠的纯文本代理之间左右为难。如今，AWS 在 Strands Evals SDK 中推出了四种新的多模态大语言模型（MLLM）作为裁判的评估器，专门用于图像到文本任务：**Overall Quality**（整体质量）、**Correctness**（正确性）、**Faithfulness**（忠实性）和 **Instruction Following**（指令遵循）。每个评估器都会根据源图像对模型输出进行评分。评估器将图像直接发送给多模态裁判模型，同时附上查询、响应以及可选的参考答案。裁判模型返回基于图像的分数以及推理过程字符串，便于调试。这些评估器可以无缝替换现有 Strands Evals 工作流中的纯文本评估器，并集成到持续集成（CI）中，自动捕捉视觉幻觉、事实错误和指令违规。本文将介绍如何设置这四种多模态评估器并运行图像到文本任务；如何在有参考和无参考评估之间切换；如何为特定领域标准编写自定义多模态评估标准；如何在 Amazon Bedrock 上选择平衡准确性、成本和延迟的裁判模型；以及如何应用提示设计选择来提升评估器与人类判断的一致性。 ## 设置与使用首先，确保已安装 Python 3.10 或更高版本。通过 Strands Evals SDK 可以快速调用这些评估器。示例代码如下： ```python from strands_evals import MultimodalEvaluator evaluator = MultimodalEvaluator( judge_model="anthropic.claude-3-sonnet-20240229-v1:0", evaluator_type="faithfulness" ) result = evaluator.evaluate( image_path="invoice.jpg", query="提取发票总金额", response="总金额为 $123.45", reference="$123.45" # 可选 ) print(result.score, result.reasoning) ``` ## 自定义多模态评估标准若需针对特定领域制定标准，可编写自定义评估标准。例如，在医疗影像报告中，可以定义“报告必须描述病变位置和大小”等规则，评估器将据此打分。 ## 选择裁判模型 Amazon Bedrock 提供了多种多模态模型，如 Claude 3 Sonnet、Claude 3 Haiku 等。**Claude 3 Sonnet** 在准确性和延迟之间取得了良好平衡，适合大多数场景；而 **Claude 3 Haiku** 则更注重成本效益。用户可根据任务需求灵活选择。 ## 提示设计技巧实验表明，在提示中加入“逐步推理”指令（如“请先描述图像内容，再评估回答”）可以显著提升评估器与人类判断的一致性。此外，明确要求模型输出评分理由，有助于调试和审计。通过引入多模态评估器，开发者可以更可靠地自动化评估图像到文本任务的输出质量，减少人工干预，加速 AI 应用的落地。

AWS ML1个月前原文

165

使用 Amazon SageMaker AI 和 vLLM 构建实时语音应用

新上线

实时语音转写是语音助手、直播字幕、联络中心分析和无障碍工具等应用的核心能力。传统请求-响应推理需要等待完整音频上传后才能开始转写，这引入的延迟破坏了实时体验。从 2025 年 11 月起，Amazon SageMaker AI 支持双向流式推理，允许客户端与模型容器之间持续双向传输数据。同时，vLLM 通过其 Realtime API（基于 WebSocket 的双向流）支持实时音频转写。本文将两者结合，展示如何使用 SageMaker AI 的 vLLM 容器部署 Mistral AI 的 Voxtral-Mini-4B-Realtime-2602 模型，构建一个完全托管的实时语音转文本服务。 ## 关键特性构建生产级语音 AI 应用需要多个基础设施组件紧密配合，并满足严格的延迟要求。SageMaker AI 和 vLLM 各自解决了不同部分的问题： - **实时语音模型与高效 GPU 服务**：核心是能够增量处理音频的 ASR 模型，vLLM 通过其 Realtime API（原生 WebSocket 端点 `/v1/realtime`）提供支持，并采用分段 CUDA 图执行减少 GPU 内核启动开销，从而降低流式转写中的每 token 延迟。 - **双向流式推理**：SageMaker AI 支持双向流，客户端可同时发送音频并接收转写结果，无需等待完整音频。 - **完全托管与可扩展**：SageMaker AI 负责基础设施管理，包括自动缩放、监控和安全性。 ## 部署步骤 1. **准备模型**：从 Hugging Face 获取 Voxtral-Mini-4B-Realtime-2602 模型，并将其打包为适用于 vLLM 的格式。 2. **创建 SageMaker 端点**：使用 SageMaker SDK 创建一个启用了双向流的端点，指定 vLLM 容器镜像。 3. **配置 WebSocket 客户端**：客户端通过 WebSocket 连接到端点，持续发送音频数据并接收实时转写结果。完整示例代码可在 [GitHub 仓库](https://github.com/aws-samples/amazon-sagemaker-ai-vllm-realtime) 中找到。 ## 性能与优势相比传统方法，该方案显著降低了端到端延迟。例如，在语音助手场景中，用户说话后几乎立即看到转写文本，交互更加自然。此外，SageMaker AI 的托管特性减少了运维负担，而 vLLM 的开源特性允许用户灵活调整模型配置、量化和编译设置。 ## 应用场景 - **语音助手**：实时理解用户指令并快速响应。 - **直播字幕**：为直播视频生成实时字幕。 - **联络中心分析**：实时转写客户通话，进行情感分析或合规检查。 - **无障碍工具**：帮助听障人士实时获取语音信息。这一组合为开发者提供了构建实时语音应用的高性能、低成本方案，推动了 AI 语音技术的普及。

AWS ML1个月前原文

166

使用 Amazon Nova Sonic 打造可扩展语音代理：多代理、工具与会话分割设计模式

新上线

在构建语音代理时，延迟、实时音频管理以及多代理协调是常见挑战。本文介绍了如何利用 **Amazon Nova Sonic**、**Amazon Bedrock AgentCore** 和 **Strands BidiAgent** 来设计可扩展且低延迟的语音代理系统。文章重点探讨了三种主流架构模式：**工具模式**、**代理即工具（子代理）模式** 和 **会话分割模式**，并分析了各自的权衡与最佳实践。 ## 关键组件概览 - **Amazon Nova Sonic**：一种基础模型，支持实时、自然的语音到语音对话，能理解语气并保持流畅交互。 - **Amazon Bedrock AgentCore Runtime**：无服务器托管环境，提供双向 WebSocket 流、微 VM 级会话隔离（避免“吵闹邻居”延迟尖峰）、基于 MCP 协议的共享工具托管以及持久化内存。 - **Strands BidiAgent**：开源框架中的集成类，负责管理双向流生命周期、路由工具调用和处理会话管理，简化与 Nova Sonic 的对接。 ## 三种架构模式详解 ### 1. 工具模式（Tool Pattern）将功能封装为独立工具，代理通过调用工具执行具体任务。这种模式适合功能明确、调用链简单的场景，易于维护和测试。 ### 2. 代理即工具模式（Agent-as-Tool / Sub-Agent）将子代理作为工具集成到主代理中。每个子代理拥有独立的提示词、记忆和权限，适合处理复杂子任务（如订单查询、退款处理）。主代理负责路由请求，子代理专注执行，从而降低单个代理的复杂度。 ### 3. 会话分割模式（Session Segmentation）通过隔离不同会话的提示词、内存和权限，避免上下文污染和权限泄露。AgentCore 的微 VM 隔离天然支持此模式，确保每个会话独立运行，提升安全性与并发性能。 ## 最佳实践：降低延迟 - **使用 WebSocket 流**：避免 HTTP 轮询，减少往返时间。 - **微 VM 隔离**：防止高负载代理影响其他会话。 - **工具预加载**：通过 AgentCore Gateway 共享工具实例，减少冷启动。 - **异步处理**：非关键操作（如日志记录）异步执行，不阻塞对话流。 ## 小结通过组合这三种模式，团队可以构建出既灵活又高性能的语音代理系统。Amazon Nova Sonic 提供实时语音能力，Bedrock AgentCore 解决托管和隔离问题，Strands BidiAgent 简化集成。对于需要处理复杂工作流的企业，这些设计模式是实现规模化语音交互的关键。

AWS ML1个月前原文

167

在Kiro CLI中通过Amazon Bedrock AgentCore Memory扩展对话记忆能力

新上线

## 当终端遇上记忆：Kiro CLI如何借助Amazon Bedrock实现上下文感知对话在AI Agent快速迭代的当下，**对话记忆**已成为衡量智能助手成熟度的关键指标。近日，AWS发布了一项技术实践：通过自定义**模型上下文协议（MCP）** 服务器，将**Amazon Bedrock AgentCore Memory**与**Kiro CLI**深度集成，让终端内的AI对话不再“失忆”。 ### 痛点：终端里的“金鱼记忆” Kiro CLI作为一款命令行工具，允许开发者直接与Kiro的AI Agent交互。然而，传统CLI模式下的会话往往是“一次性”的——每次对话都被视为独立事件，无法保留上下文。例如，当用户询问“刚才提到的那个API端点是什么？”时，Agent可能一脸茫然。这种**无状态交互**严重限制了复杂任务链的构建，比如多轮调试、配置迭代或跨会话项目管理。 ### 解法：MCP服务器与托管记忆的联姻 Amazon Bedrock AgentCore Memory是AWS推出的**全托管记忆服务**，专为AI Agent设计。它能够自动存储、检索和更新来自历史对话的关键信息，使Agent具备“长期记忆”。而MCP则是一种标准化协议，用于定义Agent与外部工具或数据源之间的交互方式。在这套方案中，开发者需要做的是： 1. **构建一个自定义MCP服务器**，作为Kiro CLI与Bedrock AgentCore Memory之间的桥梁。 2. 在MCP服务器中实现**记忆读写接口**，将Kiro CLI生成的对话内容同步至Bedrock的托管记忆存储。 3. 当新对话开始时，Agent通过MCP服务器自动检索相关历史记忆，实现上下文延续。 ### 落地价值：从“单次问答”到“持续协作” 集成后，Kiro CLI的使用体验将发生本质变化： - **跨会话连贯性**：用户可以在不同时间点继续同一话题，Agent能准确引用之前的结论或代码片段。 - **任务断点续传**：若调试过程中终端意外关闭，重新启动后Agent仍能“记住”之前的错误日志和修复步骤。 - **个性化适应**：Agent能根据用户长期的使用习惯（如偏好某种代码风格、常用命令组合）给出更贴切的建议。 ### 行业视角：记忆是Agent走向“智能体”的必由之路当前，AI Agent正从“工具调用者”向“自主工作者”演进，而**持久化记忆**正是这一跃迁的核心基础设施。无论是OpenAI的Assistants API中的线程机制，还是LangChain的记忆模块，业界都在试图解决同一个问题：如何让AI在长时间跨度内保持一致的“人格”与知识状态。 AWS此次通过MCP协议将托管记忆能力开放给Kiro CLI，本质上是在**降低记忆功能的集成门槛**——开发者无需自建向量数据库或管理会话状态，即可为命令行工具赋予企业级的记忆能力。这对于运维自动化、DevOps流水线、以及需要长期上下文支持的开发辅助场景，具有显著的实际意义。 ### 总结 Kiro CLI + Amazon Bedrock AgentCore Memory的组合，展示了**托管服务+标准化协议**在AI工程化中的典型应用模式。对于追求高效与智能的开发者而言，让终端记住每一次对话，或许就是下一轮生产力提升的起点。

AWS ML1个月前原文

168

Amazon SageMaker Feature Store 新能力加速机器学习特征管道

新上线

亚马逊云科技今日宣布，**SageMaker Python SDK v3.8.0** 为 SageMaker Feature Store 带来三项新能力，旨在帮助数据科学家和工程师更高效地构建、管理和使用机器学习特征管道。这些新功能聚焦于简化特征工程工作流、增强数据治理以及提升查询性能。 ### 新能力一：与 AWS Lake Formation 集成，强化数据治理第一项新能力是 **SageMaker Feature Store 与 AWS Lake Formation 的深度集成**。通过这一集成，用户可以在特征组（Feature Group）级别应用细粒度的访问控制策略。Lake Formation 提供基于属性的访问控制（ABAC）和行级安全，使得团队能够安全地共享特征数据，同时遵守合规要求。例如，数据管理员可以设定规则，仅允许特定用户或角色访问包含敏感信息的特征列，而其他列则对更广泛的团队开放。 ### 新能力二：支持 Apache Iceberg 表属性，优化存储与查询第二项能力是 **SageMaker Feature Store 现在支持 Apache Iceberg 表属性**。Iceberg 是一种开源表格式，专为大规模数据分析设计，支持 ACID 事务、快照和模式演进。通过在 Feature Store 中启用 Iceberg 表属性，用户可以享受以下好处： - **更快的查询性能**：Iceberg 的分区修剪和列式存储优化可显著减少扫描数据量。 - **时间旅行查询**：能够回溯到特定时间点的特征数据版本，便于模型调试和重现。 - **自动表维护**：Iceberg 的压缩和清理机制减少了存储成本并提高了查询效率。 ### 新能力三：增强的 Python SDK 功能，简化开发体验第三项新能力体现在 **SageMaker Python SDK v3.8.0 的更新**，包括更简洁的 API、更好的错误处理以及更丰富的文档。例如，现在可以通过更少的代码行创建和管理特征组，并直接与 Iceberg 表交互。此外，SDK 还支持将特征数据直接写入 S3 中的 Iceberg 格式，无需额外配置。 ### 实际应用场景与价值这些新能力对机器学习团队意味着什么？以金融风控场景为例，特征工程团队需要频繁更新欺诈检测模型的特征，同时确保敏感客户数据不被滥用。通过 Lake Formation 集成，可以轻松定义哪些分析师能访问哪些特征；而 Iceberg 支持则让历史特征回滚变得简单，便于模型审计。对于希望快速上手的用户，亚马逊云科技提供了 **完整的端到端示例笔记本**（位于 SageMaker Python SDK 仓库中），涵盖 Lake Formation 治理配置和 Iceberg 表属性设置。开发者可以直接克隆这些笔记本，在自己的 AWS 环境中进行测试。 ### 小结此次更新标志着 **SageMaker Feature Store 在数据治理和性能优化上迈出重要一步**。随着机器学习模型对特征质量和时效性的要求日益提高，这些工具能帮助团队减少基础设施管理负担，将更多精力投入到特征创新和模型迭代中。建议用户升级到最新 SDK，并参考官方笔记本探索新功能。

AWS ML1个月前原文

169

在 Amazon Bedrock 上实现编程式工具调用

新上线

在 AI 应用开发中，让大语言模型（LLM）能够自主调用外部工具是释放其能力的关键。Amazon Bedrock 近期推出的编程式工具调用（Programmatic Tool Calling, PTC）功能，正为开发者提供了一条更灵活、可控的路径。本文将通过三种实现方式，展示如何利用 PTC 构建可执行代码的 AI 代理。 ## 什么是编程式工具调用？传统的工具调用中，模型仅返回工具名称和参数，由应用层负责执行。而 **PTC 允许模型直接生成可执行的代码片段（如 Python 脚本）**，并在安全沙箱中运行，从而实现更复杂的逻辑，比如数据处理、API 调用链或动态决策。 ## 三种实现路径对比 ### 1. 自托管 Docker 沙箱（ECS） - **适用场景**：需要完全控制执行环境、网络策略或使用自定义运行时。 - **实现方式**：在 Amazon ECS 上部署 Docker 容器作为沙箱，通过 Bedrock 的响应触发容器内的代码执行。 - **优势**：最大灵活性，可集成私有库、GPU 资源等。 - **代价**：需自行维护基础设施，处理安全隔离和扩缩容。 ### 2. 托管解决方案（Bedrock AgentCore Code Interpreter） - **适用场景**：希望快速集成，无需管理底层环境。 - **实现方式**：直接使用 Bedrock 内置的 **AgentCore Code Interpreter**，模型生成的代码在 AWS 托管的沙箱中自动执行。 - **优势**：零运维，自动安全隔离，支持 Python 标准库。 - **限制**：无法安装第三方包或访问外部网络（默认配置）。 ### 3. Anthropic SDK 兼容代理 - **适用场景**：团队已使用 Anthropic SDK（如 Claude API），希望迁移到 Bedrock 但保持开发体验一致。 - **实现方式**：通过一个轻量级代理层，将 Bedrock 的 PTC 响应转换为 Anthropic SDK 格式，使得现有代码无需大改即可接入。 - **优势**：降低迁移成本，复用已有工具链。 - **注意**：代理层需自行维护，可能引入额外延迟。 ## 实践建议与思考从行业趋势看，**PTC 正在模糊“模型”与“应用”的边界**。过去，LLM 仅作为推理引擎，现在它开始直接操控计算资源。这种转变对安全性和可观测性提出了更高要求： - **安全隔离**：无论采用哪种方式，代码执行环境必须与生产环境隔离。Docker 沙箱或托管解释器都应限制文件系统、网络和系统调用。 - **错误处理**：模型生成的代码可能出错，需设计重试、回退或人工审核机制。 - **成本控制**：代码执行消耗算力，尤其是长时间运行的任务，建议设置超时限制。对于大多数团队，**推荐从托管 Code Interpreter 开始**，快速验证 PTC 在业务场景中的价值。当需求超出托管环境的能力（如需要 GPU 或私有包）时，再迁移到自托管方案。而 Anthropic 兼容代理更适合已有深度绑定 Anthropic 生态的团队。 ## 小结 Amazon Bedrock 的 PTC 功能为 AI 代理的开发提供了更多选择。从自托管到托管，再到兼容代理，开发者可以根据安全、成本和运维偏好灵活设计架构。随着 LLM 编码能力的提升，这种“模型即执行者”的模式将成为构建智能应用的重要范式。

AWS ML1个月前原文

170

用 Amazon Nova 2 提示工程实现内容审核：从MLCommons标准到自定义策略

新上线

内容审核系统需要在“放过有害内容”和“误伤正常内容”之间取得平衡，而不同平台又有各自的审核标准。Amazon Nova 2 Lite 提供了一种灵活的解决方案：通过提示工程（Prompt Engineering）即可调整审核策略，无需重新训练模型。本文基于 MLCommons AILuminate 评估标准，展示了如何使用结构化提示和自由形式提示来驱动 Nova 2 Lite 进行内容审核，并提供了性能基准对比。 ## 审核策略的灵活性传统上，内容审核依赖固定分类器，一旦政策更新就需要重新训练。Amazon Nova 2 Lite 的提示工程方法将策略定义从模型训练中解耦——你只需修改提示中的类别描述，模型就能按新标准判断。例如，MLCommons AILuminate 标准定义了 **12 类危害分类**，涵盖物理危害（如暴力犯罪）、非物理危害（如仇恨言论）和情境危害（如专业建议）三大类。你可以直接使用这套分类，也可以替换为自己的自定义策略。 ## 两种提示方式文章介绍了两种提示方法： - **结构化提示**：使用 JSON 或表格格式明确列出危害类别、定义和判定规则。模型按字段逐一检查内容是否匹配。 - **自由形式提示**：用自然语言描述审核要求，适合快速迭代或非技术人员操作。两种方式都保持相同的底层提示结构，仅替换类别定义部分即可。 ## 性能基准 Amazon Nova 2 Lite 在三个公开数据集上与其他基础模型进行了对比。作为一款 **极低成本的 multimodal 模型**，它在高吞吐场景下表现突出。尽管具体数字未在摘要中展开，但文章强调 Nova 2 Lite 在速度和成本上的优势使其成为内容审核管线的理想选择。 ## 典型工作流文章附带的架构图展示了一个基于 **Amazon Bedrock** 的审核管线：用户上传内容后，Nova 2 Lite 按提示规则分类，标记违规项，再由人工或自动策略决定处理方式。整个过程无需微调，策略更新只需编辑提示文件。 ## 小结对于需要频繁调整审核策略或资源有限的团队，Amazon Nova 2 结合提示工程提供了一个实用的路径。它降低了内容审核系统的维护成本，同时保持了较高的准确性和可定制性。 > 注：本文基于 AWS 官方博客，所有数据与引用均源自原文。

AWS ML1个月前原文

171

Aderant借助Amazon Quick实现云运营转型：搜索速度提升90%，文档处理提速75%

新上线

在法律行业，数据分散于多个系统是常见痛点。Aderant作为全球领先的法律业务管理软件提供商，近期通过引入 **Amazon Quick** 的AI驱动能力，成功实现了跨六个供应商系统的统一搜索，并自动化了文档工作流。结果令人瞩目：**搜索时间缩短90%**，**文档处理速度提升75%**。这一案例展示了企业如何利用AI工具优化运营效率，并提供了可复用的方法论。 ## 痛点：碎片化的系统与低效的搜索 Aderant的运营团队长期面临一个典型挑战：信息散落在六个不同的供应商系统中。律师和工作人员在查找案件资料、客户信息或内部文档时，往往需要逐一登录各系统，手动输入查询条件，再跨平台整合结果。这种碎片化模式不仅耗时，还容易出错，直接影响决策效率和客户响应速度。 ## 解决方案：Amazon Quick的统一搜索与自动化 Amazon Quick是AWS推出的一项AI增强型搜索服务，能够连接多个数据源，并提供自然语言查询能力。Aderant利用其核心功能： - **统一索引**：将六个供应商系统的数据汇总至单一搜索入口，无需改变原有数据存储结构。 - **智能文档处理**：通过AI自动提取、分类和归档文档，减少人工介入。 - **自然语言查询**：用户可用日常语言提问（如“上季度约翰逊案的账单记录”），系统直接返回精准结果。 ## 成效：90%与75%的量化飞跃实施后，Aderant的运营数据发生了质变： - **搜索效率**：平均搜索时间从数分钟降至数秒，加速幅度达90%。律师和行政人员不再为找文件而中断工作流。 - **文档自动化**：文档创建、审批和归档流程中，人工步骤减少75%，错误率同步下降。 ## 启示：企业如何复制这一成功？ Aderant的实践为其他企业提供了清晰路径： 1. **识别核心痛点**：优先解决跨系统数据孤岛问题，而非盲目部署AI。 2. **选择可扩展工具**：Amazon Quick这类服务支持快速集成现有系统，降低迁移成本。 3. **持续优化**：利用AI的反馈机制，根据使用数据调整搜索权重和自动化规则。在AI重塑行业运营的浪潮中，Aderant的案例证明：**精准的AI工具应用，能大幅释放企业潜能**。未来，随着Amazon Quick等服务的迭代，类似转型将更加普及。

AWS ML1个月前原文

172

无缝集成：将Atlassian Confluence Cloud与Amazon Quick连接起来

新上线

在企业日常工作中，文档与数据往往分散在不同的系统中——技术文档存放在Confluence，业务数据则在Amazon S3或JIRA中。频繁切换工具不仅打断工作流，还容易导致信息孤岛。Amazon Quick推出的Confluence Cloud集成正是为了解决这一痛点，让用户无需离开Quick界面，即可通过自然语言查询、检索和管理Confluence内容。 ## 集成方式：不止一种选择 Quick提供了三种集成路径，以适应不同技术栈和团队需求： - **内置连接器**：针对Confluence Cloud、Jira、Salesforce等流行工具，提供预配置的驱动式集成，无需编写代码。 - **自定义REST API**：通过OpenAPI规范连接自有或第三方API，灵活性更高。 - **Model Context Protocol (MCP) 服务器**：基于开放标准，支持动态工具发现，适合复杂或定制化场景。本次重点介绍的是内置连接器方案，它最直接且易于上手。 ## 核心功能：知识库与Actions Quick的集成能力分为三大类： 1. **知识库（Knowledge Bases）**：对非结构化内容（如文档、Wiki）进行索引，支持语义搜索。用户提问时，Quick能自动检索相关Confluence页面并返回精准答案。 2. **Actions**：在提示或查询时连接外部系统，实现读取、写入和自动化任务。例如，直接通过Quick更新Confluence页面内容，或从JIRA拉取工单状态。 3. **Topics和Datasets**：针对结构化数据源（如Amazon Redshift）提供自然语言查询能力。本次教程聚焦于知识库和Actions的设置。 ## 设置步骤概览要实现Confluence Cloud与Quick的集成，主要分为以下几步： 1. **创建知识库**：将Confluence空间中的页面索引到Quick，使内容可被语义搜索。 2. **配置Actions**：通过内置连接器授权Quick访问Confluence，并定义可执行的操作（如查询页面、创建或更新文档）。 3. **组织资源**：在Quick Spaces中对集成资源进行分组管理，方便团队协作。 ## 实际价值：减少上下文切换，加速决策集成之后，团队可以在一个界面内完成跨系统操作。例如： - 当需要了解某个项目的技术方案时，直接在Quick中提问，系统会从Confluence检索相关文档并给出摘要。 - 如果发现文档需要更新，可直接通过Quick的Action修改Confluence页面，无需切换浏览器标签页。 - 结合其他数据源（如S3中的日志、JIRA中的工单），Quick能提供更全面的上下文，帮助快速做出决策。这种集成不仅减少了手动检索和重复登录的麻烦，更重要的是打破了信息壁垒，让知识真正流动起来。对于使用Atlassian生态并已上云的企业来说，这是一个值得关注的能力升级。 ## 小结 Amazon Quick与Confluence Cloud的集成，是AI助手与现有工作流深度融合的典型案例。它不再是一个孤立的对话工具，而是成为连接企业知识库和业务系统的中枢。随着更多内置连接器和MCP生态的完善，这类集成将越来越成为企业级AI应用的标配。

AWS ML1个月前原文

173

在 Amazon Bedrock AgentCore 中构建自定义代码评估器

新上线

将原型智能体投入生产时，需要在多个维度上评估其质量。Amazon Bedrock AgentCore Evaluations 提供 LLM-as-a-Judge 检查以及可扩展的代码评估器，以捕获特定领域的评估需求。本文以金融市场情报智能体为例，展示了如何实现四个基于 Lambda 的自定义代码评估器，涵盖股价实时波段验证、经纪人身份强制校验、工具输出 JSON Schema 合规性以及 PII 脱敏检查。 ## 为什么需要代码评估器？在金融服务等专业领域，关键质量维度往往超出语言范畴。例如，一个市场情报智能体必须： - 在可配置的实时波段内引用股价 - 在访问财务档案前遵循强制经纪人身份识别流程 - 返回符合严格 JSON Schema 的工具输出 - 拒绝泄露个人身份信息这些检查需要确定性代码——相同输入产生相同结果。若用 LLM-as-a-Judge 执行这些检查，不仅成本高昂，而且对于客观逻辑而言并非最优选择。**自定义代码评估器** 允许将 AWS Lambda 函数作为评估引擎，完全控制评分逻辑：正则表达式、结构验证、外部数据查询、调用其他服务或业务规则。 ## 评估器的工作模式自定义代码评估器支持两种运行模式： - **按需评估**：在开发工作流和 CI/CD 流水线中充当质量门禁 - **在线评估**：对生产实时流量进行评分即使追踪来自不同的智能体框架，也可以通过 Lambda 函数一致地评估智能体质量。 ## 实现四个自定义评估器文中实现了以下四个评估器： 1. **股价实时波段验证器**：确保智能体引用的股价在预设的实时浮动范围内，避免过时数据误导决策。 2. **经纪人身份强制校验器**：在访问客户财务档案前，检查是否已完成 Broker-ID 的确认流程，符合合规要求。 3. **工具输出 Schema 合规性检查器**：验证智能体返回的 JSON 结构是否严格匹配预定义的 Schema，防止下游解析错误。 4. **PII 脱敏检测器**：扫描智能体的输入和输出，检测并屏蔽身份证号、电话号码等敏感信息。 ## 结合内置评估器与其他 AWS 服务自定义评估器可以与 AgentCore 内置的 LLM-as-a-Judge 评估器组合使用。例如，用内置评估器评估回答的流畅性和相关性，用自定义评估器处理硬性合规检查。此外，Lambda 函数可以调用其他 AWS 服务： - **Amazon Comprehend** 进行实体识别和情感分析 - **Amazon SageMaker** 部署的专用模型进行事实核查 - **Amazon SNS** 发送实时告警 ## 注册与运行评估器通过 AgentCore 的控制台或 API 注册，指定 Lambda ARN 和评估维度。按需评估可在开发阶段手动触发；在线评估则配置为在智能体每次响应后自动执行。评估结果会聚合到 Amazon CloudWatch，方便监控和告警。 ## 小结自定义代码评估器为智能体质量评估提供了**确定性强、成本可控、高度可定制**的解决方案。对于金融、医疗、法律等对合规性和准确性要求极高的领域，代码评估器是 LLM-as-a-Judge 的有力补充。通过 Lambda 的灵活性，可以将任何业务规则转化为自动化的评估关卡，加速智能体从原型到生产的进程。

AWS ML1个月前原文

174

在 Amazon S3 的 Amazon Quick 知识库中限制敏感文档访问

新上线

## 概述在 AI 驱动的企业应用中，知识库的权限管理是数据安全的关键环节。**Amazon Quick** 近期为基于 **Amazon S3** 的知识库引入了**文档级访问控制列表（ACL）**，让企业能够精细化管理文档访问权限，确保敏感信息仅对授权用户可见。这一更新对于需要严格控制知识库内容访问的场景（如内部合规文档、客户隐私数据等）尤为重要。 ## 核心功能：文档级 ACL 传统上，知识库的权限往往停留在知识库或目录层级，难以实现文档级别的细粒度控制。Amazon Quick 的新功能允许管理员为 S3 知识库中的每个文档设置独立的 ACL 规则。这意味着，即使多个文档存储在同一 S3 路径下，系统也能根据用户身份或角色，动态决定哪些文档可以被检索、引用或展示。 **配置流程**包括： - 在 S3 存储桶中为文档附加 ACL 元数据（如通过标签或自定义属性）。 - 在 Amazon Quick 知识库中关联 ACL 配置，并映射到用户或群组。 - 通过聊天或自动化工作流测试权限效果，确保非授权用户无法获取受限文档。 ## 行业背景与价值随着生成式 AI 在企业中的普及，**知识库安全**已成为企业采纳技术的核心顾虑之一。传统 RAG（检索增强生成）方案中，模型可能因检索到敏感内容而输出不合规信息。文档级 ACL 直接解决了这一痛点，允许企业在不牺牲 AI 能力的前提下，满足 GDPR、HIPAA 等合规要求。 ## 应用场景 - **内部知识管理**：不同部门只能访问其相关的文档，如 HR 政策仅对人力资源团队可见。 - **客户支持**：基于客户等级或订阅类型，提供差异化的知识库内容。 - **合规审计**：敏感法律文档仅限法务部门访问，并记录所有查询日志。 ## 小结 Amazon Quick 的文档级 ACL 功能，为 S3 知识库提供了一种灵活且强大的权限控制手段。企业无需重构现有存储架构，即可实现对 AI 应用输出内容的精准管控。对于正在构建企业级 AI 助手的团队来说，这是一个值得关注的重要更新。

AWS ML2个月前原文

175

用 Amazon Lex Assisted NLU 提升机器人准确率：告别手动配置

新上线

Amazon Lex 新推出的 **Assisted NLU（自然语言理解）** 功能，正在改变对话式 AI 机器人的构建方式。传统 NLU 系统依赖开发者手动配置每一个可能的用户表述变体，不仅耗时巨大，而且难以覆盖真实场景下的语言多样性。Assisted NLU 则利用大语言模型（LLM）自动处理拼写错误、复杂句式和多意图表达，无需额外编码即可提升意图识别和槽位填充的准确率。 ### 传统 NLU 的三大痛点 1. **表述变体覆盖不全**：用户说“我想订酒店”和“我需要预订住宿”可能指向同一个意图，但传统系统需要分别枚举。 2. **复杂请求解析失败**：类似“帮我订一间 Seattle 市中心的双人房，12月15到18号”这样的句子，常丢失房间类型、位置、日期等关键信息。 3. **歧义处理能力弱**：用户说“我需要处理我的预订”，机器人无法判断是查询、修改还是取消。 ### Assisted NLU 如何工作 Assisted NLU 通过结合传统机器学习和 LLM，利用**意图和槽位的名称与描述**来理解用户输入。它支持三种工作模式： - **Primary 模式**：全程使用 LLM 增强理解，适合高精度场景。 - **Fallback 模式**：仅当传统 NLU 置信度不足时启用 LLM，作为安全兜底。 - **意图消歧**：当多个意图概率接近时，主动引导用户确认。该功能已包含在标准 Amazon Lex 定价中，无需额外付费。 ### 实施最佳实践 #### 1. 优化意图与槽位描述 Assisted NLU 依赖语义理解，因此**描述的质量直接决定准确率**。建议： - 为每个意图提供清晰、具体的描述，例如“BookHotel”的描述可写为“用户预订酒店房间，包括选择地点、日期和房型”。 - 为槽位添加上下文提示，如“room_type”的描述为“房间类型，如标准间、套房、豪华房”。 #### 2. 利用 Test Workbench 验证 Amazon Lex 提供的 **Test Workbench** 可批量测试对话样本，对比传统 NLU 和 Assisted NLU 的表现。建议： - 准备涵盖常见表述、复杂句式和边缘情况的测试集。 - 关注意图分类准确率、槽位填充完整率和对话完成率三个指标。 - 根据测试结果迭代调整描述和示例语句。 #### 3. 渐进式迁移策略 - **新建机器人**：直接启用 Assisted NLU，从设计阶段就采用 LLM 增强。 - **现有机器人**：建议先启用 Fallback 模式，逐步观察效果，再切换到 Primary 模式。 - 保留传统 NLU 配置作为基线，便于对比回归。 ### 行业影响与展望 Assisted NLU 的推出，标志着对话式 AI 从“规则驱动”向“语义理解”的重要转变。对于企业而言，这意味着： - **降低维护成本**：减少手动枚举 utterance 的工作量，迭代周期从周级缩短到天级。 - **提升用户体验**：机器人能更自然地理解用户的真实表达，减少重复和放弃率。 - **加速上线速度**：新业务场景的对话模型搭建时间可缩短 50% 以上。不过，LLM 的引入也带来新的考量：模型推理延迟、对描述质量的敏感度，以及在特定领域（如医疗、金融）的合规性。建议开发者在正式上线前进行充分的压力测试和合规审查。总的来说，Amazon Lex Assisted NLU 为构建高精度对话机器人提供了一条更智能、更高效的路径。无论是初创公司还是大型企业，都可以通过合理的设计和测试，快速提升机器人的自然语言理解能力。

AWS ML2个月前原文

176

实时语音智能体：Stream Vision Agents 携手 Amazon Nova 2 Sonic 实现分钟级生产部署

新上线

实时语音交互正成为 AI 应用的下一个前沿，但构建低延迟、可生产的语音智能体往往需要复杂的工程堆栈。Stream Vision Agents 这一开源框架与 **Amazon Bedrock** 及 **Amazon Nova 2 Sonic** 的结合，正在大幅降低这一门槛。开发者现在可以在几分钟内搭建起能够理解语音、调用工具并支持多语言的实时语音智能体，且具备生产级可靠性。 ## 架构解密：Stream Vision Agents + Amazon Nova 2 Sonic 如何协同工作 Stream Vision Agents 是一个专为实时多模态交互设计的开源框架，它抽象了音频流处理、事件管理和连接维护等底层细节。而 **Amazon Nova 2 Sonic** 是 Amazon Bedrock 上最新推出的语音模型，专为低延迟语音交互优化。两者结合后，开发者只需专注于智能体的业务逻辑，无需关心音频编解码、WebSocket 重连等基础设施。核心工作流如下： 1. 用户语音通过 Stream Vision Agents 的客户端 SDK 捕获并实时流式传输。 2. 框架将音频流送入 Amazon Bedrock 上的 Nova 2 Sonic 模型进行语音识别与理解。 3. 模型返回文本或结构化响应，框架支持通过 **函数调用**（Function Calling）触发外部 API 或数据库查询。 4. 响应文本由 Nova 2 Sonic 的文本转语音（TTS）能力合成为语音，流式回传给用户。 5. 连接意外中断时，框架内置的 **自动重连** 机制确保会话无缝恢复。 ## 从代码到生产：关键能力一览以下是该集成方案中值得关注的几项生产级特性： - **函数调用**：智能体可以调用预定义的函数来获取实时数据（如天气、库存、订单状态），而不仅仅是静态回复。例如，用户询问“我的订单什么时候到？”，智能体自动调用订单查询 API 并返回结果。 - **多语言语音支持**：Nova 2 Sonic 原生支持多种语言，包括中文、英文、日文、西班牙语等，且切换语言无需额外配置。这对于构建跨国客服或本地化应用至关重要。 - **自动重连**：网络波动时，Stream Vision Agents 会自动检测断连并重新建立 WebSocket 连接，同时保留会话上下文，避免用户重复表述。 - **低延迟优化**：端到端延迟控制在 **300ms 以内**，达到实时对话所需的“无感知”体验标准。 ## 实战：一个简单的语音助手示例假设我们要构建一个支持中英文的“会议助手”，能够查询日程和添加提醒。以下伪代码展示核心逻辑： ```python from stream_vision_agents import Agent, BedrockNovaSonic agent = Agent( model=BedrockNovaSonic(model_id="amazon.nova-sonic-v1"), functions=[get_schedule, add_reminder], languages=["zh-CN", "en-US"] ) agent.run() # 启动实时语音交互 ``` 开发者只需定义好函数和模型参数，Stream Vision Agents 会处理音频流的输入输出、自动重连和函数调用路由。相比传统方案，代码量减少约 70%。 ## 行业意义与未来展望这一集成方案的出现，意味着 **实时语音智能体** 不再是大厂专属。中小团队甚至个人开发者，都可以基于开源框架和云上 API 快速构建生产级应用。场景覆盖客服、语音助手、在线教育、医疗问诊等。值得注意的是，Stream Vision Agents 本身是开源项目，这意味着社区可以持续贡献新的功能模块（如情感识别、说话人分离），而 Amazon Bedrock 则提供了稳定且可扩展的算力底座。这种“开源+云”的组合模式，正在成为 AI 应用开发的主流范式。未来，随着多模态模型进一步成熟，这类智能体有望融合视觉信息（如摄像头画面）与语音交互，实现更丰富的场景理解。

AWS ML2个月前原文

177

从数据孤岛到统一洞察：Amazon QuickSight 跨账户 Athena 访问功能上线

新上线

Amazon QuickSight 宣布推出跨账户 Athena 访问功能，用户现在可以通过 AWS Identity and Access Management (IAM) 角色链，查询其他 AWS 账户中的 Athena 数据，查询费用将计入数据所在账户。 ## 背景：数据孤岛与统一分析的挑战在企业多云或大型组织中，数据往往分散在不同 AWS 账户中——例如生产环境、测试环境、分析团队各自拥有独立账户。传统上，跨账户查询 Athena 数据需要复杂的数据复制或管道集成，不仅增加延迟和成本，还容易导致数据不一致。 ## 新功能：跨账户 Athena 访问借助 **跨账户 Athena 访问**，QuickSight 用户无需移动数据即可实现跨账户分析。其核心机制是 **IAM 角色链**：用户通过 QuickSight 的 SPICE 引擎或直接查询模式，利用 IAM 角色跨账户委托权限，从而查询目标账户中的 Athena 表。查询费用直接归属于数据所在账户，简化了成本分摊。 ## 使用场景与价值 - **统一报表**：将多个业务线的数据整合到一个 QuickSight 仪表板，无需数据仓库。 - **合规与治理**：数据保留在原账户，满足数据主权和访问控制要求。 - **成本透明**：查询费用直接计入数据账户，便于按业务部门核算。 ## 技术要点 - 需要配置跨账户 IAM 信任策略，确保 QuickSight 账户可代入目标账户的角色。 - 支持 Athena 工作组的跨账户引用，需确保目标账户的 Athena 工作组已授权。 - 当前功能适用于 **Amazon Athena** 数据源，后续可能扩展至其他服务。 ## 行业意义这一更新标志着 **无服务器分析** 向更松耦合、更细粒度协作迈进。在 AI 和机器学习工作流中，数据通常分布在训练、推理、日志等多个账户，跨账户查询能力可显著加速数据准备和特征工程环节。 ## 小结跨账户 Athena 访问是 QuickSight 在“统一洞察”方向上的重要一步，尤其适合多账户架构的组织。它降低了数据移动成本，同时保留了数据治理的灵活性。对于已经在使用 Athena 和 QuickSight 的企业，这是一个值得立即评估的功能。

AWS ML2个月前原文

178

用Chrome企业策略为AI Agent划定浏览边界：Amazon Bedrock AgentCore新功能解析

新上线

Amazon Bedrock AgentCore浏览器现已支持Chrome企业策略和自定义根CA证书，让组织能够对AI Agent的浏览器行为实施精细化管控。这项更新直击AI Agent无限制网页访问带来的安全痛点——通过配置URL白名单/黑名单、禁用密码管理器、阻止文件下载等450余项策略，企业可以确保Agent仅在授权域内活动，同时借助自定义CA证书打通与内部服务及SSL拦截代理的安全连接。本文深入解读该功能的技术原理、配置方法与行业价值。 ## 为什么需要为AI Agent施加浏览器策略？ AI Agent若拥有不受限的网页访问权限，可能带来三类核心风险： 1. **导航越界**：Agent可能自行跳转到社交网站、搜索引擎等非授权域名，偏离任务目标。 2. **功能滥用**：浏览器自带的密码管理器、自动填充、文件下载等功能，可能被Agent无意间用于存储或泄露敏感数据。 3. **证书断层**：企业内部服务常使用私有CA签发证书，Agent浏览器默认不信任此类证书，导致HTTPS连接失败。 Chrome企业策略从浏览器层面直接锁定这些风险，**独立于Agent的提示词或推理逻辑**，形成一道不可绕过的安全屏障。 ## 核心能力：450+策略 + 自定义CA Amazon Bedrock AgentCore此次更新主要带来两大能力： ### 1. Chrome企业策略集成通过标准的Chrome企业JSON配置，用户可以设定超过450项浏览器设置，包括： - **URL过滤**：通过白名单和黑名单精确控制Agent可访问的域名列表。 - **下载限制**：禁止Agent在浏览器中下载任何文件。 - **密码管理**：禁用密码管理器、自动填充等功能，防止凭据被意外存储。 - **其他控制**：如禁用开发者工具、限制插件加载等。这些策略以JSON格式统一管理，与现有Chrome企业部署流程一致，降低了学习成本。 ### 2. 自定义根CA证书支持针对内部服务场景，AgentCore允许上传组织自己的根CA证书。这样Agent浏览器就能信任由私有CA签发的HTTPS证书，顺利连接内部系统或经过SSL拦截代理的加密流量。对于金融、医疗、政务等高度依赖内部网络的企业而言，这一能力直接打通了AI Agent落地的“最后一公里”。 ## 实用示例：从限制到验证文章通过一个完整的实践案例展示了功能流程： - **配置策略**：限制Agent只能访问Amazon Bedrock AgentCore官方文档网站。 - **执行与记录**：Agent在会话中尝试导航到其他网站时，浏览器被策略拦截，行为被完整录制。 - **CA验证**：使用公共测试站点演示自定义根CA证书的信任过程。最终，Agent在浏览器策略的约束下，成功完成对AgentCore文档的研究任务，验证了策略生效与安全边界的一致性。 ## 行业视角：AI Agent安全从“劝诫”走向“强制” 此前，AI Agent的安全浏览主要依赖开发者编写提示词约束，例如“不要访问非授权网站”。但提示词可以被绕过、遗忘或误解，安全可靠性有限。Chrome企业策略的引入，将安全控制从**软性指导**升级为**硬性执行**——无论Agent如何决策，浏览器行为始终受策略框架约束。这种“策略即代码”的思路，与零信任架构（Zero Trust）高度契合。企业无需信任Agent的内部逻辑，只需信任底层浏览器的策略执行引擎，从而大幅降低攻击面。 ## 总结 Amazon Bedrock AgentCore的Chrome企业策略与自定义CA支持，为AI Agent的浏览器行为提供了企业级的安全底座。它不仅解决了导航越界、功能滥用、证书断层三个核心痛点，更将安全控制与Agent开发解耦，让安全团队可以独立定义规则。随着AI Agent在企业工作流中的渗透率提升，这种“浏览器级安全”的能力将成为标配。

AWS ML2个月前原文

179

携手Pulse AI与Amazon Bedrock，构建金融文档智能处理方案

新上线

金融机构每天需要处理成千上万份复杂文档，从资产负债表、损益表、SEC文件到研究报告和审计材料。传统OCR工具在处理这些文档时往往力不从心——它们将文档视为图像，忽略了表格的合并单元格、多栏布局的交叉引用以及上下文依赖的语义信息。一个OCR错误在普通法律文档中可能只需快速修正，但在金融数据中却可能通过连锁计算引发系统性分析错误，带来高昂代价。本文将展示如何构建一套文档提取与模型微调流水线，通过融合**Pulse AI**的先进文档理解能力与**Amazon Bedrock**的强大AI服务，实现企业级的准确率和规模化上下文金融洞察提取。 ## 为什么传统OCR不够用？金融文档具有独特的结构复杂性： - **精细表格**：合并单元格、层级数据、跨行跨列引用 - **多栏布局**：各栏之间相互关联，需要理解阅读顺序 - **上下文依赖**：同一数字在不同场景下含义不同，需要语义理解传统OCR将文档当作图片处理，丢失了结构关系和上下文信息，导致大量人工修正、数据录入延迟和系统性分析错误。 ## Pulse AI + Amazon Bedrock 解决方案 **Amazon Bedrock** 提供完全托管的模型定制服务，零ML运维负担，按需部署无需容量规划。**Nova模型系列**具有出色的成本效益比，让团队专注于创新而非基础设施。 **Pulse AI** 则不同于传统单体OCR流水线，它将视觉语言模型与专为文档理解设计的经典ML组件相结合，创建了一个智能解决方案，能够： 1. 提取结构化数据并具备语义感知 2. 为金融领域模型生成高质量的监督微调数据集 3. 支持在特定金融数据上训练和部署自定义大语言模型（LLM） ## 实际应用与效果 Pulse已在全球多家企业部署，包括**三星、Cloudera、Howard Hughes**以及**财富500强金融机构**和领先的私募股权公司。这些组织通过该方案处理大量复杂金融文档，显著降低了OCR错误率，加速了数据提取流程，并提升了下游分析的准确性。 ## 构建自己的流水线开发者可以基于Amazon Bedrock上的Nova模型，结合Pulse AI的文档理解API，快速搭建端到端的金融文档处理流水线。关键步骤包括： - 文档解析与结构识别 - 语义级字段提取 - 数据清洗与验证 - 微调数据集生成 - 自定义LLM训练与部署这种方案不仅提高了处理效率，更让金融分析人员能够从繁琐的数据整理中解放出来，专注于更高价值的洞察工作。 ## 小结金融文档处理的难点在于结构复杂性和语义依赖性。通过Pulse AI与Amazon Bedrock的组合，企业能够获得一个既理解文档结构又把握金融语义的智能系统，从而在规模化处理中实现高准确率，降低风险，加速决策。

AWS ML2个月前原文

180

用 Amazon Nova Sonic 和 WebRTC 构建实时语音流应用

新上线

实时语音交互的端到端直播应用开发面临诸多挑战：网络带宽限制导致高延迟与质量下降，语言障碍影响人机交互的自然度，可扩展性与韧性难以平衡性能与成本，跨浏览器和移动端兼容性需要大量开发投入。本文介绍一种基于 **Amazon Nova 2 Sonic（Nova Sonic）** 和 **Amazon Kinesis Video Streams WebRTC（WebRTC）** 的解决方案，旨在攻克这些难题。 ## 核心挑战与应对传统语音代理管线通常将语音识别、语言处理和语音合成拆分为独立模块，导致延迟叠加。Nova Sonic 采用 **统一的语音到语音架构**，实现用户与 AI 代理间的低延迟实时对话。它通过统一的语音理解与生成，提供自然、类人的对话体验，并支持多种说话风格和外部代理工具接口，可构建更具上下文感知能力的响应式语音界面。 WebRTC 则负责在不稳定的网络中动态调整比特率，维持音频质量的同时减少连接中断。两者均由 AWS 全托管，自动弹性伸缩且具备高韧性。AWS 还提供了开源示例，帮助开发者快速启动项目。 ## 架构与实现模式典型的实时流处理管道包含媒体源、媒体服务器和媒体消费者三大组件。传统协议如 RTMP、RTSP、HLS、MPEG-DASH 各有局限。WebRTC 作为一种公开协议，通过 **实时点对点直连** 革新了直播流传输，无需额外插件或软件安装，省去中间服务器，显著降低延迟。文章详细阐述了结合 Nova Sonic 与 WebRTC 的解决方案架构，并给出了两个实际场景示例（原文未展开具体场景，但可推断涉及多语言客服、实时语音助手等）。开发者可利用 AWS 提供的开源示例作为起点，快速搭建应用。 ## 行业意义这一组合方案特别适合对实时性要求高的场景，如在线教育、远程医疗、语音客服、游戏语音交互等。Nova Sonic 的语言能力打破了多语言交互的壁垒，而 WebRTC 的弹性网络适配确保了全球用户的一致体验。对于初创公司而言，使用全托管服务可以大幅降低基础设施运维负担，将精力集中在业务逻辑上。

AWS ML2个月前原文

上一页9 / 18下一页