SheepNav
新上线今天0 投票

突破上下文窗口限制:用 Amazon Bedrock AgentCore 处理超长文档

在处理数百万字符的文档时,传统大语言模型(LLM)的上下文窗口往往成为瓶颈。即使是最长的上下文窗口,也可能因输入过长而拒绝请求,或产生基于不完整信息的回答。本文介绍了如何利用 Amazon Bedrock AgentCore Code InterpreterStrands Agents SDK 实现递归语言模型(RLM),从而突破这一限制。

为什么上下文窗口不够用?

以金融分析为例,比较一家公司两年年报中的指标。每份报告 300–500 页,加上分析师报告、SEC 文件等,总字符数可达数百万。直接输入模型时,要么超出上下文窗口限制而失败,要么虽然“塞入”但模型难以关注中间部分的信息——这就是著名的 “lost in the middle” 问题。上下文窗口大小是一个硬限制,单纯通过提示工程无法解决。我们需要一种将文档大小与模型上下文窗口解耦的方法。

RLM:将上下文视为环境

RLM 由 Zhang 等人在 arXiv:2512.24601 中提出,它重新定义了问题:不将整个文档喂给模型,而是将输入视为一个外部环境,模型通过编程方式与之交互。模型只接收查询和环境描述,然后编写代码来搜索、切片、迭代分析文档。当需要理解某个特定部分的语义时,模型会委托给子 LLM 调用,并将结果保存在工作记忆中。

实现方式

通过 Bedrock AgentCore Code Interpreter,你可以:

  • 处理任意长度的文档,无上下文窗口上限。
  • 将 Code Interpreter 作为持久工作记忆,进行迭代式文档分析。
  • 在沙盒化 Python 环境中编排子 LLM 调用,分析特定文档片段。

具体流程如图 1 所示:根 LLM 生成代码探索文档环境,将语义分析委托给子 LLM,并将结果累积在工作记忆中,然后优化下一步操作。

实际价值

这种递归方法不仅突破了上下文窗口的硬限制,还避免了“lost in the middle”问题。对于金融、法律、学术研究等需要处理超长文档的领域,RLM 提供了一种可扩展的解决方案。Amazon Bedrock AgentCore 和 Strands Agents SDK 的组合,让开发者能够快速构建这类应用,而无需从头实现复杂的工作流。

小结

上下文窗口不再应该是文档分析的瓶颈。通过递归语言模型和 Amazon Bedrock AgentCore,你可以将文档处理能力提升到新的水平。无论是百万字符的报告还是多文件集合,RLM 都能让你在不丢失信息的前提下进行深入分析。

延伸阅读

  1. Amazon Nova Act 获得 HIPAA 合规资格,助力医疗 AI 自动化
  2. Grok 陷入困境,SpaceX 押注 AI 数据中心以超越科技巨头
  3. Meta深陷危机、Google搜索大改造、AI毕业典礼被嘘——本期Uncanny Valley全解析
查看原文