突破上下文窗口：用Amazon Bedrock AgentCore处理超长文档

在处理数百万字符的文档时，传统大语言模型（LLM）的上下文窗口往往成为瓶颈。即使是最长的上下文窗口，也可能因输入过长而拒绝请求，或产生基于不完整信息的回答。本文介绍了如何利用 Amazon Bedrock AgentCore Code Interpreter 和 Strands Agents SDK 实现递归语言模型（RLM），从而突破这一限制。

为什么上下文窗口不够用？

以金融分析为例，比较一家公司两年年报中的指标。每份报告 300–500 页，加上分析师报告、SEC 文件等，总字符数可达数百万。直接输入模型时，要么超出上下文窗口限制而失败，要么虽然“塞入”但模型难以关注中间部分的信息——这就是著名的 “lost in the middle” 问题。上下文窗口大小是一个硬限制，单纯通过提示工程无法解决。我们需要一种将文档大小与模型上下文窗口解耦的方法。

RLM：将上下文视为环境

RLM 由 Zhang 等人在 arXiv:2512.24601 中提出，它重新定义了问题：不将整个文档喂给模型，而是将输入视为一个外部环境，模型通过编程方式与之交互。模型只接收查询和环境描述，然后编写代码来搜索、切片、迭代分析文档。当需要理解某个特定部分的语义时，模型会委托给子 LLM 调用，并将结果保存在工作记忆中。

实现方式

通过 Bedrock AgentCore Code Interpreter，你可以：

处理任意长度的文档，无上下文窗口上限。
将 Code Interpreter 作为持久工作记忆，进行迭代式文档分析。
在沙盒化 Python 环境中编排子 LLM 调用，分析特定文档片段。

具体流程如图 1 所示：根 LLM 生成代码探索文档环境，将语义分析委托给子 LLM，并将结果累积在工作记忆中，然后优化下一步操作。

实际价值

这种递归方法不仅突破了上下文窗口的硬限制，还避免了“lost in the middle”问题。对于金融、法律、学术研究等需要处理超长文档的领域，RLM 提供了一种可扩展的解决方案。Amazon Bedrock AgentCore 和 Strands Agents SDK 的组合，让开发者能够快速构建这类应用，而无需从头实现复杂的工作流。

小结

上下文窗口不再应该是文档分析的瓶颈。通过递归语言模型和 Amazon Bedrock AgentCore，你可以将文档处理能力提升到新的水平。无论是百万字符的报告还是多文件集合，RLM 都能让你在不丢失信息的前提下进行深入分析。

突破上下文窗口限制：用 Amazon Bedrock AgentCore 处理超长文档

为什么上下文窗口不够用？

RLM：将上下文视为环境

实现方式

实际价值

小结

延伸阅读

相关资讯