精选今天0 投票
FinAgent-RAG:专为金融文档问答设计的智能体增强检索生成框架
金融文档问答(QA)要求对分散在公司文件中的异构证据(结构化表格、文本叙述和脚注)进行复杂的多步数值推理。现有的检索增强生成(RAG)方法采用单次检索然后生成的范式,难以应对金融分析中常见的组合推理链。为此,研究人员提出了 FinAgent-RAG,一种智能体 RAG 框架,它通过迭代检索-推理循环与自我验证来编排流程,专为金融数值推理的精度要求而设计。
三大核心创新
FinAgent-RAG 集成了三项领域特定创新:
- 对比金融检索器(Contrastive Financial Retriever):通过难负样本挖掘训练,能够区分语义相似但数值不同的金融段落,提升检索精度。
- 程序化思维推理模块(Program-of-Thought):生成可执行的 Python 代码进行精确算术运算,避免依赖容易出错的 LLM 心算推理。
- 自适应策略路由器(Adaptive Strategy Router):根据问题复杂度动态分配计算资源,在 FinQA 数据集上减少 41.3% 的 API 成本,同时保持准确率。
性能表现
在三个基准数据集上的广泛实验表明,FinAgent-RAG 取得了领先结果:
- FinQA:执行准确率 76.81%
- ConvFinQA:78.46%
- TAT-QA:74.96%
相比最强基线,准确率提升了 5.62 至 9.32 个百分点。消融实验、跨四种 LLM 的骨干网络评估以及部署成本分析,均证实了该框架的鲁棒性和在实际金融机构中的可行性。
行业意义
当前金融分析领域,大语言模型(LLM)虽展现出强大能力,但在需要精确数值计算的场景中仍存在幻觉和计算错误问题。FinAgent-RAG 通过将检索、代码生成和自适应资源分配相结合,为金融文档 QA 提供了一种更可靠、更高效的解决方案。该工作已提交至《Expert Systems with Applications》期刊,并公开了详细的技术报告(22 页,含 11 张图表和 13 张表格)。
一句话总结:FinAgent-RAG 通过智能体循环、代码推理和自适应路由,在金融数值问答上显著超越现有方法,同时降低了计算成本。