SheepNav
精选今天0 投票

Agent4cs:面向大型分层代码库的多智能体代码摘要系统

理解大型复杂代码库,尤其是那些结构混乱、文档不全的代码,一直是软件开发中的难题。现有代码摘要方案通常依赖单一语言模型或像 Claude Code 这样的编码助手,将源代码视为扁平文本,未能充分利用仓库内丰富的相互依赖关系和层次结构信息。为此,研究者提出 Agent4cs——一种多智能体框架,采用自底向上的方式对大型代码库进行摘要。

Agent4cs 包含三个核心智能体:

  • 摘要智能体:负责生成稳健的摘要;
  • 关键词提取智能体:主动从子文件夹中识别关键信息;
  • 质量保证智能体:迭代优化输出,确保可读性、连贯性和完整性。

在 7 个前沿模型上的评估显示,与两种包含代码片段的结构化提示基线相比,Agent4cs 在所有文件夹层级上的语义一致性平均提升了 8%。此外,在真实世界数据集上的广泛评估表明,归一化关键词覆盖率相比相同基线最高提升了 38%。该论文已被第 23 届欧洲多智能体系统会议(EUMAS 2026)主轨接收。

这一成果为大型代码库的理解与维护提供了新的自动化路径,尤其适合那些缺乏文档或结构晦涩的项目。多智能体协作的方式不仅提升了摘要质量,也展示了智能体系统在软件工程中的潜力。

延伸阅读

  1. 超越下一个词预测:RLVR在Atlassian工作流中实现工具使用代理的概念验证
  2. 扩散语言模型革新放射报告:任意顺序填充能力超越自回归模型
  3. CreativityNeuro:通过权重引导激发大模型发散思维,遏制模式崩溃
查看原文