Mimosa框架：进化型多智能体系统革新AI自主科研

当前，自主科学研究（ASR）系统虽然利用了大语言模型（LLMs）和智能体架构，但仍受限于固定的工作流程和工具集，难以适应不断变化的任务和环境。近日，研究人员在arXiv上发布了一篇题为《Mimosa Framework: Toward Evolving Multi-Agent Systems for Scientific Research》的论文，提出了一个名为Mimosa的进化型多智能体框架。该框架旨在解决现有ASR系统的僵化问题，通过自动合成任务特定的多智能体工作流，并利用实验反馈进行迭代优化，从而推动科学研究自动化的新范式。

核心创新：从“固定”到“进化”

传统的ASR系统通常采用预设的、线性的工作流程，这在面对复杂、动态的科学问题时显得力不从心。Mimosa的核心突破在于引入了**“进化”** 机制。它不再依赖一成不变的脚本，而是能够根据具体任务动态生成并持续改进其工作流程。

Mimosa的运作机制可以分解为几个关键环节：

动态工具发现：框架利用模型上下文协议（Model Context Protocol, MCP） 来发现和集成可用的工具与科学软件库。这确保了系统能够接入最新的研究资源。
工作流拓扑生成：一个元编排器（meta-orchestrator） 负责分析任务，并生成一个由多个智能体协作完成的工作流拓扑结构。
任务执行与代码生成：专门的代码生成智能体负责执行子任务，它们会调用已发现的工具和库来完成具体的计算或分析步骤。
基于LLM的评估与迭代优化：执行结果由一个基于LLM的“法官” 进行评分。该法官提供的反馈是驱动工作流进化的核心动力。如果当前工作流效果不佳，系统会基于反馈自动调整智能体的协作方式或工具使用策略，生成新的、可能更优的工作流版本进行下一轮尝试。

性能表现与关键发现

研究团队在ScienceAgentBench基准测试上对Mimosa进行了评估。当使用DeepSeek-V3.2作为底层执行模型时，Mimosa取得了43.1%的成功率。这一表现不仅超越了单智能体基线，也优于静态配置的多智能体系统。

一个尤为重要的发现是：不同的大语言模型对多智能体分解和迭代学习的响应存在显著差异。这意味着，工作流进化带来的益处并非普适，其效果高度依赖于底层执行模型（即所使用的LLM）自身的能力。这一发现为未来ASR系统的模型选择与优化提供了重要参考。

超越基准：框架的实用价值与开放性

Mimosa的设计充分考虑了实际科研场景的需求：

模块化与工具无关性：其模块化架构和工具无关的设计使其易于扩展，可以方便地集成新的工具、库或智能体类型。
可审计性与可复现性：框架完整记录了每一次执行的轨迹，并归档了所有工作流版本。这为科研过程的审查、验证和结果复现提供了坚实保障，符合科学研究的严谨性原则。
跨学科潜力：论文指出，结合领域专家的指导，Mimosa有潜力自动化处理各学科中大量可通过计算解决的科学任务。

最重要的是，Mimosa已被发布为一个完全开源的平台。研究团队明确表示，其目标是“为社区驱动的自主科学研究提供一个开放的基础”。这有望吸引全球开发者与研究者共同参与，加速ASR技术的创新与应用生态建设。

小结：迈向更自主、更灵活的AI科研助手

Mimosa框架代表了AI赋能科学研究的一个重要方向：从执行固定程序的“自动化工具”，向能够自主规划、试错并优化解决方案的“进化型研究伙伴”转变。它通过动态工作流合成与迭代反馈机制，初步解决了ASR系统的适应性问题。尽管其成功率在基准测试中仍有提升空间，且效果受限于底层LLM的能力，但其开源、可审计、可扩展的特性，为未来构建更强大、更可信的AI科研系统奠定了有希望的基础。随着大语言模型能力的持续进步和社区的共同贡献，这类进化型多智能体系统有望在药物发现、材料设计、数据分析等复杂科学探索中扮演越来越关键的角色。

Mimosa框架：迈向用于科学研究的进化型多智能体系统

核心创新：从“固定”到“进化”

性能表现与关键发现

超越基准：框架的实用价值与开放性

小结：迈向更自主、更灵活的AI科研助手

延伸阅读

相关资讯