精选今天0 投票
PrologMCP:为LLM智能体打造的标准化Prolog工具接口
前沿推理调优语言模型在执行深度演绎任务时仍会失败,且通过扩展内部推理来提升性能的成本高昂。符号委托提供了一条互补路径:语言模型负责翻译问题,而求解器执行推理。然而,当前面向逻辑编程的自动形式化流程通常是针对特定任务或智能体的定制集成。我们提出了 PrologMCP,一个任务无关、开源的服务器,通过模型上下文协议(MCP)将 Prolog 暴露为有状态工具。其紧凑的工具接口、结构化错误报告以及基于会话的隔离机制,使得“翻译-运行-检查-修复”循环成为 MCP 智能体的可复用原语。我们在 PARARULE-Plus 的两个子集上评估了增强 PrologMCP 的形式化智能体与标准及推理 LLM(Claude Sonnet 4.6、GPT-4.1 和 o4-mini)的表现:一个通用样本,另一个更具挑战性,针对自然语言推理的特定失败模式。在通用样本上,形式化智能体匹配或超越推理 LLM(准确率 1.00 vs. 1.00 / 0.998),相比标准模型提升最大(GPT-4.1 为 0.762)。在挑战性子集上,形式化智能体保持接近完美(1.00 / 0.99),而推理 LLM 下降至 0.95 / 0.94。这些结果表明,通过 MCP 将推理委托给 Prolog 是扩展自然语言推理的一种稳健且可检查的替代方案。