SheepNav
MaskLLM

MaskLLM

producthunt.com

AI幻觉与推理失败案例库

6天前制作者:nitro

关于 MaskLLM

MaskLLM 是一个由社区维护的公开档案库,专门记录和整理各类 AI 模型(尤其是大语言模型)的失败模式。这些失败模式包括但不限于:幻觉(生成虚假信息)、推理崩溃(逻辑断裂或矛盾)、谄媚反转(为迎合用户而改变立场)、越狱攻击(绕过安全限制)等。

核心功能

  • 结构化记录:每个失败案例都按照统一格式提交,包含输入、输出、模型信息、失败类型等字段,便于批量导出和数据分析。
  • 数据集导出:支持将案例集导出为标准数据集格式(如 JSON、CSV),可直接用于模型训练、评估或可解释性研究。
  • 红队审查:为安全研究人员提供真实攻击案例,辅助设计更鲁棒的防御机制。

主要特性

  • 社区驱动:任何人都可以提交案例,经过审核后入库,形成持续增长的失败模式知识库。
  • 分类清晰:按失败类型(幻觉、推理错误、越狱等)和模型版本进行标签化管理,方便检索。
  • 可复现性:每个案例均记录完整的对话上下文和模型参数,确保研究者能够复现失败场景。
  • 开源免费:所有数据公开,无使用限制,促进 AI 安全领域的透明协作。

适用场景

  • AI 安全研究:分析模型漏洞,设计对抗性防御。
  • 模型评估:在测试集中加入真实失败案例,提升评估的全面性。
  • 可解释性研究:通过失败模式理解模型内部机制。
  • 教育训练:作为教材展示 AI 的局限性,培养批判性思维。

相关工具