
MaskLLM
producthunt.com
AI幻觉与推理失败案例库
6天前制作者:nitro
关于 MaskLLM
MaskLLM 是一个由社区维护的公开档案库,专门记录和整理各类 AI 模型(尤其是大语言模型)的失败模式。这些失败模式包括但不限于:幻觉(生成虚假信息)、推理崩溃(逻辑断裂或矛盾)、谄媚反转(为迎合用户而改变立场)、越狱攻击(绕过安全限制)等。
核心功能
- 结构化记录:每个失败案例都按照统一格式提交,包含输入、输出、模型信息、失败类型等字段,便于批量导出和数据分析。
- 数据集导出:支持将案例集导出为标准数据集格式(如 JSON、CSV),可直接用于模型训练、评估或可解释性研究。
- 红队审查:为安全研究人员提供真实攻击案例,辅助设计更鲁棒的防御机制。
主要特性
- 社区驱动:任何人都可以提交案例,经过审核后入库,形成持续增长的失败模式知识库。
- 分类清晰:按失败类型(幻觉、推理错误、越狱等)和模型版本进行标签化管理,方便检索。
- 可复现性:每个案例均记录完整的对话上下文和模型参数,确保研究者能够复现失败场景。
- 开源免费:所有数据公开,无使用限制,促进 AI 安全领域的透明协作。
适用场景
- AI 安全研究:分析模型漏洞,设计对抗性防御。
- 模型评估:在测试集中加入真实失败案例,提升评估的全面性。
- 可解释性研究:通过失败模式理解模型内部机制。
- 教育训练:作为教材展示 AI 的局限性,培养批判性思维。