AI 行为不端举报平台 FLARE-AI 上线

你是否曾担心你的 AI 聊天机器人在试图制造炸弹或泄露你的个人信息？现在有一个专门的网站可以让你发出警报。一群 AI 研究人员创建了一个名为 FLARE-AI（Flaw Reporting for AI）的众包网站，用于报告和追踪 AI 的危害行为。例如，如果聊天机器人生成恶意软件、提供制造炸弹的配方、泄露个人隐私或引发用户的妄想思维，用户都可以通过 FLARE-AI 进行举报。该系统采用开源代码，允许他人验证问题，并将报告转发给模型制造商以及像 MITRE 这样的非营利组织（该组织专门追踪技术系统的问题）。这有点像 Downdetector，后者汇总用户关于应用程序和网站等全球服务中断的实时报告。该网站是研究团队在 AI 报告方面持续工作的最新一步，我去年曾首次报道过他们的工作。团队成员还参与了今年 6 月宣布的一项国会法案的咨询工作，该法案将让美国政府承担追踪这类 AI 不当行为的核心角色。

“目前，还没有一个集中、可靠的方式来报告 AI 系统的缺陷，”HuggingFace 的 AI 政策研究员 Avijit Ghosh 表示，他与计算机科学家 Elaine Zhu 和 Shayne Longpre 共同领导了 FLARE-AI 的开发。这个警报系统是与来自 32 个不同组织的 49 位 AI 专家合作开发的。在一篇概述该工作的论文中，研究人员认为，随着 AI 被更广泛地采用以及自主系统获得更大的权力，他们的倡议可能变得至关重要。他们认为，缺乏一致的 AI 缺陷报告方式是一个重大问题。

智库“安全与新兴技术中心”的研究员 Jessica Ji 表示：“我认为这是一个非常好的倡议。”她指出，研究人员正确地认识到现有报告机制是零散的，而 AI 模型则是黑箱。“我支持任何能让 AI 更透明的事情，”她说。虽然漏洞和网络安全问题备受关注（尤其是最近），但 Ghosh 告诉我，AI 系统的问题涉及心理伤害、歧视或偏见以及错误信息等主题。他补充说，不同的公司对这些问题有不同的标准，这意味着一些问题会被忽视。FLARE-AI 旨在填补这一空白，提供一个统一的举报平台，让公众的声音能够被听到，并推动 AI 行业更加负责任地发展。

AI 行为不端？现在你可以公开举报了

延伸阅读

相关资讯