
AI 行为不端?现在你可以公开举报了
你是否曾担心你的 AI 聊天机器人在试图制造炸弹或泄露你的个人信息?现在有一个专门的网站可以让你发出警报。一群 AI 研究人员创建了一个名为 FLARE-AI(Flaw Reporting for AI)的众包网站,用于报告和追踪 AI 的危害行为。例如,如果聊天机器人生成恶意软件、提供制造炸弹的配方、泄露个人隐私或引发用户的妄想思维,用户都可以通过 FLARE-AI 进行举报。该系统采用开源代码,允许他人验证问题,并将报告转发给模型制造商以及像 MITRE 这样的非营利组织(该组织专门追踪技术系统的问题)。这有点像 Downdetector,后者汇总用户关于应用程序和网站等全球服务中断的实时报告。该网站是研究团队在 AI 报告方面持续工作的最新一步,我去年曾首次报道过他们的工作。团队成员还参与了今年 6 月宣布的一项国会法案的咨询工作,该法案将让美国政府承担追踪这类 AI 不当行为的核心角色。
“目前,还没有一个集中、可靠的方式来报告 AI 系统的缺陷,”HuggingFace 的 AI 政策研究员 Avijit Ghosh 表示,他与计算机科学家 Elaine Zhu 和 Shayne Longpre 共同领导了 FLARE-AI 的开发。这个警报系统是与来自 32 个不同组织的 49 位 AI 专家合作开发的。在一篇概述该工作的论文中,研究人员认为,随着 AI 被更广泛地采用以及自主系统获得更大的权力,他们的倡议可能变得至关重要。他们认为,缺乏一致的 AI 缺陷报告方式是一个重大问题。
智库“安全与新兴技术中心”的研究员 Jessica Ji 表示:“我认为这是一个非常好的倡议。”她指出,研究人员正确地认识到现有报告机制是零散的,而 AI 模型则是黑箱。“我支持任何能让 AI 更透明的事情,”她说。虽然漏洞和网络安全问题备受关注(尤其是最近),但 Ghosh 告诉我,AI 系统的问题涉及心理伤害、歧视或偏见以及错误信息等主题。他补充说,不同的公司对这些问题有不同的标准,这意味着一些问题会被忽视。FLARE-AI 旨在填补这一空白,提供一个统一的举报平台,让公众的声音能够被听到,并推动 AI 行业更加负责任地发展。