
英国警方构建庞大犯罪预测系统,部分结果却不可信
英国警方正积极拥抱AI革命,但《连线》杂志的一项调查揭示了其中一地预测分析实验的混乱内幕。
数据驱动的“风险画像”
自2016年起,布里斯托尔市议会与埃文郡和萨默塞特郡警察局联合启动了“思考家庭数据库”(Think Family Database),存储了近50万居民的敏感信息,包括警方情报、住房状况、心理健康记录、青少年怀孕情况、育儿课程参与度及免费学校餐食资格等。在此基础上,官员们构建了机器学习模型,为成千上万的成人和儿童打分,试图描绘出当地的“威胁、伤害和风险图景”。在一次2022年初帮助官员处理儿童剥削犯罪的活动中,一名警方数据科学家如此描述其方法:“我基本上将所有数据倒进一个大桶,用数据科学铲子搅拌,然后为每个人得出一个可爱的风险评分。”
23个模型与“危险人物排行榜”
“思考家庭数据库”的风险评分只是埃文郡和萨默塞特郡警察局庞大预测分析项目的一部分。该部门至少创建了23个独立模型,包括识别入室盗窃风险、法庭缺席风险、失踪风险以及成为家暴受害者风险的算法。一名高级警官甚至提到创建了该地区最危险罪犯的“排行榜”——这显然指的是“罪犯管理应用”(Offender Management App),该应用设计用于存储约30万人的数据。
公众知情权的缺失
警方如何开发和使用这些预测工具,对公众而言一直不甚透明。布里斯托尔当地警察问责组织负责人约翰·佩格拉姆(John Pegram)表示,直到2023年他才听说“罪犯管理应用”,而该应用早已存在多年。当他得知此事后,开始怀疑自己是否也在其中。“我想我知道自己在那个应用上,”佩格拉姆说。2024年初,他提交申请要求了解警方如何使用他的数据,但警方拒绝回应。几个月后,在佩格拉姆聘请律师介入后,警方确认他在应用中,但拒绝进一步说明。
像布里斯托尔、英国乃至全球越来越多地方的许多人一样,佩格拉姆不知道自己是否被算法评分、分数是多少,也不知道这如何影响他与当局的互动。
可信度危机
《连线》的调查发现,这些预测模型的部分结果并不可信。尽管警方声称这些工具能提升效率,但内部文件显示,模型存在偏差、数据质量低下等问题,导致某些评分缺乏可靠性。例如,用于识别潜在犯罪受害者的模型可能因历史数据中的系统性偏见而放大不平等。
小结
英国警方的AI实验揭示了技术乐观主义与公共问责之间的紧张关系。虽然预测分析有望优化资源配置,但缺乏透明度和验证机制可能侵蚀公众信任。随着AI在执法中的普及,确保算法公平、可解释且受监督,将成为关键挑战。