利用认知抽象与推理语料库探索人类在抽象规则推断和问题解决中的行为
人类在抽象推理方面展现出惊人的灵活性,能够从稀疏的示例中快速学习和应用规则。为了深入探究这种能力背后的认知策略,研究人员开发了认知抽象与推理语料库(CogARC),为理解人类智能的运作机制提供了新的窗口。
研究背景
抽象推理是人类智能的核心特征之一,也是人工智能领域长期追求的目标。抽象与推理语料库(ARC) 最初由François Chollet于2019年提出,旨在为AI系统提供一个衡量抽象推理能力的基准测试。然而,ARC主要面向机器评估,对人类认知过程的直接研究支持有限。
为了弥合这一差距,研究团队从ARC中精心挑选并改编了75个抽象视觉推理问题,创建了认知抽象与推理语料库(CogARC)。这个专门为人类设计的子集保留了原问题的核心挑战——要求参与者从少量示例中推断输入输出规则,并将测试输入转换为正确的测试输出,同时增加了对行为数据的详细记录能力。
实验设计与发现
研究共进行了两项实验,涉及260名人类参与者。实验过程中,系统以高时间分辨率记录了参与者的完整行为轨迹,包括示例查看模式、编辑序列和多尝试提交过程。这种精细的数据采集方式使得研究人员能够深入分析人类在解决抽象问题时的认知策略演变。
实验结果显示,参与者在CogARC任务中整体表现良好:实验1(40名参与者)的平均准确率约为90%,实验2(220名参与者)的平均准确率约为80%。然而,不同问题和参与者之间的表现差异显著。较难的问题引发了更长的思考时间和更多样化的解决策略,这表明问题难度直接影响认知负荷和策略选择。
一个有趣的发现是,随着任务进行,参与者启动响应的速度加快,但准确率略有下降。研究人员认为这反映了对任务结构的熟悉度增加,而非规则学习能力的实质性提升。这一发现对理解人类学习曲线的本质具有重要意义。
认知策略分析
研究特别关注了错误解决方案的模式。即使最终答案不正确,许多参与者的解决路径也表现出高度收敛性,尽管这些路径在长度和平滑度上存在差异。研究人员观察到两种主要的问题解决轨迹:
- 直接高效型:参与者快速识别规则,平稳推进至稳定结果
- 探索调整型:涉及更长时间的探索、试错,甚至部分重启,最终才收敛到解决方案
这些行为模式揭示了人类在不确定性条件下如何泛化规则、错误泛化并调整策略。CogARC不仅记录了最终结果,更重要的是捕捉了认知过程的动态变化,为理解人类抽象推理的机制提供了丰富的行为数据。
研究意义与展望
CogARC的建立标志着抽象推理研究从单纯的性能评估向认知过程分析的转变。这个语料库为比较人类与AI的推理策略提供了共同基础,有助于揭示两者在问题解决上的根本差异。对人类错误模式和策略调整的深入理解,可能为开发更接近人类认知方式的AI系统提供关键启示。
未来研究可以进一步探索个体差异因素(如认知风格、专业知识)对抽象推理策略的影响,或将CogARC应用于神经科学研究,结合脑成像技术揭示抽象推理的神经基础。随着AI系统在复杂推理任务上面临的挑战日益凸显,对人类认知策略的深入理解将成为推动下一代AI发展的重要动力。