Parameter Golf 挑战赛：AI辅助研究的经验与教训

OpenAI 举办的 Parameter Golf 挑战赛吸引了超过 1000 名参与者和 2000 份提交，探索了在严格约束下的 AI 辅助机器学习研究。本文总结了技术亮点与经验教训。

挑战赛概况

Parameter Golf 的目标是让参与者在16 MB的工件限制（包括模型权重和训练代码）以及10分钟的训练预算（8×H100 GPU）内，最小化在固定 FineWeb 数据集上的损失。比赛持续八周，提供了基线模型、数据集和评估脚本，参与者通过 GitHub 提交结果。

一些最出色的结果来自对现有组件的精细调优。例如，提交 #60 的 @notapplica 结合了此前多个获胜方案的优点，采用 Muon 权重衰减、谱嵌入初始化、残差混合调度和编译评估，构建了更深的模型。

许多参赛者深入探索了量化技术，在有限空间内塞入更大模型。还有新颖的模型架构设计，如测试时训练（test-time training）等，展现了技术创造力。

比赛中最令人兴奋的方面之一是 AI 编码智能体的广泛使用。这些智能体降低了实验成本，使更多人能够参与，并改变了竞争节奏。然而，它们也带来了提交审查、归因和评分的新挑战。

Parameter Golf 成为了一个有效的人才发现平台。开放式的技术挑战能够揭示出色的机器学习品味和毅力，这是比赛的重要收获之一。

Parameter Golf 不仅推动了技术探索，也为未来 AI 辅助研究的竞赛形式提供了宝贵经验。