TabPFN-MT：原生多任务表格上下文学习器，推理成本O(1)

概览

Prior-Data Fitted Networks（PFN）在表格数据任务中表现出色，但传统 PFN 仅支持单任务推理——要预测多个目标变量，必须重复执行前向传播，且无法在任务间共享信息。近期，来自麦吉尔大学的研究团队提出了 TabPFN-MT，这是一种原生支持多任务的上下文学习器，通过扩展的多目标合成先验训练，能在一次前向传播中同时预测多个目标，大幅提升计算效率。

核心创新

TabPFN-MT 的架构改进集中在两个关键点：

扩展的 y 编码器（expanded y-encoder）：将每个样本的多个目标值编码为统一表示，使模型能同时处理多个标签。
共享解码器头（shared decoder head）：所有任务共享同一个解码器，从而在上下文学习中捕获任务间的依赖关系。

这种设计使得模型在推理时，对于 T 个任务的计算复杂度从传统的 O(T) 降至 O(1)，即无论有多少个目标变量，都只需一次前向传播即可完成所有预测。

性能表现

在344 个数据集上的广泛评估显示，TabPFN-MT 在中小规模数据集（平均样本数少于 1000）上取得了深度表格多任务学习的新最优结果。具体而言：

在多任务数据集上，其准确率平均排名为 4.89，是所有测试模型中的最高平均排名。
即使与最新的单任务集成模型相比，TabPFN-MT 依然极具竞争力，尽管多任务联合优化存在固有的计算不对称性。

行业意义

表格数据是金融、医疗、工业等领域最常见的结构化数据形式。传统多任务学习通常需要为每个任务单独训练模型或进行多次推理，成本高昂。TabPFN-MT 通过上下文学习替代梯度训练，特别适合样本量有限但任务繁多的场景（如小样本医疗诊断、多目标金融预测）。其 O(1) 推理成本 使得在边缘设备或实时系统上部署多任务模型成为可能。

局限与展望

当前模型主要面向中小规模数据集（<1000 样本），在大规模数据上的表现尚待验证。此外，多任务间的负迁移问题——即某些任务相互干扰导致性能下降——在 TabPFN-MT 中如何被缓解，论文未给出深入分析。未来工作可能包括扩展至更大数据集，以及探索更灵活的任务编码方式。

总体而言，TabPFN-MT 为表格多任务学习提供了一个高效、即用的新范式，其 “一次推理，多任务完成” 的特性有望在工业界快速落地。

TabPFN-MT：专为表格数据设计的原生多任务上下文学习器

概览

核心创新

性能表现

行业意义

局限与展望

延伸阅读

相关资讯