科学家找到提升元学习泛化性能新方法

胡珉琦张欢 2024-08-21 20:23:16 中国科学报

近日，中国科学院软件研究所天基综合信息系统全国重点实验室研究团队的一项研究成果，聚焦元学习的学习机制与任务采样，有助于模型泛化与迁移性能的提升，被被人工智能领域顶级国际会议IJCAI接收。

元学习旨在从有限的数据中构建多样化的训练任务来学习一般知识，然后迁移到新的任务中。传统观点认为，训练任务越多样，模型的泛化能力越好。然而，研究团队通过结构因果模型实验发现，在元学习机制下的任务最佳分类器不仅是利用因果因子进行决策，同时还会受到非因果因子的干预，即元学习中特定任务的因果因子和标签之间有虚假相关性，这些任务混杂因子会引起任务负迁移，从而影响泛化性能。

基于上述发现，研究团队提出了一种元学习因果表示学习器MetaCRL，用来消除任务混杂因子。MetaCRL由两个模块组成：解耦模块和因果模块。解耦模块首先通过学习语义矩阵获得整个生成因子，然后使用分组函数获取与每个任务相关的生成因子子集，旨在获得所有与任务相关的生成因子以及与单个任务相关的特定任务生成因子；因果模块则负责确保生成因子的真实因果关系，即基于因果不变性定理以及同一模型可以在不同分布中学习因果相关性，一方面是对表现出分布变化的多个训练数据集强制执行不变性，另一方面是通过简单的双层优化来保证解耦模块获得的语义矩阵和分组函数得到的生成因子具有真实因果关系。

MetaCRL能应用于各种元学习框架，通过交替优化MetaCRL与元学习模型，使元学习基于真实因果因子学习各种任务的通用知识，从而消除任务混杂因子。研究团队进一步在各种下游任务上进行了分类、回归、预测等广泛实验。结果表明，引入MetaCRL的各种元学习基线方法都获得了稳定的性能提升。此外，在多个基准数据集的知识迁移实验中进一步证明了MetaCRL消除任务混杂的有效性。

该论文共同第一作者为硕士生王婧瑶、副研究员任懿，通讯作者为特别研究助理强文文。

（责编：赵珊）

人民周刊网版权及免责声明：

1.凡本网注明“来源：人民周刊网”或“来源：人民周刊”的所有作品，版权均属于人民周刊网（本网另有声明的除外）；未经本网授权，任何单位及个人不得转载、摘编或以其它方式使用上述作品；已经与本网签署相关授权使用协议的单位及个人，应注意作品中是否有相应的授权使用限制声明，不得违反限制声明，且在授权范围内使用时应注明“来源：人民周刊网”或“来源：人民周刊”。违反前述声明者，本网将追究其相关法律责任。

2.本网所有的图片作品中，即使注明“来源：人民周刊网”及/或标有“人民周刊网(www.peopleweekly.cn)”“人民周刊”水印，但并不代表本网对该等图片作品享有许可他人使用的权利；已经与本网签署相关授权使用协议的单位及个人，仅有权在授权范围内使用图片中明确注明“人民周刊网记者XXX摄”或“人民周刊记者XXX摄”的图片作品，否则，一切不利后果自行承担。

3.凡本网注明“来源：XXX（非人民周刊网或人民周刊）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。

4.如因作品内容、版权和其它问题需要同本网联系的，请在30日内进行。

※ 联系电话：010-65363526 邮箱：rmzk001@163.com

科学家找到提升元学习泛化性能新方法

人民周刊微信公众号

人民周刊微博

热点话题

热门视频