科学家在大模型少样本域适应方面取得进展

胡珉琦张欢 2024-08-21 20:24:23 中国科学报

近日，中国科学院软件研究所天基综合信息系统全国重点实验室研究团队提出了一种新颖的提示学习方法BayesPrompt，该方法通过探索以去偏方式近似下游任务的完整训练域，为预训练语言模型提供去歧义指导。相关论文被机器学习领域顶级学术会议ICLR 2024接收。

研究人员认为，学习范式长期存在的问题之一是下游域的训练样本中仅包含有限且离散的语义信息，无法较好地支持传统可训练提示获得足够监督，使得生成的提示对预训练语言模型的指导变得微乎其微。这个问题导致了预训练语言模型在下游域，尤其在少样本场景下性能的下降。

为此，研究团队从分布视角重新审视了预训练语言模型下游推理的原理，认为训练样本的有限会使得可训练提示只学习到目标域的有偏分布，而有偏分布仅包含部分信息且与目标域的实际分布不一致，这会引起协变量偏移问题，从而导致预训练语言模型产生知识歧义。

此次新提出的BayesPrompt旨在进行去偏域抽象，利用已知分布来近似下游域的去偏真实分布，再从近似分布中均匀采样代表性特征以生成对预训练语言模型（PLMs）的提示。研究团队通过进一步的理论验证，证明了与基准方法相比，BayesPrompt在预训练语言模型的下游推理上获得了更紧致的分类误差上界。此外，在少样本数据集设置下的实验结果进一步证明了BayesPrompt的有效性。

（责编：赵珊）

人民周刊网版权及免责声明：

1.凡本网注明“来源：人民周刊网”或“来源：人民周刊”的所有作品，版权均属于人民周刊网（本网另有声明的除外）；未经本网授权，任何单位及个人不得转载、摘编或以其它方式使用上述作品；已经与本网签署相关授权使用协议的单位及个人，应注意作品中是否有相应的授权使用限制声明，不得违反限制声明，且在授权范围内使用时应注明“来源：人民周刊网”或“来源：人民周刊”。违反前述声明者，本网将追究其相关法律责任。

2.本网所有的图片作品中，即使注明“来源：人民周刊网”及/或标有“人民周刊网(www.peopleweekly.cn)”“人民周刊”水印，但并不代表本网对该等图片作品享有许可他人使用的权利；已经与本网签署相关授权使用协议的单位及个人，仅有权在授权范围内使用图片中明确注明“人民周刊网记者XXX摄”或“人民周刊记者XXX摄”的图片作品，否则，一切不利后果自行承担。

3.凡本网注明“来源：XXX（非人民周刊网或人民周刊）”的作品，均转载自其它媒体，转载目的在于传递更多信息，并不代表本网赞同其观点和对其真实性负责。

4.如因作品内容、版权和其它问题需要同本网联系的，请在30日内进行。

※ 联系电话：010-65363526 邮箱：rmzk001@163.com

科学家在大模型少样本域适应方面取得进展

人民周刊微信公众号

人民周刊微博

热点话题

热门视频