中国科学院上海微系统与信息技术研究所仿生视觉系统实验室主任李嘉茂团队提出了视觉三维(3D)人体姿态估计的新模型,并在权威评测数据集上完成了验证。相关研究被机器视觉领域三大国际学术会议之一的欧洲计算机视觉国际会议(ECCV)录用。
3D人体姿态估计是机器视觉理解人体动作的关键技术,在虚拟现实、运动分析、人机交互等领域有着广泛应用。目前,机器视觉领域往往利用人工神经网络进行自监督学习,从多视角的二维(2D)图像中预测3D人体姿态。
重投影一致性是实现自监督学习3D人体姿态的关键,主要思想为:由虚拟相机对预测的3D人体姿态进行拍摄,得到的2D人体姿态应与输入图像中直接得到的2D人体姿态一致。在实际操作中,输入图像的2D姿态由相机成像的透视投影得到,而预测的3D姿态无法使用透视投影,导致人工神经网络的学习与预测之间出现了偏差。
研究团队提出了一种旋转正交投影模型,根据参考点距离图像中心的偏移情况,计算旋转补偿,从而在保持投影模型简单的同时,缩小与透视投影模型之间的误差。在此基础上,研究团队提出了分组旋转正交投影方法,根据关节点之间的相对距离将人体分割成多个部分,并分别计算参考点和相应的旋转补偿,进一步缩小了与透视投影模型的误差。此外,研究团队提出了关节反向约束,利用骨骼运动学先验增强对三维空间中人体姿态的监督。
(责编:赵珊)