本申请实施例涉及计算机,尤其涉及一种换脸方法、模型训练方法、电子设备和存储介质。
背景技术:
1、随着科学技术的日益发展,换脸技术不再需要人工参与,使用人工智能技术便可进行图像换脸和视频换脸。换脸技术可广泛应用于电影制作、游戏开发和创建虚拟角色等方面。换脸技术的关键点在于如何精确和充分地将身份相关的面部特征,包括结构和纹理,转移到目标人脸上。
2、相关技术中,通过源图像关键点提取源图像的脸部区域,再根据目标图像的关键点将源图像的脸部区域融合到目标图像中,从而完成图像换脸。这种换脸方法只是将相关的面部特征转移到了目标人脸上,并不能保证目标人脸的属性不变,如存在未能保留目标人脸的背景、服装以及姿势等属性,使得换脸图像的换脸效果较差。
3、因此,如何生成高质量的换脸效果成为一个亟待解决的问题。
技术实现思路
1、有鉴于此,本申请实施例提供一种换脸方法、模型训练方法、电子设备和存储介质,以至少部分解决上述问题。
2、根据本申请实施例的第一方面,提供了换脸方法,包括:
3、获取待换脸的第一图像和被换脸的第二图像;对所述第二图像进行关键点检测,得到所述第二图像对应的脸部缺失图像和脸部二值掩码图;将所述第一图像对应的脸部区域图像输入到脸部参考模型中,得到所述第一图像中的人物的脸部特征信息;基于所述第二图像和人物姿态分析模型进行姿势提取,得到所述第二图像中的人物的姿态特征信息;将所述脸部二值掩码图、所述脸部缺失图像和所述脸部特征信息作为预训练的扩散模型的主输入侧,并且将所述姿态特征信息作为所述扩散模型的条件输入侧,得到所述第二图像中的人物被换脸后的目标图像。
4、根据本申请实施例的第二方面,提供了一种模型训练方法,包括:
5、获取待换脸的第一图像样本和被换脸的第二图像样本;对所述第二图像样本进行关键点检测,得到所述第二图像样本的脸部缺失图像和脸部二值掩码图;将所述第一图像样本对应的脸部区域图像样本输入到脸部参考模型中,得到脸部特征信息;基于所述第二图像样本和人物姿态分析模型进行姿势提取,得到所述第二图像样本中的人物的姿态特征信息;将所述二值掩码图、所述脸部缺失图像和所述脸部特征信息作为扩散模型的主输入侧,并且将所述姿态特征信息作为所述扩散模型的条件输入侧确定噪声损失、身份损失、重建损失和感知损失;并通过所述噪声损失、所述身份损失、所述重建损失和所述感知损失分阶段对所述扩散模型进行训练,得到训练后的扩散模型。
6、根据本申请实施例的第三方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行如第一方面或如第二方面所述的方法对应的操作。
7、根据本申请实施例的第四方面,提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如第一方面或如第二方面所述的方法。
8、根据本申请实施例提供的方案,获取待换脸的第一图像和被换脸的第二图像;对第二图像进行关键点检测,得到第二图像对应的脸部缺失图像和脸部二值掩码图;将第一图像对应的脸部区域图像输入到脸部参考模型中,得到第一图像中的人物的脸部特征信息;基于第二图像和人物姿态分析模型进行姿势提取,得到第二图像中的人物的姿态特征信息;将脸部二值掩码图、脸部缺失图像和脸部特征信息作为预训练的扩散模型的主输入侧,并且将姿态特征信息作为扩散模型的条件输入侧,得到第二图像中的人物被换脸后的目标图像。在该过程中,结合脸部二值掩码图和第一图像中人物的脸部特征信息,能够在第二图像对应的脸部缺失图像对应的脸部缺失区域重新绘制第一图像的人脸,可以保证与脸部缺失图像能自然融合,保留了第二图像除人脸部分以外的其他部分,使得第一图像的人脸和第二图像能够协调融合。且将姿态特征信息作为条件约束输入到扩散模型的条件输入侧,用于控制生成的目标图像中的人物姿态,最终可以得到高保真的,自然的目标图像。
1.一种换脸方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述扩散模型包括自注意力层和图像交叉注意力层;
3.根据权利要求2所述的方法,其特征在于,所述第二图像为视频中的图像帧;所述扩散模型还包括时间注意力层;
4.根据权利要求2所述的方法,其特征在于,所述基于所述脸部二值掩码图、隐空间噪声、所述脸部缺失图像进行特征提取,得到第一隐空间特征图,包括:
5.根据权利要求2所述的方法,其特征在于,所述第一查询矩阵根据所述第一隐空间特征图和第一预设矩阵确定;所述第二值矩阵根据所述脸部特征信息和所述第二预设权重矩阵确定;所述第二键矩阵根据所述脸部特征信息和第三预设权重矩阵确定。
6.一种模型训练方法,其特征在于,包括:
7.根据权利要求6所述的方法,其特征在于,所述噪声损失包括图像样本对应的第一噪声损失和图像帧样本对应的第二噪声损失;所述身份损失包括图像样本对应的第一身份损失和所述图像帧样本对应的第二身份损失;所述重建损失包括图像样本对应的第一重建损失和所述图像帧样本对应的第二重建损失;所述感知损失包括图像样本对应的第一感知损失和所述图像帧样本对应的第二感知损失。
8.根据权利要求7所述的方法,其特征在于,所述通过所述噪声损失、所述身份损失、所述重建损失和所述感知损失分阶段对所述扩散模型进行训练,得到训练后的扩散模型,包括:
9.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
10.一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-5中任一项或6-8中任一项所述的方法。
