主动域适应语义分割方法、系统、设备及存储介质

专利2025-04-06  22


本发明涉及图像语义分割,尤其涉及一种主动域适应语义分割方法、系统、设备及存储介质。


背景技术:

1、近年来,深度学习在计算机视觉领域取得了显著的进展。然而,深度学习模型通常需要大量高质量的标注数据来进行训练。对于语义分割等像素级预测任务而言,获取大规模标注数据集需要耗费巨大的时间和人力资源,因此人工标注数据集变得不切实际。

2、为了解决这个问题,研究者们提出了无监督域适应学习方法。该方法旨在利用在拥有大量标注样本的源域上学习到的知识,帮助模型在与源域相关但缺乏标注的目标域上进行学习。通过减小领域之间的差异,提高模型在目标域上的性能,从而降低目标域上的标注成本。尽管当前的无监督域适应学习方法通过减少源域和目标域之间的差异已经取得了较好的效果,但由于缺乏目标域标注信息的引导,域适应问题仍然没有完全解决。

3、为了进一步提升模型在目标域的性能,主动域适应学习方法被提出。该方法通过主动学习的方式选择少量最有价值的目标域样本进行标注,从而进一步指导模型的域适应学习。通过有针对性地选择标注样本,模型可以更好地学习目标域的特点。这种方法通过引入少量的标注成本,能够显著改善域适应性能。

4、常用的主动域适应方法是根据模型预测的不确定度选择最有价值的目标域样本进行图像级或像素级标注。在授权公告号为cn111767674b的中国发明专利《一种基于主动域适应的测井岩性识别方法》中,利用源域样本训练两个具有差异化的神经网络,并获取两个神经网络对目标样本集合中每个样本的预测结果;根据预测结果,该方法选择目标域样本中具有高不确定度的样本进行图像级标注,并将这些标注样本用于模型的目标域学习。在公布号为cn114220086a的中国发明专利申请《一种成本高效的场景文字检测方法及系统》中,提出熵感知的全局对齐模块和文字区域对齐模块的场景文字检测网络进行预训练,减少领域间的差异;利用预训练模型进行基于不确定性度量的主动学习,选择不确定度最高的若干目标域样本进行图像级标注,并使用这些标注样本对预训练模型进行微调,以适应目标域学习。在公布号为cn115620160a的中国发明专利申请《基于多分类器对抗主动迁移学习的遥感图像分类方法》中,使用对抗迁移学习方法训练特征提取器和两个分类器;主动学习查询策略选择被多分类器分类不一致的目标域数据进行图像级标注,并将其用于模型的目标域学习。在公布号为cn116863186a的中国发明专利申请《基于源域无关领域适应和主动学习的图像分类方法及系统》中,采用源域模型初始化目标域模型的特征提取器和分类器,并提取所有样本的特征;对所有样本的特征进行聚类操作,得到所有样本的伪标签,并计算每个样本的邻居不确定性的值;根据邻居不确定性的值选择目标域样本进行图像级标注。在公布号为cn116758541a的中国发明专利申请《基于主动学习的域适应交互式语义分割方法、装置和设备》中,通过弱监督的方式加速人机交互和语义分割两个任务的融合;预热阶段使用源域数据和标注采样策略对模型进行多轮训练;标注采样策略是根据预设价值评估函数和预设得分阈值,采用先看后问的标注采样策略对目标域样本进行像素级标注(每张图仅标注少量最有价值的像素点)。在公布号为cn117058373a的中国发明专利申请《双级别对齐主动学习的半监督域自适应语义分割方法》中,使用源域数据进行模型预训练;用预训练模型提取目标域样本的特征,并进行特征聚类;从每个聚类中选择同等数量的熵最高的困难目标域样本进行图像级标注,并利用这些标注数据进行对抗和对比学习,通过双级别对齐主动学习提高模型的域适应性能。

5、但是,以上进行图像级或像素级标注的方案中,标注效率及标注的质量均有待提升。

6、有鉴于此,特提出本发明。


技术实现思路

1、本发明的目的是提供一种主动域适应语义分割方法、系统、设备及存储介质,提高了主动域适应的标注效率,同时提高了标注的质量,保障了域适应语义分割的性能。

2、本发明的目的是通过以下技术方案实现的:

3、一种主动域适应语义分割方法,包括:

4、通过域适应模型提取目标域图像的熵图,通过超像素提取网络提取目标域图像的超像素,结合熵图确定每一超像素的平均熵,并根据平均熵的大小划分为两类,一类称为高不确定度超像素,另一类称为低不确定度超像素;对于低不确定度超像素,使用设定条件进行融合;

5、使用参与融合的超像素标注,获得第一阶段标注,并使用第一阶段标注训练目标域模型,获得第一阶段的目标域模型;

6、通过域适应模型与第一阶段的目标域模型分别提取高不确定度超像素的特征,并选择若干个特征差异最大的高不确定度超像素进行标注,获得第二阶段标注,再使用第二阶段标注训练第一阶段的目标域模型,获得第二阶段的目标域模型;

7、通过第二阶段的目标域模型对目标域图像进行语义分割。

8、一种主动域适应语义分割系统,包括:

9、低不确定度超像素融合模块,用于通过域适应模型提取目标域图像的熵图,通过超像素提取网络提取目标域图像的超像素,结合熵图确定每一超像素的平均熵,并根据平均熵的大小划分为两类,一类称为高不确定度超像素,另一类称为低不确定度超像素;对于低不确定度超像素,使用设定条件进行融合;

10、第一阶段标注与训练模块,用于使用参与融合的超像素标注,获得第一阶段标注,并使用第一阶段标注训练目标域模型,获得第一阶段的目标域模型;

11、第二阶段标注与训练模块,用于通过域适应模型与第一阶段的目标域模型分别提取高不确定度超像素的特征,并选择若干个特征差异最大的高不确定度超像素进行标注,获得第二阶段标注,再使用第二阶段标注训练第一阶段的目标域模型,获得第二阶段的目标域模型;

12、语义分割模块,用于通过第二阶段的目标域模型对目标域图像进行语义分割。

13、一种处理设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序;

14、其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现前述的方法。

15、一种可读存储介质,存储有计算机程序,当计算机程序被处理器执行时实现前述的方法。

16、由上述本发明提供的技术方案可以看出,以超像素为单元进行选择标注,与图像级和像素级标注方法不同,超像素级标注通过仅为每个超像素分配一个语义类别大大提升了标注效率;此外,不同与现有方案基于不确定度的选择标注策略,本发明综合考虑了标注数量和标注难例这两个方面,并提出基于域信息量的选择策略,选择对域适应学习最有价值的超像素进行标注,此处最有价值主要体现在两个方面:首先,融合后的大尺寸超像素具有更多的标注像素,因而其标注价值较高,选择先标注融合后的超像素;其次,对于未参与融合的小尺寸超像素,选择域差异最大的进行标注,因为域差异大的样本往往是难例,更需要进行标注学习;总的来说,基于域信息量的选择策略主要体现在像素数量和质量两个方面;通过采用超像素级标注方法和基于域信息量的选择策略,本发明在大大降低标注成本的同时提高了标注的质量,保障了域适应语义分割的性能。


技术特征:

1.一种主动域适应语义分割方法,其特征在于,包括:

2.根据权利要求1所述的一种主动域适应语义分割方法,其特征在于,所述域适应模型预先使用源域标注数据和目标域无标注数据进行训练;所述超像素提取网络预先使用源域标注数据进行训练。

3.根据权利要求1所述的一种主动域适应语义分割方法,其特征在于,所述结合熵图确定每一超像素的平均熵,并根据平均熵的大小划分为两类表示为:

4.根据权利要求1所述的一种主动域适应语义分割方法,其特征在于,所述融合的设定条件为:

5.根据权利要求1所述的一种主动域适应语义分割方法,其特征在于,特征差异的计算方式为:

6.根据权利要求1所述的一种主动域适应语义分割方法,其特征在于,使用第一阶段标注训练目标域模型以及使用第二阶段标注训练第一阶段的目标域模型时,使用跨域混合和伪标签一致性技术;

7.根据权利要求6所述的一种主动域适应语义分割方法,其特征在于,训练时的主动域适应损失为:

8.一种主动域适应语义分割系统,其特征在于,包括:

9.一种处理设备,其特征在于,包括:一个或多个处理器;存储器,用于存储一个或多个程序;

10.一种可读存储介质,存储有计算机程序,其特征在于,当计算机程序被处理器执行时实现如权利要求1~7任一项所述的方法。


技术总结
本发明公开了一种主动域适应语义分割方法、系统、设备及存储介质,以超像素为单元进行选择标注,与图像级和像素级标注方法不同,超像素级标注通过仅为每个超像素分配一个语义类别大大提升了标注效率;此外,不同与现有方案基于不确定度的选择标注策略,本发明重点关注域适应场景下的难例样本,并提出基于域信息量的选择策略,选择对域适应学习最有价值的超像素进行标注;通过采用超像素级标注方法和基于域信息量的选择策略,本发明在大大降低标注成本的同时提高了标注的质量,保障了域适应语义分割的性能。

技术研发人员:王子磊,高源
受保护的技术使用者:中国科学技术大学
技术研发日:
技术公布日:2024/12/17
转载请注明原文地址:https://xbbs.6miu.com/read-23171.html