本发明属于图像处理,尤其涉及一种基于transformer的创面伤口图像增强方法。
背景技术:
1、医学图像已成为现代医学诊断不可或缺的一部分,直接影响医生诊断的准确性和治疗疾病的及时性。创面伤口图像信息量大且细节丰富,但在图像的获取过程中,图像受到各种因素的干扰以至于获得的医学图像存在各种噪声。由于设备仪器在不同时间、不同位置下进行数据采集,拍摄区域内的光照程度会有所不同,这可能导致其采集到的图像具有不同的亮度、对比度和颜色分布。这对于后续的创面伤口分析可能造成困扰,直接影响了医生的对于创面伤口的判断的准确性。
2、为了解决光照不均匀问题,研究人员提出了一些方法和技术:(1)光照校正:通过对采集到的图像进行光照校正,使得图像在亮度、对比度和颜色方面具有一致性。光照校正算法可以根据图像的亮度分布,调整每个像素的亮度值,从而实现图像的光照均衡化;(2)高动态范围图像融合:针对光照差异较大的场景,可以采用高动态范围(high dynamicrange,hdr)图像融合技术。该技术通过融合多张不同曝光程度的图像,从而在全景图像中实现更广泛的亮度范围,并减少光照不均匀性;(3)基于灰度变换的图像增强方法:灰度变换是图像增强的重要手段之一,可以使图像动态范围增大,对比度得到扩展,使图像清晰、特征明显。灰度变换可以有效的改变图像的直方图分布,使像素的分布更为均匀。
3、尽管上述方法在解决光照不均匀问题方面具有一定的优势,但也存在一些潜在的缺点:(1)光照校正方法可能导致过度处理或失真,在进行全局光照校正时,某些局部区域的细节可能会丢失或变得不真实,过度校正会导致图像的亮度和对比度过度调整,可能影响图像的可视性和细节。(2)hdr图像拼接在处理光照差异较大的场景时效果较好,但对于光照变化不连续或过渡较为复杂的场景,可能无法完全消除光照不均匀性,这可能导致拼接后的图像出现过渡不自然或部分区域明暗不一致的问题。(3)基于灰度变换的图像增强方法对于低照度图像的处理,尤其是对于极低照度的微光图像来说仍存在许多局限性,比如会导致图像过度增强、颜色失真、噪声凸显、细节增强不足等;对于亮度的调节能力也不足,如对低亮度区域不能够做到足够的增强,对局部高亮度区域的亮度不能够进行亮度压制等。
4、低照度图像中亮度、颜色、细节等特征往往存在于不同尺度的信息中,因此实现高质量低照度图像增强极具挑战性。现有的图像增强方法无法充分利用多尺度特征,也无法有效结合多个尺度的特征,不能全面提升图像的亮度、颜色和细节质量。为解决上述问题,本发明提出一种基于transformer的图像增强网络,通过端对端的transformer网络来进行图像增强,克服光照不均匀造成的图像失真等问题。
技术实现思路
1、针对现有技术中存在的不足,本发明提供了一种基于transformer的创面伤口图像增强方法,通过端对端的transformer网络来进行图像增强,克服了光照不均匀造成的图像失真等问题。
2、本发明通过以下技术手段实现上述技术目的。
3、一种基于transformer的创面伤口图像增强方法,包括如下过程:
4、步骤1:通过图像采集设备采集待增强的创面伤口图像,并输入图像处理设备进行图像处理;
5、步骤2:创面伤口图像经过一个3×3深度卷积,然后输入局部映射分支模块,计算局部分量:乘法系数和加法系数a,来调整图像光照的影响;
6、步骤3:引入协调注意力模块来辅助网络对于局部分量m和a的计算,进一步增加局部映射分支模块中计算出的局部分量的信息,经过协调注意力模块后再通过一个3×3深度卷积来降低通道的维度,之后输出新的局部分量;
7、步骤4:创面伤口图像输入全局映射分支模块进行处理,获取三个全局预测参数:噪声系数、伽马参数、色彩矩阵;
8、步骤5:结合步骤3输出的局部分量,将步骤4得到的三个全局预测参数通过重新配置图像参数使得输入图像能够自适应恢复为目标光照下的图像,最后得到最终的低光照图像增强结果。
9、进一步地,所述步骤2中,局部映射分支模块包括两个独立的网络,分别用于生成乘法系数和加法系数,每个独立网络均由三个像素增强模块组成,输入图像经过像素增强模块后通过元素相加将输入特征与输出特征相结合,通过跳跃连接保持原始图像细节;
10、像素增强模块对输入图像进行处理的具体过程如下:首先输入图像经过一个3×3深度卷积后与原始输入特征叠加,然后通过一个归一化模块,再依次使用逐点卷积、5×5深度卷积、逐点卷积来增强局部细节,然后再次通过一个归一化模块,最后使用两个逐点卷积来增强特征表示,同时在两个逐点卷积之间使用高斯误差线性单元激活函数以更好地保持输入信息。
11、进一步地,所述归一化模块在进行矩阵融合通道之前,通过学习两个参数a和b来进行缩放和偏置,以提高可学习矩阵的适应性,实现输入特征的光照归一化。
12、进一步地,所述步骤3中,协调注意力模块的处理包括两步:协调信息嵌入以及协调注意力的生成;
13、协调信息嵌入:通过分解全局池化,将其转化为一维特征编码,以保留位置信息,对于给定的输入,首先使用尺寸为h×1或者1×w的池化层分别沿着水平坐标和垂直坐标对通道进行编码,通过沿着水平和垂直方向聚合特征,获取长期依赖关系,保存位置信息,进一步帮助网络聚焦于感兴趣的目标;
14、协调注意力的生成:通过上述协调信息嵌入变换后,对其输出进行连接操作,然后使用1×1卷积变换函数进行变换操作,然后沿着空间维度将特征图分解,然后利用1×1卷积进行升维度操作,再结合sigmoid激活函数得到最后的注意力向量。
15、进一步地,所述步骤4中,全局映射分支模块采用transformer网络的注意力模块提取图像的全局信息来产生所需参数,通过将一个随机初始化的全局变量输入到全局预测分支中,在训练阶段,在每次迭代中动态更新查询参数来不断匹配目标图像,网络自适应调整操控图像全局信息的参数,将高斯误差线性单元作为全局预测分支网络结构的激活函数,该激活函数利用输入本身的概率统计量提供随机正则,同时保持输入信息。
16、进一步地,所述全局映射分支模块的处理过程如下:
17、输入图像在输入全局映射分支模块之前首先经过由两个3×3深度卷积组成的轻量编码器,该轻量编码器以较低的分辨率对高维特征进行编码,且使用更高的特征表示以提取图像的全局级特征;然后将生成的特征图输入全局预测模块,输入特征经过一个3×3深度卷积后与原始输入特征叠加,再通过两个全连接层对提取的特征进行分类,得到图像自身的键k和值v,然后与网络引入的可嵌入学习的全局参数q结合进行计算,并通过全连接层得到新的特征,再通过层归一化和两个全连接层得到所需预测的参数,同时全局映射分支模块也使用高斯误差线性单元激活函数;并且,在全局映射分支模块输出参数之前,加入额外的初始化参数来辅助训练,维持训练的稳定性生成所需的参数,输出的参数再分别通过一个逐点卷积以降低通道维度,最终得到全局预测的三个参数:噪声系数、伽马参数、色彩矩阵。
18、本发明具有如下有益效果:
19、(1)图像信息更为丰富,效果更加贴近现实感受:本发明架构中的局部映射和全局预测分支,能够同时提取图像的局部和全局信息,能够进一步丰富图像的信息;其次,区别于其余算法增强造成的色调失真过曝等问题,本发明的算法增强的结果符合人眼视觉感受,未出现图像色调失真等问题。
20、(2)网络结构的轻量化:为了增加网络对输入图像分辨率的适应性,本发明的算法采用深度可分离卷积网络(depth-wise convolution)组成的transformer网络结构实现pem模块,能够极大程度的减少网络中的参数,进一步节省计算量。
21、(3)注意力机制的优越性:引入协调注意力机制ca,来进一步增加局部映射分支中计算出的局部分量的信息;与其余注意力机制相比,ca注意力机制不仅考虑了通道信息,还融合了方向相关的位置信息,且更加的灵活和轻量化。
1.一种基于transformer的创面伤口图像增强方法,其特征在于,包括如下过程:
2.根据权利要求1所述的基于transformer的创面伤口图像增强方法,其特征在于,所述步骤2中,局部映射分支模块包括两个独立的网络,分别用于生成乘法系数和加法系数,每个独立网络均由三个像素增强模块组成,输入图像经过像素增强模块后通过元素相加将输入特征与输出特征相结合,通过跳跃连接保持原始图像细节;
3.根据权利要求2所述的基于transformer的创面伤口图像增强方法,其特征在于,所述归一化模块在进行矩阵融合通道之前,通过学习两个参数和来进行缩放和偏置,以提高可学习矩阵的适应性,实现输入特征的光照归一化。
4.根据权利要求1所述的基于transformer的创面伤口图像增强方法,其特征在于,所述步骤3中,协调注意力模块的处理包括两步:协调信息嵌入以及协调注意力的生成;
5.根据权利要求1所述的基于transformer的创面伤口图像增强方法,其特征在于,所述步骤4中,全局映射分支模块采用transformer网络的注意力模块提取图像的全局信息来产生所需参数,通过将一个随机初始化的全局变量输入到全局预测分支中,在训练阶段,在每次迭代中动态更新查询参数来不断匹配目标图像,网络自适应调整操控图像全局信息的参数,将高斯误差线性单元作为全局预测分支网络结构的激活函数,该激活函数利用输入本身的概率统计量提供随机正则,同时保持输入信息。
6.根据权利要求5所述的基于transformer的创面伤口图像增强方法,其特征在于,所述全局映射分支模块的处理过程如下:
