本发明涉及气体识别,特别是涉及一种基于边标记框架的图神经网络气体分类识别方法。
背景技术:
1、尽管化学传感器的性能受到传感器属性的影响,但长期以来,它们在相同条件下暴露于相同分析物时逐渐发生的化学感官信号响应的变化和不可预测性,即所谓的传感器漂移,一直被视为化学传感领域面临的一大挑战。这种现象会降低电子鼻系统的稳定性,并使用于区分气体或气味的模型变得过时。原因可能源于多种效应,如长期使用的传感器老化、污染导致的敏感材料中毒以及不同操作过程中传感器的热效应。尽管这些漂移通常被分类为一阶和二阶成分,但很难经验性地区分它们,也不可能开发出适合纠正不同漂移源的方法,因为起源尚未确定。因此,关于漂移减少,一些研究人员专注于高性能传感器材料,该材料可以与气体可逆地相互作用,有些通过温度调节技术最小化传感器中毒的不可逆效应,而其他工作认为,应该从长期角度对一阶和二阶成分实施漂移对抗。尽管如此,漂移机制相当复杂且不可避免,以至于多年来一直困扰着传感器研究界,并可能继续存在。
2、传统方法主要从两个方面着手解决电子鼻的漂移补偿问题:
3、(1)基于信号预处理的技术,通过改善数据质量来减少漂移的影响,比如基线处理方法:通过从传感器响应中减去一个参考基线值来改进信号,和频域滤波方法:通过聚焦于特定的频域,可以过滤掉信号中的噪声成分,尤其是那些与目标气体检测无关的成分;
4、(2)漂移分量校正方法,通过校正数据中的漂移分量来提高模型的稳定性和准确性。包括正交信号校正(osc):通过从数据中去除与目标变量不相关的变量信息纠正漂移、主成分分析(pca):通过数据降维来提取主要特征,以揭示数据中隐藏的、最重要的结构、广义最小二乘加权(glsw):通过为不同的数据点分配不同的权重来优化模型的拟合效果、直接标准化(ds):通过对比标准化样本与实际样本的响应,调整模型以适应可能的漂移。这些方法由于灵敏度和精度较低的原因,近些年来多被替代。
5、现有技术缺点:在传统的图神经网络(gnn)中,节点的特征和标签是模型学习的主要对象。然而,这种方法在处理少样本学习问题时可能会遇到挑战,因为它依赖于节点级别的信息,而没有充分考虑样本间的关系。
技术实现思路
1、本发明提供的一种基于边标记框架的图神经网络气体分类识别方法,有效提高了气体分类结果的准确性。
2、为达到上述目的,本发明提供的一种基于边标记框架的图神经网络气体分类识别方法,其关键是,包括以下步骤:
3、步骤1:气体传感器阵列实时采集气体特征数据a,并将所述气体特征数据a传递给预处理模块;
4、步骤2:所述预处理模块对所述气体特征数据a进行预处理操作,得到查询集样本b,并传递给基于边标记框架的图神经网络egnndrift;
5、步骤3:所述基于边标记框架的图神经网络egnndrift的输入层将所述查询集样本b和n类支持集样本输入到特征提取模块,每类支持集样本包含r个气体样本;
6、步骤4:所述特征提取模块分别对所述查询集样本b和n类支持集样本进行特征提取操作,得到查询集特征向量c和n类支持集特征向量,并传递给图构造模块;
7、步骤5:所述图构造模块将所述查询集特征向量c和n类支持集特征向量构造为全连接图d,并对所述全连接图d中的节点特征和边特征进行初始化,得到初始化特征图e并传递给图更新模块;
8、步骤6:所述图更新模块对所述初始化特征图e进行节点特征更新和边特征更新的迭代操作,进行n次迭代操作后,输出聚类特征图f给分类识别模块;
9、步骤7:所述分类识别模块对所述聚类特征图f进行分类识别,并输出气体分类结果。
10、通过上述设计,通过迭代更新边的标签来显式地模拟样本间的相似度和差异性。与传统的gnn模型相比,egnndrift模型不依赖于隐式的聚类相似度模拟,而是直接利用边缘标签来指导学习过程。这种显式的聚类演化使得模型能够更准确地捕捉样本间的结构信息,从而提高对新气体类别的识别能力。
11、所述预处理操作为对输入数据进行归一化、标准化处理,使其符合基于边标记框架的图神经网络输入要求。
12、作为优选:在所述步骤4中,所述特征提取模块对所述查询集样本b或支持集样本进行特征提取操作,步骤如下:
13、步骤a1:所述特征提取模块中的空间注意力层获取所述查询集样本b或支持集样本,并对其进行空间特征提取操作,得到空间特征数据s1,并传递给第一批归一化层;
14、步骤a2:所述第一批归一化层对所述空间特征数据s1进行批归一化操作,得到第一批归一化数据s2,并传递给第一残差块;
15、步骤a3:所述第一残差块对所述第一批归一化数据s2进行残差卷积操作,得到第一残差数据s3,并传递给第二批归一化层;
16、步骤a4:所述第二批归一化层对所述第一残差数据s3进行批归一化操作,得到第二批归一化数据s4,并传递给第二残差块;
17、步骤a5:所述第二残差块对所述第二批归一化数据s4进行残差卷积操作,得到查询集特征向量c或支持集特征向量,并传递给编码单元。
18、所述特征提取模块用于提取输入数据的抽象特征,以供基于边标记框架的图神经网络egnndrift使用,从而提高气体分类效率。
19、所述特征提取模块不仅能够提取样本的深层特征,还能够通过空间注意力机制sam和残差连接来增强模型的学习能力和稳定性。
20、作为优选:在所述步骤a1中,所述空间注意力层对所述查询集样本b或支持集样本进行空间特征提取操作,步骤如下:
21、步骤b1:得到一维特征图:假设空间注意力层的输入数据x∈rc×w,其中,c和w分别表示输入数据的通道数和通道宽度;通过对输入数据x进行平均池化和最大池化,得到平均池化特征图和最大池化特征图,表达式如下:
22、favg∈r1×w
23、fmax∈r1×w
24、其中,favg表示平均池化特征图在通道维度上的平均值,fmax表示最大池化特征图在通道维度上的最大值;
25、步骤b2:特征图的拼接:将所述平均池化特征图favg和最大池化特征图fmax在通道维度上进行拼接,得到拼接好的特征图fconcat∈r2×w;
26、步骤b3:得到空间注意力图:对拼接后的特征图fconcat进行一维卷积操作,通过sigmoid激活函数得到空间注意力图ms∈r2×w,表达式如下:
27、ms=σ(con(fconcat))
28、其中,σ表示sigmoid函数,conv表示一维卷积,一维卷积操作表达式如下:
29、
30、其中,yt是输出特征向量在位置t的值,xi是输入特征向量在位置i的值,wi,t-i是卷积核在位置i对应的权重,bt是偏置项。
31、步骤b4:注意力加权:将原始输入特征图x与空间注意力图ms相乘,得到加权后的输出特征图x′:
32、
33、其中,表示元素级别的乘法操作。
34、所述空间注意力层中的空间注意力机制sam用于提升基于边标记框架的图神经网络egnndrift对输入数据中关键空间区域特征的识别和响应能力,使egnndrift能够动态地集中处理数据中对当前任务最为关键的部分,从而显著提高处理效率和准确性。通过空间注意力机制,egnndrift不仅能够更好地捕捉到数据的本质特征,还能够在特征表示层面进行优化,进而增强后续任务的性能,如分类、检测或分割等。
35、空间注意力机制sam具有多项显著优点:首先,它提高了模型的专注度,使模型能够集中资源处理数据中最关键的特征,从而减少了对不重要区域的计算浪费。其次,sam增强了特征表达,通过突出重要的空间特征,有助于生成更丰富和有区分性的特征表示,这对于提升模型在复杂任务上的性能至关重要。此外,sam的适应性强,能够使模型自适应地调整关注点,有效处理不同类别或条件下的数据。sam还具备端到端学习的便利性,可以轻松集成到现有的深度学习框架中。它的泛化能力也得到了增强,因为模型能够关注数据中的关键信息,从而在未见数据上也能表现出较好的性能。在计算效率方面,sam通过减少对不重要区域的处理,可以在某些情况下提高模型的计算速度。最后,sam的概念直观,实现简单,能够通过现有的深度学习库轻松实现和应用。这些优点使得sam成为深度学习模型处理复杂空间数据时的强大工具。
36、在卷积层之前引入空间注意力机制sam,通过增强对输入特征空间中关键信息的聚焦能力,显著提升了特征提取模块的性能。
37、作为优选:所述第一残差块和第二残差块结构一致,均设置有并列连接的权重层和恒等层,所述权重层由5个首尾依次连接的一维卷积层构成,所述恒等层由1个残差连接的一维卷积层构成;
38、其中,第一残差块或第二残差块的表达式如下:
39、xn+1=f(xn,{wn,m})+convn(xn,{w'n,m})
40、其中,xn是输入特征,在第一残差块中xn为第一批归一化数据s2,在第二残差块中xn为第二批归一化数据s4;xn+1是输出特征,在第一残差块中xn+1为第一残差数据s3,在第二残差块中xn为查询集特征向量c或支持集特征向量;n代表残差层的序号;f(xn,{wn,m})是权重层残差函数,表示输入xn经过权重层变换后的结果;convn(xn,{w′n,m})表示输入xn经过恒等层变换后的结果;{wn,m}是第n个残差块的权重集合,w′n,m是恒等层参数。
41、残差块中的卷积层包含多个卷积核w,每个卷积核负责提取输入数据的一种特定类型的局部特征。
42、在每个残差块中,一维卷积层的堆叠允许模型学习不同尺度的局部特征。第一层卷积层负责捕捉最基础的局部特征,而随后的卷积层则能够捕捉到更复杂的模式。这种堆叠方式不仅增加了模型的学习能力,而且通过残差连接保持了网络的稳定性。
43、作为优选:在所述步骤5中,所述全连接图d中的每个节点代表一个特征向量,每条边代表两个节点之间的关系类型;所述节点特征初始化表达式如下:
44、
45、其中,表示第i个初始节点特征,e(xi)表示第i个输入样本xi提取的特征向量;
46、所述边特征初始化表达式如下:
47、
48、
49、其中,yi表示第i个节点标签,yj表示第j个节点标签,yij表示节点i和j之间的边特征标签,表示节点i和j之间的初始边特征,每个边缘特征是一个二维的向量,d=1时eij1表示两个连接节点之间的类间关系的强度,d=2时eij2表示两个连接节点之间的类内关系的强度;||是类内关系和类间关系的集结;label表示标签,null表示无效。
50、只有支持集中有标签的样本之间的边的标签可以直接初始化为[1||0]或[0||1],支持集中无标签样本或查询集中样本相关的边的标签被设置为[0.5||0.5],表示边连接顶点的关系未知。
51、作为优选:在所述步骤6中,所述图更新模块设置有l层图神经网络,每层图神经网络均设置有节点特征更新单元、相似度计算单元和边特征更新单元,每层图神经网络进行一次节点特征更新和边特征更新的迭代操作;
52、所述图更新模块对所述初始化特征图e进行节点特征更新和边特征更新的迭代操作,步骤如下:
53、步骤c1:所述图更新模块中的节点特征更新单元对所述初始化特征图e进行节点特征更新操作,得到节点更新特征图,并传递给相似度计算单元和边特征更新单元;
54、步骤c2:所述相似度计算单元通过度量网络,计算所述节点更新特征图中每两个节点之间的相似度,并将计算得到的相似度传递给边特征更新单元;
55、步骤c3:所述边特征更新单元根据所述相似度对所述节点更新特征图进行边特征更新操作,得到边更新特征图并传递给下一层图特征网络进行迭代操作;
56、步骤c4:当迭代次数等于l时,第l层图神经网络中的边特征更新单元输出聚类特征图f给分类识别模块。
57、通过上述设计,利用数据的图结构信息,通过迭代更新节点和边缘特征来显式地进行聚类,从而提高小样本学习任务的性能。
58、作为优选:节点特征更新表达式如下:
59、
60、
61、其中,表示归一化边缘特征,表示对所有与节点i相连的边进行求和,k表示与节点i直接相连的所有其他节点的索引;表示节点变化网络,表示节点变化网络参数,l表示第l层图神经网络,1≤l≤l;
62、在每一层图神经网络中,节点特征通过聚合邻居节点的特征来更新,这个过程考虑了将边缘特征作为权重,类似于注意力机制。
63、每两个节点之间的相似度计算表达式如下:
64、
65、
66、其中,表示节点i和j之间类内关系的相似度,表示节点i和j之间类间关系的相似度,表示度量网络,表示度量网络的参数;
67、边特征更新表达式如下:
68、
69、其中,节点i和j之间的边特征向量;表示根据节点特征更新计算得到的未归一化的边特征向量;表示的l1范数,即向量中所有元素绝对值之和。
70、作为优选:在所述步骤7中,所述分类识别模块提取所述聚类特征图f中查询集样本节点与各个支持集样本节点之间的相似度数据,并计算查询集样本与每一类支持集样本的相似度平均值,然后将相似度平均值最大的支持集样本所对应的气体类别作为气体分类结果。
71、每个气体类别对应多个支持集样本,两个相同气体类别的支持集样本与所述查询集样本的相似度数据并不相同,故通过计算查询集样本与每一类支持集样本之间的相似度平均值,然后将相似度平均值最大的支持集样本所对应的气体类别,作为查询集样本的气体分类结果。
72、通过上述设计,有效提高了气体分类结果的准确性。
73、作为优选:所述气体类别包括但不限于氨、乙醛、丙酮、乙烯、乙醇和甲苯。
74、本发明的有益效果:通过在图神经网络中引入边缘标记机制,不仅考虑了节点的特征和标签,还为边赋予了标签,从而更精细地捕捉样本间的相似度和聚类关系。
1.一种基于边标记框架的图神经网络气体分类识别方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于边标记框架的图神经网络气体分类识别方法,其特征在于:在所述步骤4中,所述特征提取模块对所述查询集样本b或支持集样本进行特征提取操作,步骤如下:
3.根据权利要求2所述的基于边标记框架的图神经网络气体分类识别方法,其特征在于:在所述步骤a1中,所述空间注意力层对所述查询集样本b或支持集样本进行空间特征提取操作,步骤如下:
4.根据权利要求2所述的基于边标记框架的图神经网络气体分类识别方法,其特征在于:所述第一残差块和第二残差块结构一致,均设置有并列连接的权重层和恒等层,所述权重层由5个首尾依次连接的一维卷积层构成,所述恒等层由1个残差连接的一维卷积层构成;
5.根据权利要求1所述的基于边标记框架的图神经网络气体分类识别方法,其特征在于:在所述步骤5中,所述全连接图d中的每个节点代表一个特征向量,每条边代表两个节点之间的关系类型;所述节点特征初始化表达式如下:
6.根据权利要求1所述的基于边标记框架的图神经网络气体分类识别方法,其特征在于:在所述步骤6中,所述图更新模块设置有l层图神经网络,每层图神经网络均设置有节点特征更新单元、相似度计算单元和边特征更新单元,每层图神经网络进行一次节点特征更新和边特征更新的迭代操作;
7.根据权利要求6所述的基于边标记框架的图神经网络气体分类识别方法,其特征在于:节点特征更新表达式如下:
8.根据权利要求1所述的基于边标记框架的图神经网络气体分类识别方法,其特征在于:在所述步骤7中,所述分类识别模块提取所述聚类特征图f中查询集样本节点与各个支持集样本节点之间的相似度数据,并计算查询集样本与每一类支持集样本的相似度平均值,然后将相似度平均值最大的支持集样本所对应的气体类别作为气体分类结果。
9.根据权利要求8所述的基于边标记框架的图神经网络气体分类识别方法,其特征在于:所述气体类别包括但不限于氨、乙醛、丙酮、乙烯、乙醇和甲苯。
