本发明属于情绪识别,尤其涉及一种基于脑电的注意力机制的跨域情绪识别方法。
背景技术:
1、情绪识别使计算机能够理解和响应人类的情绪状态,是实现更加自然、高效和富有同理心的人机交互的基础。情绪识别在医学疾病的诊断治疗、交通安全、市场调研等方面有着广泛应用。脑电图作为一种直接反映大脑活动的工具,为情绪识别提供了新的研究视角。当用户试图掩饰真实感受时,传统的基于行为的情绪识别方法可能受限,而脑电图等生物测量方法可以提供更深层次的情绪识别。深入研究脑电图在情绪识别中的应用,可以更好地理解情绪产生的神经机制,并提高情绪识别的准确性和效率。尽管脑电情绪识别的研究已取得显著成就,仍面临诸多挑战。脑电信号作为一种极具复杂性的生物信号,具有维度高和非线性强等特征,不同频带的信号含义各异,且易受个体差异、电极布局及外界干扰所影响。此外,获得高质量脑电信号需依赖精确的实验设置和专业设备,为深度学习算法提供充足的标注数据既耗时又消耗大量资源。因此,迫切需要开发高效的神经网络模型来实现脑电信号的准确识别。
2、现实情境往往存在着跨受试者和跨时间段的情绪识别场景,在不同受试者上,即便进行着相同的任务,产生的脑电信号数据的特征也存在着巨大差异,从而导致在已有受试者上训练得到的高性能模型,在新受试者上进行测试时,其模型的泛化能力较差。针对域自适应方法,提出了不同的模型,例如:一种基于深度对抗网络的域自适应神经网络,通过最大化域鉴别损失,在欺骗域鉴别的方向上训练特征提取器;一种用于情绪识别的新型域适应方法,旨在跨个体和时间时段泛化模型,通过优化神经网络模型来最小化分类错误,同时让源数据和目标数据在潜在表示上变得相似。通过这些域适应相关方法的应用,研究者们正在逐步解决eeg数据的个体差异问题,从而提高了模型在不同受试者上的泛化能力。但是目前的研究在捕捉目标域与源域之间的有效特征方面表现不足,同时在缩小域间差异以提升平均分类精度的努力上也显得不尽人意。
技术实现思路
1、发明目的:本发明的目的在于提供一种基于脑电的注意力机制的跨域情绪识别方法。采用深度过参数化卷积结构作为特征提取器,利用轻量级的网络捕捉丰富的脑电特征,引入的注意力机制能够自动辨识并聚焦于那些对于跨域任务最关键的特征。通过联合采用mmd损失和关联相似度损失,amsjda不仅使得源域和目标域在特征程度上进行了对齐,更是使得预测更加一致,提高了模型在目标域上的分类效果。最后,利用差异损失计算多个目标域的预测结果,使得分类结果更加精确。相对于已有的多源域适应模型,该模型能够有效缩小域间差异,提升目标预测的一致性,实现跨受试者和跨时段场景下的高准确率识别任务。
2、技术方案:本发明的一种基于脑电的注意力机制的跨域情绪识别方法,包括如下步骤:
3、步骤1、接收n个独立源域的脑电数据集和一个目标域的脑电数据集并通过一个共享加入cbam注意力机制的公共特征提取模块提取出公共特征;
4、步骤2、将所提取的公共特征送入各自的特定域特征提取器;
5、步骤3、最小化公共特征之间的最大均值差异距离及关联相似度缩小不同域之间的差异,使源域特征与目标域特征对齐;
6、步骤4、将目标域特征和所有源域特征引入到各自的分类器中,产生相应的分类预测;
7、步骤5、采用源域的结果来计算分类损失,将目标域数据送入每个源域分类器,生成多个目标域预测结果并计算差异损失;
8、步骤6、将目标域预测结果的平均值作为模型的最终输出,实现跨时段场景下的情绪识别。
9、进一步的,步骤1具体为:接收n个独立源域的数据集和一个目标域的数据集{xt},使用深度过参数化卷积模块作为公共特征提取器,引入cbam注意力机制,通过接收深度过参数化卷积层的中间特征f∈rc×h×w作为输入,首先计算通道注意力,为每个维度分配不同的权重;
10、
11、其中,f'∈rc'×h×w表示经过通道注意力后的输出,c'表示通道注意权重已经被分配给c后的通道信息,表示元素乘法;
12、mc(f)是f的通道注意力权重的计算结果,可表示为:
13、mc(f)=σ(w1(w0(avgpool(f)))+w1(w0(maxpool(f)))) (2)
14、其中,σ表示激活函数sigmoid,avgpool表示平均池化操作,maxpool表示最大池化操作,w0∈rc/r×c,w1∈rc×c/r,r为常量;
15、然后,根据由以下特征表征的内部空间关系来生成空间注意的映射;
16、
17、其中f'∈rc'×h'×w',其中h'和w'表示空间注意力权重已分配给h和w后的表示;
18、ms(f')是f的空间注意力权重的计算,可表示为:
19、ms(f')=σ(fn×n[avgpool(f');maxpool(f')]) (4)
20、其中n表示卷积核的大小,[avgpool(f');maxpool(f')]表示平均池化和最大池化结果的级联。
21、进一步的,步骤2具体为:使用多层感知器作为特定域特征提取器,每个源域和目标域的数据都经过其相应的特定域特征提取器,将数据映射到一个独有的潜在空间中,从每个分支中提取出精细的、域特定的特征。
22、进一步的,步骤3具体为:首先采用mmd来估计两域之间的距离,mmd的公式表示为:
23、
24、其中,ns和nt分别表示源域和目标域中的样本数量,φ(·)是将原始数据映射到高维特征空间的特征映射函数,mmd损失通过对比两个域的平均特征分布来识别和缩小它们之间的统计差异,使用关联相似度对源域和目标域的数据来提升目标域和源域的标签预测一致性,关联相似度损失表示为:
25、lasso=γ1·lwalker+γ2·lvisit (6)
26、其中γ1,γ2是权重因子。下面详细描述lwalker和lvisit;
27、设一组源域数据为a,目标域数据为b,首先,需要计算从每个源域样本ai到每个目标域样本bj的转移概率ps→t。ps→t计算公式表示为:
28、
29、其中,(similarity(ai,bj))表示源域样本ai和目标域样本bj之间的相似性度量,通常使用点积,再计算从目标域样本bj回到源域样本ai的转移概率pt→s(j,i);
30、
31、利用上述两个转移概率计算从源域样本ai到目标域样本bj再回到源域样本a’i的两步循环转移概率,即将ai到bj的转移概率与bj回到a’i的转移概率相乘,然后对所有目标域样本bj求和;
32、ps→t→s(i,i')=∑j ps→t(i,j)pt→sj,i') (9)
33、lwalker可表示为:
34、lwalker=kl(log(ps→t→s+∈)||ts) (10)
35、其中,∈是为了数值稳定性而添加的小常数,选取为1e-8,kl(·)为kl散度,ts被定义为:
36、
37、根据ps→t(i,j)计算目标样本被访问的平均概率pvisit(j);
38、
39、其中,ns是源域样本的总数;
40、定义一个理想的访问概率分布v,其中每个目标样本被访问的概率是均等的,v表示为:
41、
42、其中,nt是目标域样本的总数,vj)表示理想情况下,任意目标域样本j被访问的概率,即每个样本被均等考虑;
43、通过计算pvisit(j)和vj)之间的差异来定义lvisit损失,该损失可表示为:
44、
45、其中,kl(·)为kl散度。
46、进一步的,步骤4具体为:使用从特定领域的特征提取器中提取的特征来预测结果,在域特定分类器中,每个源域对应n个单一的softmax分类器。
47、进一步的,步骤5具体为:对于每一个训练的分类器,选择交叉熵损失函数来估计分类损失,引入差异损失的度量,使n个分类器的预测收敛,分类损失可表示为:
48、
49、其中,代表预测标签,代表真实标签,j(·)代表交叉熵损失函数,差异损失可表示为:
50、
51、其中,代表模型对于目标域中第i个样本的预测输出,而代表目标域中第j个样本的真实标签或目标,总的损失函数可表示为:
52、l=lcls+αlmmd+βldisc+γlassoc (17)
53、在训练过程中,α和γ系数是动态调整的,表达式如下:
54、
55、其中i代表当前迭代次数,k和c是预设的参数,它们决定了γ随迭代次数i变化的速率和位置。
56、本发明还公开一种计算机装置,包括存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现本发明方法的步骤。
57、本发明还公开一种计算机可读存储介质,其上存储有计算机程序/指令,该计算机程序/指令被处理器执行时实现本发明方法的步骤。
58、本发明还公开一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现本发明方法的步骤。
59、有益效果:与现有技术相比,本发明具有如下显著优点:
60、1、本发明提出了使用深度过参数化卷积模块作为这一公共特征提取器,并且进一步引入cbam注意力机制。引入注意力机制能够使模型自动识别出每个域中最关键的特征,从而提升模型对于域数据的适应性和泛化能力。相比于简单地将所有既有数据合并为单一源域的方法,本发明提出的方法采用了一种多源域适应架构,通过将深度过参数化卷积网络与注意力机制结合,能够更有效地处理多源域数据,确保模型在各种不同域之间都能达到良好的性能。
61、2、本发明同时结合mmd损失和关联相似度损失,相比于其他多源域适应模型在减小域间差异这一方面只考虑到了特征的边缘分布,本发明能够缩小源域与目标域之间的分布差异并促进标签预测一致性。关联相似度策略不仅促使模型在源域和目标域之间学习到具有类别辨识性的、可迁移的特征表示,而且还确保了模型对目标域的整体结构有一个全面的理解。这种方法特别适用于那些源域和目标域数据分布可能存在较大差异的领域适应任务,它帮助模型在保持对源域样本的高分类准确性的同时,也能够更好地泛化到新的、未见过的目标域数据上。
62、3、本发明采用动态调整损失系数的策略能够帮助模型更好地收敛,防止在训练初期由于某些损失项过于强烈而导致的不稳定性。通过这样的设置,模型可以在初期集中于基础特征的学习,在后期逐渐将注意力转移到更复杂或特定任务相关的特征上。
1.一种基于脑电的注意力机制的跨域情绪识别方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于脑电的注意力机制的跨域情绪识别方法,其特征在于,步骤1具体为:接收n个独立源域的数据集和一个目标域的数据集{xt},使用深度过参数化卷积模块作为公共特征提取器,引入cbam注意力机制,通过接收深度过参数化卷积层的中间特征f∈rc×h×w作为输入,首先计算通道注意力,为每个维度分配不同的权重;
3.根据权利要求1所述的一种基于脑电的注意力机制的跨域情绪识别方法,其特征在于,步骤2具体为:使用多层感知器作为特定域特征提取器,每个源域和目标域的数据都经过其相应的特定域特征提取器,将数据映射到一个独有的潜在空间中,从每个分支中提取出精细的、域特定的特征。
4.根据权利要求1所述的一种基于脑电的注意力机制的跨域情绪识别方法,其特征在于,步骤3具体为:首先采用mmd来估计两域之间的距离,mmd的公式表示为:
5.根据权利要求1所述的一种基于脑电的注意力机制的跨域情绪识别方法,其特征在于,步骤4具体为:使用从特定领域的特征提取器中提取的特征来预测结果,在域特定分类器中,每个源域对应n个单一的softmax分类器。
6.根据权利要求1所述的一种基于脑电的注意力机制的跨域情绪识别方法,其特征在于,步骤5具体为:对于每一个训练的分类器,选择交叉熵损失函数来估计分类损失,引入差异损失的度量,使n个分类器的预测收敛,分类损失可表示为:
7.一种计算机装置,包括存储器、处理器及存储在存储器上的计算机程序,其特征在于,所述处理器执行所述计算机程序以实现权利要求1所述方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1所述方法的步骤。
9.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1所述方法的步骤。
