情感分析方法、装置、计算机设备以及存储介质

专利2025-03-03  30


本发明涉及自然语言处理,特别涉及一种情感分析方法、装置、计算机设备以及存储介质。


背景技术:

1、基于方面级的情感分析(absa)涉及识别句子中的特定方面术语及其情感极性。基于已标注的大型语料库上,absa 的研究在英文文本上取得了成功,但现实世界的社交媒体交互通常涉及多种语言,突出了跨语言情感分析的需要。

2、在跨语言的方面级情感分析中,每个方面词的情感都根据一组预定义的情感极性进行分类,即积极、中性或消极,其任务旨在使得模型在源语言标记数据集上进行训练,然后在目标语言的未标注数据集上进行预测。由于为低资源语言获取大量带注释的训练数据非常昂贵,早期的跨语言情感分析工作仅依靠来自不同源语言的注释数据来学习目标语言的情感分类。这些模型通常依赖于双语词典、预训练的跨语言词嵌入或机器翻译来弥合源语言和目标语言之间的差距。

3、目前的技术方案通常利用多语言预训练模型对对齐的翻译数据进行微调,对跨语言方面词一致性进行对齐,以弥合源语言和目标语言之间的差距。然而,上述技术方案尽管有相关工作从句子级层面上对源语言和目标语言进行对齐,在实际应用中,仅依靠句子级的对齐可能会引入上下文噪声,从而导致对方面词的重视程度降低,难以对方面词进行准确的情感分析。


技术实现思路

1、基于此,本发明提供一种情感分析方法、装置、计算机设备以及存储介质,基于源语言集以及目标语言集的预测情感概率分布集,对教师模型进行训练,获得训练后的教师模型以及预设的学生模型输出的目标语言未标记句子集的预测情感概率分布集,作为学生模型的训练数据,采用知识蒸馏方法,对学生模型进行训练,提高了学生模型执行跨语言方面级情感分类任务的准确率,从而实现基于目标语言的方面词的提取以及方面词的情感极性的确认,提高了情感分析的准确性。该技术方法如下:

2、第一方面,本申请实施例提供了一种情感分析方法,包括以下步骤:

3、获得源语言集、目标语言集以及目标语言未标记句子集,其中,所述源语言集包括源语言句子集以及方面词替换源语言句子集;所述目标语言集包括目标语言句子集以及方面词替换目标语言句子集;

4、将所述源语言集、目标语言集以及目标语言未标记句子集输入至预设的编码模型中进行编码处理,获得所述源语言集、目标语言集以及目标语言未标记句子集的句子编码表示集;

5、将所述源语言集以及目标语言集的句子编码表示集输入至预设的教师模型中进行情感概率分布计算,获得所述源语言集以及目标语言集的预测情感概率分布集;根据所述源语言集以及目标语言集的预测情感概率分布集,对预设的教师模型进行训练,获得目标教师模型;

6、将所述目标语言未标记句子集的句子编码表示集分别输入至所述目标教师模型以及预设的学生模型,获得所述目标教师模型以及学生模型输出的所述目标语言未标记句子集的预测情感概率分布集;根据所述目标教师模型以及学生模型输出的所述目标语言未标记句子集的预测情感概率分布集,对所述学生模型进行训练,获得目标学生模型;

7、获得待分析句子,将所述待分析句子输入至所述编码模型中进行编码处理,获得所述待分析句子的句子编码表示,将所述待分析句子的句子编码表示输入至所述目标学生模型,获得所述待分析句子的方面词情感分析结果。

8、第二方面,本申请实施例提供了一种情感分析装置,包括:

9、数据获取模块,用于获得源语言集、目标语言集以及目标语言未标记句子集,其中,所述源语言集包括源语言句子集以及方面词替换源语言句子集;所述目标语言集包括目标语言句子集以及方面词替换目标语言句子集;

10、句子编码模块,用于将所述源语言集、目标语言集以及目标语言未标记句子集输入至预设的编码模型中进行编码处理,获得所述源语言集、目标语言集以及目标语言未标记句子集的句子编码表示集;

11、教师模型训练模块,用于将所述源语言集以及目标语言集的句子编码表示集输入至预设的教师模型中进行情感概率分布计算,获得所述源语言集以及目标语言集的预测情感概率分布集;根据所述源语言集以及目标语言集的预测情感概率分布集,对预设的教师模型进行训练,获得目标教师模型;

12、学生模型训练模块,用于将所述目标语言未标记句子集的句子编码表示集分别输入至所述目标教师模型以及预设的学生模型,获得所述目标教师模型以及学生模型输出的所述目标语言未标记句子集的预测情感概率分布集;根据所述目标教师模型以及学生模型输出的所述目标语言未标记句子集的预测情感概率分布集,对所述学生模型进行训练,获得目标学生模型;

13、情感分析模块,用于获得待分析句子,将所述待分析句子输入至所述编码模型中进行编码处理,获得所述待分析句子的句子编码表示,将所述待分析句子的句子编码表示输入至所述目标学生模型,获得所述待分析句子的方面词情感分析结果。

14、第三方面,本申请实施例提供了一种计算机设备,包括:处理器、存储器以及存储在所述存储器上并可在所述处理器上运行的计算机程序;所述计算机程序被所述处理器执行时实现如第一方面所述的情感分析方法的步骤。

15、第四方面,本申请实施例提供了一种存储介质,所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的情感分析方法的步骤。

16、在本实施例中,提供一种情感分析方法、装置、计算机设备以及存储介质,基于源语言集以及目标语言集的预测情感概率分布集,对教师模型进行训练,获得训练后的教师模型以及预设的学生模型输出的目标语言未标记句子集的预测情感概率分布集,作为学生模型的训练数据,采用知识蒸馏方法,对学生模型进行训练,提高了学生模型执行跨语言方面级情感分类任务的准确率,从而实现基于目标语言的方面词的提取以及方面词的情感极性的确认,提高了情感分析的准确性。

17、为了更好地理解和实施,下面结合附图详细说明本发明。



技术特征:

1.一种情感分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的情感分析方法,其特征在于,还包括步骤:对所述编码模型进行训练;

3.根据权利要求1或2所述的情感分析方法,其特征在于,所述根据所述源语言集以及目标语言集的预测情感概率分布集,对预设的教师模型进行训练,获得目标教师模型,包括步骤:

4.根据权利要求3所述的情感分析方法,其特征在于:所述目标教师模型包括若干个子教师模型;

5.根据权利要求4所述的情感分析方法,其特征在于,所述根据所述目标教师模型以及学生模型输出的所述目标语言未标记句子集的预测情感概率分布集,对所述学生模型进行训练,获得目标学生模型,包括步骤:

6.根据权利要求5所述的情感分析方法,其特征在于,所述将所述待分析句子的句子编码表示输入至所述目标学生模型,获得所述待分析句子的方面词情感分析结果,包括步骤:

7.一种情感分析装置,其特征在于,包括:

8.一种计算机设备,其特征在于,包括处理器、存储器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如权利要求1至6任一项所述的情感分析方法的步骤。

9.一种存储介质,其特征在于:所述存储介质存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的情感分析方法的步骤。


技术总结
本发明涉及自然语言处理技术领域,特别涉及一种情感分析方法、装置、计算机设备以及存储介质,基于源语言集以及目标语言集的预测情感概率分布集,对教师模型进行训练,获得训练后的教师模型以及预设的学生模型输出的目标语言未标记句子集的预测情感概率分布集,作为学生模型的训练数据,采用知识蒸馏方法,对学生模型进行训练,提高了学生模型执行跨语言方面级情感分类任务的准确率,从而实现基于目标语言的方面词的提取以及方面词的情感极性的确认,提高了情感分析的准确性。

技术研发人员:薛云,吴承彦,蔡倩华
受保护的技术使用者:华南师范大学
技术研发日:
技术公布日:2024/12/17
转载请注明原文地址:https://xbbs.6miu.com/read-22205.html