问题处理方法、装置、设备、存储介质及程序产品与流程

专利2025-06-03  31


本发明涉及自然语言处理,尤其是涉及一种问题处理方法、装置、设备、存储介质及程序产品。


背景技术:

1、目前大语言模型的幻觉现象比较严重。其中幻觉指的是大语言模型基于输入指令生成的结果包含了无根据或者错误的内容,简单来说就是杜撰、一本正经的胡说八道。而大语言模型的幻觉现象会降低大语言模型解决问题的准确率。


技术实现思路

1、本发明的目的在于提供一种问题处理方法、装置、设备、存储介质及程序产品,用以解决由于大语言模型的幻觉现象导致大语言模型解决问题的准确率低的问题。

2、为了达到上述目的,第一方面,本发明提供一种问题处理方法,该方法包括:

3、获取第一指令,所述第一指令是针对第一问题的指令;

4、将所述第一指令输入至大语言模型,获得所述大语言模型的幻觉识别区块输出的词元,所述幻觉识别区块用于识别所述大语言模型基于输入指令生成的结果中是否包含表征无答案的内容,所述幻觉识别区块包括所述大语言模型的至少一层;

5、在所述幻觉识别区块输出的词元表示所述第一问题无答案的情况下,将所述大语言模型的最后一层输出的词元变更为所述幻觉识别区块输出的词元,并作为所述第一问题的答案输出;

6、在所述幻觉识别区块输出的词元表示所述第一问题有答案的情况下,将所述大语言模型的最后一层输出的词元作为所述第一问题的答案输出。

7、在一些实施例中,所述将所述第一指令输入至大语言模型,获得所述大语言模型的幻觉识别区块输出的词元,包括:

8、将所述第一指令输入至所述大语言模型,获得所述大语言模型的最后一层输出第一个词元时,所述大语言模型的幻觉识别区块的隐向量;

9、对所述幻觉识别区块的隐向量进行解码,得到所述幻觉识别区块输出的词元。

10、在一些实施例中,所述方法还包括:

11、在所述幻觉识别区块输出的词元表示所述第一问题有答案的情况下,获取所述大语言模型的最后一层输出的除所述第一个词元外的其他词元;

12、所述将所述大语言模型的最后一层输出的词元作为所述第一问题的答案输出,包括:

13、将所述大语言模型的最后一层输出的所述第一个词元和所述其他词元作为所述第一问题的答案输出。

14、在一些实施例中,所述方法还包括:

15、获取幻觉指令集合,所述幻觉指令集合中指令对应的问题无答案;

16、针对所述幻觉指令集合的每个指令,将所述指令输入至所述大语言模型,获得目标词元对应在所述大语言模型的每一层输出的词元和置信度,所述目标词元为所述大语言模型的最后一层输出的第一个词元;

17、利用各个指令对应的、所述目标词元对应在所述大语言模型的每一层输出的词元和置信度,得到所述大语言模型的幻觉识别区块。

18、在一些实施例中,所述利用各个指令对应的、所述目标词元对应在所述大语言模型的每一层输出的词元和置信度,得到所述大语言模型的幻觉识别区块,包括:

19、针对每个所述指令,基于所述目标词元对应在所述大语言模型的每一层输出的词元,从中获取第一词元对应的第一区块,所述第一词元包括至少一个表示所述指令对应的问题无答案的词元;

20、基于所述目标词元对应在所述大语言模型的每一层输出的置信度,获得所述第一区块对应的置信度;

21、从获得的多个所述第一区块中选取置信度大于预设阈值的第一区块作为所述大语言模型的幻觉识别区块。

22、第二方面,本发明还提供一种问题处理装置,该装置包括:

23、第一获取模块,用于获取第一指令,所述第一指令是针对第一问题的指令;

24、第二获取模块,用于将所述第一指令输入至大语言模型,获得所述大语言模型的幻觉识别区块输出的词元,所述幻觉识别区块用于识别所述大语言模型基于输入指令生成的结果中是否包含表征无答案的内容,所述幻觉识别区块包括所述大语言模型的至少一层;

25、第一处理模块,用于在所述幻觉识别区块输出的词元表示所述第一问题无答案的情况下,将所述大语言模型的最后一层输出的词元变更为所述幻觉识别区块输出的词元,并作为所述第一问题的答案输出;

26、第二处理模块,用于在所述幻觉识别区块输出的词元表示所述第一问题有答案的情况下,将所述大语言模型的最后一层输出的词元作为所述第一问题的答案输出。

27、第三方面,本发明还提供一种问题处理设备,包括处理器和收发器,所述收发器在处理器的控制下接收和发送数据,所述处理器用于执行以下操作:

28、获取第一指令,所述第一指令是针对第一问题的指令;

29、将所述第一指令输入至大语言模型,获得所述大语言模型的幻觉识别区块输出的词元,所述幻觉识别区块用于识别所述大语言模型基于输入指令生成的结果中是否包含表征无答案的内容,所述幻觉识别区块包括所述大语言模型的至少一层;

30、在所述幻觉识别区块输出的词元表示所述第一问题无答案的情况下,将所述大语言模型的最后一层输出的词元变更为所述幻觉识别区块输出的词元,并作为所述第一问题的答案输出;

31、在所述幻觉识别区块输出的词元表示所述第一问题有答案的情况下,将所述大语言模型的最后一层输出的词元作为所述第一问题的答案输出。

32、第四方面,本发明还提供一种问题处理设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;所述处理器执行所述程序时实现如上述第一方面所述的问题处理方法。

33、第五方面,本发明还提供一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上述第一方面所述的问题处理方法中的步骤。

34、第六方面,本发明还提供一种计算机程序产品,包括计算机指令,所述计算机指令被处理器执行时实现如上述第一方面所述的问题处理方法中的步骤。

35、本发明的上述技术方案至少具有如下有益效果:

36、本发明实施例中,通过获取第一指令,所述第一指令是针对第一问题的指令;之后,将所述第一指令输入至大语言模型,获得所述大语言模型的幻觉识别区块输出的词元,所述幻觉识别区块用于识别所述大语言模型基于输入指令生成的结果中是否包含表征无答案的内容,所述幻觉识别区块包括所述大语言模块的至少一层;最后,在所述幻觉识别区块输出的词元表示所述第一问题无答案的情况下,将所述大语言模型的最后一层输出的词元变更为所述幻觉识别区块输出的词元,并作为所述第一问题的答案输出;在所述幻觉识别区块输出的词元表示所述第一问题有答案的情况下,将所述大语言模型的最后一层输出的词元作为所述第一问题的答案输出,这样,通过激活大语言模型对问题是否能回答的区块(即幻觉识别区块)能力,以大语言模型内在固有的能力解决大语言模型的幻觉问题,进而提升大语言模型解决问题的准确率。



技术特征:

1.一种问题处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将所述第一指令输入至大语言模型,获得所述大语言模型的幻觉识别区块输出的词元,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述利用各个指令对应的、所述目标词元对应在所述大语言模型的每一层输出的词元和置信度,得到所述大语言模型的幻觉识别区块,包括:

6.一种问题处理装置,其特征在于,包括:

7.一种问题处理设备,包括处理器和收发器,所述收发器在处理器的控制下接收和发送数据,其特征在于,所述处理器用于执行以下操作:

8.一种问题处理设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;其特征在于,所述处理器执行所述程序时实现如权利要求1至5任一项所述的问题处理方法。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1至5任一项所述的问题处理方法中的步骤。

10.一种计算机程序产品,其特征在于,包括计算机指令,所述计算机指令被处理器执行时实现如权利要求1至5任一项所述的问题处理方法中的步骤。


技术总结
本发明提供一种问题处理方法、装置、设备、存储介质及程序产品,涉及自然语言处理技术领域。该方法包括获取第一指令,第一指令是针对第一问题的指令;将第一指令输入至大语言模型,获得大语言模型的幻觉识别区块输出的词元;在幻觉识别区块输出的词元表示第一问题无答案的情况下,将大语言模型的最后一层输出的词元变更为幻觉识别区块输出的词元,并作为第一问题的答案输出;在幻觉识别区块输出的词元表示第一问题有答案的情况下,将大语言模型的最后一层输出的词元作为第一问题的答案输出。本发明的方法通过激活大语言模型对问题是否能回答的区块能力,以大语言模型内在固有的能力解决大语言模型的幻觉问题,提升大语言模型解决问题的准确率。

技术研发人员:于皓,张杰,王展
受保护的技术使用者:北京中科金得助智能科技有限公司
技术研发日:
技术公布日:2024/12/17
转载请注明原文地址:https://xbbs.6miu.com/read-24945.html