一种基于知识图谱的智能问答方法、装置、设备和介质与流程

专利2025-06-21  19


本发明属于智能问答,具体而言涉及一种基于知识图谱的智能问答方法、装置、设备和介质。


背景技术:

1、大型语言模型(llm)拥有复杂的设计结构和大量参数。它们通过在广泛多样的语料库上进行严格的预训练,在自然语言处理(nlp)任务中取得了显著的成就,涵盖了从语言理解到条件和无条件文本生成等多个领域;但是由于llm有时表现出幻觉的倾向,提供的预测有时不够准确,另一方面,llm的黑箱性质损害了其可解释性和事实准确性,导致尽管模型在训练中学习了事实,但仍可能出现错误的陈述。

2、现有的利用知识图谱的智能问答方法,通常通过知识库的功能缓解这些问题,从可检索的数据库中外部获取自然语言知识,通过计算相关概念之间嵌入向量的相似度来评估与信息搜索查询的语义相似度,但是通过计算得到的相似度缺乏得到结构化的信息,只能得到相关的文本信息,存在生成回答准确性低的技术问题。


技术实现思路

1、鉴于上述的分析,本发明实施例旨在提供一种基于知识图谱的智能问答方法、装置、设备和介质,用以解决现有技术中存在的上述问题中的一者或多者。

2、本发明的目的是这样实现的:

3、本发明第一方面实施例提供一种基于知识图谱的智能问答方法,包括:

4、获取输入问题;

5、将知识库中的文本转换为文本块的形式,并提取关键词,得到关键词列表;

6、基于所述文本块构建文本块图,基于所述关键词列表构建关键词图;根据所述文本块图和所述关键词图构建关键词列表与文本块的映射关系;

7、计算输入问题与知识库中的文本块的第一相似度,将所述第一相似度大于第一阈值的文本块设为第一候选文本块;

8、提取输入问题的第一关键词,计算第一关键词与关键词列表中的关键词的第二相似度,将所述第二相似度大于第二阈值的关键词设为第一候选关键词;根据关键词列表与文本块的映射关系,将所述第一候选关键词相对应的文本块设为第二候选文本块;

9、计算所述第一候选关键词与关键词图中的关键词的第三相似度,将所述第三相似度大于第三阈值的关键词设为第二候选关键词;根据关键词列表与文本块的映射关系,将所述第二候选关键词相对应的文本块设为第三候选文本块;

10、根据所述第一候选文本块、第二候选文本块、第三候选文本块、第一候选关键词和第二候选关键词生成最终回答。

11、进一步地,所述将知识库中的文本转换为文本块的形式,并提取关键词,包括:向量化所述文本块,对向量化后的文本块进行聚类;在每个聚类的集群中,采样2c个文本块向量,其中c个文本块向量接近聚类中心,另外c个文本块向量在类中随机选择;将采样的2c个文本块向量对应的文本块输入大语言模型中,提取文本块中的关键词。

12、进一步地,所述基于所述文本块构建文本块图,包括:将知识库中的文本块处理为向量形式;构建以文本块向量为节点,以文本块向量之间的相似度为节点之间的边的文本块图。

13、进一步地,所述基于所述关键词列表构建关键词图,包括:构建以关键词列表中的关键词为节点,以关键词之间的关联强度为节点之间的边的关键词图。

14、进一步地,所述根据所述文本块图和所述关键词图构建关键词列表与文本块的映射关系,包括:初始化文本块图的节点和关键词图的节点之间的权重值,所述权重值表示文本块图中的文本块与关键词图中的关键词之间的相关度;使用图拉普拉斯学习方法迭代更新权重值,直至迭代收敛。

15、进一步地,还包括:根据所述输入问题生成至少两个相似问题,使用跳数预测模型预测所述输入问题和相似问题的跳数,将出现频率最高的跳数作为输入问题的预测跳数;根据输入问题的预测跳数在知识图谱中进行检索,得到补充信息,将所述补充信息补充到所述最终回答中。

16、进一步地,所述根据输入问题的预测跳数在知识图谱中进行检索,包括:在知识图谱中查找与所述输入问题和所述相似问题相对应的实体;将与输入问题和相似问题相对应的实体的节点作为初始检索节点;以所述初始检索节点为起点,剔除与当前检索节点相连的边中与输入问题或相似问题不相关的边,在知识图谱中循环迭代检索,直至达到所述预测跳数,得到多组可能解决输入问题和相似问题的实体与关系组合;计算多组实体与关系组合的得分,将得分最高的实体与关系组合设为补充信息。

17、本发明第二方面实施例提供一种基于知识图谱的智能问答装置,包括:

18、获取模块,用于获取输入问题;

19、提取模块,用于将知识库中的文本转换为文本块的形式,并提取关键词,得到关键词列表;

20、构建模块,用于基于所述文本块构建文本块图,基于所述关键词列表构建关键词图;根据所述文本块图和所述关键词图构建关键词列表与文本块的映射关系;

21、第一候选模块,用于计算输入问题与知识库中的文本块的第一相似度,将所述第一相似度大于第一阈值的文本块设为第一候选文本块;

22、第二候选模块,用于提取输入问题的第一关键词,计算第一关键词与关键词列表中的关键词的第二相似度,将所述第二相似度大于第二阈值的关键词设为第一候选关键词;根据关键词列表与文本块的映射关系,将所述第一候选关键词相对应的文本块设为第二候选文本块;

23、第三候选模块,用于计算所述第一候选关键词与关键词图中的关键词的第三相似度,将所述第三相似度大于第三阈值的关键词设为第二候选关键词;根据关键词列表与文本块的映射关系,将所述第二候选关键词相对应的文本块设为第三候选文本块;

24、生成回答模块,用于根据所述第一候选文本块、第二候选文本块、第三候选文本块、第一候选关键词和第二候选关键词生成最终回答。

25、本发明第三方面实施例提供一种电子设备,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时实现任一实施例所述的基于知识图谱的智能问答方法。

26、本发明第四方面实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现任一实施例所述的基于知识图谱的智能问答方法。

27、与现有技术相比,本发明至少可实现如下有益效果之一:

28、本发明提供的基于知识图谱的智能问答方法,通过将知识库中的文本块以及关键词构建为结构化的文本块图和关键词图,再通过结构化的知识图谱构建起关键词列表与文本块的映射关系,在检索时,分别对输入问题在知识库中检索,对输入问题的关键词在关键词列表中检索,以及对输入问题的关键词在关键词图中检索后根据映射关系检索,得到多个候选文本块和关键词后,综合得出最终回答,提高了模型生成回答的准确性,减少了幻觉现象。



技术特征:

1.一种基于知识图谱的智能问答方法,其特征在于,包括:

2.根据权利要求1所述的基于知识图谱的智能问答方法,其特征在于,所述将知识库中的文本转换为文本块的形式,并提取关键词,包括:

3.根据权利要求1所述的基于知识图谱的智能问答方法,其特征在于,所述基于所述文本块构建文本块图,包括:

4.根据权利要求3所述的基于知识图谱的智能问答方法,其特征在于,所述基于所述关键词列表构建关键词图,包括:

5.根据权利要求1所述的基于知识图谱的智能问答方法,其特征在于,所述根据所述文本块图和所述关键词图构建关键词列表与文本块的映射关系,包括:

6.根据权利要求1-5任一项所述的基于知识图谱的智能问答方法,其特征在于,还包括:

7.根据权利要求6所述的基于知识图谱的智能问答方法,其特征在于,所述根据输入问题的预测跳数在知识图谱中进行检索,包括:

8.一种基于知识图谱的智能问答装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-7任一项所述的基于知识图谱的智能问答方法。

10.一种存储介质,其特征在于,其上存储有计算机程序,所述程序被处理器执行时,实现权利要求1-7任一项所述的基于知识图谱的智能问答方法。


技术总结
本发明涉及一种基于知识图谱的智能问答方法、装置、设备和介质,包括:获取输入问题;将知识库的文本转换为文本块形式,提取关键词,得到关键词列表;基于文本块构建文本块图,基于关键词列表构建关键词图;计算输入问题与文本块的第一相似度,大于第一阈值的文本块设为第一候选文本块;提取输入问题的第一关键词,计算第一关键词与关键词列表的第二相似度,大于第二阈值的关键词设为第一候选关键词;第一候选关键词相对应的文本块设为第二候选文本块;计算第一候选关键词与关键词图中的关键词的第三相似度,大于第三阈值的关键词设为第二候选关键词;第二候选关键词相对应的文本块设为第三候选文本块;根据候选文本块、候选关键词生成最终回答。

技术研发人员:袁会会,楼航宇,吴润喆,仇瑜,刘德兵
受保护的技术使用者:北京智谱华章科技有限公司
技术研发日:
技术公布日:2024/12/17
转载请注明原文地址:https://xbbs.6miu.com/read-25566.html