本技术涉及计算机数据处理,尤其涉及一种基于大语言模型的问答的技术。
背景技术:
1、自从llm(large language model,大语言模型)出现后,可能因训练的数数据数量不足或者质量不高等因素会导致模型学到错误的信息或虚假的知识,或者模型可能存在某些未知的缺陷或偏见会导致模型在处理时产生不准确的结果,又或者模型在训练时可能会学习到一些与实际情况不符的规则或模式,过度泛化,都可能会导致llm出现幻觉问题。
2、为了改善llm的幻觉问题,普遍的思路是采用rag(retrieval-augmentedgeneration,检索增强生成)技术,通过将外部知识文本进行不同颗粒度的拆分后形成多角度摘要,以向量形式存储到知识库中,llm根据用户输入的问题,检索知识库,得到相关知识信息,统一整合到llm,再由llm生成对应问题的最终答案。由于rag技术通常在生成回答前采用单次检索,且不存在处理逻辑反思过程,在生成回答时可能会存在检索内容不足以支撑回答细节,或者处理的整体逻辑性不强,使得生成的回答存在细节错误导致可信度不高。尤其是在针对一些复杂的、需要模型总结、理解的大篇幅的问题时。
技术实现思路
1、本技术的目的是提供一种基于大语言模型的问答方法、装置及设备,用以至少部分解决现有技术中大语言模型针对部分问题在生成回答时的整体逻辑性不强,生成的回答可能存在细节错误导致可信度不高的技术问题
2、根据本技术的一方面的一个实施例,提供了一种基于大语言模型的问答方法,其中,所述方法包括:
3、基于获取的问题内容,确定对应所述问题内容的回答流程,并基于所述问题内容和回答流程,确定对应回答流程的当前阶段的若干关键字和若干问题;
4、将所述若干关键字输入关键字检索模型,得到第一检索结果,以及将所述若干问题输入向量检索模型,得到第二检索结果,并将所述第一检索结果和所述第二检索结果输入精排模型,得到对应当前阶段的参考文档;
5、基于所述问题内容、回答流程和参考文档,确定对应当前阶段的回答,并汇总到已生成的回答;
6、d基于所述问题内容、回答流程和已生成的回答,反思回答流程中的后续阶段是否需要调整,若需要,则进行调整,并针对回答流程的下一阶段,重复上述步骤,确定对应下一阶段的回答;
7、e遍历回答流程的每个阶段,重复上述步骤,得到每个阶段对应的回答,并将汇总了最后一个阶段的回答的已生成的回答作为所述问题内容对应的最终回答。
8、可选地,其中,所述基于获取的问题内容,确定对应所述问题内容的回答流程包括:
9、将获取的问题内容输入大语言模型中的回答流程提示工程,得到对应所述问题内容的回答流程。
10、可选地,其中,所述基于所述问题内容和回答流程,确定对应回答流程的当前阶段的若干关键字和若干问题包括:
11、将所述问题内容和回答流程分别输入大语言模型中的关键字生成提示工程和问题生成提示工程,得到对应回答流程的当前阶段的若干关键字和若干问题。
12、可选地,其中,所述将所述若干关键字输入关键字检索模型,得到第一检索结果包括:
13、将所述若干关键字输入关键字检索模型,基于预设知识库进行检索,得到第一检索结果。
14、可选地,其中,所述将所述若干问题输入向量检索模型,得到第二检索结果包括:
15、将所述若干问题输入向量检索模型,基于预设知识库进行检索,得到第二检索结果。
16、可选地,其中,所述基于所述问题内容、回答流程和参考文档,确定对应当前阶段的回答包括:
17、将所述问题内容、回答流程和参考文档输入大语言模型中的回答提示工程,得到对应当前阶段的回答。
18、可选地,其中,所述基于所述问题内容、回答流程和已生成的回答,反思所述回答流程中的后续阶段是否需要调整包括:
19、将所述问题内容、回答流程和已生成的回答输入大语言模型中的反思提示工程,反思所述回答流程中的后续阶段是否需要调整。
20、可选地,其中,若回答流程的后续阶段需要调整,所述方法包括:
21、当调整后的回答流程的阶段数量满足预设阈值,则不再进行反思。
22、可选地,其中,所述方法包括:
23、若已生成的回答满足预设条件,则不再进行反思。
24、可选地,其中,所述将汇总了最后一个阶段的回答的已生成的回答作为所述问题内容对应的最终回答包括:
25、对汇总了最后一个阶段的回答的已生成的回答进行内容去冗余操作,将去冗余后的已生成的回答作为所述问题内容对应的最终回答。
26、根据本技术的另一方面的另一个实施例,提供了一种基于大语言模型的问答装置,所述装置包括:
27、第一模块,用于基于获取的问题内容,确定对应所述问题内容的回答流程,并基于所述问题内容和回答流程,确定对应回答流程的当前阶段的若干关键字和若干问题;
28、第二模块,用于将所述若干关键字输入关键字检索模型,得到第一检索结果,以及将所述若干问题输入向量检索模型,得到第二检索结果,并将所述第一检索结果和所述第二检索结果输入精排模型,得到对应当前阶段的参考文档;
29、第三模块,用于基于所述问题内容、回答流程和参考文档,确定对应当前阶段的回答,并汇总到已生成的回答;
30、第四模块,用于基于所述问题内容、回答流程和已生成的回答,反思回答流程中的后续阶段是否需要调整,若需要,则进行调整,并针对回答流程的下一阶段,通过上述相关模块,确定对应下一阶段的回答;
31、第五模块,用于得到每个阶段对应的回答,并将汇总入最后一个阶段的回答的已生成的回答作为所述问题内容对应的最终回答。
32、与现有技术相比,本技术提供了一种基于大语言模型的问答方法,其特征在于,所述方法包括:基于获取的问题内容,确定对应所述问题内容的回答流程,并基于所述问题内容和回答流程,确定对应回答流程的当前阶段的若干关键字和若干问题;将所述若干关键字输入关键字检索模型,得到第一检索结果,以及将所述若干问题输入向量检索模型,得到第二检索结果,并将所述第一检索结果和所述第二检索结果输入精排模型,得到对应当前阶段的参考文档;基于所述问题内容、回答流程和参考文档,确定对应当前阶段的回答,并汇总到已生成的回答;基于所述问题内容、回答流程和已生成的回答,反思回答流程中的后续阶段是否需要调整,若需要,则进行调整,并针对回答流程的下一阶段,重复上述步骤,确定对应下一阶段的回答;遍历回答流程的每个阶段,重复上述步骤,得到每个阶段对应的回答,并将汇总了最后一个阶段的回答的已生成的回答作为所述问题内容对应的最终回答。通过该方法,确定针对问题的回答流程,并分别针对回答流程的每个阶段进行与问题相关的关键字和扩展问题的检索,得到每个阶段的参考文档,并得到每个阶段的回答,汇总成最终答案,在llm的检索部分实现检索增强,在llm的生成部分还结合截止到当前阶段的已生成的回答,对回答流程进行反思。可增强生成回答时的整体逻辑性,减少最终回答的细节错误,从而提升最终回答的可信度。
1.一种基于大语言模型的问答方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于获取的问题内容,确定对应所述问题内容的回答流程包括:
3.根据权利要求1所述的方法,其特征在于,所述基于所述问题内容和回答流程,确定对应回答流程的当前阶段的若干关键字和若干问题包括:
4.根据权利要求1所述的方法,其特征在于,所述将所述若干关键字输入关键字检索模型,得到第一检索结果包括:
5.根据权利要求1所述的方法,其特征在于,所述将所述若干问题输入向量检索模型,得到第二检索结果包括:
6.根据权利要求1所述的方法,其特征在于,所述基于所述问题内容、回答流程和所述参考文档,确定对应当前阶段的回答包括:
7.根据权利要求1所述的方法,其特征在于,所述基于所述问题内容、回答流程和已生成的回答,反思所述回答流程中的后续阶段是否需要调整包括:
8.根据权利要求1所述的方法,其特征在于,若回答流程的后续阶段需要调整,所述方法包括:
9.根据权利要求1所述的方法,其特征在于,若已生成的回答满足预设条件,则不再进行反思。
10.根据权利要求1所述的方法,其特征在于,所述将汇总了最后一个阶段的回答的已生成的回答作为所述问题内容对应的最终回答包括:
11.一种基于大语言模型的问答装置,其特征在于,所述装置包括:
12.一种计算机可读介质,其特征在于,
13.一种基于大语言模型的问答设备,其特征在于,所述设备包括:
