基于大语言模型RAG框架构建智能客服交互的方法及系统与流程

专利2025-04-17  18


本发明涉及人工智能,具体涉及一种基于大语言模型rag框架构建智能客服交互的系统、方法、电子设备及存储介质。


背景技术:

1、现有的智能客服系统工作方式基于如下技术:通过自然语言处理(nlp)模块对用户的输入的文本进行分析和处理,通过自然语言理解(nlu)模块理解用户的意图;通过自然语言生成(nlg)模块根据用户意图生成回复;

2、现有的智能客服系统的解决方案主要基于人工预先建立的知识库,基于自然语言处理和自然语言理解从知识库中通过模版、规则或意图匹配知识库中的答案或语料,然后通过自然语言生成进行处理后返回给用户,准确性严重依赖人工预先建立的知识库,需要人工进行维护,面对复杂问题时无法理解用户的意图和需求,推理能力有限,无法根据用户的意图进行智能回答,回复比较生硬,回答的质量有待提高。

3、因此,目前亟需一种能够准确实现智能客服交互的方法。


技术实现思路

1、本发明实施例的目的在于提供一种基于大语言模型rag框架构建智能客服交互的系统、方法、电子设备及存储介质,用以解决现有技术中知识库的构建严重依赖人工,需要人工维护,且无法处理复杂问题的问题。

2、为实现上述目的,本发明实施例提供一种基于大语言模型rag框架构建智能客服交互的方法,所述基于大语言模型rag框架构建智能客服交互的方法具体包括:

3、获取历史数据,将所述历史数据进行数据处理;其中,所述历史数据包括知识文档、标准问答数据、历史对话数据、业务信息数据和产品信息数据;

4、采用多种划分方法对所述知识文档进行逻辑划分得到片段,将所述片段输入大语言模型进行处理,将处理后的片段输入嵌入式模型进行向量化,得到片段向量并存储至向量数据库中;

5、将所述标准问答数据输入嵌入式模型进行向量化,得到标准问答数据向量并存储至向量数据库中;

6、通过大语言模型对所述历史对话数据、业务信息数据和产品信息数据进行处理,得到处理结果数据,将所述处理结果数据输入嵌入式模型进行向量化,得到处理结果数据向量并存储至向量数据库中;

7、获取用户咨询问题,通过嵌入式模型将所述用户咨询问题转换为语义向量,从向量数据库中检索出与所述语义向量相关的多个索引结果;

8、通过reranker算法对多个索引结果进行一次重新排序,得到最终索引结果;

9、将所述最终索引结果作为上下文和用户咨询问题一起输入大语言模型,生成问题结果。

10、在上述技术方案的基础上,本发明还可以做如下改进:

11、进一步地,所述获取历史数据,将所述历史数据进行数据处理,包括:

12、对所述历史数据进行数据提取,得到提取数据;

13、对所述提取数据进行清洗和标准化处理后,获取所述历史数据对应的元数据。

14、进一步地,所述划分方法包括固定大小划分方法和内容感知划分方法。

15、进一步地,所述采用多种划分方法对所述知识文档进行逻辑划分得到片段,将所述片段输入大语言模型进行处理,将处理后的片段输入嵌入式模型进行向量化,得到片段向量并存储至向量数据库中,包括:

16、判断片段的内容是否可用,若片段的内容不可用,通过大语言模型对所述片段的内容进行信息的抽取或总结;

17、通过大语言模型对片段的内容进行自问自答,并根据内容关联度和一致性进行评分获取有效问答对。

18、进一步地,所述基于大语言模型rag框架构建智能客服交互的方法,还包括:

19、通过大语言模型判断历史对话数据的完成度,得到高质量历史对话数据;

20、根据高质量历史对话数据自动化更新标准问答数据。

21、进一步地,所述基于大语言模型rag框架构建智能客服交互的方法,还包括:

22、获得所述用户咨询问题的问题结果后,对所述问题结果进行校验,判断所述问题结果是否正确;

23、当所述问题结果不正确时,重新获取所述用户咨询问题对应的问题结果,并对所述问题结果进行校验,直至所述问题结果正确。

24、进一步地,所述基于大语言模型rag框架构建智能客服交互的方法,还包括:

25、当未检索到所述索引结果时,重新获取所述用户咨询问题的补充问题,直至检索到所述索引结果。

26、一种基于大语言模型rag框架构建智能客服交互的系统,包括:

27、获取模块,用于获取历史数据,将所述历史数据进行数据处理;其中,所述历史数据包括知识文档、标准问答数据、历史对话数据、业务信息数据和产品信息数据;

28、向量化模块,用于采用多种划分方法对所述知识文档进行逻辑划分得到片段,将所述片段输入大语言模型进行处理,将处理后的片段输入嵌入式模型进行向量化,得到片段向量并存储至向量数据库中;

29、将所述标准问答数据输入嵌入式模型进行向量化,得到标准问答数据向量并存储至向量数据库中;

30、通过大语言模型对所述历史对话数据、业务信息数据和产品信息数据进行处理,得到处理结果数据,将所述处理结果数据输入嵌入式模型进行向量化,得到处理结果数据向量并存储至向量数据库中;

31、检索模块,用于通过reranker算法对多个索引结果进行一次重新排序,得到最终索引结果;

32、问题结果生成模块,用于将所述最终索引结果作为上下文和用户咨询问题一起输入大语言模型,生成问题结果。

33、一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如所述方法的步骤。

34、一种非暂态计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述方法的步骤。

35、本发明实施例具有如下优点:

36、本发明中基于大语言模型rag框架构建智能客服交互的方法,减少知识库构建时的强人工依赖,通过大语言模型自动化生成和维护知识库;提升检索的精度:结合大语言模型生成高质量的知识库数据;按条件检索提升检索的相关度和精确率;增加reranker算法提升检索召回结果的精确度;提升回复质量和解决复杂问题的能力:结合大语言模型和高质量的知识库可以提升系统解决复杂问题的能力,以及提升回复质量,减少生硬、教条化回复。解决了现有技术中知识库的构建严重依赖人工,需要人工维护,且无法处理复杂问题的问题。



技术特征:

1.一种基于大语言模型rag框架构建智能客服交互的方法,其特征在于,所述基于大语言模型rag框架构建智能客服交互的方法具体包括:

2.根据权利要求1所述基于大语言模型rag框架构建智能客服交互的方法,其特征在于,所述获取历史数据,将所述历史数据进行数据处理,包括:

3.根据权利要求1所述基于大语言模型rag框架构建智能客服交互的方法,其特征在于,所述划分方法包括固定大小划分方法和内容感知划分方法。

4.根据权利要求1所述基于大语言模型rag框架构建智能客服交互的方法,其特征在于,所述采用多种划分方法对所述知识文档进行逻辑划分得到片段,将所述片段输入大语言模型进行处理,将处理后的片段输入嵌入式模型进行向量化,得到片段向量并存储至向量数据库中,包括:

5.根据权利要求1所述基于大语言模型rag框架构建智能客服交互的方法,其特征在于,所述基于大语言模型rag框架构建智能客服交互的方法,还包括:

6.根据权利要求1所述基于大语言模型rag框架构建智能客服交互的方法,其特征在于,所述基于大语言模型rag框架构建智能客服交互的方法,还包括:

7.根据权利要求1所述基于大语言模型rag框架构建智能客服交互的方法,其特征在于,所述基于大语言模型rag框架构建智能客服交互的方法,还包括:

8.一种基于大语言模型rag框架构建智能客服交互的系统,其特征在于,包括:

9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中的任一项所述的方法的步骤。

10.一种非暂态计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中的任一项所述的方法的步骤。


技术总结
本发明实施例公开了一种基于大语言模型RAG框架构建智能客服交互的方法及系统,包括:采用多种划分方法对知识文档进行逻辑划分得到片段,将处理后的片段输入嵌入式模型进行向量化,得到片段向量并存储至向量数据库中;将标准问答数据向量并存储至向量数据库中;将处理结果数据输入嵌入式模型进行向量化,得到处理结果数据向量并存储至向量数据库中;通过嵌入式模型将用户咨询问题转换为语义向量,通过reranker算法对多个索引结果进行一次重新排序,得到最终索引结果;将最终索引结果作为上下文和用户咨询问题一起输入大语言模型,生成问题结果。解决现有技术中知识库的构建严重依赖人工,需要人工维护,且无法处理复杂问题的问题。

技术研发人员:王冲冲,刘尉良,陈冠岭
受保护的技术使用者:南京福佑在线电子商务有限公司
技术研发日:
技术公布日:2024/12/17
转载请注明原文地址:https://xbbs.6miu.com/read-23531.html