基于大语言模型的智能数字员工语音对话式报税方法与流程

专利2025-03-06 41

本发明涉及报税业务领域，特别涉及基于大语言模型的智能数字员工语音对话式报税方法。

背景技术：

1、随着经济发展，纳税人对报税的需求越来越频繁，但现有的报税业务系统存在一定弊端，便捷报税的提升空间有限。纳税人需要记住繁琐的操作步骤，加上税务制度的逐步完善，导致报税工作流程变得复杂，需要大量税务基层人员指导纳税人操作。现有的税务大厅解决方案，如教学视频、对照式双屏步骤操作说明器或步骤说明，需要纳税人阅读和理解内容后再操作，费时费力，效果不理想。为了提升纳税人的自助报税体验，需要提供新的办税服务模式。然而，电子税务局的业务系统缺乏简便的服务操作，第三方业务系统也没有权限优化。

技术实现思路

1、本发明的目的在于克服现有技术的缺点与不足，提供基于大语言模型的智能数字员工语音对话式报税方法，通过连接外部的智能数字员工和借助人工智能对话引擎，提供对话式报税服务，进一步提升纳税人的体验。

2、本发明的另一目的在于提供基于大语言模型的智能数字员工语音对话式报税系统。

3、本发明的目的通过以下的技术方案实现：

4、基于大语言模型的智能数字员工语音对话式报税方法，包括以下步骤：

5、s1、接收用户输入的报税意图目标语音；

6、s2、对话语音引擎将报税意图目标语音转成文字，获得第一文本，再将第一文本进行预处理及特征提取，获得第一文本的特征向量；

7、s3、第一文本的特征向量输入到大语言模型，大语言模型给定第一文本的上下文中下一个单词的概率分布，最终获得第一文本的概率分布信息；

8、s4、将第一文本的概率分布信息输入到意图分类器，获得第一文本的意图预测结果；

9、s5、若第一文本的意图预测结果命中报税情形，则唤醒智能数字员工流程自动化，转到步骤s6；若未命中，则提醒不在服务范围；

10、s6、智能数字员工流程自动化接口调用对话语音引擎，引导用户语音输出需要的填报信息，通过转文字获得第二文本集合，报税智能数字员工流程自动化提醒用户核对信息，获得用户确认指令后，自动代替用户操作自然人电子税务局提交填报信息。

11、步骤s2中，所述预处理及特征提取通过预处理模型完成，预处理模型通过词嵌入将第一文本的单词转换为向量表示，捕捉单词之间的语义关系和上下文信息，实现将第一文本数据转换为具有较高语义信息的向量表示。

12、步骤s2中，所述第一文本的特征向量具体通过以下方式获得：

13、a)语料库初始化：收集报税对话数据、税务专有名称数据生成的文本数据集合，用于训练词嵌入模型；

14、b)预处理模型通过将第一文本进行分词处理操作，拆分为单次序列，根据公开停用词词库移除停用词停用信息，获得处理后数据；

15、c)预处理模型将处理后数据统计分词结果中的单词频率，并根据频率构建词汇表，再根据词汇表和语料库，输入词嵌入模型word2vec获得最终的词嵌入表示，即得到最终的词嵌入向量；

16、d)提取特征：用户输入数据至训练好的词嵌入模型，将每个单词转换为对应的向量表示；使用以下公式计算特征向量f(x) ：

17、f(x) = [w_1, w_2, ..., w_n]；

18、其中，w_i表示第i个单词的词嵌入向量。

19、步骤s6中，所述第二文本集合为流程自动化预设需要采集的信息组，包括申报月份、申报成本、总收入，对应值内容为用户输入内容。

20、步骤s6中，所述智能数字员工流程自动化的操作过程如下：

21、i.调用对话语音引擎获取流程所需填表参数信息；

22、ii.自动获取自然人电子税务局登录二维码，通过引导用户扫码登录系统；

23、iii.登录状态下，报税智能数字员工流程自动化按脚本预设路径，自动点击对应页面html元素，实现打开电子税务局报税流程菜单页面，进入报税填报参数页面；

24、iv.将前述获取的第二文本集合参数内容，按预设位置填入对应输入框，完成信息填入后，根据必填*号标识，校对页面必填项元素有无完成填写，满足全部填写信息，点击提交按钮元素，完成流程代替人工提交报税流程；

25、v.根据提交后的页面，采集提交成功标识，通过接口调用前端前述对话语音引擎，播报报税成功结果。

26、本发明的另一目的通过以下的技术方案实现：

27、基于大语言模型的智能数字员工语音对话式报税系统，包括对话语音引擎、预处理模型、大语言模型，以及智能数字员工流程自动化模块；其中，

28、对话语音引擎将报税意图目标语音转成文字，获得第一文本；

29、预处理模型再将第一文本进行预处理及特征提取，获得第一文本的特征向量；

30、第一文本的特征向量输入到大语言模型，大语言模型给定第一文本的上下文中下一个单词的概率分布，最终获得第一文本的概率分布信息；

31、若第一文本的意图预测结果命中报税情形，则唤醒智能数字员工流程自动化，智能数字员工流程自动化接口调用对话语音引擎，引导用户语音输出需要的填报信息，通过转文字获得第二文本集合，报税智能数字员工流程自动化提醒用户核对信息，获得用户确认指令后，自动代替用户操作自然人电子税务局提交填报信息。

32、所述大语言模型为通义千问14b。

33、同时，本发明提供：

34、一种服务器，所述服务器包括处理器和存储器，所述存储器中存储有至少一段程序，所述程序由所述处理器加载并执行以实现上述基于大语言模型的智能数字员工语音对话式报税方法。

35、一种计算机可读存储介质，所述存储介质中存储有至少一段程序，所述程序由处理器加载并执行以实现上述基于大语言模型的智能数字员工语音对话式报税方法。

36、本发明与现有技术相比，具有如下优点和有益效果：

37、本发明结合对话语音引擎、大语言模型以及智能数字员工，实现从原来记住路径或者对照操作指南，手工操作电子税务局系统的报税工作，变成语音式对话报税，减少需要税务局工作人员辅导的工作量。

技术特征：

1.基于大语言模型的智能数字员工语音对话式报税方法，其特征在于，包括以下步骤：

2.根据权利要求1所述基于大语言模型的智能数字员工语音对话式报税方法，其特征在于，步骤s2中，所述预处理及特征提取通过预处理模型完成，预处理模型通过词嵌入将第一文本的单词转换为向量表示，捕捉单词之间的语义关系和上下文信息，实现将第一文本数据转换为具有较高语义信息的向量表示。

3.根据权利要求1所述基于大语言模型的智能数字员工语音对话式报税方法，其特征在于，步骤s2中，所述第一文本的特征向量具体通过以下方式获得：

4.根据权利要求1所述基于大语言模型的智能数字员工语音对话式报税方法，其特征在于，步骤s6中，所述第二文本集合为流程自动化预设需要采集的信息组，包括申报月份、申报成本、总收入，对应值内容为用户输入内容。

5.根据权利要求1所述基于大语言模型的智能数字员工语音对话式报税方法，其特征在于，步骤s6中，所述智能数字员工流程自动化的操作过程如下：

6.基于大语言模型的智能数字员工语音对话式报税系统，其特征在于，包括对话语音引擎、预处理模型、大语言模型，以及智能数字员工流程自动化模块；其中，

7.根据权利要求6所述基于大语言模型的智能数字员工语音对话式报税系统，其特征在于，所述大语言模型为通义千问14b。

8.一种服务器，所述服务器包括处理器和存储器，其特征在于，所述存储器中存储有至少一段程序，所述程序由所述处理器加载并执行以实现权利要求1至5中任一权利要求所述基于大语言模型的智能数字员工语音对话式报税方法。

9.一种计算机可读存储介质，所述存储介质中存储有至少一段程序，其特征在于，所述程序由处理器加载并执行以实现权利要求1至5中任一权利要求所述基于大语言模型的智能数字员工语音对话式报税方法。

技术总结
本发明公开了基于大语言模型的智能数字员工语音对话式报税方法，包括以下步骤：将报税意图目标语音转成文字，获得第一文本及其特征向量并输入到大语言模型，输出第一文本的概率分布信息并输入到意图分类器，获得第一文本的意图预测结果，若其命中报税情形，则唤醒智能数字员工流程自动化，调用对话语音引擎，引导用户语音输出需要的填报信息，通过转文字获得第二文本集合，报税智能数字员工流程自动化提醒用户核对信息，用户确认指令后，自动代替用户操作。本发明结合对话语音引擎、大语言模型以及智能数字员工，将原来记住路径或者对照操作指南，手工操作电子税务局系统的报税工作，变成语音式对话报税，减少需要税务局工作人员辅导的工作量。

技术研发人员：廖万里,金卓,欧阳博文,陈国祥
受保护的技术使用者：珠海金智维信息科技有限公司
技术研发日：
技术公布日：2024/12/17

转载请注明原文地址:https://xbbs.6miu.com/read-22291.html