一种时间序列数据处理方法、设备、存储介质及程序产品与流程

专利2025-05-01  17


本发明涉及人工智能,特别是涉及一种时间序列数据处理方法、设备、计算机可读存储介质及计算机程序产品。


背景技术:

1、时间序列建模分析在许多实际应用中都至关重要,比如需求规划,异常检测,投资管理,电力负荷预测,天气预报等等。

2、目前基于时序数据而设计训练的模型主要基于固定的前一观测窗口长度来生成预测结果,由于较小的窗口长度可捕获局部模式,但缺乏对全局趋势的感知,而较大的窗口长度虽能捕获较多的上下文信息,但可能会忽略细节信息,从而导致该时间序列数据处理方案可能会引起复杂时序模式的信息丢失,影响时间序列数据处理结果的精度,且仅局限于根据前一观测窗口长度来生成预测结果,无法适用于预测任务类型之外的时序数据任务。

3、综上所述,如何有效地解决时间序列数据处理结果精度低,无法适用于预测任务类型之外的时序数据任务等问题,是目前本领域技术人员急需解决的问题。


技术实现思路

1、本发明的目的是提供一种时间序列数据处理方法,该方法提高了时间序列数据处理结果精度,适用于多种类型的时序数据任务;本发明的另一目的是提供一种时间序列数据处理装置、设备及计算机可读存储介质。

2、为解决上述技术问题,本发明提供如下技术方案:

3、一种时间序列数据处理方法,包括:

4、接收对时间序列数据的提问语句;

5、利用主智能体按照问题类型对所述提问语句进行分解,并将分解得到的各类别的子问题分配至对应类型的次级智能体;

6、分别利用各次级智能体从对应类型的提示词池中查找所述子问题对应的至少一个时序的历史知识;

7、分别利用各次级智能体根据查找到的历史知识生成接收到的子问题对应的时间序列数据答案;

8、其中,所述主智能体和各次级智能体为对预设语言模型进行窗口长度拓展得到的智能体。

9、在本发明的一种具体实施方式中,利用主智能体按照问题类型对所述提问语句进行分解,包括:

10、利用主智能体按照问题类型对所述提问语句采用思维链技术进行分解。

11、在本发明的一种具体实施方式中,分别利用各次级智能体从对应类型的提示词池中查找所述子问题对应的至少一个时序的历史知识,包括:

12、利用各次级智能体从对应类型的提示词池中查找所述子问题对应的至少一个时序的提示词键向量;

13、将所述提示词池中所述提示词键向量所映射的提示词值向量确定为所述历史知识。

14、在本发明的一种具体实施方式中,将所述提示词池中所述提示词键向量所映射的提示词值向量确定为所述历史知识,包括:

15、从所述提示词池中查找所述提示词键向量所映射的由趋势值、周期值和残差值拼接得到的提示词值向量;

16、将所述提示词值向量确定为所述历史知识。

17、在本发明的一种具体实施方式中,将所述提示词值向量确定为所述历史知识,包括:

18、利用所述次级智能体对所述子问题和各时序分别对应的提示词值向量进行拼接,得到拼接向量;

19、将所述拼接向量确定为所述历史知识。

20、在本发明的一种具体实施方式中,将所述提示词池中所述提示词键向量所映射的提示词值向量确定为所述历史知识,包括:

21、当查找到的提示词键向量的个数大于1个时,分别计算所述子问题与各提示词键向量之间匹配度;

22、对各提示词键向量进行匹配度高低排序,得到排序结果;

23、根据所述排序结果,从匹配度高的一端选取前预设数量个提示词键向量;

24、将所述提示词池中选取到的各提示词键向量分别所映射的提示词值向量确定为所述历史知识。

25、在本发明的一种具体实施方式中,利用所述次级智能体对所述子问题和各时序分别对应的提示词值向量进行拼接,包括:

26、利用所述次级智能体对所述子问题和选取到的各提示词键向量分别所映射的提示词值向量进行拼接。

27、在本发明的一种具体实施方式中,在分别利用各次级智能体根据查找到的历史知识生成接收到的子问题对应的时间序列数据答案之后,还包括:

28、利用各次级智能体将各时间序列数据答案返回给所述主智能体;

29、利用所述主智能体将各时间序列数据答案返回给发送所述提问语句的问题发送端。

30、在本发明的一种具体实施方式中,还包括各次级智能体的训练过程,各次级智能体的训练过程,包括:

31、通过窗口长度自拓展技术对初始预训练语言模型进行窗口长度拓展,得到窗口拓展后语言模型;

32、获取各类别的时序数据任务分别对应的时序数据集;

33、分别利用各时序数据集对所述窗口拓展后语言模型进行指令微调训练,得到各次级智能体。

34、在本发明的一种具体实施方式中,分别利用各时序数据集对所述窗口拓展后语言模型进行指令微调训练,包括:

35、分别利用各时序数据集通过参数高效微调对所述窗口拓展后语言模型进行训练。

36、在本发明的一种具体实施方式中,在得到各次级智能体之后,还包括:

37、对各类别的时序数据任务分别对应的时序数据集添加预设百分比的随机掩码,得到添加后时序数据集;

38、利用各添加后时序数据集对各次级智能体进行二分类预测训练。

39、在本发明的一种具体实施方式中,获取各类别的时序数据任务分别对应的时序数据集,包括:

40、获取时序数据预测任务、时序数据分类任务、时序数据检测任务和时序数据补全任务分别对应的时序数据集。

41、一种时间序列数据处理设备,包括:

42、存储器,用于存储计算机程序;

43、处理器,用于执行所述计算机程序时实现如前所述时间序列数据处理方法的步骤。

44、一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如前所述时间序列数据处理方法的步骤。

45、一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现如前所述时间序列数据处理方法的步骤。

46、本发明所提供的时间序列数据处理方法,接收对时间序列数据的提问语句;利用主智能体按照问题类型对所述提问语句进行分解,并将分解得到的各类别的子问题分配至对应类型的次级智能体;分别利用各次级智能体从对应类型的提示词池中查找所述子问题对应的至少一个时序的历史知识;分别利用各次级智能体根据查找到的历史知识生成接收到的子问题对应的时间序列数据答案;其中,主智能体和各次级智能体为对预设语言模型进行窗口长度拓展得到的智能体。

47、由上述技术方案可知,通过窗口长度拓展训练得到主智能体和多个次级智能体,通过主智能体对提问语句进行分解,并将分解得到的各类别的子问题分配至对应类型的次级智能体。预先分别为各次级智能体部署对应类型的提示词池,提示词池包含多个时序的历史知识。利用各次级智能体根据查找到的历史知识生成接收到的子问题对应的时间序列数据答案。通过窗口长度拓展解决了时序数据建模窗口长度选择的难题,通过设置包含多个时序对应的历史知识的提示词池,使得历史知识得到的有效利用,实现了时序数据知识的复用迁移。有效地提升了数据分析的视野,提高了时间序列数据处理结果精度。通过多个次级智能体分别处理不同类别的子问题,具备了处理复杂多变的时序数据的能力,从而适用于多种类型的时序数据任务。

48、相应的,本发明还提供了与上述时间序列数据处理方法相对应的时间序列数据处理装置、设备和计算机可读存储介质,具有上述技术效果,在此不再赘述。


技术特征:

1.一种时间序列数据处理方法,其特征在于,包括:

2.根据权利要求1所述的时间序列数据处理方法,其特征在于,利用主智能体按照问题类型对所述提问语句进行分解,包括:

3.根据权利要求1或2所述的时间序列数据处理方法,其特征在于,分别利用各次级智能体从对应类型的提示词池中查找所述子问题对应的至少一个时序的历史知识,包括:

4.根据权利要求3所述的时间序列数据处理方法,其特征在于,将所述提示词池中所述提示词键向量所映射的提示词值向量确定为所述历史知识,包括:

5.根据权利要求4所述的时间序列数据处理方法,其特征在于,将所述提示词值向量确定为所述历史知识,包括:

6.根据权利要求5所述的时间序列数据处理方法,其特征在于,将所述提示词池中所述提示词键向量所映射的提示词值向量确定为所述历史知识,包括:

7.根据权利要求6所述的时间序列数据处理方法,其特征在于,利用所述次级智能体对所述子问题和各时序分别对应的提示词值向量进行拼接,包括:

8.根据权利要求1所述的时间序列数据处理方法,其特征在于,在分别利用各次级智能体根据查找到的历史知识生成接收到的子问题对应的时间序列数据答案之后,还包括:

9.根据权利要求1所述的时间序列数据处理方法,其特征在于,还包括各次级智能体的训练过程,各次级智能体的训练过程,包括:

10.根据权利要求9所述的时间序列数据处理方法,其特征在于,分别利用各时序数据集对所述窗口拓展后语言模型进行指令微调训练,包括:

11.根据权利要求9所述的时间序列数据处理方法,其特征在于,在得到各次级智能体之后,还包括:

12.根据权利要求9所述的时间序列数据处理方法,其特征在于,获取各类别的时序数据任务分别对应的时序数据集,包括:

13.一种时间序列数据处理设备,其特征在于,包括:

14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至12任一项所述时间序列数据处理方法的步骤。

15.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至12任一项所述时间序列数据处理方法的步骤。


技术总结
本发明公开了一种时间序列数据处理方法、设备、存储介质及程序产品,涉及人工智能技术领域,包括:接收对时间序列数据的提问语句;利用主智能体按照问题类型对提问语句进行分解,并将分解得到的各类别的子问题分配至对应类型的次级智能体;分别利用各次级智能体从对应类型的提示词池中查找子问题对应的至少一个时序的历史知识;分别利用各次级智能体根据查找到的历史知识生成接收到的子问题对应的时间序列数据答案;其中,主智能体和各次级智能体为对预设语言模型进行窗口长度拓展得到的智能体。本发明提高了时间序列数据处理结果精度,适用于多种类型的时序数据任务。

技术研发人员:杨延东
受保护的技术使用者:苏州元脑智能科技有限公司
技术研发日:
技术公布日:2024/12/17
转载请注明原文地址:https://xbbs.6miu.com/read-24037.html