用于大数据量场景的数据可视化的方法和系统与流程

专利2026-02-22  4


本发明涉及数据可视化,特别涉及一种用于大数据量场景的数据可视化的方法和系统。


背景技术:

1、在当前信息时代,数据量呈指数级增长,特别是在物联网、智能城市、金融科技等领域,大数据的处理和分析已经成为一个重大挑战。现有的大数据可视化技术主要集中在静态数据的展示上,缺乏对持续性、动态性大数据的有效处理和展示方法。面对大量数据,传统的可视化方法往往无法满足实时性和准确性的要求,导致信息过载或重要信息被淹没。此外,现有技术在数据特征分析和智能选择最优可视化方法方面存在不足,无法根据数据的不同特征自适应地选择最优的可视化方案来展现数据。


技术实现思路

1、针对上述缺陷,本发明解决的技术问题在于,提供一种方法,通过对大数据进行精简和特征分析,系统能够智能选取最为适配的可视化方法,实现大数据量数据的高效、准确和直观的可视化展现,从而帮助用户更好地理解和分析数据,提升决策效率和效果。解决现有大数据可视化技术中存在的实时性差、准确性低和无法智能选择最优可视化方法等问题。

2、本发明第一方面提供了用于大数据量场景的数据可视化方法,包括:s101:对所述大数据量场景的原始数据进行数据预处理成第一数据。s102:对所述第一数据进行压缩和采样成第二数据。s103:特征提取所述第二数据的主要特征模式,作为第三数据。s104:选择可视化模型,进行可视化模型训练后,将表示主要特征模式的所述第三数据作为输入,输出为表示可视化模式的第四数据。s105:将所述第四数据进行可视化展示;

3、其中,步骤s103的主要特征模式,包括以下特征模式的至少一种:时间序列特征、统计特征和频域特征;

4、步骤s104具体包括以下步骤:

5、特征输入,输入所述主要特征模式;

6、机器学习模型训练: 使用历史数据组成的训练数据集对机器学习模型进行训练;训练数据集应包含各种数据特征模式及其对应的最佳可视化方法标签;对训练数据集进行特征工程强化,包括使用分类器输入所述特征模式向量,确定类别特征;针对表示类别特征的one-hot编码向量利用嵌入矩阵将其嵌入到连续的向量空间,获得嵌入后的连续特征向量;通过每个训练数据集对应的特征模式的连续特征向量及其对应的最佳可视化方法标签,对机器学习模型进行训练;所述机器学习模型包括:一个数据集特征编码器、一个可视化特征编码器;数据集特征编码器输入每个训练数据集的特征模式的连续特征向量,输出数据集特征编码;可视化特征编码器输入对应每个训练数据集的可视化标签文本,输出可视化标签特征编码;初始化数据集特征编码器和可视化特征编码器,将各个训练数据集的连续特征向量和与该训练数据集对应的可视化标签作为正样本,将训练数据集的连续特征向量和非对应该训练数据集的可视化标签作为负样本,构造包括数据集特征编码和可视化标签特征编码二者的损失函数;通过训练优化损失函数,形成训练后的数据集特征编码器、可视化特征编码器;

7、在训练完成后的实际应用中,针对主要特征模式进行特征工程强化,形成连续特征向量,进而作为数据集特征编码器特征输入,进而获得数据集特征编码向量,将备选的最佳可视化方法标签输入训练好的可视化特征编码器,获得可视化特征编码,根据数据集特征编码向量和可视化特征编码的相似度,通过训练好的机器学习模型预测最适合的可视化方法,作为预测的可视化模式,进而输出预测的可视化模式。

8、根据本发明的一个实施例,所述s101种对所述大数据量场景的原始数据进行数据预处理成第一数据,包括:对所述原始数据进行清洗、去重和格式转换,成第一数据。

9、根据本发明的一个实施例,所述s102中对所述第一数据进行压缩和采样成第二数据,包括:通过无损压缩算法和有损压缩算法压缩所述第一数据成第二数据。

10、根据本发明的一个实施例,述s103中特征提取所述第二数据为第三数据,包括:所述特征提取包括时间序列的特征提取、统计的特征提取和频域特征提取。

11、根据本发明的一个实施例,所述s105中将所述第四数据进行可视化展示,将所述第四数据进行折线图、柱状图和散点图展示。

12、根据本发明的一个实施例,所述s105还包括:所述第四数据满足不同条件筛选的可视化展示。所述第四数据满足不同查看数据细节或整体趋势的可视化展示。

13、所述第四数据满足在原有折线图、柱状图和散点图的图表上添加数据标准的可视化展示。

14、本发明第二方面提供了一种用于大数据量场景的数据可视化系统,所述系统包括:

15、数据预处理模块,用于对所述大数据量场景的原始数据进行数据预处理成第一数据。

16、压缩采样模块,用于对所述数据预处理模块的数据进行压缩和采样,成第二数据。

17、分析模块,用于特征提取所述压缩采样模块的第二数据为第三数据。

18、选择模块,用于选择模型,将所述分析模块的第三数据作为输入,进行模型训练,输出为第四数据。展示模块,用于将选择模块的第四数据进行可视化展示。

19、本发明第三方面提供了一种智能设备,包括发送器、接收器、存储器和处理器;所述存储器用于存储计算机指令;所述处理器用于运行所述存储器存储的所述计算机指令实现以上用于大数据量场景的数据可视化的方法。

20、本发明第四方面提供了一种存储介质,包括:可读存储介质和计算机指令,所述计算机指令存储在所述可读存储介质中;所述计算机指令用于实现以上用于大数据量场景的数据可视化的方法。

21、本发明提供的有益效果:通过对大数据进行精简和特征分析,能够智能选取最为适配的可视化方法,实现大数据量数据的高效、准确和直观的可视化展现,同时数据的可交互展示,多元化满足用户的使用需求,为用户更好的分析数据奠定基础。从而帮助用户更好地理解和分析数据,提升决策效率和效果。



技术特征:

1.用于大数据量场景的数据可视化的方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述s101中对所述大数据量场景的原始数据进行数据预处理成第一数据,包括:对所述原始数据进行清洗、去重和格式转换,成第一数据。

3.根据权利要求2所述的方法,其特征在于,所述s102中对所述第一数据进行压缩和采样成第二数据,包括:

4.根据权利要求3所述的方法,其特征在于,所述s103中特征提取所述第二数据为第三数据,包括:

5.根据权利要求4所述的方法,其特征在于,所述s105中将所述第四数据进行可视化展示,将所述第四数据进行折线图、柱状图和散点图展示。

6.根据权利要求5所述的方法,其特征在于,所述s105还包括:

7.用于大数据量场景的数据可视化的系统,其特征在于,所述系统包括:

8.一种智能设备,其特征在于,包括:发送器、接收器、存储器和处理器;

9.一种存储介质,其特征在于,包括:可读存储介质和计算机指令,所述计算机指令存储在所述可读存储介质中;所述计算机指令用于实现权利要求1至6任一项所述用于大数据量场景的数据可视化方法。


技术总结
本发明公开了一种用于大数据量场景的数据可视化的方法和系统,包括:对所述大数据量场景的原始数据进行数据预处理成第一数据;对所述第一数据进行压缩和采样成第二数据;特征提取所述第二数据的主要特征模式,作为第三数据;选择可视化模型,进行可视化模型训练后,将表示主要特征模式的所述第三数据作为输入,输出为表示可视化模式的第四数据;将所述第四数据进行可视化展示。本发明实现大数据量数据的高效、准确和直观的可视化展现,从而帮助用户更好地理解和分析数据,提升决策效率和效果。

技术研发人员:李立,赵伟,李斌,于慧超,石永杰
受保护的技术使用者:北京网藤科技有限公司
技术研发日:
技术公布日:2024/12/17
转载请注明原文地址:https://xbbs.6miu.com/read-30001.html