本发明涉及通信数据处理,具体涉及一种多维通信指标数据的预处理装置及方法。
背景技术:
1、随着当前移动通信网络越来越复杂,运营商为提升网络质量,提升用户使用感知和满意度,既需要对当前网络性能指标数据进行监控,分析和挖掘,又需要通过历史数据和当前数据的对比,分析和挖掘,以发现潜在的网络质量问题,使得查询分析的数据量越来越大。
2、引入开源数据库是企业降低成本一种有效的办法,开源数据库如关系型数据库(postgresql)、mpp分析型数据库(doris)都是可选用的组件。由于移动通信指标数量超多,且数据存储在不同的表或文件中,数据加载到原有数据库必须分表存储,运营商分析数据时多需要多表关联查询,单一的开源数据库组件已经不能有效的支撑数据处理、写入、存储、查询的需求;因此,亟需一种新的解决方案来满足多表关联查询、复杂指标预处理、数据预处理低时延与查询请求快速响应的应用需求。
技术实现思路
1、针对背景技术中所提及的技术缺陷,本发明实施例的目的在于提供一种多维通信指标数据的预处理装置及方法,以避免原来多张表存储时必须关联多表查询的弊端,从而满足查询请求快速响应的应用需求。
2、为实现上述目的,第一方面,本发明实施例提供了一种多维通信指标数据的预处理装置,所述预处理装置包括:
3、采集模块,用于从原始指标库或文件服务器中采集原始通信指标数据,并存入到预设的采集库中;
4、配置模块,用于构建配置表以形成配置库;其中,所述配置表中包括网元信息;
5、初始汇总模块,用于将所述采集库中所有的原始通信指标数据和所述配置表中的网元信息按预设的初始维度合并成一张大宽表并存储形成一指标数据库;所述指标数据库中的大宽表包括小区级全量指标表、基站级全量指标表和场景级全量指标表;
6、维度汇总模块,用于以所述初始维度为基表,按预设的汇总维度汇总,并存储到指标数据库;
7、指标预汇总模块,用于根据查询需求信息,以上述各维度数据为基础,进行复杂指标的预汇总处理;上述各维度数据包括:小区级全量指标表、基站级全量指标表和场景级全量指标表。
8、作为本申请的一种具体实现方式,所述配置表包括小区配置表、基站配置表、场景小区关系表和指标聚合公式配置表;其中,所述指标聚合公式配置表中的字段包括指标名称,指标的时间维度聚合方式和指标的网元维度聚合方式。
9、作为本申请的一种具体实现方式,所述初始维度包括预设的主键字段;其中,所述主键字段包括对应的id和时间维度;所述汇总维度包括时间/网元维度汇总。
10、作为本申请的一种具体实现方式,所述按预设的汇总维度汇总,具体包括小时/基站级全量指标表汇总、小时/场景级全量指标表汇总、天数据汇总、周数据汇总、月数据汇总和忙时数据汇总。
11、作为本申请的一种具体实现方式,所述忙时数据汇总具体包括:
12、先取忙时任务时间,查询任务时间当天24小时的小时/小区级全量指标表,按小区id分组,按对应忙时数据的值排序,取第一条数据,并将该数据插入忙时/小区全量指标表;
13、再取忙时任务时间,查询任务时间当天24小时的小时/基站级全量指标表,按基站id分组,按对应忙时数据的值进行排序,取第一条数据,并将该数据插入忙时/基站全量指标表。
14、第二方面,本发明实施例还提供了一种多维通信指标数据的预处理方法,应用于第一方面所述的一种多维通信指标数据的预处理装置,所述方法包括以下步骤:
15、从原始指标库或文件服务器中采集原始通信指标数据,并存入到预设的采集库中;
16、构建配置表以形成配置库;其中,所述配置表中包括网元信息;
17、将所述采集库中所有的原始通信指标数据和所述配置表中的网元信息按预设的初始维度合并成一张大宽表并存储形成一指标数据库;所述指标数据库中的大宽表包括小区级全量指标表、基站级全量指标表和场景级全量指标表;
18、以所述初始维度为基表,按预设的汇总维度汇总,并存储到指标数据库;
19、根据查询需求信息,以上述各维度数据为基础,进行复杂指标的预汇总处理;上述各维度数据包括:小区级全量指标表、基站级全量指标表和场景级全量指标表。
20、本发明实施例提供的技术方案,通过将所有通信指标数据按初始维度合并成一张大宽表进行存储,并基于此表再进行其它维度的汇总,避免了原来多张表存储时必须关联多表查询的弊端,减少io读取量,从而提高了查询的效率;避免了原来多张表存储时重复存储网元属性字段,减少了存储的数据量;
21、同时,以初始维度为基表,进行网元/时间维度的汇总,并以此为基础进行复杂指标的预处理,从而降低数据预处理时延,提高查询响应的需求。
1.一种多维通信指标数据的预处理装置,其特征在于,所述预处理装置包括:
2.如权利要求1所述的一种多维通信指标数据的预处理装置,其特征在于,所述配置表包括小区配置表、基站配置表、场景小区关系表和指标聚合公式配置表;其中,所述指标聚合公式配置表中的字段包括指标名称,指标的时间维度聚合方式和指标的网元维度聚合方式。
3.如权利要求2所述的一种多维通信指标数据的预处理装置,其特征在于,所述初始维度包括预设的主键字段;其中,所述主键字段包括对应的id和时间维度;所述汇总维度包括时间/网元维度汇总。
4.如权利要求3所述的一种多维通信指标数据的预处理装置,其特征在于,所述按预设的汇总维度汇总,具体包括小时/基站级全量指标表汇总、小时/场景级全量指标表汇总、天数据汇总、周数据汇总、月数据汇总和忙时数据汇总。
5.如权利要求4所述的一种多维通信指标数据的预处理装置,其特征在于,所述忙时数据汇总具体包括:
6.一种多维通信指标数据的预处理方法,其特征在于,应用于权利要求1所述的一种多维通信指标数据的预处理装置,所述方法包括以下步骤:
7.如权利要求6所述的一种多维通信指标数据的预处理方法,其特征在于,所述配置表包括小区配置表、基站配置表、场景小区关系表和指标聚合公式配置表;其中,所述指标聚合公式配置表中的字段包括指标名称,指标的时间维度聚合方式和指标的网元维度聚合方式。
8.如权利要求7所述的一种多维通信指标数据的预处理方法,其特征在于,所述初始维度包括预设的主键字段;其中,所述主键字段包括对应的id和时间维度;所述汇总维度包括时间/网元维度汇总;
9.如权利要求8所述的一种多维通信指标数据的预处理方法,其特征在于,所述忙时数据汇总具体包括:
