一种洪涝易发性预测模型的处理方法、装置以及处理设备

专利2026-01-01  9


本申请涉及洪涝易发性预测领域,具体涉及一种洪涝易发性预测模型的处理方法、装置以及处理设备。


背景技术:

1、洪涝是世界范围内最常见、最具破坏性的自然灾害之一,因此,准确识别和预测易受暴雨洪涝影响的区域,对于暴雨洪涝防范和减缓灾害损失具有十分重要的意义。

2、洪涝易发性(flood susceptibility)是指特定地区在当地地形地貌、水文和气象条件下发生洪涝灾害的可能性,洪涝易发性预测是一种预测洪涝易发地区的手段,能够为洪涝响应工作提供数据支持,从而能够提前应对洪涝或减少洪涝带来的损害。

3、而本申请发明人发现,通过当前广泛应用的监督学习方法来预测洪涝易发性时,由于洪涝数据集的数据量稀缺和数据记录片面,会导致训练好的模型性能存在不确定性的问题。

4、而半监督学习(semi-supervised learning)是一种介于监督学习和无监督学习之间的机器学习方法,主要应用于标签数据稀缺或样本标记困难的情况。在半监督学习中,模型可以利用少量有标签的数据和大量无标签的数据进行学习,相较于监督学习,半监督学习方法能够充分利用未标记数据的信息,从而获得更好的泛化性能和更高的预测准确性。

5、在半监督学习方法中,对无标记数据的利用方式可分为两种范式:伪标签(proxylabel)和一致性正则化(consistency regularization)。

6、对于伪标签方法,首先,伪标签方法依赖于已有模型的预测结果,如果初始模型的性能较差,那么得到的伪标签也可能不准确,从而影响模型的训练和性能;其次,伪标签方法在处理噪声和错误标签方面表现较差,因为它无法区分真实标签和伪标签。

7、对于一致性正则化方法,其为一种常见的半监督学习正则化技术,旨在通过对不同输入或不同模型预测之间的一致性进行约束,提高模型的泛化能力。一致性正则化通常通过对未标记样本进行轻微扰动,生成新样本,并要求这些新样本在模型输出中与原始样本保持一致,该扰动技术通常采用数据增强方法,通过对单个样本的数据增强,与原始样本的一致性约束来提升模型的性能。

8、在图像、自然语言、频率信号等领域,以一致性正则化为基础的半监督学习方法已经取得显著成果,然而在洪涝易发性预测领域,洪涝清单数据集通常是以一维多特征结构化形式存在的,目前针对这类数据集的数据增强技术主要针对多个样本,而缺乏针对单个样本的数据增强方法,由于这种局限性,一致性正则化的半监督学习方法难以在洪涝易发性预测领域得到有效应用。


技术实现思路

1、本申请提供了一种洪涝易发性预测模型的处理方法、装置以及处理设备,提供了一种新颖的模型训练架构,通过基于一维多特征结构化数据的单样本数据增强方法,并耦合应用一致性正则化半监督学习方法,减少了数据问题带来的预测结果不稳定性,可以效果较佳地进完成模型训练,提供模型的洪涝易发性预测精度,具有良好的实际应用价值。

2、第一方面,本申请提供了一种洪涝易发性预测模型的处理方法,方法包括:

3、获取洪涝清单数据集,其中,洪涝清单数据集包括携带标签的第一洪涝清单数据集和未携带标签的第二洪涝清单数据集,标签标识对应的洪涝清单数据部分是否存在洪涝发生情况,洪涝清单数据集以预设的洪涝影响因子的定量值作为特征;

4、基于k-means聚类方法和smote方法,对洪涝清单数据中的第二洪涝清单数据集,进行单样本数据增强,得到增强数据集;

5、在洪涝清单数据集和增强数据集这两种数据集的基础上,结合一致性正则化半监督学习方法,训练多层感知器模型,得到洪涝易发性预测模型,其中,洪涝易发性预测模型用于基于模型所输入洪涝影响因子特征值来预测对应的洪涝易发性。

6、第二方面,本申请提供了一种洪涝易发性预测模型的处理装置,装置包括:

7、获取单元,用于获取洪涝清单数据集,其中,洪涝清单数据集包括携带标签的第一洪涝清单数据集和未携带标签的第二洪涝清单数据集,标签标识对应的洪涝清单数据部分是否存在洪涝发生情况,洪涝清单数据集以预设的洪涝影响因子的定量值作为特征;

8、增强单元,用于基于k-means聚类方法和smote方法,对洪涝清单数据中的第二洪涝清单数据集,进行单样本数据增强,得到增强数据集;

9、训练单元,用于在洪涝清单数据集和增强数据集这两种数据集的基础上,结合一致性正则化半监督学习方法,训练多层感知器模型,得到洪涝易发性预测模型,其中,洪涝易发性预测模型用于基于模型所输入洪涝影响因子特征值来预测对应的洪涝易发性。

10、第三方面,本申请提供了一种处理设备,包括处理器和存储器,存储器中存储有计算机程序,处理器调用存储器中的计算机程序时执行本申请第一方面或者本申请第一方面任一种可能的实现方式提供的方法。

11、第四方面,本申请提供了一种计算机可读存储介质,计算机可读存储介质存储有多条指令,指令适于处理器进行加载,以执行本申请第一方面或者本申请第一方面任一种可能的实现方式提供的方法。

12、从以上内容可得出,本申请具有以下的有益效果:

13、针对基于一致性正则化半监督学习的洪涝易发性预测目标,本申请提供了一种新颖的模型训练架构,通过基于一维多特征结构化数据的单样本数据增强方法,并耦合应用一致性正则化半监督学习方法,减少了数据问题带来的预测结果不稳定性,可以效果较佳地进完成模型训练,提供模型的洪涝易发性预测精度,具有良好的实际应用价值。



技术特征:

1.一种洪涝易发性预测模型的处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述基于k-means聚类方法和smote方法,对所述洪涝清单数据中的所述第二洪涝清单数据集,进行数据增强,得到增强数据集,包括:

3.根据权利要求1所述的方法,其特征在于,对于所述一致性正则化半监督学习方法,有以下配置内容:

4.根据权利要求1所述的方法,其特征在于,所述多层感知器模型为配置有一个1个输入层、2个隐藏层和1个输出层的全连接层人工神经网络,每层的节点数量是13、128、128和2,网络中间层的激活函数为relu激活函数,所述隐藏层与所述输出层之间的激活函数为sigmoid激活函数。

5.根据权利要求1所述的方法,其特征在于,在模型训练过程中,所述方法还包括:

6.根据权利要求5所述的方法,其特征在于,在所述超参数调参处理之后,所述聚类类别k值采用240,λ采用0.5。

7.根据权利要求1所述的方法,其特征在于,所述方法还包括:

8.一种洪涝易发性预测模型的处理装置,其特征在于,所述装置包括:

9.一种处理设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,所述处理器调用所述存储器中的计算机程序时执行如权利要求1至7任一项所述的方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至7任一项所述的方法。


技术总结
本申请提供了一种洪涝易发性预测模型的处理方法、装置以及处理设备,提供了一种新颖的模型训练架构,通过基于一维多特征结构化数据的单样本数据增强方法,并耦合应用一致性正则化半监督学习方法,减少了数据问题带来的预测结果不稳定性,可以效果较佳地进完成模型训练,提供模型的洪涝易发性预测精度,具有良好的实际应用价值。

技术研发人员:王伦澈,罗增良,于涵,覃文敏,潘翠红
受保护的技术使用者:中国地质大学(武汉)
技术研发日:
技术公布日:2024/12/17
转载请注明原文地址:https://xbbs.6miu.com/read-28805.html