本发明涉及小样本邻域的生态环境遥感监测,尤其涉及一种确定森林扰动类型的方法和装置、电子设备。
背景技术:
1、扰动是森林生态系统动态变化过程的重要部分,在时空上具有异质性,且在时间上是相对离散的事件,它能够改变森林的组成结构,弱化生态服务能力,降低森林资源的可用性。扰动不仅影响森林生态系统本身的演化,还进一步对森林碳储碳汇产生强烈影响。尤其是亚热带常绿林,它是重要的全球碳汇。然而,由于频繁的自然灾害(如火灾)和人类活动(如开垦、砍伐等),亚热带森林已成为森林扰动的研究热点。为了更好地量化森林损失以及区域和全球碳动态,维护森林生态系统的可持续性,了解亚热带常绿林不同扰动类型的特征及其影响是必不可少的。
2、目前,对于森林扰动类型的识别方法主要归纳为两类,即直接法和两阶段法。直接利用从遥感时序数据中获取的时谱度量指标以及扰动类型先验知识,在像元尺度借助机器学习算法(如随机森林、决策树等)同步进行扰动检测与归因的方法即为直接法。两阶段法分为两步,首先在像元尺度基于变化检测算法确定扰动事件,再将扰动像元合并为扰动斑块后,提取扰动事件的空谱特征,最后再借助机器学习算法(如随机森林、深度学习算法等)进行扰动事件归因。上述两种方法其本质均是利用机器学习进行分类。但这需要大量的样本数据(先验知识)对模型进行训练。很多研究在获取样本数据时通过各种历史记录资料、高分影像、实地调查等各种途径人工判读大量的样本数据。为了提高分类模型的泛化性能,每一类扰动类型至少需要200个标注样本。其标注成本非常大,需要耗费大量的时间。
技术实现思路
1、本发明实施例的目的是提供一种确定森林扰动类型的方法和装置、电子设备,能够解决现有技术中存在的上述问题。
2、为解决上述技术问题,本发明提供如下技术方案:
3、在本发明实施的一个方面,提供了一种确定森林扰动类型的方法,包括:
4、从土地覆盖数据集中获取森林扰动数据;其中,所述扰动数据包括:扰动时间和扰动发生位置;
5、对所述森林扰动数据进行特征分析,得到各分类下的森林扰动数据;
6、以所述各分类下的森林扰动数据为基础数据,采用随机森林分类器和支持向量机分类器互导的方式多次迭代进行样本数据量扩增以及分类器训练,得到满足预设条件的随机森林分类器和支持向量机分类器;
7、基于所述满足预设条件的随机森林分类器和支持向量机分类器对待预测的森林扰动数据进行预测,得到森林扰动类型。
8、可选地,从土地覆盖数据集中获取森林扰动数据的步骤,包括:
9、对初始的土地覆盖数据集进行森林掩膜得到森林相关数据;
10、利用连续变化检测与分类算法ccdc对所述森林相关数据进行检测,得到检测结果,其中,所述检测结果中包括:森林变化为其他地类的扰动以及其他地类变化为森林的扰动;
11、基于土地覆盖数据集对所述森林变化为其他地类的扰动进行扰动像元过滤,得到森林扰动数据。
12、可选地,对所述森林扰动数据进行特征分析,得到各分类下的森林扰动数据的步骤,包括:
13、基于亚热带常绿林扰动分类的时间特征、空间特征、光谱特征以及地形特征对所述森林扰动数据进行分析,得到每次森林扰动对应的分类;
14、将相同分类的森林扰动数据划分至同一分类中,得到各分类下的森林扰动数据。
15、可选地,以所述各分类下的森林扰动数据为基础数据,采用随机森林分类器和支持向量机分类器互导的方式多次迭代进行样本数据量扩增以及分类器训练,得到满足预设条件的随机森林分类器和支持向量机分类器的步骤,包括:
16、针对每个分类的森林扰动数据,取预设数量的森林扰动数据作为样本数据;
17、将每个分类的样本数据按照预设比例划分为训练样本和测试样本;
18、采用训练样本分别对随机森林分类器和支持向量机分类器进行训练;
19、分别依据训练后的随机森林分类器和支持向量机分类器对各分类对应的测试样本进行预测,确定所述随机森林分类器和支持向量机分类器的测试精准度;
20、在所述测试精准度未满足预设条件的情况下,分别依据训练后的所述随机森林分类器和支持向量机分类器对未标注森林扰动数据进行分类,得到第一分类结果与第二分类结果;
21、依据所述第一分类结果和所述第二分类结果,确定所述随机森林分类器和支持向量机分类器的训练样本增量样本;
22、采用所述随机森林分类器对应的增量后训练样本对所述随机森林分类器进行训练,以及采用所述支持向量机分类器对应的增量后的训练样本对所述支持向量机分类器进行训练,以此完成一次随机森林分类器和支持向量机分类器互导训练。
23、可选地,所述依据所述第一分类结果和所述第二分类结果,确定所述随机森林分类器和支持向量机分类器的训练样本增量样本的步骤,包括:
24、比对所述第一分类结果和所述第二分类结果,将存在差异的分类结果确定为伪标签数据;
25、从所述第一分类结果包含的伪标签数据中筛选出第一高置信度伪标签数据,并将所述第一高置信度伪标签数据作为所述支持向量机分类器的训练样本增量样本;
26、从所述第二分类结果包含的伪标签数据中筛选出第二高置信度伪标签数据,并将所述第二高置信度伪标签数据作为所述随机森林分类器的训练样本增量样本。
27、可选地,从所述第一分类结果包含的伪标签数据中筛选出第一高置信度伪标签数据的步骤,包括:
28、从所述第一分类结果中包含的伪标签数据中,筛选分类概率值大于第一预设概率阈值的第一伪标签数据;
29、利用置信学习算法过滤掉所述第一伪标签数据中的错误伪标签数据,得到第一高置信度伪标签数据。
30、可选地,将所述第一高置信度伪标签数据作为所述支持向量机分类器的训练样本增量样本的步骤包括:
31、针对所述第一分类结果中包含的各分类,确定各分类对应的第一高置信度伪标签数据;
32、对各分类对应的第一高置信度伪标签数据进行类间数据平衡处理;
33、将类间平衡处理后的第一高置信度伪标签数据作为所述支持向量机分类器的训练样本增量样本。
34、在本发明实施的另一方面,提供了一种确定森林扰动类型的装置,其中,
35、获取模块,用于从土地覆盖数据集中获取森林扰动数据;其中,所述扰动数据包括:扰动时间和扰动发生位置;
36、分类模块,用于对所述森林扰动数据进行特征分析,得到各分类下的森林扰动数据;
37、互导训练模块,用于以所述各分类下的森林扰动数据为基础数据,采用随机森林分类器和支持向量机分类器互导的方式多次迭代进行样本数据量扩增以及分类器训练,得到满足预设条件的随机森林分类器和支持向量机分类器;
38、预测模块,用于基于所述满足预设条件的随机森林分类器和支持向量机分类器对待预测的森林扰动数据进行预测,得到森林扰动类型。
39、可选地,所述获取模块包括:
40、第一子模块,用于对初始的土地覆盖数据集进行森林掩膜得到森林相关数据;
41、第二子模块,用于利用连续变化检测与分类算法ccdc对所述森林相关数据进行检测,得到检测结果,其中,所述检测结果中包括:森林变化为其他地类的扰动以及其他地类变化为森林的扰动;
42、第三子模块,用于基于土地覆盖数据集对所述森林变化为其他地类的扰动进行扰动像元过滤,得到森林扰动数据。
43、在本发明实施的又一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序时,实现上述任一所述的确定森林扰动类型的方法。
44、本发明实施例提供了一种确定森林扰动类型的方案,从土地覆盖数据集中获取森林扰动数据;对森林扰动数据进行特征分析,得到各分类下的森林扰动数据;以各分类下的森林扰动数据为基础数据,采用随机森林分类器和支持向量机分类器互导的方式多次迭代进行样本数据量扩增以及分类器训练,得到满足预设条件的随机森林分类器和支持向量机分类器;基于满足预设条件的随机森林分类器和支持向量机分类器对待预测的森林扰动数据进行预测,得到森林扰动类型。通过本发明实施例提供的确定森林扰动类型的方案,结合小样本学习以及随机森林和支持向量机两个基分类器的互导学习方法对模型进行训练,用户仅需手动标记小数量的样本即可,后续通过迭代互导扩增样本数据量,可节省样本标记所耗时长和人工成本。
1.一种确定森林扰动类型的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,从土地覆盖数据集中获取森林扰动数据的步骤,包括:
3.根据权利要求1所述的方法,其特征在于,对所述森林扰动数据进行特征分析,得到各分类下的森林扰动数据的步骤,包括:
4.根据权利要求1所述的方法,其特征在于,以所述各分类下的森林扰动数据为基础数据,采用随机森林分类器和支持向量机分类器互导的方式多次迭代进行样本数据量扩增以及分类器训练,得到满足预设条件的随机森林分类器和支持向量机分类器的步骤,包括:
5.根据权利要求4所述的方法,其特征在于,所述依据所述第一分类结果和所述第二分类结果,确定所述随机森林分类器和支持向量机分类器的训练样本增量样本的步骤,包括:
6.根据权利要求5所述的方法,其特征在于,从所述第一分类结果包含的伪标签数据中筛选出第一高置信度伪标签数据的步骤,包括:
7.根据权利要求5所述的方法,其特征在于,将所述第一高置信度伪标签数据作为所述支持向量机分类器的训练样本增量样本的步骤包括:
8.一种确定森林扰动类型的装置,其特征在于,所述装置包括:
9.根据权利要求8所述的装置,其特征在于,所述获取模块包括:
10.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
