一种基于WOA-K-means的风电出力分析方法与流程

专利2026-06-27 3

本发明涉及风力发电，尤其涉及一种基于woa-k-means的风电出力分析方法。

背景技术：

1、风力发电作为一种重要的可再生能源，其出力数据具有极大的波动性和不确定性。这种复杂性增加了对风电出力数据分析的难度，同时也对传统的聚类算法提出了挑战。k-means聚类算法作为一种常用的无监督学习方法，广泛应用于数据挖掘和分析领域。它通过将数据集划分为不同的簇，使得簇内数据的相似性最大化，但其对初始聚类中心的敏感性以及采用欧式距离度量样本相似性带来的局限性，使得其在处理风电日出力曲线时效果不理想。

2、风电日出力曲线作为时间序列数据，受天气、季节等多种因素影响，表现出显著的波动性和不确定性。传统k-means算法在聚类过程中，因初始聚类中心的随机性，可能会导致最终结果的差异，甚至陷入局部最优解。此外，欧式距离度量方法只能反映曲线的数值相似性，难以准确反映风电出力曲线的内在特征。因此，亟需一种改进的算法来提高风电出力数据聚类分析的准确性和效率。

技术实现思路

1、针对现有技术中所存在的不足，本发明提供了一种基于woa-k-means的风电出力分析方法，其解决了现有技术中存在的因初始聚类中心的随机性，可能会导致最终结果的差异，甚至陷入局部最优解的问题，以及欧式距离度量方法只能反映曲线的数值相似性，难以准确反映风电出力曲线的内在特征的问题。

2、本发明提出了一种基于woa-k-means的风电出力分析方法，包括如下步骤：

3、s1、计算各个风电日出力曲线数据的特征值，以此进行数据降维处理；

4、s2、将日出力数据降维之后构造待聚类样本的特征数据集作为聚类基础数据，通过鲸鱼优化算法woa寻优迭代得当前c个聚类数目的c个聚类中心；

5、s3、分别计算各个样本与当前聚类中心的发电量差异以及形维波动量差异，再确定样本与聚类中心之间综合差异度，以此作为k-means算法中的距离划分依据；

6、s4、将c个聚类中心作为k-means算法的初始聚类中心，将样本划分到距离最小的聚类中；在完成所有数据点的分配后，重新计算每个簇的中心；更新迭代聚类中心；重复执行分配步骤和更新步骤，直到聚类中心不再发生显著变化或达到预设的迭代次数；

7、s5、计算聚类效果评价指标，以此评价当前聚类结果，衡量聚类有效程度；

8、s6、重复步骤s1-s5，循环(cmax-cmin+1)次，输出使聚类效果评价指标最大对应的聚类数目以及相应的聚类结果。

9、本发明的技术原理为：传统利用k-means可从海量复杂的风电出力数据中提取典型出力场景，存在对初始聚类中心敏感，日出力曲线内在特征性难以通过欧式距离反映的问题。而本发明提出以波动性和出力效率作为特性指标对日出力曲线进行降维处理，再通过鲸鱼优化算法(whale optimization algorithm，woa)的全局搜索能力优化初始聚类中心，并且提出以形维波动差异和发电量差异得到适用处理曲线的综合差异距离用于k-means度量不同样本相似度情况，最后通过改进的轮廓系数对聚类结果进行评价。

10、相比于现有技术，本发明具有如下有益效果：

11、1、降低聚类敏感性：利用鲸鱼优化算法的全局搜索能力优化初始聚类中心，从而减少k-means算法对初始聚类中心的敏感性，避免陷入局部最优解，提升聚类结果的稳定性和准确性。

12、2、改进相似度度量：引入风电出力曲线的波动性和发电量差异作为综合差异度量指标，替代传统的欧式距离。这样能够更准确地反映风电出力曲线的形态特征，提升聚类结果的实际意义和应用价值。

13、3、提升聚类质量：通过改进的轮廓系数方法确定最优聚类数目，并评价聚类结果的有效性。轮廓系数均值的最大化确保了聚类数目的合理性和聚类结果的质量。

14、4、数据降维：在聚类分析前，基于风电日出力曲线的特征值进行数据降维处理，减少了数据的维度，提高了聚类算法的效率和计算速度。

15、5、全面流程优化：综合上述改进方法，形成一个系统化的聚类分析流程，从特征值提取、数据降维、初始聚类中心优化到最终的聚类结果评价，实现对风电日出力数据的科学、高效聚类分析。

技术特征：

1.一种基于woa-k-means的风电出力分析方法，其特征在于，包括如下步骤：

2.如权利要求1所述的分析方法，其特征在于，所述步骤s1中的特征评价指标包括：变异系数cv、极端波动率kpfr、平均波动系数kfluc、峰谷差率kdiff、出力峰度ks、总发电量e。

3.如权利要求2所述的分析方法，其特征在于，所述特征评价指标中：

4.如权利要求3所述的分析方法，其特征在于：将风电出力曲线降维，通过所述的6个特征评价指标构成特征属性数组：

5.如权利要求4所述的分析方法，其特征在于，所述步骤s2中，通过woa算法确定初始聚类中心以及划分集群个数c，具体步骤如下：

6.如权利要求1所述的分析方法，其特征在于，所述步骤s3中，样本与当前聚类中心的发电量差异采用如下公式计算：

7.如权利要求6所述的分析方法，其特征在于，将发电量差异和形维波动量差异进行组合，得到综合差异距离为cd(x，y)，如下式：

8.如权利要求1所述的分析方法，其特征在于，所述步骤s5中，采用结合出力曲线综合差异距离的轮廓系数法确定最优聚类数目，并且评价聚类质量，具体如下式：

技术总结
本发明提供了一种基于WOA‑K‑means的风电出力分析方法。以K‑means算法为基础，以波动性和出力效率作为特性指标对日出力曲线进行降维处理，再通过WOA算法的全局搜索能力优化初始聚类中心，以形维波动差异和发电量差异得到适用处理曲线的综合差异距离用于K‑means算法度量不同样本相似度情况，最后通过改进的轮廓系数对聚类结果进行评价。从而解决了传统K‑means算法对初始聚类中心敏感，日出力曲线内在特征性难以通过欧式距离反映的问题。具有聚类结果准确性高、稳定性强，提高了聚类算法的效率和计算速度的优点，形成一个系统化的聚类分析流程，实现了对风电日出力数据的科学、高效聚类分析。

技术研发人员：黄远见,涂圣勤,覃晖,董峰,许红断,黄迪,张子平,介永胜,马安国,肖可以,吴云,田伟,陆熬
受保护的技术使用者：湖北清江水电开发有限责任公司
技术研发日：
技术公布日：2024/12/17

转载请注明原文地址:https://xbbs.6miu.com/read-31945.html