本发明涉及电力系统领域,具体是一种基于dmmoeqn的电力系统参数辨识方法。
背景技术:
1、随着现代电力系统的规模和复杂性不断增加,电力系统参数辨识参数辨(parameter identification, pi)在保障系统稳定性和可靠性方面变得尤为重要,其原理是通过观测系统的输入和输出数据,确定系统模型中的未知参数。现有的电力系统参数辨识技术主要包括基于传统统计方法、数值优化方法以及基于机器学习和深度学习的方法。
2、1. 传统统计方法
3、传统的统计方法包括最小二乘法、最大似然估计法和卡尔曼滤波等。这些方法通过构建数学模型并结合观测数据来估计系统参数。例如,最小二乘法通过最小化观测值与模型预测值之间的误差来估计参数。然而,这些方法在面对非线性、大规模和动态变化的电力系统时,往往表现出较差的适应性和计算效率。
4、2. 数值优化方法
5、数值优化方法利用优化算法来寻找使目标函数最优的参数值。常见的优化算法包括遗传算法、粒子群优化算法和模拟退火算法等。这些方法在处理复杂的非线性问题时具有一定优势,但在实际应用中往往存在收敛速度慢、易陷入局部最优解等问题。
6、3. 基于机器学习和深度学习的方法
7、近年来,随着计算能力和数据量的增加,机器学习和深度学习方法在电力系统参数辨识中的应用越来越广泛。典型的方法包括支持向量机、随机森林、神经网络等。这些方法通过从大量数据中学习系统的复杂关系,可以较为准确地进行参数估计。然而,深度学习方法通常需要大量的训练数据和计算资源,且模型的训练过程复杂,计算资源消耗大,不易于在资源受限的环境中应用。
8、存在的问题和缺点
9、尽管现有技术在电力系统参数辨识方面取得了一定的成果,但仍然存在以下主要问题和缺点:
10、1. 应对动态变化的能力不足:现有方法在面对电力系统的动态变化和非线性特性时,难以获得准确的参数估计。电力系统参数可能因环境变化、负载波动等因素频繁变化,现有方法难以实时调整并保持准确的参数估计。
11、2. 多参数辨识效果不佳:现有方法在处理多参数辨识问题时,往往忽略了不同参数之间的相关性,导致计算复杂度高、效率低下,且参数估计不准确。面对电力系统中多个参数同时变化的情况,现有方法难以有效应对,常常导致整体辨识效果不理想。
12、3. 计算复杂度高:传统统计方法和数值优化方法在处理大规模和高维度的数据时,计算复杂度高,收敛速度慢,难以满足实时应用的要求。
技术实现思路
1、本发明的目的在于克服现有技术的不足,提供一种基于dmmoeqn的电力系统参数辨识方法,包括如下步骤:
2、步骤一,设定电力系统的初始参数和电力系统的目标参数,并得到目标观测值,并创建记忆池;
3、步骤二,获取电力系统的初始观测值和目标观测值,智能体通过在线网络根据当前观测值选择最佳参数调整动作;执行动作,电力系统根据动作更新电力系统的参数状态,并得到新的观测值;
4、步骤三,根据新的观测值和目标观测值之间的误差计算步骤奖励,根据步骤奖励得到总奖励;
5、步骤四,记录当前参数状态、动作、奖励和下一次的参数状态,并存储在记忆池中;
6、步骤五,判断电力系统的观测值是否在目标观测值的误差范围内,若在误差范围内,则更新目标值和目标观测值,并继续迭代,直到达到预定的目标值的数量n,进入步骤八;否则,进入步骤六;
7、步骤六,从记忆池中采样,根据采集的样本通过最大化总奖励,更新在线网络的参数,在设定时间隔内,将在线网络的参数复制到目标网络;
8、步骤七,重复步骤二到步骤六,当达到预定的最大迭代次数或达到预定的目标值的数量n,epoch结束,进入步骤八;
9、步骤八,进行初始化,继续训练;当epoch数大于预设最大epoch数时,训练结束,得到训练完成的电力系统参数辨识模型,通过训练完成的电力系统参数辨识模型得到电力系统参数,根据电力系统参数对电力系统进行调节。
10、进一步的,所述的智能体通过在线网络根据当前观测值选择最佳参数调整动作;执行动作,电力系统根据动作更新电力系统的参数状态,并得到新的观测值,包括:
11、所述的智能体包括基于mmoe的目标网络和在线网络;智能体根据当前电力系统状态观测值选择并执行最佳参数调整动作;在每次迭代过程中,电力系统根据智能体的动作更新电力系统的参数状态,并得到新的观测值。
12、进一步的,所述的根据新的观测值和目标观测值之间的误差计算步骤奖励,根据步骤奖励得到总奖励,包括:
13、计算当前观测值和目标观测值之间的二范数误差;将二范数误差转换为即时奖励,所述的即时奖励为:
14、
15、其中为当前观测值,为目标观测值;累加所有即时奖励,得到总奖励。
16、进一步的,所述的从记忆池中采样,根据采集的样本通过最大化总奖励,更新在线网络的参数,包括:
17、对每个样本,计算当前q值和目标q值;计算时序差分误差,所述的时序差分误差为:
18、
19、其中r为即时奖励,为折扣因子,q'为目标网络的q值;
20、使用均方误差损失函数最小化时序差分误差,均方误差损失函数为:
21、
22、其中为第i个样本的td误差;反向传播误差并更新网络权重;定期将在线网络的参数复制到目标网络。
23、进一步的,所述的判断电力系统的观测值是否在目标观测值的误差范围内,若在误差范围内,则更新目标值和目标观测值,包括:
24、在训练开始时预设n个目标值,达到当前目标值对应的目标观测值后,更换到下一个目标值,通过仿真得到新的目标观测值,将新的目标观测值设为当前目标,更新目标值的记录,直到达到所有预设的n个目标值。
25、一种基于dmmoeqn的电力系统参数辨识系统,应用所述的一种基于dmmoeqn的电力系统参数辨识方法,包括电力系统参数辨识模型模块、电力系统参数采集模块、数据处理模块和数据存储模块;
26、所述的电力系统参数辨识模型模块、电力系统参数采集模块和数据存储模块分别与所述的数据处理模块连接。
27、本发明的有益效果是:
28、1.提高对频繁变化参数的辨识能力:现有技术难以应对电力系统中参数因环境变化和负载波动而频繁变化的情况。dmmoeqn方法通过引入智能体的连续目标值追踪机制,使得系统能够快速响应环境和操作条件的变化,动态调整参数,实现对频繁变化参数的实时追踪和高效辨识。实验表明,在仿真环境中,本方法能够在目标参数变化后迅速调整,辨识精度显著提高。
29、2.增强多参数同时辨识的能力:多参数同时变化是电力系统中的常见现象,现有方法在处理多参数辨识时往往忽略参数间的相关性,导致辨识效果不佳。本发明通过将mmoe模型的多任务学习能力引入ddqn,能够同时处理多个参数的辨识,提升整体辨识精度和效率。实验结果显示,在面对多参数变化的复杂场景中,本方法能够有效降低参数辨识误差。
30、3.降低计算复杂度,提高响应速度:传统统计方法和数值优化方法在处理大规模和高维度数据时,计算复杂度高,收敛速度慢,难以满足实时应用的要求。本发明利用基于mmoe的ddqn强化学习框架,通过在线网络和目标网络的双重结构,有效降低计算复杂度,加快参数辨识过程,提高系统的实时响应能力。根据实验数据,dmmoeqn方法在大规模数据处理中的总计算时间显著减少,响应速度显著提高。
31、4.提高辨识的准确性和稳定性:通过定时更新目标网络,本发明确保训练过程的稳定性,减少参数调整过程中的波动和不稳定性,从而提高了参数辨识的准确性和稳定性。实验数据表明,本方法的均方根误差(rmse)在不同测试环境下均保持较低水平,辨识结果更为可靠。
1.一种基于dmmoeqn的电力系统参数辨识方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于dmmoeqn的电力系统参数辨识方法,其特征在于,所述的智能体通过在线网络根据当前观测值选择最佳参数调整动作;执行动作,电力系统根据动作更新电力系统的参数状态,并得到新的观测值,包括:
3.根据权利要求1所述的一种基于dmmoeqn的电力系统参数辨识方法,其特征在于,所述的根据新的观测值和目标观测值之间的误差计算步骤奖励,根据步骤奖励得到总奖励,包括:
4.根据权利要求1所述的一种基于dmmoeqn的电力系统参数辨识方法,其特征在于,所述的从记忆池中采样,根据采集的样本通过最大化总奖励,更新在线网络的参数,包括:
5.根据权利要求1所述的一种基于dmmoeqn的电力系统参数辨识方法,其特征在于,所述的判断电力系统的观测值是否在目标观测值的误差范围内,若在误差范围内,则更新目标值和目标观测值,包括:
6.一种基于dmmoeqn的电力系统参数辨识系统,其特征在于,应用权利要求1-5任一所述的一种基于dmmoeqn的电力系统参数辨识方法,包括电力系统参数辨识模型模块、电力系统参数采集模块、数据处理模块和数据存储模块;