基于时空特征的数据中心建模与运行策略确定方法及装置

专利2025-04-17  19


本说明书涉及人工智能,尤其是涉及基于时空特征的数据中心建模与运行策略确定方法及装置。


背景技术:

1、随着大数据时代的到来,全社会对于算力的需求越来越多,各类大模型备受青睐,然而,这些大模型的训练往往需要大量的算力。为了满足这种呈指数增长的算力需求,全球各地的数据中心需求量也日益增长。作为一种典型的用能设备,数据中心的能耗日益增高,其中,数据中心中的制冷系统占据了大量能耗。因此,研究数据中心制冷设备的节能问题,即如何控制机房空调使得各个设备安全运行的同时使整体运行能耗尽可能小,具有重要的工程意义。

2、在研究数据中心制冷设备的节能问题的过程中的关键点之一在于数据中心动态热环境的刻画,即预测不同控制策略下机房温度场的分布情况,计算流体力学(computational fluid dynamics,cfd)常用于刻画热环境,cfd方法通过把原来在时间域及空间域上连续的物理量的场,用一系列有限个离散点上的变量值的集合来代替,建立起关于这些离散点上场变量之间关系的代数方程组,然后求解代数方程组获得场变量的近似值。然而cfd方法极其消耗仿真资源,仿真时间极长,不适合用于实时控制优化,为此,亟需基于时空特征的数据中心建模与运行策略确定方法,实现数据中心动态热环境快速、准确的刻画,以及构建有效的数据中心制冷策略,从而减少数据中心能耗。


技术实现思路

1、鉴于目前的cfd方法的实现成本高,难度大,不适合用于实时控制优化,提出了本方案以便克服上述问题或者至少部分地解决上述问题。

2、一方面,本说明书的一些实施例的目的在于提供基于时空特征的数据中心建模与运行策略确定方法,所述方法包括:

3、获取数据中心的历史热环境数据;

4、利用所述历史热环境数据训练预设的级联神经网络模型,以使所述级联神经网络模型根据历史热环境数据中的时空特征对下一时刻热环境数据进行预测,得到热环境仿真模型;

5、基于所述热环境仿真模型,构建数据中心的运行优化目标及对应的约束条件;

6、根据所述运行优化目标及对应的约束条件确定马尔可夫决策过程中的状态变量、动作变量及奖励函数,以建立马尔可夫决策过程模型;

7、根据所述马尔可夫决策过程模型,在所述热环境仿真模型对应的学习环境下,应用深度强化学习算法训练得到数据中心的运行策略。

8、进一步地,获取数据中心的热环境数据,进一步包括:

9、构建机房子模型;所述机房子模型包括两排机柜单元以及一个或多个列间空调单元;

10、根据数据中心的真实布局情况对所述机房子模型进行组合排布,得到数据中心模拟模型;

11、在预设的多种工况下运行所述数据中心模拟模型,得到多种工况下数据中心的热环境数据。

12、进一步地,所述级联神经网络模型包括级联的transformer模型与图神经网络模型。

13、进一步地,利用所述历史热环境数据训练预设的级联神经网络模型,以使所述级联神经网络模型根据历史热环境数据中的时空特征对下一时刻热环境数据进行预测,得到热环境仿真模型,包括:

14、将所述历史热环境数据输入至所述级联神经网络模型中,以使所述transformer模型提取所述历史热环境数据中第一时刻之前的热环境数据的时序特征,对第一时刻的下一时刻热环境数据进行预测,并根据预测结果迭代所述transformer模型;

15、根据所述transformer模型的输出结果确定所述图神经网络模型的输入数据,以使所述图神经网络模型提取输入数据中的空间特征,对第一时刻的下一时刻热环境数据进行预测,并根据预测结果迭代所述图神经网络模型,从而得到热环境仿真模型;

16、或,

17、将所述历史热环境数据输入至所述级联神经网络模型中,以使所述图神经网络模型提取所述历史热环境数据中第二时刻之前的空间特征,对第二时刻的下一时刻热环境数据进行预测,并根据预测结果迭代所述图神经网络模型;

18、根据所述图神经网络模型的输出结果确定所述transformer模型的输入数据,以使所述transformer模型提取输入数据中的时序特征,对第二时刻的下一时刻热环境数据进行预测,并根据预测结果迭代所述transformer模型,从而得到热环境仿真模型。

19、进一步地,基于所述热环境仿真模型,构建数据中心的运行优化目标及对应的约束条件,包括:

20、根据所述热环境仿真模型的热环境仿真数据及运行时间信息,确定热环境仿真模型的耗能量;

21、将最小化所述耗能量作为所述运行优化目标,并根据数据中心允许的运行策略操作范围确定所述约束条件。

22、进一步地,根据所述马尔可夫决策过程模型,在所述热环境仿真模型对应的学习环境下,应用深度强化学习算法训练得到数据中心的运行策略,包括:

23、步骤0:初始化网络参数及信息缓冲区;所述信息缓冲区用于存储历史热环境数据;

24、步骤1:获取当前状态,并基于控制策略采样得到当前动作;

25、步骤2:将所述历史热环境数据输入至所述热环境仿真模型,预测得到下一时刻状态;

26、步骤3:根据当前动作及下一时刻状态更新所述信息缓冲区;

27、步骤4:将所述当前状态及当前动作输入所述奖励函数,计算得到奖励值;

28、步骤5:将由所述当前状态、当前动作、奖励值以及下一时刻状态组成的状态转移数据加入至本次迭代的重放缓冲区;所述重放缓冲区用于存放每次迭代所需的状态转移数据;

29、步骤6:对本次迭代的重放缓冲区中的状态转移数据进行部分批量采样,得到采样批量数据,并基于所述采样批量数据进行强化学习,更新网络参数;

30、重复上述步骤1-步骤6,直至达到预设迭代次数。

31、进一步地,基于所述采样批量数据进行强化学习,更新网络参数,包括:

32、基于所述采样批量数据,利用强化学习更新动作值函数、状态值函数及控制策略。

33、另一方面,本说明书的一些实施例还提供基于时空特征的数据中心建模与运行策略确定装置,所述装置包括:

34、接收模块,用于获取数据中心的历史热环境数据;

35、仿真模块,用于利用所述历史热环境数据训练预设的级联神经网络模型,以使所述级联神经网络模型根据历史热环境数据中的时空特征对下一时刻热环境数据进行预测,得到热环境仿真模型;

36、构建模块,用于基于所述热环境仿真模型,构建数据中心的运行优化目标及对应的约束条件;

37、确定模块,用于根据所述运行优化目标及对应的约束条件确定马尔可夫决策过程中的状态变量、动作变量及奖励函数,以建立马尔可夫决策过程模型;

38、训练模块,用于根据所述马尔可夫决策过程模型,在所述热环境仿真模型对应的学习环境下,应用深度强化学习算法训练得到数据中心的运行策略。

39、另一方面,本说明书的一些实施例还提供了一种计算机设备,包括存储器、处理器、以及存储在所述存储器上的计算机程序,所述计算机程序被所述处理器运行时,执行上述方法的指令。

40、另一方面,本说明书的一些实施例还提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被计算机设备的处理器运行时,执行上述方法的指令。

41、另一方面,本说明书的一些实施例还提供了一种计算机程序产品,所述计算机程序产品包括计算机程序,所述计算机程序被计算机设备的处理器运行时,执行上述方法的指令。

42、本说明书的一些实施例提供的一个或者多个技术方案,至少具有如下的技术效果:

43、本说明书的实施例自动获取数据中心的历史热环境数据,并利用历史热环境数据训练的级联神经网络模型,在训练过程中,级联神经网络模型根据历史热环境数据中的时空特征对下一时刻热环境数据进行预测,从而保证训练得到的热环境仿真模型能够从时序和空间两个维度充分挖掘历史热环境数据中的内在联系,实现对未来热环境的准确评估,之后,基于热环境仿真模型构建数据中心的运行优化目标及对应的约束条件,将数据中心的运行优化过程转换为马尔可夫决策过程,确定马尔可夫决策过程中的状态变量、动作变量及奖励函数,建立马尔可夫决策过程模型,并且热环境仿真模型能够提供高质量的学习环境下,利用深度强化学习训练得到数据中心的运行策略,从而保证运行策略的有效性,便于对数据中心的实时优化控制。

44、上述说明仅是本说明书的一些实施例技术方案的概述,为了能够更清楚了解本说明书的一些实施例的技术手段,而可依照说明书的内容予以实施,并且为了让本说明书的一些实施例的上述和其它目的、特征和优点能够更明显易懂,以下特举本说明书的一些实施例的具体实施方式。


技术特征:

1.基于时空特征的数据中心建模与运行策略确定方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,获取数据中心的热环境数据,进一步包括:

3.根据权利要求1所述的方法,其特征在于,所述级联神经网络模型包括级联的transformer模型与图神经网络模型。

4.根据权利要求3所述的方法,其特征在于,利用所述历史热环境数据训练预设的级联神经网络模型,以使所述级联神经网络模型根据历史热环境数据中的时空特征对下一时刻热环境数据进行预测,得到热环境仿真模型,包括:

5.根据权利要求1所述的方法,其特征在于,基于所述热环境仿真模型,构建数据中心的运行优化目标及对应的约束条件,包括:

6.根据权利要求1所述的方法,其特征在于,根据所述马尔可夫决策过程模型,在所述热环境仿真模型对应的学习环境下,应用深度强化学习算法训练得到数据中心的运行策略,包括:

7.根据权利要求6所述的方法,其特征在于,基于所述采样批量数据进行强化学习,更新网络参数,包括:

8.基于时空特征的数据中心建模与运行策略确定装置,其特征在于,所述装置包括:

9.一种计算机设备,包括存储器、处理器、以及存储在所述存储器上的计算机程序,其特征在于,所述计算机程序被所述处理器运行时,执行根据权利要求1-7任意一项所述方法的指令。

10.一种计算机存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被计算机设备的处理器运行时,执行根据权利要求1-7任意一项所述方法的指令。


技术总结
本说明书涉及人工智能技术领域,提供了基于时空特征的数据中心建模与运行策略确定方法及装置。该方法包括:获取数据中心的历史热环境数据;利用历史热环境数据训练预设的级联神经网络模型,得到热环境仿真模型;基于热环境仿真模型,构建数据中心的运行优化目标及对应的约束条件;根据运行优化目标及对应的约束条件确定马尔可夫决策过程中的状态变量、动作变量及奖励函数,以建立马尔可夫决策过程模型;根据马尔可夫决策过程模型,在热环境仿真模型对应的学习环境下,应用深度强化学习算法训练得到数据中心的运行策略。通过本说明书实施例,可实现对数据中心动态热环境快速、准确的刻画,以及构建有效的数据中心制冷策略。

技术研发人员:周翰辰,牟倪,贾庆山
受保护的技术使用者:清华大学
技术研发日:
技术公布日:2024/12/17
转载请注明原文地址:https://xbbs.6miu.com/read-23553.html