许俊 胡孝俊 高健 姚贵策 贺晓
开放科学(资源服务)标识码(OSID):DOI:10.16661/j.cnki.1672-3791.2311-5042-5296
作者简介:
许俊(1979—),女,本科,高级工程师,研究方向为数据中心基础设施设计研究。
胡孝俊(1987—),男,硕士,高级工程师,研究方向为数据中心基础设施设计研究。
通信作者:姚贵策(1989—),男,博士,副教授,研究方向为先进冷却技术\智慧能源管理技术研究。E-mail:yaoguice@buaa.edu.cn。
摘 要:从局部离散流场数据点重构全局流场信息对数据中心机房的节能节碳具备重要的研究意义。基于局部散点对数据中心进行气流组织温度场快速重构,可以有效降低数据中心总能耗。主要通过发展一种基于多特征输入的三维马蹄形(convolutional networks for biomedical image segmentation,U-net)神经网络架构,利用布设在数据中心机房的温度传感器数据值进行气流组织温度场重构。并研究了在不同学习率与数据集大小的设置下,该机器学习模型的训练预测能力。对比结果表明:不同学习率对于模型训练的结果有较大影响,应通过预实验选取最佳学习率。在同等条件下,应优先选取较大的数据集进行训练,便于提取高维物理特征。
关键词:云计算 机器学习 计算流动动力学 气流组织温度场
中图分类号:TP393
随着云计算等新型数据通信模式的快速发展,算力正在成为一种新的生产力,而数据中心机房作为算力的物理承载,面临着服务器运行时产生的热负荷。当热负荷过大时,将无法有效发挥计算集群的性能,因此需要高效的冷却模式。为了降低制冷所需能耗,改善数据中心气流分布,需要得到数据中心气流组织温度场,并基于温度场结果进行结构布局优化,从而实现效益最大化。气流组织温度场可通过计算模拟或实验手段得到,传统的计算模拟方式为计算流动动力学(Computational Fluid Dynamics,CFD)模拟,但数据中心机房面积一般为百平米级及以上,对其直接进行CFD模拟将消耗大量的计算资源,无法应用于实际的工程优化中。因此,亟须发展出一种气流组织温度场快速重构的方法。
近年来,数据科学[1]与机器学习[2,3]获得了井喷式的发展,这也为流体力学研究者提供了新的技术与方向[4,5]。其中,本征正交分解技术被广泛应用于流场特征提取与重构,显著降低了流场的计算成本。然而,该方法对于复杂流场结构的特征提取存在一定的局限性[6],特别是对高维特征的捕捉仍有不足。而神经网络(Neural Network,NN)作为机器学习的典型算法,天然具备提取高维特征的能力[7],因此NN类算法可以一定程度上弥补POD类算法的不足。相比于全连接神经网络(Fully-connected NN,FNN),卷积神经网络[8](Convolutional NN,CNN)简化了网络结构复杂度,可以更加高效地从流场数据中提取高维特征[9]。在CNN的基础上,将符号距离图(Signed Distance map,SDF)作为输入特征进行耦合,创造性地提出了DeepCFD框架[10],通过该框架可实现变构型流场重构。目前基于CNN的流场重构主要集中在二维构型,对三维构型的流场重构仍然存在不足。
本文在DeepCFD框架的基础上,发展了一种基于多特征输入的三维马蹄形神经网络架构,通过引入不同工况的温度点阵图等输入,以及将二维卷积转换为三维卷积,该机器学习方法可以有效地对数据中心机房三维气流组织温度场进行快速重构。此外,本文也对学习率进行了参数化研究。
1 训练数据集生成
训练机器学习模型需要大量的数据集,本文利用6SigmaDC软件进行不同工况下的数据中心气流组织温度场模拟。首先,建立了如图1所示的三维数据中心机房模型,机房面积为4.8 mx4.2 m,高度为,在其中布设了6台服务器。
由于数据中心机房服务器功率一般处于4~12 kW区间,空调温度一般处于12~20 ℃区间,因此在该范围内,选择了工程应用中较为常见的91组参数组合用于温度场的工况模拟。由于6SigmaDC模拟生成的场数据为网格节点上的数据,具备一定的非均匀性(如图2所示),因此采用最邻近插值法对原始模拟数据进行三维插值,得到训练模型需要的均匀数据集。
2 三维U-net网络
三维U-net网络主要由三维卷积、三维池化、三维反池化与三维残差层构成,因此可以实现三维气流组织温度场的重构预测,其架构如图3所示。该网络架构主要分为两部分,从输入特征到U形底部之前为编码部分,从U形底部之后到输出预测结果为解码部分。编码部分从接收3个特征输入图开始,经过4次卷积以及池化的降维操作,将流场特征信息进行提取存储。对输入特征图进行编码后,再进行解码过程,解码过程除了卷积外,还加入了反池化与残差,残差网络结构可以更好地利用编码过程学习到的特征,同时对于训练还可以有效抑制梯度爆炸问题。网络最终的输出即为单通道的温度预测值矩阵。
3 结果分析与讨论
利用6SigmaDC模拟产生的91组不同工况下气流组织温度场数据,采用交叉验证策略进行多特征输入三维U-net网络的训练,并针对不同的影响因素进行参数化研究。实际预测结果如图4所示。经过91组数据的训练,可成功得到三维温度场的快速预测,并且误差保持在较低水平。时间成本由原来的十几个小时降低至秒级。
不通过学习率对预测结果的影响可以得出,学习率设置为0.03%时,训练损失最低,预测结果最准确的。
4 结论
本文发展了一种基于多特征输入的三维U-net神经网络架构用于数据中心机房三维气流组织温度场快速重构,基于该机器学习方法的气流组织温度场重构技术很有希望应用于真实数据机房的快速预测与结构优化工程中。同时值得注意的是,在GPT(Generative Pre-training Transformer)炙手可热的大环境下,人工智能算法层出不穷,今后的研究还可以利用更加强大的机器学习算法进一步提升模型的训练速度与预测精度。
参考文献
[1] DHAR V.Data science and prediction[J].Communications of the ACM,2013,56(12):64-73.
[2] BRUNTON S L,NOACK B R,KOUMOUTSAKOS P.Machine learning for fluid mechanics[J].Annual Review of Fluid Mechanics,2020,52:477-508.
[3] MAHESH B.Machine learning algorithms-a review[J].International Journal of Science and Research (IJSR)[Internet],2020,9(1):381-386.
[4] BRUNTON S L.Applying machine learning to study fluid mechanics[J].Acta Mechanica Sinica,2021,37(12):1718-1726.
[5] VINUESA R,BRUNTON S L.Enhancing computational fluid dynamics with machine learning[J].Nature Computational Science,2022,2(6):358-366.
[6] 李天一,万敏平,陈十一.Gappy POD方法重构湍流数据的研究[J].力学学报, 2021,53(10):2703-2711.
[7] WEINAN E.The dawning of a new era in applied mathematics[J].Notices of the American Mathematical Society,2021,68(4):565-571.
[8] MALLAT S.Understanding deep convolutional networks[J].Philosophical Transactions of the Royal Society A: Mathematical,Physical and Engineering Sciences,2016,374(2065):20150203.
[9] HASEGAWA K,FUKAMI K,MURATA T,et al.CNN-LSTM based reduced order modeling of two-dimensional unsteady flows around a circular cylinder at different reynolds numbers[J].Fluid Dynamics Research,2020,52(6):065501.
[10] RIBEIRO M D,REHMAN A,AHMED S,et al.DeepCFD: efficient steady-state laminar flow approximation with deep convolutional neural networks[J].ArXiv Preprint,2020,2004:08826.