数据中心机房机架温度预测模型研究

2019-07-19 06:42吴亚奇付保川陈珍萍

苏州科技大学学报(工程技术版) 2019年2期

吴亚奇，付保川，陈珍萍

（苏州科技大学电子与信息工程学院，江苏苏州215009）

随着云计算技术的快速发展，现已逐渐步入了大数据时代。作为海量数据的载体，随着数据服务需求的爆炸性增长和IT技术的快速发展，数据中心进入了迅猛发展时期[1]。数据中心机房存放有大量的用于数据计算和存储的IT设备，由于电子元器件的高密度产生的热耦合，会导致高温环境的出现。失效物理学表明，环境温度每高于器件工作温度10℃，元器件寿命就会缩减30%～50%，可靠性下降25%左右。因此，数据中心通过布置机房精密空调，采取高强度的空调冷却，以保证稳定可靠的工作环境。为了达到室内温度需求，数据中心通常采取全天供冷的方法对机房进行降温，这种方式不仅降低制冷效率，而且容易造成大量的能耗浪费[2]。数据中心只能通过采集温度数据，考虑工作量和运行需求对未来的温度变化进行估计。这种温度预测过于经验化，可靠性较低。

目前，于洋，孙成伟等人[3]提出了一种云模型和RBF神经网络结合的预测模型，通过高维云变换对影响温度因子进行确定选择，优化RBF神经网络，提高了训练速度，但存在收敛速度较慢的缺点；邹燕[4]将进风温度和CPU利用率作为输入，排风温度作为输出，利用BP神经网络对机房热区温度进行预测，该方法考虑的影响因子较为简单；安册册[5]通过TRANSYS软件搭建机房模型获得模拟参数，利用最小二乘支持向量机对温度进行预测，求解速度增快的同时精度相应下降。而针对现实数据中心的情况，考虑整体制冷环境和布局，多台精密空调共同制冷，处于不同位置机架制冷情况各不相同。在这种需要考虑整体环境及个体存在差异的情况下，常规的温度预测算法则无法满足变量之间的相关性。并且，温度是一种难以通过机理建模的非线性过程，通过传感器所获得的样本数据也相对较少。

在机器学习中，支持向量机（Support Vector Machine，SVM）可以在小样本数据的基础上统筹学习效率和模型复杂度之间的关系，能够寻求最佳的组合，具有很好的泛化能力。与此同时，支持向量机在解决非线性问题上表现出特有的优势。而决定支持向量机性能的优劣程度，在于选取的惩罚因子和核函数参数值。传统的参数选取是通过人为经验或者通过交叉验证的方法。这种方法带有一定的主观性和随意性，无法满足实际问题的需求。粒子群算法（Particle Swarm Optimization，PSO）是进化算法中的一种，从随机解出发，通过迭代并追随当前最优解来搜寻全局最优，迭代周期短，但易陷入局部最优；蚁群算法（Ant Colony Optimization，ACO）具有良好的信息正反馈、鲁棒性强、感知局部信息能力较强，迭代时间较长，易产生停滞现象。

基于两者的优缺点，该文将粒子群算法与蚁群算法混合，用于支持向量机模型的参数优化，结合苏州某数据中心实际情况，对机房内位于不同位置处的机架温度进行模拟预测，与真实数据进行对比，验证模型在整体环境中各个机架温度预测的准确性。

1 理论基础

1.1 蚁群算法

蚁群算法是意大利学者Dorigo和Colorny[6]提出，通过模拟蚁群觅食模式，达到相同于蚁群间信息正反馈的目的而形成的一种并行启发算法。其基本思想如下：初始时刻，设置m只蚂蚁，蚂蚁k根据伪随机比例规则从位置i选择下一个位置j，路径规则如下

其中，τij为边上（i，j）的信息素；ηij=1/dij为位置i转移到位置j的启发因子；allowedk为蚂蚁k下一步被允许访问的位置集合；q是均匀分布在[0，1]中的一个随机变量，q0是在[0，1]中的一个参数；J是根据第二式给出的概率分布产生出来的一个随机变量。

经过n时刻，所有蚂蚁完成一次循环。在遍历过程中，蚂蚁在每条所走过的路中释放信息素，其公式如下

式中，ρ为信息素挥发系数；Q为信息素浓度，用来控制信息素的调节速度；Vτijk是第k只蚂蚁在循环中路径ij释放的信息素。蚂蚁构建的路径长度越小，则路径上各条边会获得更多的信息素，在以后的迭代中更可能的被其他蚂蚁选择，在完成一次循环后，重新初始化，准备下一次循环。

1.2 粒子群算法

粒子群优化算法最早是由Kennedy J和Eberhart R[7]提出，通过观察研究鸟类捕食行为而受到的启发，并用于解决优化问题[8]。PSO算法首先初始化可解空间中的一群粒子，并用位置、速度和适应度值三个指标来表示粒子的特征，适应度值由适应度函数计算得到，结果的好坏表示粒子的优劣程度。每个粒子经历过的最佳的位置（最佳适应值）称为个体极值Pbest；群体所有粒子所经历的最佳位置称为群体极值Gbest。粒子在解空间中运动，通过跟踪个体和群体极值更新个体位置。粒子每更新一次位置，就计算一次适应度，并且通过比较新粒子与旧时适应度值更新个体和群体极值的位置。

假设在一个D维的搜索空间中，n个粒子X=（X1，X2，…，Xn）组成种群，其中第i个粒子表示一个D维的向量Xi=（xi1，xi2，…，xiD）T，代表在D维搜索空间中第i个粒子的位置，亦代表问题的一个潜在解。根据目标函数即可计算出每个粒子位置Xi对应的适应度值。第i个粒子的速度为Vi=（Vi1，Vi2，…，ViD）T，其个体极值为Pi=（Pi1，Pi2，…，PiD）T,种群的全局极值为Pg=（Pg1，Pg2，…，PgD）T。

在每一次迭代过程中，粒子通过个体和全局极值更新速度和位置：

式中，ω 为惯性权重；d=1，2，…，D；i=1，2，…，n；k为当前迭代次数；Vid为粒子的速度；c1和c2为非负的常数，称为加速度因子；r1和r2为分布于[0，1]之间的随机数。

1.3 SVM算法

支持向量机首先由Vapnik[9]提出，其主要思想就是找到一个回归平面，让一个集合的所有数据到该平面的距离最近。目标函数是一个正则平方误差函数：

在SVR中，目标是训练出超平面y=ωT+b，并使yn=ωTxn+b作为预测值。为了获得稀疏值，即计算超平面参数ω、b，通过部分数据，并采用є-insensitive误差函数。误差函数定义为

当预测值yn与真值的差值小于阈值є时，此样本点将不会受到惩罚；若超出阈值，惩罚量为。采用Eє替代平方误差项，所以最小化误差函数可以被定义为优化目标：

采用软边界的方法[10]，将其转化成一个约束优化问题，并为每个样本数据定义上下边界的松弛变量ξn和，将误差函数转化为一个凸优化问题：

其中，C是惩罚因子，表示对于错分样本惩罚的程度，若因子数值越大则表明错误越大。Lagrangin的引入将最优化问题转化对偶问题。然后分别对四个算子求偏导，并带回到拉格朗日函数中。最后，将ω表达式代入到yn=ωTxn+b中，可以得到支持向量机回归函数：

根据泛函数的相关理论，核函数满足Mercer条件，它就对应某一变换空间中的内积[11]。根据研究经验，本文选择径向基函数作为核函数，即

其中，x为待预报因子向量；xi为作为支持向量的样本因子向量；g为核函数参数。

2 基于ACOPSO-SVM温度预测模型

采用蚁群粒子群混合算法优化支持向量机流程图如图1所示，应用至温度预测流程如下：

第1步初始化蚁群算法初始位置向量、蚁群数目NACO、迭代时间TACO、迭代次数、最大迭代次数NACOmax、信息挥发系数ρ以及信息素浓度Q。

第二步将温度影响参数的训练集对SVM进行训练，并用式（8）计算每个蚂蚁在当前位置的适应度:

图1 算法流程

式中：yi是训练样本的真实值；yi'是训练样本的预测值。用下式计算当前所处位置的信息素浓度:

3 实验及仿真结果

影响数据中心机房温度的因素主要是空调出风口温度、气体流速、回风口温度、室内湿度等。文中模型的建立根据实际中数据中心的机房布局、位置以及设备参数设定，选取各空调出风口温度、回风口口温度、风速和机架处温湿度作为自变量，将下一时刻机架处温度作为因变量。机房布局如图2所示。

文中数据取自苏州某大型数据中心机房，房间级空调夏季实测数据。通过安装的温湿度传感器，获取空调出风、回风口和12个机架温湿度每小时的实时数据。选取七月1至七月10日这段时日，每隔一小时收集一次数据，总计240组数据作为训练学习数据。并以七月11日一天内实测的24组数据作为测试数据。

图2 机房布局

3.1 数据预处理

由于数据中包含不同的评价指标，其量纲单位不同，为了防止某些指标数据过分放大或者被忽视影响到数据分析的结果，解决数据指标之间的可比性问题，对训练集和测试集进行归一化预处理。

归一化后的数据，可以加快梯度下降求最优解的速度。同时，最优解的寻优过程会变得更加平缓，能够提高一定的预测精度。采用下式进行归一化处理：

3.2 仿真分析

粒子群学习因子的选取是参考Trelea等人[12]对粒子轨迹的收敛域分析推荐的参数。粒子群算法学习因子c1=c2=2，惯性权重ω=0.5，种群规模为30，最大迭代次数为300；蚁群种群数目为100，最大迭代次数为30，信息素ρ=0.7，信息素浓度Q=20。

通过MATLAB仿真软件和数据中心实测数据对温度预测模型进行仿真实验，得到温度实际值和预测值的对比图，并同时与SVM模型预测结果进行对比，见图3。

为了检视对比PSO-SVM的预测效果，图3中同时给出了支持向量机的模拟效果。由图3可见，蚁群粒子群优化支持向量机相较于支持向量机预测的拟合精度更高，更为接近真实值。同时，其预测的温度趋势与真实趋势大致相符，最大误差温度只有0.1℃。

由表1中给出的均方误差和决定系数能更清晰的看出模型之间的差异。但也因优化过程，增加了一定程度上的计算负荷和时间。

表1 预测误差对比

图3 温度预测结果

综上可知，蚁群粒子群混合优化支持向量机机架温度预测模型具有更好的泛化能力和预测精度，可以准确的预测下一时刻温度，从而达到理想效果。

4 结论

本文研究了数据中心下送风、房间级空调模式下各机架温度的ACOPSO-SVM预测模型。结合了蚁群粒子群混合算法和支持向量机，对数据进行训练建模研究。主要结论如下：

（1）利用蚁群算法的优化结果作为粒子群算法初始化设置，不仅可以获得蚁群算法的全局寻优能力和粒子群算法的局部寻优能力，还避免了蚁群算法迭代周期长和粒子群算法易收敛的缺点。

（2）针对数据中心实际情况，考虑到多因素间的相关性和非线性关系，提出蚁群粒子群混合算法和SVM预测模型，显示出了很高的非线性学习能力。

（3）通过对比分析SVM算法的预测结果、均方误差和相关系数，验证了ACOPSO+SVM对整体机架温度的高预测性能。