云数据中心基于负载预测的物理主机状态检测策略

2021-12-21 11:18杨柳青
关键词:能量消耗利用率数据中心

杨柳青,王 冲

(1.玉林师范学院 教育技术中心,广西 玉林 537000; 2.桂林电子科技大学 商学院, 广西 桂林 541004)

0 引 言

虚拟机迁移是构造绿色节能云数据中心的关键技术[1-2]。虚拟机迁移的过程非常复杂,目前以Cloudsim云模拟器工具包为代表的大部分文献将其划分为物理主机状态检测、虚拟机选择和虚拟机放置3个步骤[3],每个步骤都可以采用算法或者策略进行优化。

物理主机状态检测是通过监视云数据中心的所有物理主机的资源使用状态,采用一定的算法或者策略,把那些运行异常(超负载或低负载)的物理节点选择出来,形成候选迁移物理主机列表。

在接下来的虚拟机选择中,也要从异常的物理主机上选择出合适的虚拟机,形成候选迁移虚拟机列表。通过虚拟机放置策略,将虚拟机选择阶段中选择出来的虚拟机列表按照一定的算法重新放置到云数据中心其他正常状态下的物理节点上,从而保证整个云数据中心的负载均衡和节省能量消耗。

物理主机状态检测可以通过物理资源使用边界阈值管理算法等进行优化[4-5];虚拟机选择可以通过虚拟机尺寸与粒度、虚拟机迁移时间长短等算法进行优化[6-7];有些文献把虚拟机放置称为多目标优化问题或者装箱问题[8],该过程也有很多智能算法进行优化,例如萤火虫群优化算法[9]、遗传算法[10]、强化学习算法[11]、花授粉算法[12]、蚁群算法[13]等。上面的这些算法和这3个步骤还可以组合起来使用,但是最终评价标准是虚拟机迁移后的云数据中心的节能效果、物理资源利用实际效果和服务等级协议(service level agreement, SLA)违规效果等指标。

本文重点研究物理主机状态检测,在Cloudsim工具包中也称为物理资源阈值管理策略,这种资源阈值管理策略可以分为主动法和被动法,其中被动法意味着在物理主机的资源已经超过阈值边界之后再采取动作;主动法是指通过观察资源使用的样本数据在前一阶段的利用率情况,提前预测出可能出现状态的物理主机,接着进行虚拟机迁移的后续步骤。

目前已有的物理主机状态检测方法大多采用静态资源使用率阈值边界来确定主机是超负载或者低负载,其资源边界考虑的维度因素也比较单一, 其针对的云客户端也不是自适应的,以被动的方式检测为主。因为物理主机资源状态是一种随着时间和应用程序的访问而不断动态变化的,这对主机异常状态检测方法提出了新的要求。为此,本文提出了基于负载预测物理主机状态检测方法 (load prediction based physical host status detection, LP-PHSD)。本文的LP-PHSD是一种自适应的、动态的物理主机检测方法,采用时间序列和二次指数平滑法预测物理主机在未来一段时间内的资源使用率情况,确定其阈值边界,是一种主动检测策略。LP-PHSD检测策略配合后续虚拟机选择阶段和虚拟机放置阶段的其他优化方法,就构成了一个完整的新型虚拟机迁移模型。

LP-PHSD物理主机状态检测策略通过Cloudsim来实现和仿真,仿真结果表明,通过LP-PHSD优化策略形成新的虚拟机迁移模型之后,每周内总体能量消耗节约20%~30%,虚拟机迁移次数减少,云服务质量明显提高。

1 LP-PHSD工作背景与相关术语

1.1 LP-PHSD的依托环境

LP-PHSD物理主机状态检测策略依托了Cloudsim模拟器工具包,其中涉及Cloudsim中的相关模块主要包括:全局代理、本地代理、虚拟机管理器等[3]。

一个云客户端向云数据中心的全局代理请求虚拟机,该全局代理将虚拟机分派到具体的可用的物理主机上执行。图1显示了LP-PHSD物理主机状态检测的工作模块。在Cloudsim中每个物理主机上都运行有一个本地代理,他监视物理主机的软硬件资源,LP-PHSD物理主机状态检测策略的实现代码主要在本地代理模块中完成。本地代理根据物理主机处理器的利用率情况把其划分为3类:Pnormal,Pover与Punder,即正常主机,超负载主机与低负载主机。一般CPU的利用率低于或者高于一个阈值边界都处于Pover或Punder状态,其他的为正常状态Pnormal。利用率阈值边界具体取值多少可以通过各类阈值管理策略来测试、调整。虚拟机管理器用来配合本地代理具体完成虚拟机迁移的启动与关闭,这个工作场景在很多文献都有描述[3]。

1.2 LP-PHSD的相关术语

1.2.1 云数据中心的能量消耗模型

云数据中心主要由大量堆积在一起的物理主机组成,所以其能量消耗主要由物理主机的所有部件的能量消耗组成。文献[14]中认为一台物理服务器所消耗的能量百分比大约为:CPU占41%,内存占18%,磁盘占7%,PCI插槽占23%,主板占12%。基于这个思路,LP-PHSD策略中设计的物理主机的能量消耗数学模型为

E(Ucpu)=Eidle+(Emax-Eidle)Ucpu

(1)

(2)

E(Umem)=Eidle+(Emax-Eidle)Umem

(3)

E(Udisk)=Eidle+(Emax-Eidle)Udisk

(4)

E(Ubw)=Eidle+(Emax-Eidle)Ubw

(5)

Ehost=E(Ucpu)+E(Umem)+E(Udisk)+E(Ubw)

(6)

(1)—(6)式中:Ucpu(t),Umem(t),Udisk(t),Ubw(t)分别表示物理主机在mipsi时刻的CPU使用率,内存使用率,磁盘使用率,网络带宽使用率,0%≤Ucpu(t),Umem(t),Udisk(t),Ubw(t)≤100%;Eidle表示物理主机CPU、内存、磁盘空间、网络带宽在空闲时的能量消耗,即Ucpu(t)=0%,Umem(t)=0%,Udisk(t)=0%,Ubw(t)=0%时的能量消耗;Emax表示物理主机在满负载时的能量消耗,即Ucpu(t)=100%,Umem(t)=100%,Udisk(t)=100%,Ubw(t)=100%时的能量消耗;mipsi,c是第i个虚拟机VMi的第c个处理单元的MIPS请求情况;MIPSj,c是第j个物理主机Mj的第c个处理单元的整体的MIPS计算能力;pei表示虚拟机VMi的处理单元的数量;PEj表示物理主机Mj的处理单元的数量;rj(t)表示分配到物理主机Mj的虚拟机的索引集合。

图1 LP-PHSD物理主机状态检测策略实现模块Fig.1 Implementation modules of LP-PHSD

一台虚拟机请求的MIPS数量是随着应用程序的变化而变化的,所以物理主机的资源使用率也应该是随着应用程序的变化而变化。因此,统计物理服务器的能量消耗必须在一定的时间段内,这样根据(1)式可以演化为

Ehost(t)=E(Ucpu(t))+E(Umem(t))+

E(Udisk(t))+E(Ubw(t))

(7)

第j个物理主机在[t0,t1]时间段的总体能量消耗Ehost可以表示为

(8)

整个云数据中心的能量消耗为

(9)

1.2.2SLA违规在线时间

当一个云客户端提交作业到云计算平台的时候,资源缺少就会出现SLA违规,在虚拟机分配过程中,一个重要性能指标就是每个物理主机的SLA违规在线时间(SLA violation time per active host, SLATAH),SLATAH体现了物理主机具有高服务质量的在线时间情况,可以表示为

(10)

(10)式中:Tsj是物理主机CPU利用率达到100%的时间;Taj是物理主机处于在线活跃状态的时间;M为云数据中心的主机数量。

1.2.3 虚拟机迁移后的性能降低

Cloudsim中采用了2个指标来评价云数据中心的SLA违规。一是SLATAH指标;另一个是虚拟机迁移后的性能降低(performance degradation due to migrations, PDM)指标。(10) 式描述了单活动主机SLA违规时间。PDM指标可以表示为

(11)

(11)式中:Cdi是虚拟机VMi迁移导致的性能下降的估计值;Cri是请求虚拟机VMi的整个时间段内总的CPU MIPS计算能力;N为云数据中心的虚拟机数量。

1.2.4 能量与SLA违规的联合指标

SLA的违规率的计算通过 (10) 式和 (11) 式相乘得到,即

SLAViolation=SLATAH·PDM

(12)

最后能量消耗和SLA违规这2个指标往往是互相冲突的,如果SLA违规比率过高,表明云数据中心提供服务出现异常,这样企业将会失去商业利润。如果使用过多的IT物理资源来保证QoS,这样能量消耗就会增加,间接提高了企业的成本。能量与SLA违规的联合指标(ESV)是体现云服务提供商的高服务质量、低SLA违规比率和总体能量消耗平衡的指标,表示为

ESV=Etotal·SLAViolation

(13)

1.3 LP-PHSD的工作机制

虚拟机的迁移是一台虚拟机从源物理主机迁移到目标物理主机的过程,LP-PHSD在工作的时候,通过负载预测的方式,首先可以判断源物理主机是否处于异常,是否需要启动虚拟机迁移;同时,还可以判断目标物理主机是否处于异常状态,这样可以保证不会因为虚拟机迁移而导致超负载。通过LP-PHSD工作机制优化后的虚拟机迁移具体包括下面5个步骤。

步骤1基于LP-PHSD,进行源物理主机状态检测,形成候选迁移物理主机列表;

步骤2基于LP-PHSD,进行目标物理主机状态检测,形成候选迁移物理主机列表;

步骤3针对候选迁移物理主机列表上的虚拟机完成虚拟机选择,形成候选迁移虚拟机列表;

步骤4针对候选虚拟机列表中的大量虚拟机,基于递减装箱算法(best-fit-decreasing bin packing problem,BFD),优化完成虚拟机的重新放置;

步骤5重复上述步骤1至步骤4,直到指定的时间周期结束,或者所有物理主机都是正常状态后停止。

本文的LP-PHSD物理主机状态检测方法适应于近年来云客户端的复杂应用需求,资源边界的确定具有自适应性、动态性,这与Cloudsim工具包中的各个物理主机检测方法明显不一样。图2显示了LP-PHSD物理主机状态检测的工作流程。

图2 基于LP-PHSD优化后的虚拟机迁移过程Fig.2 Virtual machine migration model after LP-PHSD optimized

2 二次指数平滑负载预测

由于虚拟机迁移通过把超负载Pover或者低负载Punder物理主机上的虚拟机迁移出去,使云数据中心的所有物理主机基本都处于正常状态Pnormal,保证云数据中心的能量消耗最小,同时物理资源的利用效率也最高。虚拟机迁移是有一定的通信开销和额外消耗的,所以虚拟机迁移是一个比较严格的行为,否则将会导致更加坏的性能。

LP-PHSD算法提出基于时间序列的二次指数平滑先预测出未来时间段物理主机的状态情况,再决定是否采取虚拟机迁移动作。时间序列预测是根据变量之前的历史数据来预测将来值的模型。

二次指数平滑预测是加权平均移动法的一种特殊类型,给平均移动中所有历史观察值都赋予一个平均权重。有时候也给某些最近的观察值一些特殊的重要权重,原因是比较老的样本数据和最近的样本数据对预测值的影响是不一样的。最简单的一次指数平滑技术可以表示为

st=α·xt-1+(1-α)·st-1

(14)

(14)式中:α是平滑因子,是一种权重变量,α的取值范围为0<α<1;平滑统计变量st是之前历史观察数据xt-1和st-1的简单平均权重值。

在LP-PHSD中,{x1,x2,x3,…,xt-1}表示物理主机CPU利用率的最近一个时间间隔t的历史数据。{s1,s2,s3,…,st-1}是相对应的CPU利用率的预测值。从这些样本观察值和预测值可以得到平均方差(mean square error, MSE)为

(15)

为了找到物理主机的CPU利用率在t时刻的预测值,必须寻找到最优的α。 变量α应该可以使最小的平均方差,就是MSE最小,这里可以使用尝试错误法来寻找最佳的α值。

当数据中有某种趋势的时候,简单的一次指数平滑预测并不能完成很好的预测。为了处理这种不好的状态,本文提出了二次指数平滑预测。这和一次指数平滑比较类似,只是在每个阶段中有2个组件Level和Trend需要更新。

Level是数据的平滑估计值,Trend是在每个时间区域结束阶段平滑估计值的平均增长,二次指数平滑预测表达式为

st=αxt+(1-α)(st-1+bt-1),(0<α<1)

(16)

bt=γ(st-st-1)+(1-γ)bt-1,(0<γ<1)

(17)

(16)—(17)式中:γ是趋势平滑因子,实际是一种权重变量,γ的取值范围为0<γ<1;{st},{xt}与一次指数平滑技术中的变量含义相同;{bt}是趋势变量在时刻t的最好估计值。算法的输出为Pt+m,这里m>0,那么变量x在t+m时间段的估计值为

Pt+m=st+mbt

(18)

变量st和bt的初始值的选择有很多方法,一般情况下选择s1=x1,有3种情况可以设置b1,分别为

b1=y2-y1

(19)

(20)

(21)

现在最重要的问题是预测结果如何实际影响到虚拟机迁移,最终影响云数据中心的性能。LP-PHSD中主要用来对源物理主机和目标物理主机的迁移决策。一个迁移行为是否执行主要看物理主机当前与预测的CPU利用率情况。LP-PHSD算法的性能并不直接依赖于预测的精确度,而是依赖于物理主机状态检测中的决策精确度。表1为通过简单一次指数平滑和二次指数平滑预测后的CPU利用率比较情况。

表1 CPU利用率实际值与预测值的比较

从表1可以看出,简单一次指数平滑预测的方差为1.076%,而二次指数平滑预测的方差只有0.039%,显然预测精度更好。本文这里没有使用三次指数平滑预测,因为三次指数平滑考虑的时间因素更加多,CPU的利用率变化比较频繁,所以只选择了一个短期的预测技术。由于物理主机的状态是一个动态的云计算环境,采用预测的方式是不合理的,由于LP-PHSD算法的效率并不直接依赖于预测的精确度,只是对迁移动作做一个判断,虚拟机迁移动作最终应该是由资源的动态阈值边界来判断的。所以LP-PHSD算法还结合了另外一个资源动态阈值边界方法:绝对中位差检阈值管理策略(median absolute deviation,MAD), MAD也是Cloudsim工具包中的一种方法。

3 LP-PHSD算法描述

3.1 源物理主机状态检测

LP-PHSD针对物理主机状态检测分为2个部分:①虚拟机迁移的源物理主机检测;②目标物理主机检测。所以,LP-PHSD中提出2个算法,除了采用二次指数平滑预测算法外,主要还利用贪心模式的效率阈值边界迁移策略,这种贪心模式在很多虚拟机迁移模式中都使用,例如温度感知迁移策略[5]。针对源物理主机的状态检测算法如算法1。

算法1 源物理主机的状态检测

Input: host

Output: migration decision (true/false)

1. flag = false

2. utilization =totalRequestedMips/h.getTotalMips()//通过底层API获取当前物理主机的资源利用效率。

3. data[] = h.getUtilizationHistory()

4. upperThreshold = 1-s* MAD//绝对中位差检阈值管理边界策略

5. if (utilization > upperThreshold) then

6. flag = true

7. if (data.length < 10 or flag == false) then

8. return flag

9. currentOverUtilizedHosts.add(h)

10. future_utilization = getHostFutureLoad(data) //利用二次指数平滑法预测

11. if (future_utilization > upperThreshold) then

12. flag = true

13. else

14. flag = false

15. if (flag == true) then

16. overUtilizedHosts.add(h)

17. return flag

算法1将物理主机作为输入,把是否后续迁移动作作为算法的输出。

该算法主要是基于动态的资源使用阈值上边界,在该策略中,物理主机在超过资源使用阈值上边界时,被认为是超负载的状态,上边界的确定是通过Cloudsim中的绝对中位差阈值管理策略,该阈值是随物理主机负载的变化而变化。与传统方法类似,LP-PHSD中首先将上边界与物理主机当前CPU的利用率做比较,如果物理主机处于正常状态,虚拟机迁移后续步骤不会启动,云数据中心将不会有改变。

如果发现物理主机处于超负载状态,那么将完成基于时间序列的二次指数平滑CPU利用效率预测,为了准确预测出物理主机CPU利用率的值,必须获得更多的历史CPU利用率数据。根据数据的长度分别为5,10,15,20进行实验,发现物理主机状态检测的最佳长度是10,就是以最近10个数据点的CPU利用率作为历史数据。LP-PHSD算法的性能在数据长度为10或者12的时候基本类似。

如果预测后的CPU利用率超过了CPU资源的阈值边界上限,物理主机将被加入到超负载物理主机列表并将进入图2所示的后续虚拟机选择和虚拟机放置流程,否则虚拟机迁移过程将不会继续,这样可以使得物理主机的SLA违规率在短时间内降低。

源物理主机检测算法不能检测出当前不超负载但是将在后续某个时间会超负载的物理主机,而且该算法不能排除目标物理主机的异常情形。即如果一台物理主机作为目标物理主机被迁移,那么他的负载情况也需要进行判断,LP-PHSD算法还针对目标物理主机的状态检测进行了判断。

3.2 目标物理主机状态检测

LP-PHSD算法的针对目标物理主机状态检测如算法2。

算法2 目标物理主机状态检测

Input: host

Output: migration decision (true/false)

1.flagP = flagF = false

2.utilization =totalRequestedMips/h.getTotalMips()//通过底层API获取当前物理主机的资源利用效率

3. data[] = h.getUtilizationHistory()

4. upperThreshold = 1-s* MAD//绝对中位差检阈值管理边界策略

5. if (utilization > upperThreshold) then

6. flagP = true

7. if (data.length < 10) then

8. if (flagP == true)

9. overUtilizedHosts.add(h)

10. return flagP

11. future_utilization = getHostFutureLoad(data) //利用二次指数平滑法预测

12. if (future_utilization > upperThreshold) then

13. flagF = true

14. else flagF = false

15. if (flagF == false and flagP == true) then

16. currentOverUtilizedHosts.add(h);

17. if (flagF == true and flagP == false) then

18. predictedOverUtilizedHosts.add(h);

19. if (flagF == true and flagP == true) then

20. overUtilizedHosts.add(h)

21. return true

22. else

23. return false

目标物理主机状态检测的判断与源目标主机的判断比较类似,所以本节主要讨论2个算法不同的地方。目标主机检测不考虑当前的状态,只考虑CPU利用率的将来预测值。设计了2个状态flagP和flagF。flagP表示当前的利用率,flagF表示将来的预测值,需要判断3种情况。

1)当前值是超负载,预测值无超负载。在这种情况下物理主机必须加入超负载物理主机列表overutilizedList,但是不必继续进行虚拟机迁移。

2)当前值无超负载,预测值超负载。在这种情况下物理主机必须加入预测超负载物理主机列表predictedoverutilizedList,但是不必继续进行虚拟机迁移。

3)当前值超负载,预测值也超负载。在这种情况下物理主机必须加入超负载物理主机列表overutilizedList,同时进行虚拟机迁移后续的虚拟机选择、虚拟机放置步骤。

算法 2可以很容判断目标物理主机的状态,这样超负载物理主机和预测超负载物理主机都被排除到目标物理主机之外,不仅如此,该算法还可以判断出CPU最小利用率的物理主机,同时减少算法1中不必要的虚拟机迁移。

算法2中还可以修改1个预测值到n个预测值,如果在这n个预测值中有k个超过了阈值边界,将启动虚拟机迁移的后续步骤,而且变量n和k的值可以调整。在算法2中设n=5,k=4。

一般而言,如果n的值越大,那么预测值的精度就越高。目标物理主机状态判断完后,将进入后续的虚拟机选择和放置策略。递减装箱算法将按照当前CPU的利用率降序排列,然后每个虚拟机都依次放置到正常状态的物理主机之上,保证物理主机能量消耗尽量最小。根据LP-PHSD算法,虚拟机迁移过程依赖物理主机的当前负载及将来的预测负载。在云平台运行大工作量任务的时候,CPU的利用率往往超过阈值边界,这时没有合适的目标物理主机进行迁移,此时虚拟机迁移将不会发生,此时云数据中心会导致SLA违规,云客户端的响应时间急剧增加,如果这个时候从睡眠状态的物理主机重新开启就可以避免SLA违规。

4 LP-PHSD实验与性能分析

4.1 实验环境的构造

因为LP-PHSD基于负载预测的物理主机状态检测算法是在虚拟机迁移过程中运用的,所以进行LP-PHSD实验分析,必须构造云数据中心的虚拟机迁移场景,本文参考Cloudsim3.0工具包,依据图1中的功能模块,实现了基于Java语言的局部代理,根据算法1在该代理中进行了基于二次指数平滑负载预测的物理主机状态检测优化的代码实现。

由于LP-PHSD依托于Cloudsim云平台工具,在虚拟机选择和虚拟机放置过程都采用Cloudsim中默认的优化策略:最短时间虚拟机选择策略(minimum migration time,MMT)和递减装箱虚拟机放置算法,最终形成一个优化的虚拟机迁移模型LP-PHSD-MMT-BFD。

云数据中心的能量消耗模型及测试指标都参考了最常见的CoMon project,这是由planetlab实验室开发的一个项目[15],也是目前很常见的Benchmark项目。物理服务器配置如表2,虚拟机的请求个数与运行时间如表3。

表2 云数据中心物理服务器硬件配置

表3 LP-PHSD物理主机状态检测策略测试环境

4.2 实验性能指标

由于LP-PHSD物理主机状态检测算法依托于Cloudsim项目,为此LP-PHSD评价的主要指标有4个:①云数据中心的总体能量消耗;②虚拟机迁移次数;③SLA违规比率;④能量消耗及SLA违规联合指标,这4个指标可以体现与能量消耗相关的虚拟机迁移策略的性能好坏。

本文还与近年来其他物理资源阈值管理办法进行了比较,例如ATEA检测方法[4]、AEEVC[16]检测方法、稳定匹配虚拟机迁移[17]、虚拟机关联性虚拟机迁移[18]、蚁群优化的虚拟机迁移[19]、萤火虫群优化的虚拟机迁移[9]等,分析这些物理主机状态检测对云数据中心的性能改变情况。综上所述,本实验涉及的虚拟机迁移模式比较对象如表4。

表4 LP-PHSD物理主机状态检测性能比较对象

本文虚拟机迁移比较算法包括LP-PHSD-MMT-BFD,LRR-MMT-BFD,AEEVC,ATEA,Stable-Matching,Correlation-Based,ACS-VMM,GSO-VMM共8种模式。

4.3 实验结果与性能分析

4.3.1 云数据中心总体能量消耗

各个虚拟机迁移模型一周之内每天24小时内的总体能量消耗如表5。从表5可以看出,有了基于负载预测的LP-PHSD物理主机状态检测算法后,LP-PHSD-MMT-BFD迁移模型比Cloudsim中的LRR-MMT-BFD迁移策略在总体能量消耗上要节约25%~30%,比Stable-Matching策略、Correlation-Based策略、GSO-VMM策略、和ACS-VMM策略的能量消耗也更低,虽然周一到周五之间的数据有一定的波动,但是整体趋势是LP-PHSD-MMT-BFD迁移策略最节省云数据中心的能量消耗。分析原因是LP-PHSD 中物理主机CPU利用率使用阈值边界是动态调整的,大部分情况下都可以判断出源物理主机和目标物理主机在合适的时候启动虚拟机迁移的后续步骤,能量消耗自然减少,而且LP-PHSD-MMT-BFD中设计的能量消耗模型考虑的资源维度更加齐全,比单纯一维资源更准确。

表5 云数据中心总体能量消耗性能比较

4.3.2 虚拟机迁移次数

表6所示为一周内几种算法的云数据中心虚拟机迁移次数比较,由表6可知,LP-PHSD-MMT-BFD的虚拟机迁移次数都低于LRR-MMT-BFD策略、Stable-Matching策略、Correlation-Based迁移策略、GSO-VMM策略、ACS-VMM策略;而AEEVC策略和ATEA策略迁移次数则处于中等水平。

表6 云数据中心虚拟机迁移次数比较

LRR-MMT-BFD很容易增加超负载或低负载的物理主机数量,增加的虚拟机迁移间接增加了物理主机的能量消耗,因为虚拟机迁移过程也要消耗物理主机的CPU资源及额外通信开销,而LP-PHSD-MMT-BFD检测策略则与LRR-MMT-BFD正好相反,LP-PHSD中都是基于对物理主机资源使用效率的预测值策略。另外Stable-Matching策略、Correlation-Based策略和ACS-VMM策略的优化主要在虚拟机放置阶段,很难降低虚拟机迁移次数,要减少虚拟机迁移次数,必须在虚拟机选择阶段与物理主机状态检测阶段完成优化。

4.3.3 SLA违规率分析

表7为各类虚拟机迁移策略的SLA违规率比较,从表7可以看出,周一到周五,LP-PHSD-MMT-BFD迁移策略的SLA违规率比LRR-MMT-BFD迁移策略要低,原因是LP-PHSD-MMT-BFD周期性完成超负载物理主机检测,可以避免物理主机出现100%的CPU利用率机会,从 (12) 式可以得到SLA违规比率会降低。Stable-Matching策略、Correlation-Based策略和ACS-VMM策略在虚拟机放置阶段都采用另外的优化算法,这样整个云数据中心的SLA违规率自然会比LRR-MMT-BFD迁移策略要低,他们的SLA违规率在某些时候还优于LP-PHSD-MMT-BFD策略,AEEVC策略和ATEA策略则处于性能中等水平。GSO-VMM策略和本文的模型在SLA违规率上性能基本相同,比Cloudsim的原始迁移策略SLA违规率更低。

表7 各类虚拟机迁移策略的SLA违规率比较

4.3.4 能量与SLA违规的联合指标ESV

表8为各类虚拟机迁移的ESV联合指标,从表8可以看到,LP-PHSD-MMT-BFD迁移策略的ESV也要低于LRR-MMT-BFD迁移策略。这表明了在第1阶段物理主机状态检测过程中,算法优化对云数据中心的物理资源利用效率提高的重要性。AEEVC策略、ATEA策略、Stable-Matching策略、Correlation-Based策略和ACS-VMM策略是2016至2018年提出的虚拟机迁移优化算法,他们在虚拟机迁移的各个阶段都有优化,比2012年的LRR-MMT-BFD迁移策略性能优秀,而且蚁群优化虚拟机迁移策略的ESV甚至超过了LP-PHSD-MMT-BFD策略。

表8 各类虚拟机迁移的联合指标ESV

5 结 论

本文提出了基于负载预测的物理主机状态检测方法LP-PHSD,这是一种主动检测方法,采用基于时间序列的二次指数平滑法来预测物理主机在未来一段时间内的CPU资源使用率情况,同时,结合绝对中位差方法确定资源的动态阈值边界,通过源主机和目标主机2个检测算法来确定虚拟机迁移的时刻。实验结果表明,经过LP-PHSD优化过的虚拟机迁移策略LP-PHSD-MMT-BFD大部分情况下比常见的其他虚拟机迁移模式有更低的能量消耗和更少的虚拟机迁移次数,服务质量明显提高。LP-PHSD物理主机状态检测策略可以为其他云服务器提供商构造节能绿色云数据中心提供支持。

猜你喜欢
能量消耗利用率数据中心
太极拳连续“云手”运动强度及其能量消耗探究
酒泉云计算大数据中心
中年女性间歇习练太极拳的强度、能量消耗与间歇恢复探究分析
浅析数据中心空调节能发展趋势
没别的可吃
2019年全国煤炭开采和洗选业产能利用率为70.6%
关于建立“格萨尔文献数据中心”的初步构想
化肥利用率稳步增长
浅议如何提高涉烟信息的利用率
板材利用率提高之研究