杨 波,刘文彬,龚春红,付 沙(湖南财政经济学院信息管理系,湖南长沙410205)
数据中心的高能效方法
杨波,刘文彬,龚春红,付沙
(湖南财政经济学院信息管理系,湖南长沙410205)
概述了云计算环境下处理器能耗模型和数据中心业务模型,然后基于动态电压调节技术阐述功率分配方法,使得在调度时间固定时,系统总能耗最小,在能耗固定时,总调度时间最短,最后结合任务预测及排队模型确定数据中心的服务提供量以关闭不必要的服务器来节省能耗.
云计算;高能效;数据中心
Yang B,LiuWB,Gong CH,etal.Energy-EfficientMethods in Data Center[J].Journal of Yibin University,2015,15(6):57-60.
大数据时代的来临,海量数据分析业务使得能够按需提供弹性计算服务的云计算模式得到广泛使用,然而支撑云计算服务的核心,即数据中心,消耗的电能每年正以15%的速度增长,电能成本占据了整个运营成本的42%[1].大规模数据中心高能耗问题主要来源于两个方面,一个是处理器层次的能耗,另一个是数据中心层次的能耗[1-2].随着处理器性能的不断提高,硬件上的优化技术在一定程度上提升了能量的使用效率,但是处理器的能耗受应用程序使用模式的影响,过高的负载和过低的利用率都会导致高能耗和低使用率的问题.在数据中心层次,由于物理服务器数量不断增多和处理能力不断增强,带来了更多的能量消耗,同时由于任务的随机性,使得服务器利用率过低,产生巨大的电能浪费[3].能耗因素正在成为云计算和大规模数据中心服务能力和规模的瓶颈,限制着系统性能方面的进一步提高,考虑到云计算的成本是持续逐年下降的,在不远的将来,电能将占据云服务成本的绝大部分,因此在提供高质量服务的同时,如何减少电能的消耗将是数据中心管理的关键任务[1].
1.1处理器能耗模型
处理器是提供服务的关键设备,在处理器节能领域,已有大量的工作深入研究,并且取得了一定的研究成果,文献[4-5]指出处理器和内存消耗了服务器系统中的大部分能耗.随着节能技术在处理器产业的应用,CMOS集成电路处理器能够根据负载动态调节性能,从而达到能耗的优化.在文献[5-6]中对CMOS集成电路的动态电压调节技术进行相应的介绍,CMOS集成电路的功耗主要是由静态功耗和动态功耗构成:
PCMOS=Pstatic+Pdynamic
动态功耗在CMOS电路功耗中占主要部分,是节能研究的主要对象,其功耗模型:
P=acv2f
其中a为电路翻转频率,c是负载电容,f为时钟频率.由于电压v与时钟频率 f成正比,f又和系统服务速率成正比,因此动态功率和服务速率的n次方成正比[5-6].对于一般的处理器系统来说,在服务速率s>0时的动态功率P(s)与能耗E简化表示模型如下:
P(s)=ξsα
E=P(s)t=rP(s)1-1/α=rsα-1,(α>1)
其中ξ、α是与具体的设备相关的常量,r表示任务量大小.简化的能耗模型表明功率与运行速率成正比,能耗与任务量大小及运行速率成正比,使得需要考虑的因素大大减少.
1.2数据中心数学模型
数据中心是云计算的核心部分,但由于用户服务请求的随机性,例如,任务的到达间隔可能服从负指数分布、Erlang分布等其它随机分布[7-8],导致云计算系统服务量的供应难以确定.当前对数据中心的研究,大多都是采用排队模型来分析,如图1所示M/M/m多服务器模型.
图1 排队模型
令μ表示单个服务器的服务率,λ表示任务的到达率,故服务器系统的平均使用率可以表示为:
ρ=λ/mμ
M/M/m型服务器中有k个任务等待服务的概率表示为ρk,其数学表示为:
其中
如果所有的服务器处于忙状态,新提交的服务请求必须等待的概率表示为ρq:
过长的服务等待时间是客户不满意的根源之一,云服务商应该要使客户的等待时间保持在一个较低的水平[8].云服务商可以使用两种方法:一是增加服务器数量,二是提高服务器运行速度.
动态电压调节技术是一种有效的能效优化方法,文献[6,9-11]根据不同的调度策略、任务的实时性要求等特点,来研究服务器系统中处理器的能耗优化方法,下面将详细介绍它们的方法.
2.1单核处理器系统能效优化
假设任务是顺序的、独立无关的静态任务;服务器系统中的处理器为单核同构的,处理器的电压频率都是连续可调且无上下界的限制;进行电压频率调节的开销不考虑,同时空闲功耗为0;任务调度是非抢占式、离线的、任务大小是已知的.
当总能耗是固定时,表示为常量E,问题是最小化调度时间.设各处理器的功率为 p1,p2,…pn,则调度时间表示如下:
总能耗表示如下:
问题转化为总能耗F(p1,p2,…pn)受限于E,求最小化调度时间T(p1,p2,…pn),由KKT条件,采用拉格朗日乘子,问题模型转化为:
λ为拉格朗日乘子,对方程求解,优化结果为:
pi=1/λ(1-α)=(E/R)α/(α-1)
由此可以确定,当总能耗受限时,各个单核处理器分配相同的功率运行任务,总的调度时间最小.
当调度时间固定时,记为T,问题是完成所有任务所需要的最小总能耗.设各处理器的功率为p1,p2,…pn,则完成任务所需消耗的电量表示如下:
总调度时间表示如下:
总调度时间T(p1,p2,…pn)受限于T,求完成所有任务的最小总能耗E(p1,p2,…pn),采用拉格朗日乘子,问题模型转化为如下方程:
λ为拉格朗日乘子,对方程求解,优化结果为:
pi=1/λ(1-α)=(R/T)α
由此可以确定,当调度时间受限时,只要每个服务器的运行功率一致,总的运行能耗将最小.
2.2多核处理器系统能效优化
问题的前提与上节单核处理器是一致的.设服务器系统有m个多核处理器,现有n个任务需要处理,可以将任务划分成m组.让Rk表示在第k个处理器上执行所有任务总和,1≤k≤m.
当总能耗是固定时,记为E,求解最短调度时间.一个多核处理器可以视为多个单核处理器问题,设第k个多核处理器所需要执行的任务总量为Rk,利用上节结论,当总能耗是固定时,优化在第k个多核处理器完成所有任务所需要的最小调度时间,应当给第k个多核处理器每个处理器分配相同的功率(Ek/Rk)α/(α-1),Ek是分配给第k组的能耗,因此完成任务所需要的调度时间为:
当能耗固定时,由木桶原理可知,只有当所有组同时完成任务,即T1=T2=…Tn,此时所需要的调度时间最小[12].各个组的总能耗数学模型表示为如下方程:
求得最优调度时间为如下方程:
分配到各个组的能耗为:
当调度时间固定时,记为T,求解最小总能耗.当时间固定时,由2.1节可知,当第k组所有任务分配相同的功率(Rk/T)α,得到最小能耗,记为Ek,表示如下:
Ek=/Tα-1
所以总最小能耗即为各组能耗之和,表示如下:
2.3数据中心能效优化
设在一个数据中心有N个同构服务器,每个服务器拥有自己的队列及功率供应,当SLA(Service-Level Agreement)达成后,平均响应时间就是一个约定的固定值.虽然任务的到达率是随机变化的,但文献[8,12-13]通过收集数据中心多种商业应用的负载数据,发现大多数变化是季节性规律变化的,文献[12-13]采用线性规划方法以天为单位将负载划分为几个基准量,依据基准量在各个时间段配置不同的服务器数量,即满足了SLA,又节能了能耗.虽然各个时间段的基准负载接近实质的负载量,但仍然有随机性峰值出现,需要采用细粒度时间到达率的预测数学模型,其中以类TCP拥塞控制原理的指数平滑预测方法为代表[14],其表示方法如下:
Et+1=αOt+(1-α)Et-1
其中Et为t时间的预测到达率,Ot为t时间的观察到达率,α是一个平滑常数,一般取经验值为0.7~0.8.
通过准确预测未来的任务,提前开启或关闭适当数量的服务器,使得在不违背SLA的同时保持高能效比.文献[15-16]用排队论模型来定量分析数据中心,讨论如何优化系统配置来实现收益的最大化.当任务到达率λ、最大平均响应时间T¯确定后,服务系统的平均响应时间不能超过SLA约定的平均响应时间,表示如下:
其中ρq表示新提交的服务请求必须等待的概率,ρ0为0个任务的概率,在2.2节已给出其计算公式.
将ρ0、ρq代入上式,即可确定需要开启的服务器台数m.采用数学中的预测方法及排队论模型,对数据中心进行模拟分析,能够在一定的程度上减少资源浪费,又满足了约定的SLA.
云计算技术本身就是一种经济计算模式,将分散的计算资源集中管理,以此提高资源的使用率,但由此带来的高能耗问题也是一个不可忽视的问题.未来云数据中心的能耗优化,将从硬件级和软件级两个方向来展开,在硬件级,提高芯片工艺、改进处理器架构等技术将使单位能耗可提供更多的计算能力;在软件级,将从任务资源需求异构性、服务能力异构性、任务动态变化性等方面来设计任务管理架构,在提高用户体验感的同时减少数据中心的能耗开销.
[1]林闯,田源,姚敏.绿色网络和绿色评价:节能机制、模型和评[J].计算机学报,2011,34(4):593-612.
[2]Yun D,Lee J,Yi Y.Research in green network for future internet [J].JournalofKIISE,2010,28(1):41-51.
[3]Lee Y C,Zomaya A Y.Energy efficient utilization of resources in cloud computing systems[J].The Journal of Supercomputing,2012, 60(2):268-280.
[4]Barroso L A,Holzba U.The Case For Energy proportional comput⁃ing[J].Computer,2007,40(12):33.
[5]Li J,Martinez JF.Dynamic power-performance adaptation ofparal⁃lel computation on chip multiprocessors[C]//High-Performance Computer Architecture,The Twelfth International Symposium on.IEEE,2006:77-87.
[6]Wikipedia.CMOS[EB/OL].[2014-09-30].http://en.wikipedia.org/wiki/CMOS.
[7]Kleinrock L.Queueing Systems,Volume 1:Theory[M].New York:JohnWiley and Sons,1975.
[8]谭一鸣,曾国荪,王伟.随机任务在云计算平台中能耗的优化管理方法[J].软件学报,2012,23(2):266-278.
[9]Li K.Performance analysis of power-aware task scheduling algo⁃rithmsonmultiprocessor computerswith dynamic voltage and speed [J].IEEETransParallelDistrib Syst2008,19(11):1484-1497.
[10]Li K.Scheduling precedence constrained tasks with reduced pro⁃cessor energy onmultiprocessor computers[J].IEEE Transcation on Computers,2012,61(11):1668-1681.
[11]Howard J,Dighe S,Vangal SR,et al.A 48-core IA-32 processor in 45 nm CMOSusing on-diemessage-passing and DVFS for per⁃formance and power scaling[J].Solid-State Circuits,IEEE Journal of,2011,46(1):173-183.
[12]Cao J,Wu Y,LiM.Energy efficient allocation of virtualmachines in cloud computing environments based on demand forecast[M]//Li R,Cao J,Bourgeois J.Advances in Grid and Pervasive Computing.Springer,Berlin,Heidelberg,2012:137-151.
[13]Gandhi A,Chen Y,Gmach D,et al.Hybrid resource provisioning forminimizing data center SLA violations and power consumption [J].Sustainable Computing:Informatics and Systems,2012,2(2):91-104.
[14]Xiao Z,SongW,Chen Q.Dynamic Resource allocation using virtu⁃al machines for cloud computing environment[J].IEEE Transac⁃tionson Paralleland Distributed Systems,2013,24(6):1107-1117.
[15]Cao J,Hwang K,Li K,et al.Optimalmultiserver configuration for profit maximization in cloud computing[J].IEEE Transcation on Paralleland Distributed System,2013,26(6):1087-1096.
[16]王巍,罗军舟,宋爱波.基于动态定价策略的数据中心能耗成本优化[J].计算机学报,2013,36(3):599-612.
(编校:许洁)
Energy-EfficientMethods in Data Center
YANGBo,LIUWenbin,GONGChunhong,FUSha
(Departmentof Information and Management,Hunan University ofFinanceand Economics,Changsha,Hunan 410205,China)
TwomodelsofCPU and data center based on the energy-efficiency of cloud computingwas described.Optimal allocationmethods to find the power supplies by the dynamic voltage scaling techniquewere presented from two aspects ofminimizing scheduling length with energy consumption constraintandminimizing energy consumption with scheduling length constraint.The task prediction and queuingmodelwere combined to determine provision of the data center and turn offunnecessary servers to save energy.
cloud computing;high energy-efficiency;data center
TP393
A
1671-5365(2015)06-0057-04
2014-10-23修回:2014-12-02
湖南省教育厅科学研究项目(13C094)
杨波(1974-),男,讲师,硕士,研究方向为云计算、高能效计算、算法优化
网络出版时间:2014-12-10 09:16网络出版地址:http://www.cnki.net/kcms/detail/51.1630.Z.20141210.0916.001.html
引用格式:杨波,刘文彬,龚春红,等.数据中心的高能效方法[J].宜宾学院学报,2015,15(6):57-60.