陈锦伟
(中时讯通信建设有限公司)
虚拟化云计算平台的能耗管理探讨
陈锦伟
(中时讯通信建设有限公司)
数据中心的能耗问题是目前亟待解决的一个重要问题,随着数字化技术的发展,对数据中心的利用率较高,在管理上也比较灵活,因此被广泛运用。而且未来数据中心的发展趋势是广泛采用虚拟化技术和云计算技术,很多学者提出了采用传统能耗管理技术和虚拟化技术结合的方法,这有利于促进虚拟化云计算平台的能耗问题的解决。本文阐释了虚拟化云计算平台面临的问题,并根据虚拟化云计算的模型提出了有效的虚拟化云计算的管理机制,降低耗能成本。
虚拟化;云计算平台;能耗管理
近年来,数据中心始终伴随着高能耗的问题。随着云计算的发展,越来越多的计算资源集中在数据处理的运算,因此这就会消耗大量的能源,因此高能耗问题成为一个亟待解决的重要问题。数据系统中心的高能耗问题不仅会带来能源的消耗,还会使系统不稳定,同时对环境造成不利的影响,因此要认清虚拟化云计算平台的发展现状,针对现状进行模型化管理。
1.1 操作管理上的挑战
虚拟化技术在对数据进行操作时主要采取动态资源伸缩的方式,这有利于减小在进行云计算时的资源耗费的总成本,还能增加各方面部署的灵活性。例如当需要对虚拟化数据处理中心进行维护时,操作过程十分简单,具体的操作流程是将虚拟机转移到另一台服务器上,既不需要终止应用程序,也不需要关闭虚拟机,这给操作人员带来了极大的便利,也节省了维护的时间。但是在迁移虚拟机时也会带来额外的成本,比如增加了多余的通信负荷,同时无形中增加了对带宽的需求。因此需要借助高性能的网络设备来完成迁移虚拟机的要求,既要求快速有效、又能够减少能耗[1]。另外,采用虚拟化技术可能会涉及到关于数据中心某些决策的变化,比如如果想要达到虚拟化负荷的最佳性能,则就需要选用配置较高的处理器,以达到支持硬件虚拟化的目的,而且遗留下来的处理器将不再继续应用。另外,由于需积极处理海量的任务,这些任务可能同时在一台物理主机上运行,因此要想获得更高的可靠性,就需要购买一些更加先进和昂贵的硬件,从而加大系统运行的成本,因此在进行虚拟化数据中心的设计时要考虑到系统的成本问题。
1.2 能耗管理的挑战
在数据中心中运用虚拟化技术给数据的处理带来的极大的便利,在进行日常的操作管理时,也面临着能耗管理上的挑战。①虚拟化平台的管理对象主要是虚拟资源和物理资源,但是它们之间呈现出分离的状态,因此通过客户机器观测到的虚拟资源和物理资源会呈现出不同的状态,尤其在进行迁移时,会更加不一致。所以,如何解决虚拟机程序中的能耗管理问题是目前面临的一个极大的挑战;②在数据处理中心,由于虚拟资源和物理资源存在着不一致性,而且随着系统的不断更新、故障的维修和处理,因此这种不一致性会逐渐加大,甚至相互矛盾,不能兼容。因此在设计时要考虑到虚拟机的隔离性的问题。
(1)通过建立模型对虚拟化云平台的能耗进行分析,本文主要针对内存能耗模型、CPU能耗模型、在线迁移模型以及磁盘能耗模型进行能耗的分析。
(2)内存能耗模型
目前影响内存能耗模型的重要因素是内存读写的吞吐量。其中可以通过额外的插桩技术可以获得内存读写的吞吐量,也可以使用轻量级计算吞吐量的方法,通过这些指标都可以获得内存的能耗模型,可以被写成以下的形式:
其中计算公式中的Emem(T)表示在T时间内的内存总消耗量,而NLLC(T)则表示在T时间内NLLC缺失的总次数,αmem和γmem则表示线性模型的参数。
目前由于处理器硬件可以直接对内存访问进行跟踪管理,因此跟踪虚拟机的LLC缺失并不直观,所以操作系统也不能被直接看到。很多处理器将LLC的缺失作为观测硬件的计数器,通过对每个虚拟机的每个核上的的LLC缺失的次数来获取到虚拟机的LLC的缺失次数,因此虚拟机内存的能耗模型是:
在计算公式中,Emem.A表示其中的一个虚拟机A在在时间T内在所有虚拟机核上的LLC的缺失次数,αmem则表示线性模型的参数。
(3)CPU能耗模型
CPU能耗模型涉及到很多的因素,比如在处理器中每个子单元的活动状况、进行某个指令的情况等。当要将能耗模型进行精确设计时,就需要增大监控方面的成本。研究学者希望采用一个轻量级的替换方法,从而对处理器的活动进行分钟,设计的CPU能耗模型为:
其中αcpu和γcpu模型中的特定常数,可以经过一系列的训练来获得。因此当有一个虚拟机A的处理器,其利用率可以表示为ucpu.A,则此虚拟机的能耗可以表示为Ecpu.A=αcpuucpu.A
(4)在线迁移模型
在先迁移是指虚拟机在一种不停机的状态下进行的迁移技术。虚拟机迁移所造成的能量消耗是主要通过数据的传输率来决定,源端主机迁移的能量消耗和传输成正比例关系,随着传输率的升高,源端主机的能量消耗就越大,反之,则减小。并且当数据的传输率达到较高的水平时,迁移延迟的速度也会缩短。根据大量的实验表明,虚拟机在迁移的过程中,迁移本身带来的能量的消耗和数据的传输率并无太大关系,而能量的消耗主要体现在对网络上的数据进行传输和接受,因此表明影响虚拟机迁移产生的能量消耗的主要因素是在网络流量中的数据量的大小。为此设立了模型,以此来评估能耗的消耗。
评估的模型主要由三个部分组成:①源主机;②网络交换器;③远端的目标主机。由于它们之间的交换结构较为复杂,因此能耗不能采用常规的能量化的方式,所以主要考虑的是源端能耗以及目标主机的能耗。在理论上来说,源端的数据传输量和目标端的数据传输量基本对等,因此假定能量的消耗与由于虚拟机的迁移产生的网络成本表现出一种线性增长关系:
式中:αs、αd、βs、Βd表示需要经过训练的模型参数;Vmig表示网络流量;Emig表示能耗[2]。
(5)磁盘能耗模型
一般来说,磁盘子系统的能耗模型的建立难度较大,这是由于无法完全知晓磁盘的功耗程度和状态,再加上受到磁盘硬件缓存的干扰,因此在建立模型时较为困难。在数据处理中心,磁盘主要通过RAID的形式存在,RAID中包含着控制器,可以通过控制器来控制物理磁盘,而通过Hypervisor只能看到驱动驱动,所以建模时只能利用Hypervisor可见的参数,在具体的实践中,Hypervisor可以看到的参数只包括读和写的字节数,还有进行读和写的时间,因此可以利用这几个参数来建立磁盘能源消耗的模型:
式中:Edisk(T)表示的是在T时间内磁盘的能耗;br和bw则表示在T时间内读取和拼写的字节数;而α和γdisk可以经过训练来获取。
在对磁盘进行模型的建立时,要随时跟踪每一个虚拟机中的磁盘使用参数。然而,有一个值得关注的问题,当磁盘在进行工作等活动的时候,虚拟机则未必会活动,这是因为Hypervisor在进行批次处理的时候可能会停止I/O的运行。因此,这就要求在Hypervisor中观察明显的I/O的操作状态,而不是对虚拟机活动的活动状态进行观察。
随着科学技术的发展,虚拟化云计算平台的发展速度也日益加快,在发展中也面临着一系列得到问题。虚拟化云计算平台的使用频率增加导致云计算网络要不断更新其配置,因此这就对虚拟化云计算平台在能耗的管理上提出了巨大的挑战。所以,为了可以更好地利用云计算平台,要不断加强对能耗管理机制的开发和管理。
受到管理层次的限制,可以将虚拟化云计算平台的能耗管理机制分为两个类别:①处于虚拟化层次的能耗管理机制;②处于云平台层的能耗管理机制。具体情况如图1。
3.1 虚拟化层次的能耗管理机制
虚拟化层次的能耗管理机制又可以分为VMM层和VM层。VMM层主要是通过监控技术或者DVFS技术来检测并降低系统的能耗,还可以检测特定的功率的状态,并发出明令,调节特定硬件的功率状态。而VM层次的能耗管理机制主要是通过VIirtualPower系统对虚拟层的VPM状态进行监测管理,从而为客户提供广阔的硬件管理视野[4]。
图1 虚拟化云计算平台的能耗管理机制
3.2 云平台层的能耗管理机制
云平台层的能耗管理机制主要涉及到VPM tokens机制,其不仅可以在虚拟机里实现基本的能耗操作,还能为在线能耗管理奠定坚实的基础[5]。VPM可以对硬伸缩、软伸缩以及整合式的管理机制进行管理,并建立统一的方式,在保持能耗的同时,为系统提供足够的性能的支持。
随着信息化的发展,数据中心的高能耗问题越来越多的人所关注,目前虚拟化云平台面临的挑战主要包括操作管理和能耗管理上的挑战,通过建立内存能好模型、CPU能耗模型、在线迁移模型以及磁盘能耗模型,对数据中心的能耗进行分析,未来还可以通过建立虚拟化云计算的能耗机制来提高系统的性能,减少能耗的成本。因此,在实践中要深刻剖析虚拟化云计算平台的能源消耗的管理,其可以促进各个领域的发展,并可以为各行业领域的发展提供一定的借鉴,使人类社会的发展方向朝着更加智能化、信息化方向发展。
[1]叶可江,吴朝晖,姜晓红,何钦铭.虚拟化云计算平台的能耗管理[J].计算机学报,2012,06:1262~1285.
[2]陈俊茹.虚拟化云计算平台的能耗管理[J].电脑知识与技术,2015,21:18~19.
[3]党红恩,赵尔平,雒伟群.虚拟化云计算平台的能耗管理探讨[J].无线互联科技,2016,01:133~134.
[4]许珊.关于虚拟云计算平台的能耗管理刍议[J].电子制作,2015,11:171.
[5]徐晶.虚拟化云计算平台的能耗管理探究[J].电子技术与软件工程,2014,16:32.
TP393
A
1004-7344(2016)20-0263-02
2016-7-1
陈锦伟(1973-),男,广东广州人,助理工程师,学士,主要从事通信工程建设工作。