云计算数据中心电源管理分析

2014-08-15 00:48金誉华
河北能源职业技术学院学报 2014年1期
关键词:小型机双机虚拟化

金誉华

(泰州机电高等职业技术学校,江苏 泰州 225300)

“云”是一些可以自我维护和管理的虚拟计算资源,通常运用在一些大型服务器集群,包括计算服务器、存储服务器、宽带资源等。云计算将所有的计算资源集中起来,并由软件实现自动管理,有利于创新和降低成本。虽然国内数据中心增速远大于欧美地区,但在规模、能耗、布局和安全方面存在较大差距,数据中心能耗问题已成为制约信息化建设的不利因素。现在,随着我国对云计算技术的发展,政务云、警务云、电信云等信息平台相继出现,云计算数据中心由于联网设备庞大,电源管理成为所有“云”关注的问题。那么,如何实现云计算数据中心节能管理呢?笔者认可以主要从以下方面做一些改进。

1.集中资源优化使用效率

云计算中心只有大量采用绿色节能技术,才能减少能源开支,降低运维成本。并且在基础构建设施上打下坚实硬件条件,这样才会在稳定性与可靠性上具有竞争的实力。然而,所有这一切都离不开电源管理。而采取电源管理,则在实际工作中是靠虚拟化减少物理主机数量、充分利用未利用的计算能力等措施来实现的。管理者在IT实践中,往往会借助虚拟化技术,使云计算中心能够充分利用计算资源、网络资源和存储资源,借助桌面虚拟化技术,也可以将其延伸到PC机接入端。服务器虚拟化提高了处理器的利用率,物尽其用,而且用虚拟机承载应用,借助热迁移,令应用摆脱与物理服务器的紧耦合,让应用与物理设备无关,也就是松耦合,从而提升系统的可靠性。但是,虚拟化不能够解决全部问题。究其原因在于热迁移是条件的。虚拟机的确可以在不同物理设备之间进行迁移,但要求物理设备要保持健康状态。如果物理机突然宕机,那么它所承载的虚拟机是没有办法进行热迁移的。要提高虚拟机的可靠性不是依靠热迁移,而是依靠HA或者Fault Tolerance模块,相当于物理方案中的双机集群和容错。尽管如此,热迁移还是有其价值,就是应对计划内的停机,如设备维护、升级时,借助热迁移把应用移植走,升级完毕,再将应用迁移回来。但热迁移无法应对计划外的突然宕机,这是需要非常明确的。要提升关键业务应用系统的可靠性,还是需要借助双机集群和容错系统,其中,双机集群依靠集群软件,技术要求高,管理复杂,当系统产生意外宕机时,故障很难定位,故障恢复需要时间,期间系统没有办法提供不中断的服务。另外,是否要选用云计算,关键看它能否真正提高你的工作效率。比如,对于一家大公司来说,本身拥有自己完备、高效的数据中心,这时使用外包的云服务可能不仅不会提高效率,反而会降低你的工作效率;但是对于许多中小企业而言,与其他企业共享云计算资源却带来很高的效率。当然,绿色节能也是需要考虑的主要因素之一。此外,作为节能环保法律法规最健全的经济体,欧洲尤其注重提高数据中心能源利用效率,优化IDC功耗利用效率(PUE),热电冷联供、冰帽供冷、机柜供冷、自然冷却、热回收技术及磁悬浮变频离心等技术的较早采用,使欧洲数据中心成为最有可能最先达到优化PUE=1.2的理想境界的数据中心。

2.优化小型机的容错服务

目前,一些国家的科研人员通过利用改进服务器降低数据中心能耗。比如,由英国、比利时、瑞士、芬兰和塞浦路斯的研究人员组成的研究团队研发出一个特殊的3D微芯片,通过低功耗微处理技术,可以极大地削减云计算数据中心服务器的用电量和安装成本。据验证,使用该芯片的服务器与常规服务器相比可减少90%的能耗,可减少数据中心用户数十亿欧元的开支,同时,使更多的欧洲企业有能力投资建设数据中心。与双机相比,容错可以提供更高的可靠性,管理比较简单,故障排查非常方便,当CPU、内存、I/O等部件出现故障时,只要不是冗余部件同时损坏,系统就不会产生中断。但一部件出现故障,系统失去容错保护,但更换之后,系统就可以恢复容错工作状态,期间不需要任何停机。因此,容错服务器是关键业务应用的理想选择。同样,对于小型机,站在用户角度上来说,也是一个最佳的选择。

相对通用市场而言,小型机是不折不扣的“小众市场”,其特点是数量不大,但销售额占比很高。以我国市场为例,小型机在销量上的占比只有3%,而销售额占比却高达41%,为154亿元的规模。随着x86技术不断进步,特别是IA处理器性能已不逊于RISC,x86系统开始进入关键业务应用的市场。由于x86具有出色的性价比,大幅度降低了采购成本,因此x86成为了未来的趋势。小型机作为一种成熟的方案,拥有雄厚的用户基础,尤其是对于保守的用户来说,小型机的平台无疑是一种最好的选择。但对于创新型用户而言,已经开始尝试将应用迁移到x86的平台。对于那些没有应用包袱的用户来说,用户会更多考虑采用x86的方案,就可靠性而言,x86已经大幅度接近,甚至超过了小型机(如x86容错)。为了提升可靠性,小型机也采用双机集群和容错的方案。如今,小型机仍然采用双机集群,但容错方案已经抛弃了小型机,开始拥抱x86。因为对于容错而言,RISC架构的成本太高,用户很难承受。关键业务应用x86市场同样是双机集群和容错,其中,双机集群是借助集群软件来提升可靠性,其可靠性是99.99%,逊色于小型机集群的99.999%;但x86成本优势突出,在满足可靠性要求的前提下,x86双机集群的优势明显。但也存在着明显的不足,就是可靠性有限,双机切换无法实现真正的无缝切换,宕机后需要时间进行回复。

相对双机集群来说,x86容错方案的可靠性是99.9999%,这是超过小型机集群的。这也是容错技术的特点决定的,另外,容错还有一个优势,就是在软件授权上,容错是被作为一台机器,尽管拥有冗余的架构,但只需要一台设备的软件授权,而双机的两台设备需要分别购买授权。因此从系统总体成本来看,容错是占优,但是单从硬件成本看,容错比双机集群要高一些,而恰恰是这一点带来了选型上的障碍。从以上的分析不难看出,x86容错是关键业务应用的上佳选择。x86容错的市场定位,不是市场的拾遗补阙,而是小型机、x86集群的理想替代产品,因为对于关键业务而言,可靠性才是第一需求,而容错具有最好的性价比表现。x86容错是否会成为关键业务应用的主流,影响的因素有很多,其中不乏干扰。对于x86服务器的大厂商而言,会不遗余力的推动双机集群,软件厂商也会从多卖授权的考虑支持双机集群,而容错只能是用户的选择。

3.电源管理的智能化

现在,各地酝酿或即将采用的云计算项目非常多,项目规模也比较大。但从能源消耗管理的角度看,云计算的核心在于数据中心的电源管理。当前,有许多单位投资建设了很多的数据中心,这些数据中心为什么不够成为云计算中心?不是这些数据中心不能够对外提供IT服务,实际上,IaaS、PaaS也好,还是SaaS也好,数据中心都可以提供,它们与云计算中心相比,差别就在于效率和能源成本。借助虚拟化技术,云计算中心能够充分利用计算资源、网络资源和存储资源,借助桌面虚拟化技术,也可以将其延伸到PC机接入端。与此同时,云计算中心大量采用绿色节能技术,其核心就是减少能源开支,降低运维成本。在这个基础上之上构建的云计算服务,才会在价格上、稳定性、可靠性上具有竞争的实力。所有这一切都离不开电源管理。

据统计,数据中心的电力消耗已经占到了全球能源电力消耗的8%,更为可怕的是,数据中心电力消耗正在以每3年翻一番的速度迅猛发展。在用户每年的IT投资成本中,运维使用成本已经远远超过IT设备的购买成本,电源消耗已经成为了用户的痛点。一些云数据中心服务商也对此进行了相应的创新。比如,作为KVM系统领先厂商美国Raritan(力登)公司对于数据中心就在智能化管理上下功夫,从而降低能耗,其软硬件开发也是本着用户的关注重点来改进,其KVM产品在全球很多数据中心得到了广泛采用,熟悉数据中心管理,也更了解数据中心用户的需求。

另外,云计算的兴起大大提高了设备运算密度,进而导致用电密度的迅速扩大。如此,供电系统、冷却系统、机房空间的需求也相应增加,但机房资源十分有限,扩建机房、或者大规模改建的可行性也非常小。这就是云计算给数据中心能源管理带来的挑战。数据中心建立之初都应当充分考虑供电的安全与稳定,包括电源预留的几倍冗余。不可忽视的原因是,随着云计算迅猛发展,运营商对于电源管理的前提是保证安全、稳定的同时实现节能。对此,信息化建设的电源管理智能化成为必要选择。智能PDU因为增加了控制芯片,能够进行电源智能管理,对用电设备进行即时监控,包括电流、电压、温湿度、数值读取、分析,进而可以对用电设备的关断电、重启进行远程操作,既可提升机房的安全性,又可实现用电的科学管理,实现综合节能。由于大多数用户的核心机房装机密集,各类电源设备分布太散,很难集中管理,只有采用电源管理智能化,实现24小时无人可视化管理,才能真正化分散集中管理。

4.增强数据中心的能效管理

4.1 空间建构布局与管理

在数据中心空间建设上,应当充分合理规划,将自然条件与实际硬件设施结合起来,包括购置服务器的类型方面,应当考察其实际耗能情况,并根据需要对空间进行合理构建布局。包括空间通风、置放平台位置、自然调节等因素。比如:服务器机柜和机架、服务器符合存储容量和网络的电力需求、如何设置驱动器和交换机等因素。若采用顶级机架堆叠式交换机柜节省空间;有足够大的空间的,尽量保持空气流通,防止热点,并避免使用过多的电力;滑动抽屉和柜货架可以帮助空气的流通;底盘和安装服务器机柜可以防止热量集中在地面上,等等。另外,假若与外单位合用一个办公楼,可以考虑共享同一数据中心,或者可以安置同一服务器空间,在不涉入保密、安全的情况下,可以共享相关资源。

4.2 保持冷却系统高效节能

服务器空间系统要想高效、环保,必须保持数据中心高效的冷却系统。除了使用地砖,通风口和安全板分离组件和防止热量积聚,也可以使用空面板使电缆绝缘限制热量损失。通过使用风扇和传感器,冷通道之间可以有不同的服务器机架,可以安装到机柜的外部或内部,或者可定位在墙壁和服务器上面,以保持一致的温度。另外,正确安装监测传感器,定期在重点时限通过实时监控不同部位的数据中心的温度水平和湿度水平,并根据自己的需要随时进行调整。环保的数据中心的最佳实践包括密切监控环境条件,知道何时进行小的调整,何时进行系统整体的调整。这取决于如何设置机房的温度水平,如果机房一直变得干燥或太潮湿,需要做出调整。如不这样做,可能会导致服务器的永久性损坏,以及网络故障。也可以通过设置服务器的低功耗模式,在不使用时节省数据中心的资源。

4.3 数据中心合情优化整合

通过虚拟化将一些个别服务器整合到一台单一的服务器,然后让不同的虚拟服务器运行在一台单一的电源,在一个网络内可以执行各种工作。一台服务器的电源实际上的使用情况与多台虚拟机同时运行没有太大的不同,从而也就意味着,可以节省出更多的数据中心空间。另外,可以考虑将云计算作为一种减少物理数据中心需求的方式。数据备份、应用程序和虚拟服务器可以通过外包远程运行,仍然能够访问和更改数据,而无需维持全面的数据中心。虽然有些企业可能更倾向于将数据保存在企业内部,但如果企业的数据存储需要已经超出了企业的电源承受能力,同时又不希望扩大数据中心空间,云服务是至关重要的。还可以将一些云存储与更小、更高效的数据中心结合起来。从而确保未来的数据中心更有效,更好的保护环境。其实,数据中心能耗的快速发展并不是产业发展的正常结果,而是由不合理的规划、设计和使用所造成的。以制冷为例,制冷每消耗1W电力,至少可以带走3W IT设备所产生的热量。但在实际应用中,超量制冷是普遍存在的问题,国内大多数数据中心的PUE在2.6以上,即便如此,局部热点所导致的数据中心故障时有发生。要想合理利用资源,高水平的电力管理必不可少。要遏制飞速增长电力消耗,就需要对基础数据有一个清楚了解,越详细越好。

[1]姚贇.欧洲数据中心节能新技术[J].电气应用,2011(11):3.

[2]欧盟推动”欧盟”云计算技术研发[EB/OL].http://news.xinhuanet.com/tech/2012-11/08/c_123929196.htm,2012-11-08.

[3]何毅.提高数据中心效率的几个能效管理措施[BE/OL].http://article.pchome.net/content-1591531.htm l,2013-02-25.

猜你喜欢
小型机双机虚拟化
双机、双桨轴系下水前的安装工艺
基于OpenStack虚拟化网络管理平台的设计与实现
双机牵引ZDJ9道岔不同步问题的处理
对基于Docker的虚拟化技术的几点探讨
Loader轴在双机桁架机械手上的应用
民航空管大数据存储下AIX服务器快速恢复方法
H3C CAS 云计算管理平台上虚拟化安全防护的实现
Oracle集群常见故障三例
存储虚拟化还有优势吗?
小型机:背水一战