在柴静《苍穹之下》的结尾处,有一个《对抗雾霾,我为空气做点事》的活动介绍,其中列出了大家能为减少雾霾而做出的简单有效的各项活动。作为一名IT从业者,我们虽然不会直接造成雾霾,但和我们相关的各种服务器、网络设备,包括整个数据中心,都在耗费着巨大的电量。节约能耗,就会减少煤炭或石油的燃烧,就相当于我们为现在雾霾天的治理做出了贡献。
能耗控制一直是数据中心建设过程中很重要的一项工作。对于大型数据中心运营商来说,巨额的电费已经逐步超过了基础设施投入,成为数据中心运营的第一大成本。为了达到这一目的,IT巨头们为此做了大量工作。集装箱式数据中心现在已经开始流行,因为其集中性和封闭性,加上良好的散热通道设计,可以令电力使用率大大提高。为了节能,有些公司甚至直接将数据中心建在了北极圈附近。合理的利用水冷也成为节能的一大利器。而对于我们大多数数据中心的使用者来说,这些技术无法直接使用。如何节约某台服务器的电量,或者直接降低服务器的数量是降低能耗的重点。通过运维工程师的观察监测,我们可以发现那些没有被充分利用的资源,然后通过更换低功耗服务器、数据迁移、虚拟化等技术来在不影响业务的情况下降低能耗。
通过运维工具如蚁巡运维平台,可以对服务器、服务器组的长期运行状况做出分析,通过数据来指导如何展开节能的工作。如果某台服务器的CPU占用一直较低,则可以考虑将其更换为基于ATOM的低功耗服务器(在服务器的可靠性满足需求的前提下)。如果一整批的服务器CPU都较低,或者CPU利用的高峰期是错开的,在内存和磁盘IO满足的前提下可以考虑用虚拟化技术将这些服务器尽可能地合并。同时,通过监测资源占用的变化趋势,我们可以更有序地购买新的服务器,而不是盲目提前下单。
在运维的过程中,对管理者来说遇到的一个很大的难题就是如何评判各部门申请的服务器或其他IT设备是否被充分的地利用了起来。资源的需求者往往会为了更好的保障而申请超出需求的资源数量(如硬盘空间大小、CPU计算能力、内存大小等)。这些在没有良好的工具支撑前,很难做出良好的判断。而通过蚁巡提供的数据,可以精确得出在一段时间之内,某组服务器的磁盘空间占用是高还是低,从而得出资源是否有浪费的现象。
通过蚁巡运维平台,可以直接查看服务器某项性能指标在一年内的资源变化情况。这对于了解什么时候需要更新硬件资源或者提前采取措施预防资源被耗尽有着很大的意义。例如,如图1所示,我们可以通过硬盘空间使用率变化曲线,来判断出几个月后硬盘的空间会达到一个危险值,我们必须在这之前采取措施,如更换更大的硬盘或者将数据转移到其他地方。
图1 硬盘空间使用率变化曲线
在企业实施了虚拟化之后,对虚拟机的管理也存在着同样的问题。通过蚁巡的界面,可以一眼看出来每台物理机上的虚拟机资源占用和利用情况,从而了解到虚拟机在申请资源时,有没有过高地提出自己的要求。例如,某台虚拟机申请了8G的内存,但实际内存使用率只有不超过3%,说明该设备申请了之后基本处于闲置状态,没有得到充分的利用。这时,就可以经过协商会回收该资源。
综上所述,通过蚁巡运维平台这个良好的运维工具,我们可以在管理多台服务器时,充分利用起已有的资源,不再有设备的闲置和浪费现象,从而更好地节约了能耗,也就达到了降低雾霾的效果。同时,节约的资源和设备也给管理者节省了大量的资金,达到了双赢的局面。
地址:山东省济南市高新区新泺大街1166号奥盛大厦1号楼27层
邮编:250101
电话:400-996-9796