运营商IT 云资源池节能及效率提升方法研究

2023-01-07 07:23李红双孙淳晔赵秋爽
广东通信技术 2022年2期
关键词:机房利用率服务器

[李红双 孙淳晔 赵秋爽]

1 引言

随着运营商IT 云资源池集中化部署进程的推进,IT云资源池的规模在不断扩大。以移动公司为例,全国IT云资源池现网已部署了10.7 万台服务器,而且在以每年3万台的规模增长。资源池不仅对机房空间和电力资源提出了巨大需求,同时也带来了建设和维护成本的巨大投入。目前IT 云资源池存在的共性问题是数据中心PUE 较高,设备利用率普遍偏低。各省公司省内资源池还存在大量偏低性能的服务器在线运行、服务器重复计算、数据重复存储等问题,这些都在阻碍企业集约型发展。在国家大力提倡节能减排、降本增效的背景下,运营商有责任和义务响应国家的号召,贡献自己的一份力量,同时从企业发展角度来看,也是百利而无一害。

从技术角度分析,随着技术的发展,X86 服务器及存储的性能在不断提升,功耗也在不断降低,以及随着分布式计算、分布式存储、容器、虚拟化、人工智能等技术的成熟,淘汰落后产能提升设备利用率,降低设备能耗,采用智能手段提升运维效率均变的可能。

2 IT 云资源池存在的主要问题分析

从IT 云资源池部署的机房环境、资源池硬件配置及使用、资源池管理以及在IT 云上部署的上层应用等多个层面进行分析,目前IT 云资源池还存在以下主要问题:

(1)机房环境方面

目前省内IT 云资源池部署的机房普遍存在PUE 值偏高,空调对电力资源消耗较大,存在机房空间布局不合理,机柜利用率低,标准化程度差的现象,同时还存在业务已经下线但设备仍在占用机柜及电力资源的现象。

(2)资源池使用方面

从目前IT 云资源池的使用来看,存在整理资源利用率低,云化程度差,资源分配不灵活,缺少智能的节能措施和工具的问题。同时功耗高、性能差、故障率高的设备仍占有较高比例。

(3)云管平台方面

目前云资源池整体缺乏智能的运维手段,自动化程度低。应用部署、资源监控、资源分配各自为战,没有形成有机统一。

(4)上层应用方面

目前IT 云资源池虚拟化的进程推进较慢,虚拟化的应用范围还有待扩大。上层应用微服务能力弱,存在设备资源独占的现象;应用系统功能臃肿、繁多,系统间共享能力差,存在功能或接口重复开发,数据重复计算及存储的问题。

本文将结合以上几个方面IT 云资源池存在的主要问题,逐一进行分析,寻找节能及效率提升的方法。

3 IT 云资源池节能及效率提升方法

3.1 机房配套节能措施

(1)选用合理的空调送风方式

目前数据中心常用的空调送风方式包括:精密空调+地板下送风(封闭冷通道)、热管背板空调、列间空调(封闭热通道)等。每种送风方式适用于不同的场景,根据资源池设备部署及配置情况,选用合理的空调送风方式,可以提高空调的制冷效果,达到节能的目的。

精密空调+地板下送风:这种送风方式的优点是精密空调风量大、焓差小,地板下送风方式送风均匀;采用封闭冷通道,由于模块内外冷热通道的气流互相分隔,冷量得到有效管理,避免了气流短路,制冷效率高。这种送风方式适用于设备布局均衡、散热均匀、地板密闭性好的云资源池机房。

热管背板空调:这种空调更加靠近热源制冷,直接吸收IT 设备热量,制冷效果较好。由于冷却盘管安装在机柜背面,增加了机柜深度,占用一定的机房空间,存在对大功率设备机柜制冷效果较差的缺点。这种空调适用于单机柜装机密度低,单机柜散热量小的资源池设备机房。

列间空调:列间空调气体输送距离短,风机功率小,紧靠热源,属于近距离送风回风,制冷损耗小,可实现近端制冷,从而降低能耗,降低整体的PUE 值。适用于于装机密度高的云资源池机房。

(2)机房配套辅助节能措施

在选用合理的空调送风方式后,还可以采用以下几种辅助措施,提升节能效果。

①适当提高机房温度设置参数值:在数据中心温度要求范围内,通过适当调高空调回风温度设置参数,使冷通道温度接近机房温度要求的上限值,来降低空调总的送冷量,降低空调的能耗,达到节能的效果。[1]

②采用光纤测温技术+空调智能控制系统实现精确送风、按需送冷:通过在机房内采用光纤测温技术,结合后台的空调智能控制系统,对空调送冷量进行智能控制,实现按需送冷,精确送风,提高空调的使用效率,避免冷量浪费,达到节能的效果。

③机房热回收:通过在机房回风口安装热交换器或其他热回收装置,对采集的热能用于办公区供暖或其他应用,对服务器产生的热量有效利用,达到节能的效果。

(3)优化机房空间布局

对业务进行整合或迁移,按照新的数据中心规范要求,对老旧机房进行改造,优化机房空间布局,提高机房装机率,充分利用机房空间资源,降低机房建设成本;加快老旧设备下线,对已下线的设备及时提请报废,腾退空间及电力资源;更换新的电源系统及空调,提升制冷效果,节约电力资源。

3.2 优化资源池配置及使用

(1)优化资源池配置

随着X86 服务器性价比的逐年提升,建议对现网资源池资源配置进行优化,淘汰落后产能。

积极去“I”:对现有低效、高耗能、高维保的小型机设备进行替换,提高X86 物理机、虚拟化、容器化比例。

稳妥去“E”:逐步对高维保、扩展性差的传统存储进行替换,提高分布式存储及全闪存储的使用比例。

加快老旧设备退网:采用新集采高性能的X86 服务器替换集成度低、性能差、故障率高的老旧X86 服务器,减少在网X86 服务器数量,降低能耗及机房空间占用。

选用合适配置模型:选用恰当合理的服务器模型,避免高配低用,提高设备利用率。

推进国产化:适当扩大国产高性能X86 服务器的应用范围,降低单位业务量设备投资。

数据中心总耗电量的测量可将M1点和M2点测得的耗电量相加。大多数数据中心的供电系统会配备柴油发电机,作为应急备用电源,而柴油发电机工作时也会带来电能的损耗,该损耗不能被忽略。因此,数据中心总耗电的测量应包含市电和柴油发电机两部分。而数据中心中往往会附带一些配套设施,如办公,这部分功能所消耗的电量不应计入PUE的范围内,因此M4点测出的电量应以扣除。

试点服务器定制化:结合业务特性,试点引入定制化配置的服务器,提高服务器的使用率。

(2)提高虚拟化比例

根据IT 云资源池现状分析,物理服务器整体的资源利用率偏低。通过扩大虚拟机使用范围,提高虚拟机占比,可以达到整体减少物理服务器配置数量的效果,实现资源池节能。

提高超分比:适当提高虚拟机的虚拟整合比和CPU超分比,分配更多虚拟机,提高资源共享比例。

促进业务上云:对上层应用进行梳理,制定一套业务上云的流程措施,包括:业务系统现状分析、业务资源建模、业务上云申请及资源分配、资源监控调优等,积极引导业务平台优先选用虚拟机部署,适当对业务平台进行云化改造,提高设备利用率。

(3)引入智能节能手段

采用智能的手段,实时监控业务运行规律及设备利用率,在不影响业务应用的前提下,适当对服务器耗能组件包括CPU、内存、硬盘等进行节能梯度档位调整,通过降低部分器件频率、电压或采用关停部分器件运行等操作,达到降低设备功耗的目的[2]。

3.3 建设智能化云管平台

搭建智能化运维的云管平台实现对硬件资源的统一监控、精细管理和智能运维,从而提高设备利用率、降低故障率,达到节能的目的。云管平台需具备以下功能。

(1)资源按需分配、动态调整

引入弹性伸缩服务,根据预先配置好的策略自动调整业务所需的计算资源,在业务需求高峰增长时无缝地增加云主机,业务需求下降时无感知地收回云主机,通过自动化方式提高资源利用率,减少过度分配带来的资源耗费。

(2)闲置资源自动回收

可通过设置阈值的方法,实时监控服务器的CPU 和内存的使用率,对长期低于使用率阈值的设备启动资源回收机制,及时回收,避免资源浪费。

(3)业务错峰部署,资源削峰填谷

云管平台可通过分析各业务系统的波峰,在不影响业务的前提下,通过拉长业务处理时间,将业务集中处理进行分散,来降低业务系统忙时峰值,缩小对硬件资源的需求量,降低硬件投入;或者采用将各业务系统的峰值处理时间错开,避免峰值集中带来的大量资源需求,缩小服务器峰值时间利用率和平均利用率的差距,来确保资源能够合理利用。

(4)对资源全生命周期管理

云管平台建立从资源申请、需求评估、资源分配、运行监控、资源调度到资源回收等端到端的闭环运营管理流程,对资源进行全生命周期管理。避免资源一次性分配、多次扩容、永久占用而导致利用率低的问题。

同时建立后评估机制,云管平台定期对业务系统资源使用情况进行后评估,进行综合评价,制定资源回收、下线标准,从效益上提高平台建设的科学性、合理性。

3.4 上层应用节能措施

通过对由IT云资源池承载的上层应用平台进行优化、整合,可以减少对硬件资源的占用,从而降低资源池的投资,起到节能的效果。

(1)对上层应用功能进行瘦身

通过对上层软件平台功能进行瘦身,清理低效套餐、下线低效系统,打破应用系统只建不拆的弊端,推动使用率低、效果差的应用下线,腾出计算和存储资源,实现节能。

(2)应用平台整合,推动中台建设

通过对上层应用、数据解耦,沉淀业务、数据、技术的共性能力,以建设中台的方式实现能力复用、共享,推动上层平台整合,避免功能重复开发、数据重复存储、数据重复采集等问题,减少上层应用平台占用的计算及存储资源总量,达到节能的目的。

(3)优化软件平台、提升运行效率

软件平台功能之间流程繁琐、软件代码不优化、系统运行效率低等也是对计算资源浪费的主要原因。通过对系统软件功能、系统接口、调用流程、软件算法、软件代码等进行优化,提升运行效率,简化系统功能、由厚做薄,做到软件平台轻盈灵活,降低对计算资源的消耗,实现节能。

4 结束语

IT云资源池节能增效是一套系统工程,我们要避免“头痛医头、脚痛医脚”的管理方式,要从多方面入手,搭建好资源池运行的基础环境,做好设备选型,采用智能化、自动化的运维手段,优化上层应用,提高设备利用率,减少设备配置总量,避免设备浪费,从而达到节能的效果;同时需要跟踪技术发展,通过引入新技术、新方法来优化资源使用及运维,提升资源使用效率。

猜你喜欢
机房利用率服务器
一季度我国煤炭开采和洗选业产能利用率为74.9%
平疫结合的CT机房建设实践
2020年煤炭采选业产能利用率为69.8% 同比下降0.8%
服务器组功能的使用
理解Horizon 连接服务器、安全服务器的配置
浅谈广播电视播出机房技术操作与维护
2020年三季度煤炭开采和洗选业产能利用率为71.2%
基于VPN的机房局域网远程控制系统
PowerTCP Server Tool
传输机房安全操作和日常维护要点