陈晓健
摘要
信息技术的发展日新月异,移动互联网技术也日趋成熟。智能电网建设工作如火如荼,利用先进的信息技术来更加有效的助力业务发展已经成为行业共识。本文提出的一体化资源云管理平台旨在借助最新的云计算、虚拟化和自动化调度技术最大程度上提升电力信息系统运维效率,更好的支撑业务的发展。
【关键词】云计算 资源调度 资源管理平台
1 前言
为适应时代的发展及业务数据处理能力的提升,各种高新技术不断到被引入到电网信息化建设的各个环节,以支撑电网信息中心各个核心业务系统的安全稳定运行。随着云计算、虚拟化等技术的逐步推广应用,传统运维的IT架构和服务管理方式产生了巨大变化。借助新技术,通过快捷的计算资源和存储资源供给,安全可靠的网络访问,才能更好的支持电网业务不断向前发展。
2 现状分析
目前电力企业信息系统的建设已经颇具规模,各类支撑信息系统的IT基础设施的种类、数量快速增长;信息系统的业务应用范围、用户数量、信息系统数据量等也在迅速扩大。随着电力企业信息系统的建设步伐越来越快,如何利用有限的资源,高效的开展运维工作,将是信息部门需要面对的巨大挑战。
3 需求分析
电力企业的业务系统众多,架构复杂,运维难度大。业务系统的安全稳定运行关系国计民生,需要信息系统提供有力支撑。因此电力企业迫切需要借鉴先进行业经验,以应用系统为核心,提供跨平台支持能力;自动发现和纳管IDC各类软硬件资源,并根据业务发展需要灵活调配资源;通过自服务界面改变资源供给方式,采用自动化部署技术提升各种IT组件的部署和统筹管理能力。
3.1 服务器自动化部署
(1)支持主流操作系统平台的自动化管理(Windows/UNIX/Linux)。
(2)兼容多种虚拟化技术,统一纳管各类主流虚拟化平台。
(3)支持资源自动化发现与代理程序Agent自动安装支持无代理模式的资产扫描。。
(4)支持资源管理静态分组,或者基于查询的动态分组。
(5)支持手动添加资产信息和关联性管理。
(6)能够提供丰富的的报表模版,同时提供便捷的报表自定义和导出功能。
3.2 应用的自动化部署
(1)支持软件分发、部署,补丁管理,合规检查以及常用的自动化管理操作。
(2)提供软件定义和软件配置模板,通过模板方式灵活定义软件包与硬件、操作系统和其他软件之间的依赖关系,以及软件包静默安装所需的配置参数。
(3)提供自动化部署流程实现软件的安装、卸载、启动和停止等操作,提供工作流编辑工具,灵活的实现应用软件部署工作流的更新和编辑。
(4)层次化数据传输结构,在文件服务器和发布终端之间部署管理库,进行软件包存储转发和资源控制,實现数据包快速传输和动态交付。
3.3 自动化服务管理
(1)支持资源申请预定。在资源实际投入使用前,资源以瘦供给的方式给出,不占用平台的实际资源,有效提供资源利用率。
(2)支持资源全生命周期管理,及时回收资源。资源使用期限之前,系统提前一个星期通知系统管理员续期资源。如果续期,则更新系统资源使用记录。如果没有及时办理资源续期,系统资源默认会被管理平台作自动归档处理,相关业务关停;但等待90天后相关虚拟服务器和数据才会被彻底删除,以便审计或回溯使用;在此期间原用户可重新续约资源。
(3)提供软件介质和镜像模版管理。在虚拟化管理环境中,用户所申请的服务(基础架构服务、平台服务、软件服务)需要符合电网企业的标准化要求,例如软件版本和操作系统镜像。通过标准的介质和镜像供给,保障平台的标准化水平,有利于提升平台稳定性。
(4)提供客户自服务菜单以及标准化的服务目录。服务目录是资源管理平台可供给资源的集中展现。通过将计算资源标准化,以服务形式提供,以标准套餐的方式展现,降低平台的使用门槛,提升用户体验。兼容平台各类业界通用的虚拟化标准,包括KVM,Xen,VMWware,PowerVM等。
一体化资源云管理平台支持高可用性,以保证管理平台的连续稳定运行,在管理平台的某些设备故障时,保证管理平台的服务不中断。
4 建设思路
—体化资源云管理平台的建设,采用分布式、可扩展的技术架构,开源技术和商业产品并重,x86和UNIX兼容并包。有机结合各种软硬件资源,创建一个稳定、高效、安全的一体化服务平台。平台架构如图1所示。
从基础架构硬件管理层面,一体化资源云管理平台可以分为服务器、存储、网络等三部分。根据处理器架构的不同,分为标准机架式X86服务器和非开放平台的UNIX小型机等。存储资源包括主流的EMC和IBM磁盘阵列,以及少量的虚拟化存储资源。
在软件及应用管理方面,首先需要针对基础架构的各种虚拟化管理模块(如VMware、Hyper-V)、监控模块、配置管理模块、备份/恢复软件等,通过工作流处理引擎驱动。另外还需要安全套件满足电网安全合规管理要求。各个软硬件产品的关系如图2所示。
4.1 服务器资源池的搭建
服务器计算资源作为整个资源云管理平台的基础,借助业界主流的虚拟化技术进行资源整合。对于纳入平台管理的x86服务器,一般将型号和配置相近的服务器绑定为一个或多个相对统一的资源池,即所谓的计算资源池;技术层面一般采用VMWare、kvm或Hyper-v等虚拟化套件具体实现。而对于高配的UNIX服务器,单机性能强焊,RSA特性出众,往往可以作为一个独立的UNIX资源池进行管理;业界一般采用IBM PowerVM或hp vse技术实现。计算资源池化后,再按照不同的业务和用户需求优先级,以虚拟服务器VM的方式供给,用以支撑不同级别的业务应用;例如一般普通的应用服务器采用x86资源池,负载较低,部署快速;而数据库服务器对性能和稳定性要求较高,一般建议使用IBM PowerVM技术的高端计算资源池,即兼顾性能和又保持一定的灵活性。
规划计算资源池首先需要评估资源池的规模,评估纳管的计算资源总体情况,梳理各类服务器的配置,确定分类分级,定制资源池建设策略。资源归类的依据一般可以参考计算机的出厂年限,中央处理器架构、核心数量、工作频率、内存资源、机房物理位置等来综合考量。为保障故障时的高可用切换,对虚拟资源池管理平台而言,属于同一个资源池的不同服务器,可视为一组可互相替代的计算资源,以便减少资源浪费,同时确保故障时计算资源的切换平滑。最理想的情况是新购一批同一型号配置的新服务器组建成核心计算资源池,而企業现有的配置参差不齐的服务器可以利旧使用,组合为测试资源池,物尽其用,更好的满足不同使用用途。
计算资源池的规模并非越大越好。一方面是机房限制,如果所有资源池中的服务器放在同一个机房,出现UPS或空调之类的动环故障时容易影响整个平台的可用性。如果单个资源池太小,无法提升资源的利用率;如果单个资源池的规模越大,可以为平台提供更大的灵活性和容错性,同时要求更高的运维水平支撑。
对于重要级别较低的应用,可以分配利旧资源池,虽然故障率较高,但仍然可以提供比单机系统更高的可用性。对于重要应用,例如营销系统、人力资源系统等高级别的核心系统则尽可能地放在独立的新建资源池内,搭配高端的磁盘阵列设备,并配备专家工程师和值守人员。
4.2 以太网组网
计算资源池计算资源密集,网络流量集中,对内和对外的通信压力比普通服务器更大。网络作为基础通信设施,在进行组网规划时,主要考虑其连通性、隔离性、安全性、服务质量(QoS)等,保证整个一体化资源云管理平台的稳定运行。
为了提高系统抗风险能力,网络安全方面的考量必不可少。资源平台中的服务器和业务众多,通过网络隔离,确保非必要的网络通信相互隔离,网络通信不可达,确保网络安全。
网络连通是最基本的要求,将有需要进行互相通信的组件一比如平台和服务器之间、服务器与服务器之间,以及服务器与互联网等控制节点、用户客户端等的网络连通。随着千兆乃至万兆网络普及,资源集中带来的网络带宽压力有所减缓。
QoS网络服务质量则需要考虑每一个业务应用的重要程度,确定其优先级,确定业务对网络带宽的要求和实际产生的数据通信密度,根据实际情况合理规划,灵活调整。最大程度上用有限的资源错峰使用网络带宽,确保重要业务应用或者系统作业的网络需求优先得到满足。
通过不同的VLAN,可以简单快速的实现所期望的网络联通和隔离。在研究确定了不同业务应用和系统作业的网络特性和优先级后,为高级别的应用或者高数据通信密度的应用或作业划分到专用的独立VLAN上或者物理交换机上,以保证网络服务质量,并降低对其他业务应用和作业的影响。
4.3 存储资源池的搭建
不同的磁盘阵列性能容量差异很大。先确定业务应用重要程度、繁忙程度,对存储性能和可靠性的要求。对于核心应用系统,原则上必须分配使用高端存储资源池,采用高端磁盘阵列,兼顾性能和安全。而对于测试系统、网盘系统或边缘应用系统,对容量和灵活性要求较高,对存储性能要求较低,则应该考虑为其优先分配主机内置磁盘空间,采用SATA近在线磁盘,或采用利旧存储虚拟化方案。
数据无价,对于核心业务应用特别需要考虑存储级别的备份,以及节点故障时的数据冗余,确保数据安全性。关键应用生产系统配备高性能的SAN存储。采用成熟的IBMPPRC或EMCSRDF存储复制技术实现双存储复制实时同步,防止存储系统成为单点故障,如图3所示。
4.4 自动化流程处理引擎
一体化资源云管理平台的各个功能组件相对独立工作,但如果要完成连续性业务操作,可能需要切换不同的模块,过程冗长繁琐,效率低下容易犯错,所以自动化流程处理引擎的驱动能力必不可少。通过接口调用,将各个功能模块整合在一起,将一系列原子操作整合成完整的业务动作,统一展现给平台的管理员和最终用户。从逻辑上看,流程处理引擎的功能可以用图4表示。
5 结束语
综上所述,建立与电网公司信息化发展相适应的云计算资源管理体系,打造一体化资源云管理平台,必将有效提高IT资源的运行维护效率,实现IT资源的快速交付,敏捷响应各种业务需求,保障业务系统安全稳定运行,从整体上提高电力企业的IT服务交付能力和管理水平。
参考文献
[1]张小庆.基于云计算环境的资源提供优化方法研究[D].武汉理工大学,2013.
[2]王庆霞.浅谈IT运维管理的应用与实践[J].信息安全与技术,2012.
[3]虚拟化与云计算小组.虚拟化与云计算[M].北京:电子工业出版社,2009:133-135.
[4]马良.IAAS云计算平台中资源管理和调度技术的研究[D].北京邮电大学,2013.