马海青
摘 要:云计算技术在一定程度上能够解决信息系统建设和运维过程中存在的问题,但其技术特点决定了引入云计算技术后运维模式无法照搬现有模式,运维模式面临转型。本文针对云计算环境下的IT运维管理模式进行了探讨和分析,提出了云计算环境下的运维体系和运维管理模式,以期不断提高运维质量,实现高效的运维管理。
关键词:云计算;IT运维;管理
引言
云计算是一种基于网络的计算服务供给方式,它以跨越异构、动态分配的资源池为基础,为用户提供可自治的服务,实现资源的按需分配和按量计费。云计算推动了信息资源的规模化、集中化,促进了IT 产业的进一步分工,IT 系统的建设和运维集中到了云运营商侧,使企业可以专注于自身的业务,从而提高信息化建设的效率和弹性,提升企业的集约化水平。
一、云计算环境下IT运维面临的挑战及应对
与传统的IT运维服务管理相比,大多数基于云计算的运维服务管理出现了三大转变:首先变分散管理模式为集中管理模式,原本分散在各地的大量运维服务工作集中到了云端;其次,变复杂为简单模式,用户可以在任何地方通过任何智能终端访问业务数据,进行业务开展,减少了大量繁琐的终端维护;第三,变技术导向为流程导向型,云计算的运维服务管理人员不再是简单地从IT部门的角度考虑如何解决故障,而是从业务的战略高度考虑如何服务,不再是“我能为IT做什么”而是“IT能为我做什么”。
云计算给企业带来业务便利性的同时,也给运维服务管理带来了新的问题:企业的业务系统集中在云端,势必所有的业务活动都依赖于云的稳定运行,任何意外灾难的发生都有可能带来不可估量的损失,后果非常严重。确保云计算的正常运行是对IT运维服务管理的重要挑战,也是企业成功应用云计算的重要保证。
(1)IT运维服务体系需要调整。首先需要解决的是部门内各专业室、跨部门甚至是跨单位的条条框框管理的问题,这需要政策导向和相应的规章制度及流程来约束,同时还必须理顺维护组织架构、明确维护职责及分工以及梳理相关维护流程等。
(2)安全性要求高。云计算平台的安全问题,除了包含业务平台存在的传统意义上的安全问题(主要包括主机安全、网络安全、业务和数据的安全、运营管理安全等)以及业务平台的可靠性和可用性之外,还包括由于使用虚拟化技术带来的安全问题,如虚拟化技术漏洞风险、资源共享后的剩余信息保护等;如果云计算作为一种商务模式提供给用户使用,那么站在用户角度可能还将考虑更多的安全问题,如运营商提供的网络是否安全、提供的存储是否安全、数据是否会泄密、是否会侵犯用户的知识产权及隐私、用户账号是否会被盗用等。因此,建造一个能安全使用、可靠、可信、安全、负责任的云是个艰巨的挑战。
(3)IT运维效率需要提高。云计算的应用实现了对IT资源的集中管控,实现了自动的系统接入和维护,客观上减少了对维护人员的需求。同时,基于云计算的高效,负载监控可在性能发生问题之前就提前发现这些问题的苗头,从而防患于未然。
(4)资源规划、部署及管理能力要求高。相对原来业务平台独立建设、独立维护,云计算资源池化后,对资源规划、部署及维护管理能力的要求更高,平台集中后,一旦云平台发生故障,其影响的范围更大更严重,而云平台资源规划、部署的好坏将直接影响云计算平台高可靠性等功能的发挥,影响后续云平台维护的便捷性和系统的安全性。因此高级云资源规划、部署、运维管理人才是今后充分发挥云平台作用、确保云平台安全稳定运行的关键。
二、云计算环境下的IT运维模式
利用云计算技术池化部署资源及平台后,运维模式从传统的“烟囱式”垂直运维转变为横向共享模式,运维对象中增加了虚拟化管理层(含资源管理及服务管理)。为了应对云计算的虚拟、动态、自动化等服务要求,需要一个统一的运维管理平台,这个平台可以实现基于云服务的自动化运维、端到端监控等功能。基于云计算的IT运维管理平台使得用户和运维单位只关注服务层,不必耗费大量精力在云计算的网络计算和存储上。在自动化的服务管理结构中,业务需求通过云服务管理平台响应到基础资源上,基础资源对其进行相关联的资源部署,然后发送到相对应的底层硬件设备中,这样通过云服务管理平台就可以全方位调度硬件设备的配置,统一管理各种运维脚本,方便运维各环节复用,高效运维成千上万台主机。
三、云计算环境下的IT运维体系
随着近几年业务量的迅猛增长,云计算平台服务端的复杂性成倍增长,这对于运维来说无疑是个全新的挑战,因此,运维思路和方式必须随之发生改变才能适应现状。这种改变不是优化传统运维,而是根据云计算的特征来重构运维体系(见图1)。
3.1组织架构
云计算环境下的运维组织架构中应包含以下三个运维部门:
(1)职能管理部门:包括业务运营管理单位和业务平台运维管理单位。
(2)运维责任部门:包括云平台运维团队、硬件运维团队和业务平台运维团队。
(3)技术支撑部门:主要为第三方技术单位。
3.2运维岗位
云计算技术引入了虚拟化、资源管理、服务管理后,产生了云平台资源管理员、云平台操作管理员、云安全管理员、云平台统计分析员等运维岗位,其中云资源管理中的资源监控可独立为云平台资源监控员岗位。
3.3运维范围
业务平台运维:包括虚拟机操作系统及其上的中间件、数据库、应用系统、云运营平台等。
云平台运维:包括虚拟化软件、云管理平台、云监控平台等。
云平台硬件运维:包括服务器、网络、存储、安全设备等。
3.4运维管理制度及流程
云计算从服务的角度出发,在云平台操作系统与运行监控系统基础之上,关注如何将资源封装为可度量的服务,并让最终用户以最便捷灵活的形式按需使用这些服务。因此,资源管理、服务管理、用户管理、计费管理以及API接口管理等功能,依托于云平台的正常运营才能完成日常工作,运维管理模式转变为面向最终用户提供自助服务,以便实现按需自助服务的目的。
四、结束语
综上所述,云计算技术作为新型技术形式,将其应用于信息系统,既能创新系统运行模式,又能大大提高运行效率。同时,运维质量以及运维效果也会相应提升,这对云计算利用率提高、信息系统有序运行具有重要意义,此外,还会降低运维成本,提高运维经济效益和管理效益。
参考文献:
[1]赵志远,章继刚,季莹.智能时代下的IT运维[J].网络安全和信息化,2018(11):29-30.
[2]武佳宁.云计算环境下IT运维管理模式研究[J].信息技术,2015(08):51-53.
[3]李刚. 基于大数据及云计算的电务综合运维技术研究[D].中国铁道科学研究院,2018.
[4]. 2018年 中國企业IT运维管理市场报告[A]. .艾瑞咨询系列研究报告(2018年第3期)[C].:上海艾瑞市场咨询有限公司,2018:36.
[5]顾昊旻,陆宏波,窦国贤,刘江.云计算环境下的信息系统运维模式研究[J].价值工程,2017,36(35):155-156.