臧洪睿,杨婷婷,辛 颖,宋 健
国网吉林省电力有限公司信息通信公司,吉林 长春 130000
近年来,服务器资源组成云计算平台已成为电网公司信息系统基础平台发展的新热点,也是建设国际领先的能源互联网企业信息化的基础和保障。在电网公司信息系统的运维过程中,云资源的管理一直是件非常棘手的事情。以往的运维模式已越来越不适应现代化社会发展需求,电网公司信息化发展和运维工作人员的技术水平之间的矛盾也逐渐凸显。过去信息通信运维状态下,跨部门及组织需要长时间沟通,总体处事效率较低,自动化运维水平不高等问题较为突出[1]。如何简单且有效地管理公司云资源,形成基于云计算环境的信息系统配置智能发现及自动管理体系成为电网公司目前亟待解决的难题。
近年来,电网公司信息设备、系统均在不断升级,对系统服务质量也有了更高标准的要求。在这种情况下,运维工作若采取以往的人工手段,则会导致电网公司信息化建设和系统运维工作之间的矛盾越发突出。具体而言,系统运维还存在以下不足。(1)系统巡检工作质量不高。网络及信息系统架构比较复杂,机房、设备及信息系统的巡检需要耗费许多人力资源,工作成本非常高。(2)设备自动化运维辅助方式不多。现阶段,业务系统从建设到维护仍然选择以往的人工运维手段,缺乏自动化的现代化部署配置及资源的智能化调配工具。(3)运维人员工作难度较大。由于维护系统涉及的知识内容广泛,不仅要懂得以往的运行方法,还要了解新系统的运行维护技术,这无疑给运维人员增添了较大的工作量,使得其工作强度大幅增加,并且带来了较大的挑战,这要求系统管理员不但要加强业务知识的学习,认真做好系统运维工作,而且应充分利用业余时间了解及学习系统架构的各项说明,以更好地掌握工作技术要领。
由此可见,电力系统的建设和运维两者间的矛盾加剧,这需要相关部门结合系统的具体需求及问题来强化信息系统自动化运维体系的建设,尽可能确保系统实现自动巡查、规范部署,以及配置、监控、资源调度的自动化,不断提高运维管控水平[2]。
电网公司系统运维自动化需要分阶段完成,以解决自身实际问题。随着信息通信融合的发展,信息通信运维建设的监控系统越来越多,在监控运维工作的时候应尽可能减少系统之间纵向接口数据的传输频次,规避数据存储差异,选择规范的数据格式,使得模块化的数据分析及展现设计有所增加,给予种类繁多、内容充沛的途径,从而确保运维系统能够较好地对工作开展情况进行监督管理。此外,要求做到对监控业务系统实施灵活性的资源协调使用及故障自动维修,以确保业务监督管理的规范化及流程的可靠性;要求硬件资源、软件资源与信息系统越来越集约化,在降低运行维护成本的同时,进一步增强运维能力[3]。要达到这些要求,就必须选择自动化的形式进行运行维护,提升电网企业运维管理水平。
此阶段主要是结合运行资源管理对象清单,不断对资源对象目录进行补充及更新,使资源对象的编码所代表的意思、所用的格式等相关资料均比较清晰,同时对资源对象进行科学、规范管理。总结归纳编制数据的采集标准,它大致涉及运行采集、告警及应用性能采集三个方面,还需要确保数据定义、精准性等相关语义信息保持一致,为电力系统运行维护自动化工具之间实施数据交换提供便利条件[4]。现阶段,系统业务流程已由起初的信息系统管理途径逐渐朝着以信息技术为主的服务管理方式转变。
此阶段是以CMDB配置管理和分层建模为主要方式来实施的。配置管理数据库(CMDB)是将IT基础架构中的全部属性均当作1个配置项,可以更改及定义各个配置项的属性,各个配置项的属性数据与修改、消息等管理信息资料均具备相应的业务关联性,需要认真分析并加以处理,同时需要在存储标准库中阐释。CMDB能够有效阐释管理属性,凭借业务逻辑的关联性可以给予明确的分层模型,最终为电网公司的长期发展给予可靠的决策指导[5]。此外,CMDB和自动化维护服务对象给予的程序均可以进行有机融合,最终为运行维护的持续、稳定运行带来可靠保障,让CMDB起到有效作用。CMDB主要凭借有关逻辑业务程序来确保数据的可靠性,以确保运行维护各个环节的协调合作,最终确保运维工作的智能化开展。在项目实施时,CMDB通常被看作建立运行维护程序的重要前提,运维项目是否在公司中得到普遍推广,和项目初期构建的CMDB配置管理具有十分密切的关系。在后续推广时,还需对CMDB已形成的标准及运行维护的具体情况给予变更申请,凭借充足的配置项对当前运维服务的业务流程进行逐步优化及健全,建立自动化分析处理机制应用情景,完善业务逻辑,节约运维时间及人力成本,提升系统运维准确性及服务效率。通过微应用的途径使运维工作流程化,尽可能地消除或者减少系统运维的不确定性,节约处理的时间,确保运行维护项目可以及时交付。此外,可以应用可靠的资源来增强运行维护的有效性,确保资源的智能化配置。与此同时,结合面向服务及延伸的体系,不断改变工作人员的工作方式,确保项目业务的安全、可靠运行,同时在较短时间内满足持续变化的业务需求。
通常,电力信息系统运维工作会涉及系统实时出现的流量存在较大的变化、应用需求更新速度比较快、组网及应用环境越来越烦琐、开发形式越来越多等困难,以及系统安全稳定、运维效率、系统成本、系统体验等相关问题。在系统运行维护服务时,若已经具备一定数量的运行维护服务器,那么运维工作人员就应该及时改变思路,不能再一味注重设备运维服务,而是要逐渐加强业务系统的运行维护。
公司的自动化维护技术架构涉及自动规划、自动监控、工作状态及业务逻辑四个部分,可以较好地反映信息系统及业务系统的协调联动机制,重视体现业务逻辑的内在性、业务流程的标准化及自动化分析处理,以构成完整的业务支撑系统。自动化运维系统有利于对网络设备、操作系统、中间件及数据库实施自动化基线检查,在开展此项工作时,主要结合现有检查模板进行,也能够自定义。公司的自动化维护技术支持基线配置数据采集,既可以采用人工方式进行一键式采集,也可以自动化采集。数据采集能够借助远程协议来实施,不用在目标系统上设置代理。自动化运维服务系统能够对挖掘的数据进行科学剖析,在较短时间内帮助用户找出不符合规范要求的配置项,同时可以借助“机房—业务系统—设备—配置项”的模式,逐层展示异常配置项内容和受到相关影响的区域,即业务系统、机房或设备。自动化运维管理系统具有账号的统一管理、身份认证等功能,可将业务和运行维护工作进行有机融合,实现自动化分析处理及资源的灵活调度。自动化运维管理系统可以通过账号申请、账号自动搜索、账号自动修改密码、账号智能化检查、账号风险管理等功能,还可以对公司全部的设备账号实施精细化的管理,使公司设备账号时刻处于安全状态。同时,自动运维管理系统还可在冗杂的业务工作中灵活调配运行资源,并在使用资源出现异常情况时智能化分析其造成的影响,借助系统将处理方式上报至业务处理部门。
随着计算机信息技术的迅猛发展,电力系统信息化建设已经成为电网公司发展的重要方向,给电网公司与社会大众带来了极大便利。但电力信息化在带来极大有利条件的同时,也面临一些安全隐患,无论是黑客的恶意破坏还是工作人员在运维中的不规范操作,均可能会给电网公司带来无法预估的损失。因此,电网公司越来越重视信息系统的建设与维护。文章根据电网公司实际环境,探讨了自动化运维安全管理系统的技术结构,实现了对电网公司信息系统的自动化运维管理,最大限度地降低了电网公司在信息化建设与系统运维过程中的安全风险。