信息系统自动化运维平台的研究与应用

2019-06-09 10:35陈桐
世界家苑 2019年4期

陈桐

摘要:随着信息化进入人们的视野里,我们开始接触到这类信息并且感受到了这个应用的重要性。科技带动发展,信息化包括服务系列、云计算技术和大规模集群在内的都需要研究信息系统自动化运维平台的支撑研究,保证高效运行、资源合理分配、安全稳定性能极强占据主要地位。

关键词:信息自动化;运维平台;技术性研究

背景:随着信息化的发展,业务与信息系统融合日益紧密,保障信息系统安全稳定运行已成为确保生产经营业务顺利开展的重要基石。由于系统及设备数量众多、规模庞大、品牌型号纷繁复杂,缺少信息系统数据采集和自动化运维管理手段,对现有的系统基础资源缺乏有效监控和管理,使维护难度成几何倍数的增长,系统管理人员的工作压力越来越大。因此,如何改变信息系统运维现状,建立一套自动化运维管理系统,使运维工作由被动式运维转向主动式运维、由人工操作转向自动操作、由分散管理转向集中管控,进而提升系统整体运维质量,提高运维工作效率,已经迫在眉睫。

1 必要性分析

(1)系统巡检质量较低,重复性工作量大。机房、设备、信息系统巡检大量依赖人工,巡检频率和准确性都有待提高,巡检历史记录大量为纸质记录或者独立文档,难以得到有效利用。

(2)信息系统及软硬件平台异构性大。随着以网络、主机、存储的虚拟化为代表的云平台技术的发展,出现了传统主机存储架构和虚拟化分布式架构并行,虚拟化软件存在多种架构并存的情况,同时在信息系统建设过程中,更多的是考虑业务功能的实现,各套系统异构性很强,巡检内容、范围均有所不同,运维困难较大。

(3)云环境下运行环境复杂,运维难度高,运维操作作业自动化支撑不足。云环境下,运维的设备、资源、对象等数量大、技术难度高,如按传统手工排除故障、系统更新、部署、补丁下发等工作方式,费时费力而且非常容易出错;业务系统在云环境下的全生命周期管控缺少信息化工具支撑,无法对业务应用在云环境下的的一系列应用构建、部署、诊断、检修、监控、调控和优化等操作作业(服务)进行流程化、自动化和全程化管控。

(4)业务连续性保障支撑不足。由于自身业务系统中断,影响本业务系统用户正常使用,另外因为业务系统间的各种关联集成关系,会受影响的其他业务系统范围未知,被影响的用户群体未知。

2 业务需求

(1)主机利用率提升。随着资源池规模的逐步扩大,机房空间限制、虚拟化技术限制等问题日益突出,单个主机资源的利用率有待进一步提高,以满足单个主机能够运行更多的虚拟机的需要。

(2)运维效率提升。现有资源池业务应用系统部署时,存在大量重复的安装部署及配置信息系统自动化运维研究工作,业务系统的安装部署及配置过程有待简化。

(3)异构环境应用部署和迁移。业界采用Docker技术有效解决了运行环境差异化问题,使配置及发布更为便捷,同时DOCKER实现了更轻量的虚拟化,节省了虚拟机的性能损耗。当前资源池虚拟化架构,业务应用系统所涉及的操作系统镜像文件大,导致系统迁移部署复杂,尤其是针对异构平台的迁移,存在技术难点。

(4)业务系统拓扑关系梳理。现有业务系统大部分已在资源池中部署运行,业务系统以多节点或单节点的方式在资源池中的虚拟机上部署,而当资源池中某业务系统节点发生故障时,运维人员无法及时掌握此节点属于那个业务系统,并且无法明确与相关业务系统的逻辑关系,不能鉴别其影响范围,无法快速对相关业务系统作出应急处理。

(5)补丁分发与版本控制。由于当前沒有统一的管理界面及管理手段,在补丁升级、补丁版本回溯及准入校验时,没有相应的管理规范及监督手段支撑,往往采用运维人员根据以往经验进行相关操作,一旦出现问题,在追溯问题原因及解决问题效率上都有极大难度,费时耗力。

3 预期效果

(1)经济效益。通过云运维自动化技术的应用,将大量的运维工作都通过软件的方式自动完成,可有效降低运维工作的复杂度及运维人员的工作量,提升工作效率的同时大大降低了运维成本。

(2)管理效益。实现IT信息化运维自动化,提高业务系统性能、安全性及业务系统扩展性,提升运维工作的整体质量;将运维工作各个环节进行标准化、规范化,通过系统程序按照既定步骤自动执行,从而完成运维相关工作有利于公司建立标准化、规划化的信息化运维工作制度及工作流程。

(3)社会效益。服务意识由被动运维向主动运维转变,强化面向内外部用户服务意识,加强服务运维导向,完善系统分级服务水平,提供给用户全过程体验;通过云计算、虚拟化新技术的应用,推动专业发展的同时引领驱动公司发展。

4 信息自动化目标

(1)施行自动化的全面监控,对环境、设备、数据库等进行全面监控,形成一个可以不依靠有线连接起来的系统无论是数字集合还是其他方面,都会是自动化的。为不同的运维人员尽量提供不同地点的统一的工作平台,促进信息系统运维平台的研究与应用的科学化管理。

(2)自动化操作的关键是操作方案操作流程是否合理完整,我们通常会考虑运维的需要和对象的特性,然后根据这些决定如何绘制脚本、建立脚本库。实行运维操作,有一个方法就是可以通过可配置的惯性,将多个基本的运维操做连起来构成一个自动操作流程。为了完善录入的信息,我们采用客户端和非客户端这两种模式进行信息采集。对于服务器,那采集办法就是客户端了,对于储存设备,非客户端就是比较适合的选择了,利用远程访问来采集信息,这种方法受网络管理协议的保护,所以不用担心协议问题,所以选择适合的采集方法也很重要。

综上所述,本文基于电力系统及设备数量众多、规模庞大、品牌型号纷繁复杂、运维效率低下且管理难度大的背景,深入分析了信息系统运维自动化技术研究的必要性,在此基础上提出了电力信息系统运维自动化的业务需求,并对电力信息系统运维自动化提升带来的预期效果进行了分析和展望。随着智能电网的高速发展和革新,电力信息系统的自动化运维平台的要求越来越高。信息系统自动化运维平台的研究与应用将在日常运维工作中提高很大的工作效率,由自动化取代了手工化,不仅仅提高了效率,还节省了生产资金,而且,排除了人为的不定性因素,整体的可靠性也提高了,这种操作有利于及时的掌握信息系统和设备的运行是否正常信息。绑定运维操作标准,提高运维工作效率,为企业信息化按照所需要的要求迈进,信息自动化的优化与发展维护不仅仅只是一个维护的过程,更是一个管理提升的过程,是现代信息系统发展的必然趋势。

参考文献:

[1] 夏薇.企业信息系统相关自动化运维工具研究[J].电脑知识与技术,2018(07).

[2] 李婷婷.电力信息系统运维管理自动化解决方案[J].电子技术与软件工程,2017(01).

(身份证号:210106198702224930)