姜晓涛 张梅
摘要:随着国家电网公司信息化建设步伐的加快, IT设备数量大幅度增加,日常运检任务也日益繁重,给运维管理工作造成极大压力。本文通过梳理电力信息网日常运维工作内容,并结合最新的自动化运维技术针对部分运维业务通过规范业务流程、建设自动化运维工具,为广大一线运维操作人员提供更加实用高效的运维手段,提升公司运检自动化水平。
关键词:电力信息网 自动化运维 信息运检
中图分类号:TP39 文献标识码:A 文章编号:1007-9416(2016)07-0254-01
随着国家电网公司信息化建设步伐的加快,公司IT管理已逐步迈入了云计算与大数据的时代,其管理对象已全覆盖包含网络、主机、存储在内的设备,温度、湿度、电源在内的机房环境,数据库、中间件、业务应用系统等在内的软件环境和业务环境,在实现设备集中、业务集中、数据集中的基础上,各单位在公司调运检体系的基础之上,也在积极探索高效的手段进行日常运维管理[1]。随着IT设备数量大幅度增加,日常运检任务日益繁重,运维人员数量有限,给运维管理工作造成极大压力;特别是随着设备数量的激增,目前已有运维人员已无法保质保量完成日常工作。传统运维带来大量繁琐、重复的工作,造成管理员大量低效劳动,运维成本居高不下[3]。
为缓解运维压力,提升运维效率,可通过建设自动化运维工具实现对服务器、网络设备配置的日常管理,实现对操作系统、中间件、数据库的管理,对业务系统的管理,对管理对象进行性能分析,形成闭环的IT运维全生命周期管理。
1 运检自动化建设目标
目前国网安徽省电力公司作为SG-I6000项目[2]三家牵头试点单位之一,紧扣“运检自动化”的命题,以项目建设和应用为切入点,积极参与并推动了系统的运检自动化功能设计、试用和实践工作。本文基于SG-I6000系统平台,开发自主开发运维自动化工具模块,支持日常运维工作,并在地市电力公司进行运行实践。结合电力信息网运维工作重点,运检自动化从日常巡检自动化、软件及补丁管理自动化两个方面逐步开展自动化运维活动。
其中巡检自动化以设备自动化巡检及配置管理为主要目标。(1)设备日常巡检自动化:检查设备及应用系统的运行状态,建立运行日常巡检标准基线库,自动化巡检采集信息与基线进行符合度检查,实现对用户操作规范的约束和对信息资源进行实时检查,实现服务器、数据库、中间件、网络、业务应用和客户端等目前人工巡检的自动化,减少手工操作。(2)配置信息的日常管理,包含抓取、备份、比对、回滚及变更。针对多个节点,当发布失败后,可以通过配置项的历史快照,将各个节点的配置项快速回滚到发布前。设备配置的配置控制确保只部署授权的软件和配置,最小化服务中断风险。
软件及补丁管理自动化实现软件及补丁的自动开通、自动安装(客户端、服务器)、自动部署、自动配置、自动扩容/缩容、自动发布等领域的自动化实现手段。通过基于策略的补丁、修复、更新和升级部署,实现对软件和补丁的自动化管理。
2 运检自动化工具建设实现
2.1 运检自动化工具技术路线
运检自动化建设主要为运检自动化工具建设,工具采用开放的C/S结构,根据业务需求添加扩展功能模块,实现不同区域的个性化运检需要。运检自动化工具的用户及权限管理由I6000统一管理,工具客户端根据I6000的权限设定生成操作界面,实现操作权限控制。工具技术架构见图1。
其中IT基础设施包括主机、网络设备、安全设备、数据库、应用系统、中间件等。配置采集从I6000系统中采集主机、网络、应用、安全等的配置,建立统一资源信息库,为运检自动化工具提供IT基础设施实时故障、告警、设备配置等信息。
工具服务端为客户端提供功能和数据支撑。通过在服务端建立用户和角色,搭建所需权限模型;通过对设备进行分组,从而确定操作的数据边界;通过功能扩展管理,可按区域需求对运检自动化工具进行个性化定制;通过日常工作台,形成每个操作人员每日工作展板,利用快速便捷掌握工作进度。工具客户端采用胖客户端模式,运检工作由客户端完成,主要完成巡检自动化、软件管理、补丁管理等业务需求。将日常运检工作封装为任务的方式,以策略的模式在客户端运行,处理从I6000获取的数据,之后将结果反馈I6000,同时将任务信息反馈,以便于后期进行运维综合分析。
工具可视化层面采用国网标准图元,设计用户操作界面,构造一个友好的操作界面。
2.2 运检自动化工具实现展示
运检自动化工具通过业务分类定制巡检页面,以棒状图、曲线图、气泡图等图形,实现了采集指标的自动告警,如数据库发生锁等待、队列等待等情况,运行监控人员可以第一时间通知数据库管理员;主机电源或风扇异常,运行监控人员可以第一时间通知主机管理员。图2为数据库自动化巡检图。
3 结语
通过运检自动化工具的研制与应用,信息调度可以全面准确的掌握网络、主机、数据库的运行情况及趋势,并迅速、准确地定位故障;结合软件自动化安装及配置,提高了信息运行人员的系统部署及管理能力,较好的提升了信息网运检的自动化程度,极大提升了运行质量和工作效率。
参考文献
[1]黄聪.电力信息系统运维管理自动化解决方案的构建[J].科技传播,2015年19期.
[2]黑龙江省电力公司开展SG-I6000顶层设计工作[J].电力信息化,2013年6期.
[3]寿增.调度自动化运维监管系统的设计与应用[J].电力信息与通信技术,2014年12期.