宋静 李可 李冬
摘要:随着电力行业信息化建设的高速发展,各种信息系统及设备让运维人员难以从容应对,自动化运维迫在眉睫。而标准化是自动化运维的基础,本文提出了针对信息系统标准化工艺检查的工具,设计并实现了信息设备资源管理、指标管理、数据采集、检查基线、标准化检查、异动告警等功能,从而降低信息系统建设与运维的复杂度,助力实现自动化运维。
关键词:标准化;自动化运维;检查工具
中图分类号:TP31 文献标识码:A 文章编号:1007-9416(2019)07-0142-02
0 引言
随着电力行业信息化建设的持续深化,云计算、大数据、泛在电力物联网等新技术的应用所带来的在设计开发、部署及运行模式、用户应用方式等方面的变革,对系统运行维护提出新的要求。对主机、数据库、中间件进行规范标准的安装、配置等操作,开展标准化运维工作,能够极大的提升系统投运质量,增强系统规范性,降低信息系统建设与运维的复杂度。
本文设计研发了一套贴合电力行业现状的信息系统标准化工艺检查工具,实现主机、数据库、中间件等管理资源的静态数据自动化采集、任务计划、基线对比、标准管理等功能。可以大大提升运维人员工作效率和质量,提高数据准确性,最终实现运维过程的标准化管理。
1 系统概述
信息系统标准化工艺检查工具是基于国家电网《信息系统安装部署标准化生产工艺指导手册》,并结合运维人员日常工作经验总结设计开发的一套配置核查工具。梳理了主机、数据库、中间件的数百项基础配置指标与采集方式,并建立了多个运维标准化工艺基线数据的模型,通过各类指标采集结果与标准基线的对比分析,生成横纵向分析报告,从而快速提升运维标准化水平。
2 系统架构设计
2.1 总体架构
本工具采用MVC三层架构模式,基础框架是SSH(Struts、Spring、Hibernate)的集成框架,基于国家电网统一应用开发(SG-UAP)平台研发,研发语言是JAVA,数据库采用MySQL数据库,ES大数据存储集群、Redis缓存集群。
2.2 详细架构
如图1所示,系统的运维对象主要是主机、中间件、数据库,具体的版本有:Linux、Windows、Tomcat、Weblogic、Oracle、Mysql六大类型资源。
本地数据存储由三部分组成,分别是结构化存储Mysql数据库,非结构化存储ES数据库、缓存数据库Redis。其中ES即ElasticSearch,是一个能够提供高并发、易扩展、高可用的分布式搜索引擎,能够为系统提供一个易于查询和共享的接口[1],在此工具中主要用于存储采集规则,极大的提高了查询效率与存储上限。Redis是一种高性能的KV存储系统,比传统的关系数据库提高了吞吐量和相应的性能[2],在此工具中主要用于存储。
由检查工具客户端通过RPC发起数据采集请求,采集服务端响应并解析客户端的请求。RPC(Remote Procedure Call)指的是远程调用,通过远程调用,将采集服务与客户端剥离[3]。远程连接上被采集对象同时执行相应的采集指令,执行完成后将采集结果返回至检查工具客户端,同时根据标准化检查的设定基线,将采集值与标准值进行对比,生成相应的分析报告。
规则引擎是将运维标准工艺基线中的配置项生成可配置、可量化的规则,从而能够动态灵活的与指标采集值进行的比较,生成各类分析对比报告。并能够进行横纵向对比,当此次采集值与上次采集值不一致时生成异动告警。
3 系统功能设计
系統主要功能为资源管理、指标管理、基线管理、标准化检查、异动分析五大模块。
3.1 资源管理
资源管理作为此工具的基础模块,统一管理资源的基本信息。基础资源维护是为系统使用人员提供了资源基础数据维护的功能,在资源维护功能模块下可以维护主机、数据库、中间件、应用系统的基础数据,并可维护其间的关联关系,能够清晰的展示应用系统下的所有基础资源信息。
其中采集配置信息是资源管理中重要的一类信息,在本工具中均通过各类对象的采集协议进行远程的采集。通过协议的采集方式,无需在被采集的服务器上安装代理或者探针,极大的方便了数据采集的工作开展。
3.2 指标管理
指标管理主要维护工具中可采集的指标,并且按照各资源类型进行分类,囊括了主机、数据库、中间件的标准工艺要求的各项指标数据采集方式。每个指标有多个采集指令从而适应不同的版本,尽可能的做到涵盖标准化工艺基线建设需要的指标。
3.3 基线管理
基线管理主要是维护各类指标的标准值,基线值,基线依据国网标准工艺和安全加固手册中的标准配置来制定。可以针对不同的指标设置相应的标准值,为采集数据的分析提供标准值。基线主要涉及到以下几类,基础软硬件环境规范,操作系统安装配置规范,软件安装配置规范,安全基线配置规范,每类基线中都有详细的配置规范要求。
3.4 标准化检查
标准化检查是将资源管理下的各类资源,配置相应的要求基线,通过采集回的数据与基线中要求的标准值进行比对判断合格与不合格,并计算合格率。通过生成检查报告,并对违反基线要求的检查项进行高亮显示。通过这样批量高效的、准确可靠的检查方式,简化数据统计流程,提高工作效率,能够全面的核查资源标准工艺建设情况,从而建立一套完整、真实的数据资源台帐,支撑标准工艺建设。
3.5 异动分析
异动分析主要关注指标值的变动情况。通过对同一采集对象所采集的数据与前次采集数据进行比对分析,找出与前次配置不符、标准化检查结果变动的配置项。针对数据有变动的采集对象,通过列表的形式展现为异动告警信息,供管理人员查看分析。通过针对异动的数据做运维检查,避清楚的掌握服务器的各项指标值的变化情况,免运维工作隐患的发生。
4 结语
本文基于国家电网统一开发平台和自动化运维理念,将日常的标准化工艺建设工作落实为一套高效、便捷的管理工具。为客户提供了资源管理、指标管理、基线管理、标准化检查、移动分析等功能模块,实现了各类资源的标准化工艺建设,从而巩固提升信息系统工作成果,确保信息基础平台按照标准进行建设,着力提升电网信息基础平台隐患排查能力和稳定运行水平。
参考文献
[1] 杨丽萍,张希翔,孟椿智,等.基于Elasticsearch的大数据搜索引擎在电力企业的应用研究[J].数字技术与应用,2017(12):63+65.
[2] 张婷,孙凤文.浅述Redis在高速缓存系统中的应用[J].科学与信息化,2019(8):43-43.
[3] 杨帆,孔维萍,蒋晓肖,等.基于Thrift的RPC中间件在航天信息系统中的设计与实现[J].计算机测量与控制,2017(12):279-282+306.