信息通信集中监控系统的研究与实现

2015-11-12 06:23磊,吴红,张庆,徐智,朱
科技传播 2015年18期
关键词:子系统服务器监控

吕 磊,吴 红,张 庆,徐 智,朱 敏

国网眉山供电公司,四川眉山 620010

信息通信集中监控系统的研究与实现

吕磊,吴红,张庆,徐智,朱敏

国网眉山供电公司,四川眉山 620010

国网眉山供电公司现有的信息通信机房设备众多,涉及的设备类型、设备厂商已覆盖现有市场的众多知名厂商,随着电力信息化建设不断进行,信息机房中的设备类型、数量在不断的增加。为了有效的对这些设备工况信息进行管理,本文设计并实现了针对大型机房的信息通信集中监控系统,实现了信息通信设备及动环设备的工况数据采集、集中数据管理,通过对采集的设备工况信息的融合处理,统一分发给各监控系统,降低重复性工作,提高工作效率,更好的保障众多监控系统及各信息系统的稳定运行。

设备工况;信息设备;动环数据;集中监控

1 研究背景和意义

1.1研究背景

国网眉山供电公司现信息通信机房现有的信息机房设备众多,涉及的设备类型、设备厂商已覆盖现有市场的众多知名厂商。随着电力信息化建设不断进行,信息机房中的设备类型、数量在不断的增加。同时为了有效的对这些设备进行管理,各种信息设备管理、动环设备、监控系统也在投入业务运行,包含众多的监控系统需要从这些信息设备采集实时运行数据。

现有的信息设备工况数据采集由各个系统独立采集,暂未有统一的信息设备工况采集系统为各监控系统提供数据支撑。同时随着电力信息化建设的不断进行,电网业务需求的扩展,信息设备类型不断增加,各监控业务系统需要获取的设备指标也在不停的变化,一旦有采集设备、指标的变更,都需要信息设备运行维护人员手工进行配置,工作量大,响应时间长。同时对各监控系统都需要对相同的设备、指标各自进行调整、开发,工作效率低,重复度高。

为改变这一现状,降低重复性工作,提高工作效率,更好的保障各信息系统的稳定运行。

1.2研究意义

眉山市电力公司承担着眉山市所有电力设备的建设、维修和维护工作,而电力作为国民经济中的基础环节,对企业和人民的生产生活都有着极为重要的意义。眉山市电力公司的众多日常业务都离不开信息网络的支持,只有信息通信网络的核心机房的正常运行,才能保证其信息网络的正常运行,就是保证电力公司的日常业务的正常进行。

因此建立电力机房的信息通信集中监控系统,对机房信息设备加强监控和管理,实施机房联网监控系统,提高机房设备运行的安全性和稳定性,实现机房设备集中管理;实现信息采集和处理的及时化,实现信息设备工况统一处理,降低重复性工作,提高工作效率,更好的保障各信息系统的稳定运行。

2 研究方法和内容

2.1研究内容

信息通信集中监控系统对眉山供电公司大型运营机房涉及到的动环数据、信息设备(网络设备、服务器和存储设备)运行状态数据进行采集,建立工况共享数据库,并通过接口完成工况数据的订阅和分发,为其他应用系统提供工况数据。

1)数据采集。

采集程序从信息设备、动力环境设备采集状态数据,采集数据包括动环数据、服务器设备数据、网络设备数据、安全数据等工况状态信息。

(1)动环数据:包括空调详细信息、UPS详细信息、机房温湿度信息。

(2)服务器设备数据:服务器名称、服务器描述、操作系统类型、CPU利用率、内存利用率、网卡名称、网络接口IP地址、网络接口宽带、端口流入速度、端口流出速度。

(3)网络设备数据:包括设备名称、设备描述、IP地址、操作系统类型、操作系统描述、生产厂家、CPU利用率、内存利用率、端口流入速度、端口流出速度、接口描述、接口管理状态、接口操作状态、接口宽带、接口物理地址、接口IP地址、接口掩码等。

(4)安全数据:违规外联告警数、系统弱口令信息计数、补丁安装率、桌面终端注册率、终端防毒软件安装率、敏感信息检查执行率。

2)数据存储。

构建工况数据共享数据库结构,建设工况数据共享数据基础设施。

3)工况数据订阅与分发。

系统实现对工况数据的订阅和分发,要求具有工况数据消息接收发送、消息订阅、信息构造、消息生成、消息查询、消息过滤、监控等功能。

4)数据接收展现。

应用平台通过状态接收系统与分发系统连接,接收由状态分发系统推送状态数据。状态接收系统连接上状态分发系统后会收到状态推送系统主动推送的信息。状态接收系统接收到消息后将信息通过可视化平台进行展示。

2.2系统逻辑架构

信息通信集中监控系统框架采用了JMS、XML、CORBA、JDBC、RMI、ORM Mapping等成熟可靠的JAVA技术为基础,按照系统的功能划分模块和层次,既符合信息设备工况采集接口业务的要求,同时保证在软件功能方面是易实现、易维护、易扩充的。 信息设备工况采集接口架构如图1所示。

系统采用基于J2EE的三(多)层体系结构来构建目标系统,并针对业务的不同特点,采用B/S三层结构构建系统。系统采用Struts2+Spring3+Mybatis完成系统的基础架构;所有JMS消息机制采用ActiveMQ 5.9技术;所有第三方接口采用Restful风格的Web Service技术(WINK),为客户端厂家提供丰富且便捷的调用API,为客户端厂家实时准确的提供生产环境中各设备的详细数据,保障所有数据的准确性和一致性。

信息通信集中监控系统从业务以及功能角度分为下面几个下级子系统。

1)状态获取子系统和状态融合子系统。状态采集系统分别向主机设备、网络设备、动环系统、第三方应用发起数据采集指令并收集采集值,存入状态采集数据库。状态融合系统通过将采集的数据进行抽取、整理、量算统计等方式,对数据进行融合,并分表存入状态融合数据库。

2)状态订阅及分发子系统。订阅分发服务管理工具是一个客户端,用以配置同一局域网下的发布服务器和订阅服务器。在B/S模式下,客户端和服务器端通信采用HTTP协议,以Web页面的方式对服务器进行配置。通过订阅分发服务器管理工具,用户可以使用订阅消息的创建和管理、同步过程监控,将发布者订阅的消息推送给订阅者。

3)数据接收展现子系统。应用平台通过状态接收系统与分发系统连接,接收由状态分发系统推送状态数据。状态接收系统连接上状态分发系统后会收到状态推送系统主动推送的信息。状态接收系统接收到消息后将信息通过可视化平台进行展示。

2.3系统工作流程

1)状态获取子系统负责获取并且归档状态信息。

2)状态信息NoSQL数据库用来归档状态信息,同时保存监测设备以及监测指标信息。

3)Redis Key/Value数据库用来保存指标的最近一次的状态信息,以便在状态分发时可以快速查询。因为需要判断最新状态,所以状态信息里面需要包含采集时间。

4)作业调度关系型数据库保存第三方厂商的状态订阅信息以及相关的定时作业,还需要保存第三方厂商的设备或者指标的订阅信息。

5)状态采集子系统API对外提供接口服务,是指通过RESTful方式来进行如下管理功能。

(1)监测设备管理。

(2)监测指标管理。

(3)插件管理。

(4)查询历史状态信息。

(5)查询订阅状况。

6)消息驱动方式:由状态采集来驱动状态订阅,也就是说,设备以及指标的定义由状态采集方决定,采集方只能被动订阅。

7)如果第三方机器系统瘫痪,采用Active Message Store机制确保Message不会丢失。

8)抓取确定以设备为粒度,分发也以设备为粒度。

2.4系统功能简介

2.4.1状态获取子系统和状态融合子系统

机房动力环境监控系统数据采集通过自定义SOCKET协议采集数据,使用两个进程间相互作用的主要客户/服务器(Client/Server)模式,即客户向服务器发出服务请求,服务器接收到请求后,提供相应的服务获取数据。

通过SNMP、WMI、SYSLOG、IPMI、各种应用层协议(ICMP、HTTP、FTP、TELNET、SMTP、POP3等)及私有协议,对网络专线(DDN、VPN)、网络设备、主机设备、存储设备详细运行数据的采集。

状态融合子系统通过将采集的数据进行抽取、整理、量算统计等方式,对数据进行融合,并分表存入状态融合数据库。

采集系统负责获取并且归档状态信息,处理后采用ORACLE数据库用来归档状态信息,同时保存监测设备以及监测指标信息。

采用缓存效率非常高的Redis Key/Value数据库用来保存指标的最近一次的状态信息,以便在状态分发时可以快速查询。

消息驱动方式:由状态采集来驱动状态订阅,也就是说,设备以及指标的定义由状态采集方决定,采集方只能被动订阅。如果第三方机器系统瘫痪,采用消息队列持久化框架确保Message不会丢失。数据存储是以设备为粒度,分发也以设备为粒度。

2.4.2状态订阅及分发子系统

发布订阅系统所针对的用户群是第三方(简称客户端),由于每个客户端可能订阅不同种类的消息,所以该模块提供客户端的管理功能,提供订阅方列表、订阅方新增、订阅方修改、订阅方删除、订阅设备指标查询列表、订阅设备指标、修改订阅设备指标、查询订阅设备指标历史状态情况等功能。实现对客户端的新增、删除、修改;并对客户端的接入做相关的安全认证,防止非法的第三方接入。

消息发送模块可以根据实际情况对消息进行条件过滤。由于发布订阅系统所获取的数据来源各不相同,因此需要根据需求确定消息发送的优先级别,对时效高的消息优先发送。

数据订阅分发技术提供数据的交换和集成,数据订阅分发服务是一种在网络环境下在不同资源之间实现信息动态交换的一种信息共享机制,包括发送和接受订阅请求、自动获取变化的数据、分发用户订阅的内容、对本系统内的环境和数据进行自动维护并为整个网络提供分布式数据订阅分发服务。

通过数据订阅分发技术,用户可以将一份数据从一个数据源发布到多台目的服务器上,从而使不同的服务器用户都可以在权限许可的范围内共享这份数据。数据订阅分发技术可以确保分布在不同地点的数据库自动同步更新,从而保证数据的一致性。

2.4.3数据接收展示子系统

状态数据采用的是状态分发系统主动推送方式,由状态分发系统主动向订阅方平台发送数据,数据采用JSON格式进行传输。状态分发系统在采集数据库中获取数据,再通过专网推送到应用平台。

应用平台接收由状态分发系统推送状态数据。状态接收系统连接上状态分发系统后会收到状态推送系统主动推送的信息,应用平台对数据进行处理后分类存入数据库。

应用平台按数据按类别不同,将数据通过可视化平台进行展示。

2.5系统关键技术

1)工况数据高度集成。采集信息设备的实时工况数据,快速获取,快速集中,自动化的质量控制措施,确保数据的正确性和有效性,按照一定的规程和标准化处理实时工况数据。

2)工况数据统一分发接口。通过研发标准接口,为需要信息设备工况数据的第三方系统提供信息设备实时运行数据采集、设备指标订阅、分发等功能,为系统监控提供统一的数据采集分发接口服务。

3)工况数据定制方便、分发安全。用户或其他应用可通过客户端定制自己需要的工况数据的种类、发布时间和接收消息格式。基于消息中间件的工况数据分发稳定可靠。

4)面向服务的体系结构(SOA)。面向服务的体系结构(Service-Oriented Architecture,SOA)作为一种架构和组织IT基础结构及业务功能的方法,是为解决业务应用和IT资源相结合而产生的一种架构设计规则。它以组件设计为基础,以面向服务为核心思想,支持将业务转换为一组相互链接的服务或可重复业务任务,可在需要时通过网络访问这些服务和任务。

本系统将SOA架构应用于系统体系结构设计中,结合工作流技术,提出了一种基于 SOA 架构的工作流监控模型。这种模型结合了面向服务架构和工作流技术的双重优点,既实现了流程集成的功能需求,又能充分利用现有资源、实现软件复用、统一接口规范、提高可维护性和可扩展性。

3 研究结论和取得的主要成效

3.1研究结论

国网眉山供电公司建立的信息通信集中监控系统采用了基于JAVA和MQ的开放体系结构,建立了信息设备工况数据共享数据库,设计了工况采集的实时数据库,建立了工况数据共享基础设施,开发了信息设备工况采集接口系统软件。以订阅方按需订阅,系统主动推送的方式,减轻设备管理员的工作量,减少安全隐患,减轻被监控设备的负担。

3.2主要成效

信息通信集中监控系统框架采用了J2EE、XML、HTTP、JDBC、O-M Mapping、O-R Mapping 等成熟可靠的JAVA与WEB技术为基础,按照设备工况采集接口系统的特点划分模块和层次,既符合消息订阅分发业务的要求,同时保证在软件功能方面是易实现、易维护、易扩充的。

信息通信集中监控系统通过对信息设备工况信息统一的状态采集、处理、订阅、广播和推送系统,使其他第三方厂商的应用系统可以从本系统获取被监控设备的状态而不必直接从被监控设备获取状态,实现状态信息重用,减轻设备管理员的工作量,减少安全隐患,减轻被监控设备的负担。

信息通信集中监控系统在国网眉山供电公司信息通信中心的投入使用,实现了信息设备及动环设备状态信息的采集、存储、订阅及分发,提高了眉山供电公司信息通信部门的设备运维水平,更加充分地保障电力核心业务的运行。

[1]GB/T 21028—2007信息安全技术服务器安全技术要求[S].

[2]HJ 2507-2011 环境标志产品技术要求网络服务器[S].

[3]IEC 60950-23-2005 IEC 60950-23, Ed. 1.0: 信息技术设备.安全.第23部分:大型数据存储设备[S].

[4]国家电网公司信息系统运维体系规范[S].

[5]国家电网公司信息系统运行维护工作规范[S].

TM3

A

1674-6708(2015)147-0152-03

猜你喜欢
子系统服务器监控
不对中转子系统耦合动力学特性研究
The Great Barrier Reef shows coral comeback
GSM-R基站子系统同步方案研究
通信控制服务器(CCS)维护终端的设计与实现
你被监控了吗?
Zabbix在ATS系统集中监控中的应用
驼峰测长设备在线监测子系统的设计与应用
中国服务器市场份额出炉
得形忘意的服务器标准
计算机网络安全服务器入侵与防御