左玉东 倪建武
摘要:通过构建基于B/S架构的指挥信息系统实时监控平台,解決传统的系统运行维护以人工为主,存在着事件响应慢、故障排查长、分散管理难等问题,及时发现指挥信息系统日常运行中的异常情况,对出现的问题发出预警并进行处理,为保障系统的正常运行,进一步提升系统效率提供有力支撑。
关键词:指挥信息系统;实时监控;运行维护
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2018)07-0105-03
1 引言
随着我军指挥信息系统不断升级,系统内包含的业务规模和业务范围也不断扩大,涉及的子系统和硬件资源也在不断更新,导致对系统的管理和维护要求更高也更复杂,但同时对于系统的安全性、可靠性和稳定性也提出了更高的要求。以往的监控主要以人工为主,及时发现和解决问题的时效性相对滞后,为保证系统运行可靠性,预防突发事件发生,提高系统的运行效率,亟需建立一个较为完整可靠的监控平台,通过该平台对指挥信息系统进行实时、有效的监控与预警,发现并及时解决问题,提高故障数据分析能力,为指挥信息系统业务的正常运行提供可靠的保障。
2 平台设计及架构
通过该监控平台的设计,实现指挥信息系统设备、应用系统运行状态及性能参数的实时采集,变被动管理为主动管理,通过基于B/S模式的网络和应用系统集中监控,在节点上建立统一的信息运行管理控制中心,降低对系统中各类业务和设备维护的复杂度。
2.1 平台设计原则
平台的总体设计原则主要包括有:
统一管理原则:实现对硬件、软件资源以及应用系统资源等统一管理。通过信息的统一采集,可以实现自动分析、上报故障信息,通过合理分析、评估,实现其稳定可靠运行。
标准性原则:监控平台要遵循指挥信息系统平台的接口标准,在此基础上进行进一步的应用集成。
安全性原则:通过灵活可靠的角色权限配置,实现监控平台自身的安全性,确保监控系统的安全运行。
可视化原则:通过B/S架构,界面统一、清晰、美观,部署方便高效,可有效提高运行效率。
2.2 相关技术
平台架构种使用的相关技术主要包括:
1)SNMP
简单网络管理协议(SNMP),由一组网络管理的标准组成,该协议能够支持网络管理系统,用以监测连接到网络上的设备是否有任何引起管理上关注的情况。SNMP能够使网络管理员提高网络管理效能,及时发现并解决网络问题以及规划网络的增长。网络管理员还可以通过SNMP接收网络节点的通知消息以及告警事件报告等来获知网络出现的问题。
2)NETFLOW
NETFLOW是思科公司开发的一套网络流量监测技术,在大部分的思科路由器、港湾等网络设备都支持FLOW技术,它本身也是一套网络流量统计协议,一个NETFOLW流定义为在一个源IP地址和目的IP地址之间传输单项数据包流,并且所有的数据包具有共同的传输层源、目的端口号,可以提供非常精准的流量测量。
3)WMI
WMI(Windows Management Instrumentation,Windows 管理规范)是一项核心的Windows 管理技术;作为一种规范和基础结构,通过它可以访问、配置、管理和监视几乎所有的Windows资源,通过WMI用户可以管理本地和远程计算机。
4)数据可视化技术
数据可视化是通过图形化的手段,达到信息沟通和传递的清晰性和有效性。为了达成这种信息传递的清晰性和有效性,借助美学的形式和功能,抽象出信息的关键方面和特征,直观地进行展示,从而实现对复杂数据集中数据关系的深入挖掘和观察。该项技术与信息图形、信息可视化、统计分析等学科密切相关,是一个边缘的融合科学领域。
2.3 平台技术架构
监控平台主要包括:网络系统状态监控、服务器状态监控、日志事件管理等部分组成,系统在技术上采用J2EE架构,满足系统的集中部署分布监控。整体技术架构分为展现层、数据汇聚层、数据采集层和网络设备层,如图1所示:
1)展现层
展现层主要用于监控人员和系统之间的交互,采用web客户端图形方式展示,支持多种接入手段,从数据挖掘和数据可视化角度出发,对指挥信息系统的总体性能、状态趋势和性能详情进行深入分析并进行可视化的呈现,使得数据分析更直观,更能为系统维护人员提供帮助,基于Apache服务器,通过B/S模式完成对系统监控信息的展示。
2)对外数据接口
处理数据汇聚层采集处理的数据以外,系统还应包括各种管理数据,提供并支持多种管理接口,包括数据库接口、文件接口、其他系统相关API接口等。
3)服务层
服务层主要包含该监控系统所提供的各类服务管理,包括拓扑管理、数据分析管理、流量管理和告警管理。其中拓扑管理是通过拓扑图直观展示系统种的网络设备、网络接口和服务器,反映实时的设备和接口状态;数据分析管理通过数据汇集层提供的设备性能状态数据,监控系统运行;流量管理通过业务和流量关系,掌握数据流量的真实情况,实现安全监控,提高系统可靠性;告警管理通过对告警事件的分析分类处理,根据定制的过滤策略实现对分级告警事件的响应和定位,具有辅助故障快速定位、智能化管理等多项功能。
4)数据汇聚层
数据汇聚层完成数据的集中汇聚处理,集中管理和协调监控平台采集的各种数据,是整个监控平台的核心功能,该层通过对采集到的数据进行提取和计算,比对性能指标和参数配置,进行对系统性能概况的分析和运行趋势的预测。
5)数据采集层
数据采集层完成对整个信息系统的信息采集,主要通过定时轮询、监听代理、日志读取等手段,完成数据的采集,对发送的数据进行过滤验证,通过验证的数据进行持久化存储,采集完成后,提交给数据汇聚层。
6)网络设备层
包括信息系统的网络、存储设备、网絡基础服务及其他相关软硬件资源,通过数据层的采集后,由上一层进行进一步的处理。
2.3数据流程
数据库采用的是Oracle,在系统中,数据库访问技术主要采用ADO该系统涉及的数据主要包括指挥信息系统中的各类网络设备:各类路由器和交换机;服务器和设备终端、各应用系统和数据库的属性、状态以及性能数据,还包括这些设备的日志数据,通过数据采集,进入基础采集数据库,采集的数据包括这些设备和系统的属性数据、状态数据、性能数据以及日志数据,进行数据过滤、整合最终进行汇聚处理,进入汇聚数据库供监控系统调用,整体的数据处理流程如图2所示:
3 主要模块实现
这里主要介绍各层主要模块的实现。
3.1 数据采集层实现
数据的采集层的主要工作流程如图3:
路由器等网络设备利用标准交换模式处理数据流的第一个IP数据包并生成NETFLOW缓存,再利用同一个流中后续的数据分组进行持续更新相应的NETFLOW缓存。路由器通常会根据连接活跃时间、连接空闲时间、存储空间大小、路由器实时负载等几个因素来决定是否继续维护某条NETFLOW的缓存,所以一条记录有可能会被截成几条,这就会对采集造成影响。因此采用RULE=
TCP any any <> any 80 (dec:”http matched”:content:”http/1”;nocase;offset;0;priority;1;rid 0930)
3.2数据汇聚层实现
经过采集层采集的数据在数据汇聚脚本下将汇聚形成各种不同类型的监控数据,入属性数据、状态数据等。数据汇聚脚本要保持两大原则:一是减少对网络层设备的负荷,二是要进行数据过滤,剔除无效数据。以web应用访问数据为例,访问的地址一般都包含IP及端口号,这样就需要通过限定应用的唯一标识id和session等,监控平台通过获取系统中服务器网卡的IP和PORT,将这些信息按照格式进行封装后发送给监测平台。监测平台在接收到按要求封装好的数据后,将这些数据与数据库中的数据进行比对,匹配通过的则在数据库中进行存储,不通过的直接丢弃。
3.3服务层实现
数据经过汇聚存储后,需要由服务层进行管理和分析,以便进行展现。由于展现层需要多维度展现各种监控数据,这里主要设计了2个接口进行监控数据的提取和计算,一个是计时数据分析接口TiminDataQueryList()和资源数据分析接口ResourceDataQueryList()。以计时数据分析接口为例,主要实现过程为:第一步,从汇聚层获取数据参数,根据页面选择参数进行处理;第二步,根据请求参数判断是否请求统计数据;第三步,按统计参数首先进行数据库检索,利用检索出来的数据计算各类性能指标,然后按照统计的时间间隔进行分组,利用接口层提供的API进行统计计算,利用检索数据计算各类性能指标,并提取额各系统的相关参数。
3.4展现层实现
监控平台的展现层需要展示大量图表、数据,因此采用了较为成熟的Bootstrap框架结合和数据可视化工具HIGHCHARTS进行结果呈现,主要界面如下。
如图可见在监控平台中涉及最多的就是图表,这里通过HIGHCHARTS图表库,可以方便地在web页面中添加图表,支持饼状图、散状点图等综合图表。绘图核心代码如下:
map_charts_sys = new Highcharts.cahrt({
map_charts_sys:{
renderTo:container,
defaultSeriesType:spline /*这里采用折线图
events:{
load:function(){
var series = this.series[0];
setInterval(function(){
var x = ‘time
var y = ‘data
series.addPoint([x,y],true,true);
},
‘数据刷新频率);
}
}
}
4总结与展望
通过对现有指挥信息系统的维护状况分析,本文提出了以基于B/S模式的统一监控平台来辅助系统维护工作的设想。对指挥系统监控平台进行可行性分析,完成各层模块的设计。该系统能有效协助信息系统的管理运行,具有较高的业务逻辑性和可操作性。但在设计和实现上也存在着一些不足,一是对日志和告警星系的综合分析能力和不够强,不能在系统各部分之间建立起有效的映射关系,信息挖掘的深度不够;二是对底层系统部件的监控和展示还不全面,自动化和智能化水平还不够高,这也为下一步的工作提供了方向。
参考文献:
[1]傅启明,康永.J2EE架构的B/S系统监控平台[J].计算机系统应用,2015(6):83-86.
[2] 戚伟强.统一应用系统监控平台研究与实践[J]. 电力信息化, 2013(3).
[3] 李庆余.网络实时业务监控系统的实现[J].中国金融电脑,2002.
[4] 张擂,李清宝.基于VMM的Windows文件系统监控[J]. 计算机应用与软件,2016(7).
[5] 田肖.基于流量高峰预警机制的云平台监控系统[J]. 电子技术与软件工程,2017(5).
[6] 许震东.基于Linux平台的嵌入式动态网络监控系统的研究[J]. 电子世界,2017(3).
[7] 徐尤华.基于B/S模式的网络化监控系统研究[J]. 计算机测量与控制,2015(4).
[8] 周玮.基于LIBPCAP的网络流量监控系统设计思想与技巧的探讨[J]. 科技信息,2009(5).