陈建新,马宗达,运 凯,赵忠浩
(国网新疆电力有限公司信息通信公司,乌鲁木齐 830000)
IT监控对象阀值管理是判断一个IT设备是否正常运行的关键指标。本文的IT监控管理系统基于阀值历史数据与设备运行环境,利用大数据理论,根据设备类型生成数据基线、建立基线的上下偏离指标,结合时间特性自动化生成更具真实性的IT监控对象阀值线,更好地保障各类IT设备的稳定运行。
通过各类协议采集的IT监控能够形成的各类数据,包含两种基线。
常态基线是以天为周期的基线,无需区分工作日和假期,也无需区分工作时间和非工作时间,所有的时间都一视同仁。
2.1.1 基线生成的数据要求
基线在生成时,需要连续7天(静态参数)的数据(从第一天的0时开始到最后一天的24时)。每天数据的完整度至少要90%以上。如果不符合条件就不生成基线,在下一天继续检查。以天为单位生成基线,然后以其他的天来作为验证。必须任一天的基线被所有其他天验证通过后,才确认基线成功生成。连续7天都无法成功生成基线,那么该设备的该指标就不再继续进行基线的生成尝试。其中7天是参数。
2.1.2 下基线的特殊处理
对下基线来说,由于绝大部分数据都是大于等于0的(不存在负数的情况),所以如果下基线的值为负数,那么就设置下基线为0。如果要生成下基线为负数的指标,需要特殊标明该指标可能为负数。
2.1.3 低波动率数据的排除
在基线生成的时候,需要排除一些低波动率的数据,因为低波动的数据对变化非常敏感,而这种敏感的变化容易产生误报。我们主要通过数据的统计集中范围来判断波动率,如果数据在均值1(参数)个方差范围以内的数据占95%(参数)以上,我们认为该数据波动率比较低,就放弃建立基线。
2.1.4 基线越界
上基线和下基线在越界检查中互相独立处理。也就是说下基线的越界点和下基线的越界点分开处理,互相不干扰,下基线的越界点对上基线来说是正常点,上基线的越界点对下基线来说是正常点。
如果下基线为0的话,不需要进行越界检查。
如果无法获取指标的值,那么这个点就认为是正常的点(这点可以商榷,行为可以在配置文件中扩展)。
每次来一个新的值,就可以进行一次基线的越界检查,当一定的时间内或者一定数量的指标值中上基线越界或者下基线越界的值超过一定数量后,就产生越界事件给智维策略。目前设置的值是最近6个点有5个点是越界的(6和5是参数在配置文件中配置)。
忙闲分段基线将时间区分成两类,一类是工作时间、一类是非工作时间。工作时间和非工作时间的定义在配置文件中预先定义好。在生成基线的时候,工作时间和非工作时间分别生成。用所有工作时间的数据生成工作时间基线,非工作时间的数据生成非工作时间基线。
2.2.1 基线数据生成要求
基线在生成时,需要连续10天(静态参数)的数据(从第一天的0时开始到最后一天的24时)。每天数据的完整度至少要90%以上。如果不符合条件就不生成基线,在下一天继续检查。10天的数据分成两个部分,一部分作为工作时间的数据,一部分作为非工作时间的数据。每一部分的数据再分成5(参数)等分,用其中的一份生成基线、其他的数据进行验证,必须任一份数据生成的基线被其他份数据验证通过后,才确认基线成功生成。另外必须非工作时间基线和工作时间基线都成功生成,我们才认为忙闲分段基线成功生成。
2.2.2 下基线的特殊处理
下基线的特殊处理和常态基线一致。
2.2.3 低波动率数据的排除
低波动数据的排除和常态基线一致。
2.2.4 基线越界
基线越界处理和常态基线一致。
基线的数据时间最小为1天,最多为14天。
图1 常态基线界面图
基线的数据时间最小为2天,最多为21天。
图2 忙闲分段基线界面图
基于电力系统IT监控对象的数据基线的设计完毕,通过对该系统的调试与仿真,其功能基本达到要求。本设计以电力系统IT监控为核心,完成了电力系统IT监控系统的数据采集和分析,实现了自动化数据基线。
[1] Panagiotis Stavropoulos,John Stavridis,George Chryssolouris.The Effect of Communications on Networked Monitoring and Control of Manufacturing Processes.Procedia CIRP,2006,Vol.41.
[2] Jonathan Downey,Denis O’Sullivan,Miroslaw Nejmen,Sebastian Bombinski,Paul O’Leary,Ramesh Raghavendra,Krzysztof Jemielniak.Real Time Monitoring of the CNC Process in a Production Environment-the Data Collection & Analysis Phase.Procedia CIRP,2006,Vol.41.
[3] H.Cenk Ozmutlu,Natarajan Gautam,Russell Barton.Managing End-to-End Network Performance via Optimized Monitoring Strategies.Journal of Network and Systems Management,2002,Vol.10(1),pp.107-126.
[4] 张杰.基于SNMP的网络管理系统的研究与实现[D].东华大学计算机应用技术学院,2008.
[5] 霍其双.Windows环境下系统管控平台的设计与实现[D].浙江:浙江大学计算机应用技术学院,2013.