王林
摘要:中国的发展正高歌猛进,信息时代的到来也迎来了信息通讯,甚至发展到了通讯网络告警。网络上的信息通讯给人们在生活上、学习上、工作上都带来了许多的便利,但是凡是都有优缺点,万事都有利弊面。信息通讯网络告警带给人们便利的同时,也给人们带来了告警信息量大而针对告警的有效解决措施低下的问题。为此,本文章在大数据分析的基础上对通信网络告警存在的一系列问题提出了优化的策略。
关键词:告警;通信网络告警;闪断震荡;大数据分析;优化;
引言:随着通讯网络的产生,告警系统也面世了。为了更好地去管理告警系统并帮助大众,发现通信网络告警存在的一系列问题。据报道,某省15年加上宽带、传输等其他设备,网络的规模空前庞大而且LET基站数已经上升到10万以上。根据网络的拓扑结构来看,一个节点发生故障可能会影响多个节点,这时候告警就受到了影响。这样的情况会致使:一、有用的网络信息会被大量的告警风暴埋没;二、这不仅让告警信息更加繁琐还增加了挑选甄别的工作量;三、一条告警信息不能反映多条告警信息之间的逻辑性,没有办法对故障进行快速的定位;四、同时或者长时间的上报告警信息,会导致信息堆积,系统瘫痪。
所以,针对上面的大量问题,不能只是对业务人员的工作能力进行提高,也不能仅仅去优化智能监控系统,而是从根源上遏制住告警风暴的“咽喉”并且提高告警风暴的工作能力及其众多告警信息之间的逻辑关系。
一、告警的概念、分类及层次
(一)告警的概念
当设备故障时,监控系统将此故障情况发出告警信号。所有的故障都有声光告警和文字提醒。告警的时候,监控单元的红色警告灯会亮,蜂鸣器会发声,并且远端的系统监控中心会收到告警的信息。
(二)告警的分类
告警系统一般按照故障严重与否分为紧急告警和非紧急告警这两大类,其中还包括其他的告警,比如空调设备告警、电力室设备告警、无人值守局开门告警、外线电缆故障告警等等。
(三)告警的层次
告警的层级分为列架告警、总告警、机架(柜)告警三大层级。如图:
二、通信网络的概念及其网络结构
(一)通信网络的概念
通信是人与人之间通过多媒体进行的信息的交流与沟通的传递。网络是用物理连接将一个个个独立的工作站点或主机连在一起,组成的数据链路。通信网络是指将各个独立的设备进行物理连接,实现人与计算机、计算机与计算机、人与人之间进行信息交换的方法,从而达到交流通信和资源共享的目的。
(二)通信网络的网络结构
根据计算机基础课程,可以知道这些网络拓扑结构就像是串联的小灯泡一样,一个坏掉,其他的也都不能通电。所以这个告警信息就很有必要解决定位的问题,当发生故障时,告警信息可以定位到故障来源于那个网源,这样解决起故障来就又省去了不少的麻烦。
三、通讯网络告警优化策略
实施通信警告优化策略的三个层级有:综合网管侧、网源设备侧、和厂家网管侧。为优化综合网管侧,对异构多元的告警进行标准处理,并且进行跨厂家、跨专业的告警工作的优化;为优化网源设备侧,告警优化工作想从上报机制和告警处罚机制的研究着手;为了优化厂家网管侧,告警优化工作针对告警相关联机制作出跨网源的细粒度的工作。摘要中提到,要优化通讯网络告警整个系统,不仅要从业务人员着手,也要对系统本身进行优化。首先,为了从硬件上防止告警工作产生故障和问题,为避免通讯网络告警系统出现问题,工作人员要及时排查维修。其次,网管和业务人员要严格遵守自己的工作,严守自己的岗位,对收到的告警信息进行排查病解决各种故障,这要求通讯网络告警系统的工作人员业务水平要高,对自己的工作负责人;再者,为了从“软件”上避免网络告警系统出现问题,文章提出以下解决方案。
(一)屏蔽无需关注的告警
在通信网络告警系统的工作中,系统不能保证发出的每一个告警信号和接收到的每一个告警信息都是有用的而且会让整个系统的执行性提高,系统不能辨别哪些告警信息比较重要,需要优先上报;又或者哪些告警信息比较无用,对于网管来说,几乎可以忽略。为了防止告警风暴致使整个系统中的信息堆积和系统瘫痪以及重要的告警信息被淹没在海量的垃圾信息中,针对于没有必要去关注的告警信息,进行屏蔽。
通过正确严谨的判断和评估,甄选其中的垃圾告警直接屏蔽。告警屏蔽的屏蔽规则如下:若在综合网管侧屏蔽告警信息,对于其告警工作并没有任何的优化,所以选择方案时要珍重;若在网源设备侧屏蔽告警信息,不会有日志记录,之后也无法再查看;若在厂家网管侧屏蔽告警信息降低网管的工作量的同时还能减少无用告警的上报。
(二)延迟或抑制闪断震荡类的告警
闪断告警就是这个告警持续的时间很短,亮红灯的时间和蜂鸣声响起的时间都非常的短。震荡告警就是这个告警信号持续时间很长。
延迟或抑制闪断震荡类的告警的规则就是:根据一个告警信号延续的时间长短判断是否延迟或者抑制。例如有一些网源的网络连接出现了问题,网络变差,进不了网站,而通信网络系统检测到一些小故障,正上报发出告警信号的时候,电脑系统自动修理了该障碍,那么这样的状况就不需要再麻烦业务人员,而告警信号已经送出去,只是红色信号灯也没有亮很久,就转瞬间亮了一下,蜂鸣器也没有响很久,那样的话,通信网络告警系统就可以自动将这种信息延迟,等到业务员把重要的告警信息处理完再來看看这个故障是因为什么出现的,或者直接屏蔽掉不需要业务员花费时间来修理一台正常的通信网络机器。
对于震荡类的告警信息,也需要系统去自动监测,这个震荡类信息值不值得业务员专门去查看修理,然后上报信息。
(三)对各个网源采取智能的连接手段进行告警优化
上文中提到了通信网络的拓扑结构的分类,有总线型网状的拓扑结构、环形网状的拓扑结构、星型网状的拓扑结构。见下图:
上图为通信网络拓扑结构的三种结构。
由图可见,若把这每个网络拓扑结构的图都看成是一个电路的话,不难看出每张图都是一个串联电路,大家都知道串联电路的特点,那么无论是哪一种网络的拓扑结构都是不允许任何一个网源出故障的,只要有其中一个网源出了故障,其他的网源也不能正常的工作,接着,所有的节点都会发出告警信号上报网管,这就导致短时间内告警信息增多且量大,这时候,如果只有故障的网源发送告警信息不仅能够避免告警风暴的发生,而且还可以对发生故障的网源进行定位,业务工作人员、监督人员以及网管都能够第一时间锁定故障机器去修理。
所以这第三个通信网络告警优化策略就是设计一种智能连接的系统,给所有的网源系统都安装上,当一个节点出现故障的时候,发送一条告警信息。
(四)针对告警风暴进行的优化策略
告警,是网管最关注的工作。网络管理员要通过告警来对故障进行运维。有一种极端的告警现象,就是由于不能确定的各种原因,系统同时并且长时间的向网管告警,这会导致告警风暴的发生。容易致使信息堆积,系统瘫痪。
为了防止告警风暴的发生,并且在告警风暴发生时,系统可以及时的作出反应,将风暴带来的危害降到最低。系统可以有多个网管来对告警信息进行整合处理,当然这不是最佳的解决方案,但却是最笨的。当然,在国外也有许多公司机构专门研究出了一些系统,针对屏蔽,延迟,抑制告警信息来减少告警量。
四、结束语
随着通信网络的发展,告警成为运营网络管理必不可少的工具。并且在今后的发展中,网络规模越来越大,随之而来的告警量也今非昔比。为了让通信網络更加快速的发展,为了减轻监控以及网管的压力,必然要研究探讨如何处理告警量越来越大的问题。这篇文章介绍了什么是告警,什么是通信网络以及其三大拓扑结构,更重要的是针对通信网络告警优化提出了很多方法,例如如何去处理大量的告警信息的同时预防通信网络告警带来的“大风暴”,以及如何提高告警信息的有用性,如何筛选更加值得运维和网络管理员关注的信息以及屏蔽、延迟、抑制一些垃圾告警信息,并且明确了如何处理风暴告警对故障源头的定位,方便运维快速找到故障源并进行修理,以便系统能够持续提供服务。
参考文献:
[1] 袁静,李大伟,陆绍雯,等.智能监控应用平台告警关联大数据分析算法研究[J].电信工程技术与标准化,2019,032(005):80-84.
[2] 林斌,王磊.试论大数据分析在移动通信网络优化中的应用[J].黑龙江科技信息,2018,000(018):78-79.
[3] 高杨.试论大数据分析在移动通信网络优化中的应用[J].通讯世界,2018,341(10):113-114.
[4] 沈维捷,卞龙江,张行建,等.基于大数据技术的质量信息分析评价及电商化采购质量管控策略应用研究[J].现代管理,2019,9(5):6.