姚 瑞
浅谈淮委C&C08数字程控交换机的故障处理
姚 瑞
淮委正在使用的程控交换系统是以淮干防汛通信网现有的程控电话交换、卫星通信、微波通信、移动通信等通信系统为基础,并通过与水利专网、电信公网等其他网络汇接,组成以淮河防汛调度中心为枢纽的防汛综合性通信网络。其中以华为32模C&C08 B型数字程控交换机作为整个淮河防汛通信网的语音交换中心。
现正使用的C&C08B型数字程控交换机现有三个模块,以新办公大楼模块为中心,通过微波通道和光纤通道分别与东大院、国强路两个远端模块互连,在新大楼模块中实现统一维护。C&C08数字程控交换机采用NO.1信令与江苏省水利厅、临淮岗以及沂沭泗局交换机等互联;采用NO.7信令与蚌埠电信、蚌埠铁通交换机及ETS无线接入系统等互联;采用PRA信令与安徽省水利厅、阜阳市水利局多业务交换机、入海水道交换机、会议电视系统等互联;采用AT0模拟中继方式与河南省水利厅、信阳市水利局、驻马店市水利局、南湾水库、鲇鱼山水库、宿鸭湖水库等单位的交换机互联,实现语音通信。
理的原则
在C&C08数字程控交换机的运行过程中,经常会发生一些故障,要确保设备能够稳定运行,对故障进行及时准确的处理,维护人员首先需要了解C&C08数字程控交换机告警系统的原理、了解告警的途径以及故障处理的原则。
C&C08数字程控交换机的告警系统检测到交换机运行中产生的各种软硬件故障,经过维护软件处理后在告警台输出告警信息报告,并通过告警箱的主告警盘发出可视、可闻的信号,通知维护人员进行处理。
告警分为四个级别:
紧急告警:指带有全局性的,会导致主机瘫痪的故障告警和事件告警,如主机板故障、网板故障、时钟板故障等,对应红色告警级别指示灯,急促铃。
严重告警:指局部范围内的单板或线路故障告警和事故告警,如用户板故障、数字中继板故障等;对应红色告警级别指示灯,次急促铃。
次要告警:指一般性的,描述各单板或线路工作状态的故障告警和事故告警;对应黄色告警级别指示灯,断续铃。
提示性告警:指不会影响系统性能的提示性的故障告警和事故告警,如测试板告警,对应绿色告警级别指示灯。单次铃,响1秒,停1秒。
对于维护人员来说,可以从五个地方观察告警信息:一是听到告警箱里的声音告警并观察到告警级别,二是机架行列告警灯,三是维护终端的告警台,四是单板实际指示灯状态,五是维护台硬件配置面板上可以观察到的单板状态。另外还有来自用户的申告。平日里,维护人员要密切留意设备运行情况,还要根据设备所“透露”出的告警级别,准确定位出故障的影响范围和引起故障的原因,从而做出相应的处理。
系统发出告警信息后,维护人员应首先根据告警的级别判断障碍性质及影响,并及时遵循以下原则对故障进行分析和处理:
(1)在能够处理的范围内,尽量不影响全局通话;
(2)更换重要单板,需要在话务量少的时候进行,甚至最好在夜间进行;
(3)不要盲目更换单板,以免误操作,引起更大的故障;
(4)插拨单板时一定要佩带防静电腕套,并将防静电腕套接地端可靠接地。
在对C&C08数字程控交换机的维护过程中,经常会收到来自用户的申告,如电话没有拨号音、有杂音、不能振铃等,维护人员应当采取先检查用户的话机有没有故障,如果没有,则要逐段检查线路,听是否有拨号音,若直到机房的配线架上都没有拨号音的话,则要彻底隔离外线,根据具体故障现象,去检查设备的故障点。
(1)个别模拟用户故障:根据硬件配置面板,确切定位这些用户具体分布在哪些ASL板上,再观察相应的ASL板是否在正常运行,以及是否用户发生“锁定”现象,如果发生“锁定”现象,应在维护台上用软件将“锁定”解除,如果ASL单板有故障,则应复位或更换ASL板。
(2)大面积模拟用户故障。此时需根据故障用户分布的范围,结合信号的流程,判断故障点。
①连续16个用户故障
需准确定位用户所在的单板,观察单板状态,如果单板损坏,则要更换故障用户所在的ASL板。
②半框用户故障
此时需检查节点配置、NOD线、HW线配置是否正确(一般来说,开局后数据配置不会自行发生错误,应重点检查设备背后配线是否会被误操作而混乱)、DRV板的工作状态等,如果单板的运行状态不对,则应做复位、插拔、更换单板等处理。
③整框用户故障
应首先检查该用户框中的电源板是否故障(因为一个用户框所有ASL板同时发生故障的可能性极小,多是由电源故障所引起),检查馈电是否正常,特别要注意位于二次电源板上的开关是否合上。
(3)若一个模块内所有用户信号音不正常,需倒换、更换SIG板。
中继类故障会影响到本局用户的出局,特别是到公网的中继,一旦发生故障,会造成所有用户都不能拨打市话出局,与外界通信中断。作为维护人员,必须要了解与中继相关的概念以及定位并处理中继类故障的方法。一般来说,已经测试畅通的中继,数据不会自行发生变化(只要未被恶意修改),而且中继类数据根据双方采用的不同信令方式,数据会有较大的区别,所以本文暂不进行数据方面的讨论。
当中继类故障发生后,首先,要浏览维护台中相关告警信息,然后对某一部话机进行指定接续跟踪,看系统反馈的文字信息,再做相应的处理。
其次,要及时查看与中继有关的单板,DTM、NOD、LAP、NO.7 等单板,大多数故障是由此类单板所引起,要先观察单板件指示灯和查看告警信息,再根据信号流程初步定位故障点。
(1)DTM板故障:中继不通。分析告警信息,检查DTM板上的运行灯是否亮,并检查单板是否插好,接触是否可靠,插拔并复位DTM板。如果DTM板上的运行灯没有亮,则一般可认为DTM板损坏,此时可用其他相同型号的单板替换。如果DTM的运行灯闪亮仍然不正常,则要检查DTM板到NOD板的HW线是否连上,连线是否松动。如果没有松动,则要检查与该DTM板所对应的NOD板状态,看是否运行正常。如果一切正常,则必须检查与该DTM板相关联的信令板(如NO.7板,LAPN7板)是否工作正常。若是由于链路“吊死”而引起的中继中断,只需复位信令板即可。
(2)传输设备或者对端局设备故障引起的中继类故障。发生此类告警时,首先应甩开传输设备,在交换机端口上进行本地自环,如果告警消失,则可能是传输或者对端局设备故障。其次要在对端局对设备进行本地自环,如果对端局告警消失,则问题有可能出现在传输设备上,要检查相应的传输设备(如微波设备、光端机等故障),如果对端局告警仍然存在,则应仔细检查对端局设备本身问题。
需要说明的是,在检查过程中,维护人员除了需要对交换机充分理解之外,还应对传输通信业务所使用的传输通道有着充分的了解,在很多情况下,需要检查每一段通道中同轴电缆的接头,要用万用表去检查是否存在短路的现象,因为一点点虚焊都有可能造成到某个方向的整条中继不通(另外,由于DDF配线架需要同轴电缆头以顺时针方向旋转才能接触上,在实际工作中,曾发生过拔下来时万用表测量电缆头是好的,但只要旋转插到配线架上,电缆头就会缩进去,导致不能接通,所以检查时要特别细心)。所以要仔细观察,轻轻触摸交换机侧、微波侧、光端机侧、配线架上的同轴电缆,看有没有松动,接触是否良好,有无断路、接反或虚焊的现象。
能引起全局性故障的原因有很多,对于日常维护来说,主控框或时钟框异常可能会导致全局性的故障,严重时会影响到全局所有用户的通话。所以维护人员需要了解主控框和时钟框中板件的构成,并留意主控框和时钟框的状态。
主控框负责整机的设备管理和接续控制,是整个程控交换机的控制中心和话路中心。与主控框相关的板件有:PWC 板、BNET 板、MPU 板、NOD板、CKV板等,这些板件相互关联,相互配合。当这些板件发生故障时,极有可能造成全局性故障,如果板件确实有故障,应先充分了解板件功能,再做相应的复位、更换工作。
PWC板为二次电源板,主控框共有四块PWC板,互为热备份,有一块正常工作即可为两框供电。一般来说,四块PWC板同时损坏的可能性比较小,平时要注意板件的运行灯是否正常,特别要注意位于单板上的开关是否被不小心关上。
BNET网板是交换机自身控制、维护通信链路的交换中心,同时也是话音通信和数据通信的交换中心,具有十分重要的作用,一旦发生故障,将会造成整个程控交换机瘫痪,平时要密切留意它的运行状态。
MPU板为主处理板,是模块内的中央处理单元。而NOD板为主节点板,负责MPU与用户框设备及中继框设备之间的通信。
CKV板用于驱动从主控框至各功能单元的差分时钟。
时钟框是交换机稳定运行的基础和保证,时钟系统是数字程控交换系统的脉搏,处理时钟框故障,要了解时钟系统的参考源,处理参考源故障时,应统计出现告警的几率以及是否恢复等因素。若更换参考源,需在更换前通过命令查询备用参考源的状态,确认备用参考源正常后,方可倒换参考源。若参考源正常,则要检查CKS指示灯是否有故障指示,有则应更换单板。
作为C&C08数字程控交换机维护人员,每天都要对设备进行操作和维护,要保障稳定的语音通信,就必须对设备有充分的认识,要密切留意设备的运行状态,对于每一次故障,都要理性分析引起故障的原因,不断积累经验,才能把故障处理好,从而为淮河流域的防汛调度提供稳定的通信保障
淮委通信总站 233001)