秦 伟
(山西广播电视无线管理中心,山西 太原 030000)
目前,微波中继是传输广播电视信号的一种主要的方式。在微波电路中,经常出现各种各样的故障导致信号传输受到影响,作为数字微波电路的维护管理人员,不仅要在故障发生时沉着冷静地进行正确处置,还应当将已经出现过的各类故障总结记录,以便再次遇到相似故障时能够快速准确地处理,为确保微波电路的安全可靠运行提供强有力的技术保障。
目前,对于数字微波电路的维护管理工作主要依靠网管软件,对于网管站来说,网管软件的功能是必须了解和掌握的,因此在介绍故障案例分析之前,对网管软件进行介绍是很有必要的。由于山西省内微波干线大多使用的是NEC设备,所采用的软件是其开发的PNMTj(PASOLINK NETWORK MANAGEMENT TERMINAL java version)软件。通过该软件,可以方便地实现设备配置、测试及日常维护工作。它具有如下功能:通过图形界面显示各工作模块的工作状态;可以和同一网络中的其他网元进行通信;可以收集本站和远端各站点的设备运行情况和告警信息;可以控制管理本站设备和远端设备;可以分集接入,根据预先定义的级别给使用者分配不同的使用权限;可以对设备上发生过的历史事件及历史告警进行记录和保存;可以对设备的运行性能进行存储,以便使用者分析设备长期运行情况;可以设置设备的功能模块及运行参数;可以对本站设备和远端设备进行软件升级;可以对本站及远端设备完成基本的性能测试。
通过使用PNMTj软件可以对微波网元(站点)的收发信电平进行监视,还可以对当前或者以往的告警进行显示和查询,通过显示的告警类型及描述,可以快速的定位故障点,为排查故障提供技术支持和依据。它还可以把电平的变化通过图表的形式直观地显示出来,可以从图表中明显地看到电平急速变化的时间,因为电平的高低直接关系到整个微波设备的性能,所以电平是我们在维护中最关心的一个指标,可对整个站工作性能有一个较好的反映。还可以通过软件看到站点的误码情况,可以细分到一天内的15分钟。误码率是数字微波电路另一个重要的性能指标,通过误码率和电平的结合判断,可以对台站周围的电磁环境是否存在干扰以及衰落的情况进行判断。
通过使用PNMTj软件可以对微波网元(站点)的的工作日志进行记录,工作日志里面包含了出现过的告警类型,采取的维护操作等相关信息,是维护工作人员判断故障,分析电路状况的一种有效的技术手段,同时也是判断故障,对故障进行定性的依据。
(1)案例一。故障现象:某日,微波网管显示如下:霍山站对汾阳站方向SYS2的DC-DC CONV(电源盘)黑色,SYS1 TRP盘(系统1的收发信单元盘)黑色,霍山站系统2业务中断,从网管终端上也打不开故障单元盘的下一级菜单,且收发信测量值为***。
判断:收发信测量值为***,表示测不到收发信的值,可能的原因是收发信采样电路故障或者收发信单元盘出现故障,且同时电源盘也故障,因为收发信单元盘的供电是由电源盘提供的,所以判断为电源盘及其控制电路故障,让霍山站检查电源盘,发现为电源盘空开热敏电阻损坏,导致无法合上空开,致使电源盘无法上电,从而导致收发信单元盘掉电。
处置:更换备用或者别的系统不用的电源盘空开,故障解决。
(2)案例二。故障现象:某日某时,428站反映山西卫视信号中断。
故障分析:通过查看网管历史告警,428C-Node显示端口号为100BT_LAN_PORT2 LINK DOWN告警,此告警影响本地监视信号。LINK DOWN告警显示为设备掉线,可能的原因是解码器死机或者掉电,也有可能是解码器与C-Node网线接触不良导致。
解决办法:汾阳方向重启山西卫视解码器,重新拔插C-Node设备山西卫视等IP信号的网线或者更换一根新的网线,故障解决。
改革开放40年来,党的知识分子政策不断完善,极大地调动了广大知识分子的积极性,激发了他们的创造力。考察回顾40年来党的知识分子政策的演进,从中可以得出以下几条基本经验:
(3)案例三。故障现象:某日某时,庙前山站对汾阳方向5000S设备CTRL盘、MODEM盘(SYS1、SYS2)、150M接口盘(SYS2)全部变成红色,显示出现高低误码等告警,收发信单元盘正常,且收信电平为-50 dBm左右,在正常范围值之内。此现象出现多次,汾阳及下游台站反映IP电视信号出现中断,最长一次为30 s左右。
故障分析:由于两站的收发信电平处于正常范围之内,但出现高低误码等告警,因此排除天馈线故障的原因,是外界干扰造成的可能性比较大,于是与庙前山站联系,反馈太原市电视台正在庙前山站调整其对寿阳方向45 M小微波的室外天线,此45 M小微波天线与庙前山站对汾阳方向大微波天线位置很近,且天线的方向一致,而且这路小微波的频率也是L8 GHz,和庙前山站对汾阳方向的频率相近,因此怀疑是其干扰造成的。
解决办法:让庙前山站关闭太原市台对寿阳方向小微波,此现象不再发生,因此判断上述故障是由于干扰造成,建议太原市台将其小微波的天线进行调整。
(4)案例四。故障现象:临汾对霍山方向在一段时间内天气等电磁环境良好,但收信电平逐步下降,发信电平值在30 dBm,收信电平稳定为-56 dBm,衰落储备不足,而霍山对临汾方向发信电平为26 dBm,收信为-50 dBm。
故障分析:造成上述故障现象的原因可能是馈线进水或者天线稍有偏移,如果天线进水,晚上气温低,水汽在馈线处凝结,对收信电平造成明显影响,日出后,水汽消散,电平又恢复到正常值,因此日出前与日出后的电平值应该有明显地变化,但临汾对霍山站早晚电平值无明显变化,因此天线出现偏移的可能性较大。
解决办法:让技术人员上塔进行检查,发现临汾对霍山方向的天线固定螺丝松动,导致天线下沉,造成收信电平下降。重新紧固螺丝后,故障解决。
(5)案例五。故障现象:某日某时,从428(汾阳)方向往南各站收发信电平均正常,视频IP业务出现卡顿、马赛克等现象,但广播业务正常。
故障分析:因为收发信电平正常,且广播业务正常,因此判断微波电路是正常的,但视频IP业务却出现卡顿,因为IP是双向的,广播走的是2M时隙,是单向的,因此判断是反向网络拥塞导致视频业务中断。
解决办法:328(霍山站)是428(汾阳)往南方向的下一站,拔掉428对328方向反向155接口连线,428业务恢复正常,因此将拥塞点定位在328及其下游台站。328是枢纽站,其下游台站还有临汾、老顶山、稷王山、木孤台、伊侯山等站,从EMS网管终端上将WAN2(电视业务)端口对每个站点依次禁止。在将伊侯山禁止掉后,328及其他各站电视业务恢复正常。因此故障点定位在伊侯山。因伊侯山站将晋城传送来的电视等IP业务通过微波反向通道传送给大尖山发射站进行发射,其瞬时的流量超过了端口所设计的流量,导致网络拥塞。首先将伊侯山站反向传输的端口禁止掉,先保证正向主要业务正常,然后对伊侯山C-Node设备的端口进行限流等配置后,故障解决。
故障分析:七峰山对大同方向SY2高误码,且收信电平值明显偏低,而系统1正常,因此怀疑是SY2的TRP单元模块出现故障。
解决办法:重启七峰山对大同方向TRP单元模块,故障未消除,更换TRP单元模块后,故障消除。
(7)案例七。故障现象:某日某时,石岭关对1125方向3000S设备系统3的TRP显示UNEQUIPPED告警,其所传输业务倒换至备用波道。
故障分析:UNEQUIPPED告警意为设备没有装备,也就是未加电或者没有装此模块。通过现场技术人员观察发现DC-DC模块也就是供电模块正常,所以判断为TRP收发信单元模块故障。
解决办法:更换TRP模块后,故障消除。
(8)案例八。故障现象:某日某时,霍山对老顶山方向5000S设备的3个系统主天线收信电平为-60 dBm,分集天线收信电平为-51 dBm,相差为10 dB。
故障分析:因分集天线收信电平正常,主天线收信电平明显低,因此判断主天馈系统故障。
解决办法:霍山站维护人员检查天馈系统,发现主天线被大风吹偏,恢复至原位置后,主天线电平恢复正常。
数字微波电路是一个整体,某站出现的故障也不一定就是本站的原因造成的,如案例五,428站及下游台站出现山西卫视等IP业务中断,它的故障点就在伊侯山站,离428台很远,因此在处置故障的过程中,应有整体的概念,从整体考虑,从全局出发。而且故障现象相似也不一定是相同的原因,应相同故障不同对待,避免出现经验主义,如案例一和案例七,它的故障现象都是收信电平无显示,但故障一是由于电源盘空开故障,而案例七是由于收发信单元盘故障导致。因此既要有全局的观念,又要有局部的思维[2]。
数字微波电路故障的判断需要依靠网管与故障台站共同进行判断,而故障最终的判定在网管站,这就对网管站的值守人员提出了高的要求,需要高度的责任心和长期积累的经验。但更重要的是需要较强的责任心,每当收发信电平值与往常相比有较大幅度的变化时,就需要及时通知故障台站,进行分析,是天气的原因还是天馈系统或者别的故障导致。如有一次,某站的3000S设备某一个系统因恶劣天气造成高误码导致切换至备用系统,而当天气好转后,没有切换回主用系统,而值班员在抄表时,发现出现发生倒换的次要告警,而没有引起警觉,使得某系统的业务一直在备用系统进行传送,假设此时另外一个主用系统发生故障,将无法倒换至备用系统造成停传的安全播出事故。正确的处置方法是:当发现一直占用备用保护系统时,此时天气已经好转,造成切换的原因已经恢复正常,及时应将备用系统切换至主用系统,避免发生别的主用系统发生故障而没有备用系统进行切换的故障发生。
因为微波传输电路的电磁环境以及设备老化等原因,微波电路的故障也具有多样性的特点,故障现象表现相同,但造成故障的原因不一定相同,这就需要进行仔细的甄别判断分析,而且每次发生故障处理完成后,都应该形成报告进行总结分析,将故障的现象、故障的分析、故障的判断以及故障的处理进行详细的描述,并通过召开专题会议的形式将故障处理的过程及时进行总结,达到广而告之的目的,使得每名值班人员应知应会,使得下次遇到类似情况时有参考依据。这不是说可以照本宣科,应当从中吸取处理故障的思路,而不是生搬硬套处理的措施。而且台站也应当制定故障处置的流程,将故障的处置流程进行细化,将每个人的责任和权力进行分配,避免出现故障时手足无措,一个好的故障处置流程能够极大地缩短停传时间,缩短故障点的定位时间,可以在遇到故障时能够有效地应对,再者还应当进行适当的演练,演练可以帮助维护人员熟悉操作方法,熟练处置流程,在条件允许的情况下,可以仿真故障,逼近真实环境,便于维护人员消除恐惧心理,有序地采取正确的处置手段。因此对于微波台站来说,在认真做好值守的同时还应当未雨绸缪,做好设备的维护管理工作,备齐备品备件,做好应急预案,并定期组织进行演练,此外还应当组织业务骨干进行学习培训,不断提高设备的维护管理水平和能力。
因为基层台站没由网管软件,所以一旦微波电路出现故障,应第一时间与网管站联系,依靠网管软件,逐层一级级地进行排查,服从网管站的统一调配指挥,查到到故障点后,应首先恢复信号的传输,再做故障处理。
总之,故障的处理需要上下游台站之间的相互配合,需要技术维护人员高度的责任心和大量的实践工作经验的积累。