刘静敏
(国家新闻出版广电总局无线电台管理局2021台中控机房,黑龙江 齐齐哈尔161000)
【摘 要】针对转动天线远程控制系统存在问题,进行了全面系统分析,并提出解决方案。
【关键词】自动化;串口通讯
一、概述
由于我台中控机房进行集总控制,各机房端只进行设备维护、必要的巡视和应急故障处理工作,所以相关设备的远程控制系统稳定與否直接影响全台的安全播音工作,本文就新系统运行以来发生的一些典型故障进行了总结分析,并提出有针对性的解决办法。
二、典型故障
类型一:
中控机房远程控制系统执行倒频操作时出现参数无法切换,“Power on” 异常打开故障。A:转动天线频率、组态和角度无法切换。天线本地控制柜屏幕提示“Power on”打开状态,天线本地触摸屏被屏蔽无法进行操作,发射机端显示天线互锁闭合,如重启天线本地控制系统后现象依旧。此种情况采用升落高压的方法处理“Power on” 异常打开故障,然后可以进行后续正常的远程或本地操作。B:转动天线频率、组态切换到位,但角度无法切换。天线本地控制柜屏幕提示“Power on”打开状态,天线本地触摸屏被屏蔽无法进行操作,发射机端显示天线互锁开,如重启天线本地控制系统后会额外出现ATU水冷故障和ATU控制故障。此种情况需要的复位转动天线四层B4R1柜控制系统中的相关故障,之后天线互锁闭合,再采用升落高压的方法处理“Power on” 异常打开故障后,可以进行后续正常的远程或本地操作。
类型二:
中控机房远程自动倒频时,预设值已经设置成功,但转动天线频率、组态和角度无法切换,无法自动进行后续执行操作,远程切换为手动仍无法进行操作。此时可倒本地进行手动天线倒频操作。
三、分析及处理
对类型一的故障进行原因分析:
天线控制系统判定天线是否在加高压状态,完全依靠于远程控制系统反馈的“Power on”信号,此信号级别最高,保证在天线加高压状态下禁止天线的任何本地或远程操作。
A:倒频过程中远程控制系统异常给出“Power on”播音指示信号的激活命令,将造成天线本地控制系统进入异常状态,会立刻禁止所有正在进行(或准备进行)的操作。直至“Power on”解除。此时天线控制系统处于既不执行倒频操作又无法给出天线到位的闭锁信号的状态。远程控制系统后续指令处于队列中,无法执行。机房端本地控制全部屏蔽,也同样无法执行。
B:落高压过程中远程控制系统没有关闭“Power on”信号,由于“Power on”一直存在,造成远程控制端操作受限,无法倒频,并且使后续指令处于队列中,无法执行。机房端本地控制全部屏蔽也无法进行相关操作。
类型一故障的解决办法:
由于转动天线远程通讯接口DF1协议在通讯过程中校验不足,可能在通讯过程中发生错码,误激活“Power on”播音指示信号位,造成意外“Power on”播音指示信号激活。解决办法:在远程控制端采取措施,与开发人员联系,修改远程控制端程序,去掉实际意义不大的“Power on”信号指示功能,系统不去激活使用该功能,同时增加关闭“Power on”的独立按钮,在特殊情况下可以强制关闭。同时检查整改通讯链路设备的可靠性,强化光猫等设备的接地和抗干扰措施。
其中一次故障出现在自动播音状态下,远程端手动落高压,然后手动输入进行倒频操作过程中,可能存在程序未知bug,导致切换后手动操作时程序处于不稳定状态,或此过程中其他未知因素出现,结果导致异常“Power on”激活。此隐藏bug排查起来十分困难,且找不到相关影响因素。需要积极与开发人员联系,查找远程控制端程序bug,排除潜在隐患,增加设备可靠性。
本地控制系统设备老化造成的可能性较小,首先本地控制核心器件plc处理器,之前进行过更换,且罗克韦尔的PLC具有高度稳定性。为了排除相关可能性,可以更换新的SLC5/03板、SLC5/04板核心处理器板卡。
对于附加的天线系统水冷故障解决方案是进行转动天线ATU冷却系统加装水流接点延时装置,解决ATU水冷系统启动初期60秒左右时间内,纯净水逐渐充满整个冷却管线和器件过程中,流量计浮子大幅度波动,造成接点频繁开闭,进而导致控制系统出现水冷故障,避免此故障同时出现具有重要意义,可以大幅度缩短异态处理时长,减少停播时间。
对类型二的故障进行原因分析:
倒频操作由二条写命令和对应的返回确认数据组成,第一条为远程发送的预置数据写命令,天线本地端返回确认数据,然后第二条为根据返回的确认数据发出执行命令,天线本地再次返回确认数据,天线同时开始动作。如果远程第一条指令发出后,收不到返回确认指令,或返回指令传输过程中发生错误,会导致系统一直处于等待状态。
是否会进入异常处理分支程序及如何处理,这完全依赖于程序设计。如果没有及时有效异常处理机制和串口通信管理机制,由于通讯口指令队列中原(写)指令未完成,会导致后续对串口操作(包括手动)指令一直处于后续队列排队中,无法执行。进而远程无法操作。
解决办法:
由于转动天线远程通讯接口DF1协议在通讯过程中校验机制不足,可能在通讯过程中受到干扰发生错码,导致回传确认数据格式错误,被远程控制端丢弃忽略。在远程控制端采取措施,与开发人员联系,修改远程控制端程序,完善通信异常处理机制,采用定时重发和执行结果确认方式,同时完善串口管理程序,采用优先级管理,保证重要操作优先执行。同时检查整改通讯链路设备的可靠性,强化光猫等设备的接地和抗干扰措施。加强机房监测平台的监测功能,监测倒频时的设备运行状态,如未在规定时间内动作,及时给出告警提示。
其他可能因素:
通讯速率也是影响系统稳定性关键问题之一,由于PLC系统通讯处理能力有限,过短的刷新周期将有可能造成系统不能及时响应,特别是当PLC处于进行复杂运算状态,此时PLC一个扫描周期将变长,此时通讯内容可能没有被执行前就被后一条刷新,如果远程端没有完善的异态处理机制,将会造成未知的故障,为此,可在保障通讯时效性基础上,将通讯速率降低,避免此类问题发生。
四、小结
自动化系统改变了原有的运行方式,提高了运行效率,把值班人员从繁重操作中解放出来,但随着自动技术的发展,设备的稳定运行越来越依赖于自动化系统,这对自动化系统提出了更高的要求,而自动化系统必然会存在漏洞和不足,这就要求我们在工作中善于发现问题,及时总结分析,对系统不断进行完善,以便使自动化系统更加稳定的运行,更好的服务于安全播音工作。