张日取 蓝世祥 石金保 黄春香 任 旭 赵雪松
(1.华立科技股份有限公司,浙江 杭州 310023;2.深圳供电局有限公司,广东 深圳 430223)
随着数字智能电网的快速发展,具有数字化、互动化以及自动化功能的智能电能计量设备被大力推广应用,出现了智能电能计量设备功能、事件判断以及通信规约等一系列数据传输标准和技术规范,由集中抄表设备通过远程通信模块将相关数据上传至主站,远程通信模块的数据传输质量直接决定了电网运行体系的效果和电网智能化程度。在现场实际应用的过程中,远程通信模块受到各项技术条件(例如环境、技术规范等)的制约,会出现不同程度的失效现象,文献[2]提出了基于元器件应力法的可靠性预计与基于加速寿命试验和加速退化试验相结合的可靠性试验,部分厂家提出了进行可靠性设计、利用高可靠性材料或采用先进工艺3种提高远程通信模块可靠性的对策。文献[3]介绍了在远程通信模块检测过程中应注意和重点关注的内容,部分厂家设计了一种远程通信模块电应力可靠性试验平台,该平台能够模拟现场运行条件,并通过长期运行提前发现远程通信模块的故障,但在设计远程通信模块的过程中进行有针对性的系统测试和分析的相关研究较少。
当前,行业内没有厂家针对实际使用过程中产生的问题进行针对性测试。该文以目前行业内通用的远程通信模块为对象进行研究和总结,尝试为同类产品的可靠性测试技术研究提供参考,结合可靠性领域、仪器仪表行业内的先进研发流程和已有的物联网配电系统检测、测试等技术,为远程通信模块的生产、测试及失效分析提供参考。
该文以目前挂网运行的远程通信模块为例,开展通用的失效分析研究,介绍远程通信模块通用软、硬件失效机理和现象。同时,结合远程通信模块的特性和设计要求等条件进行探讨。
失效分析有2种方法:1)故障树分析法(Fault Tree Analysis,FTA)。2)故障模式与影响分析(Failure Modes and Effects Analysis,FMEA)。
故障树(FTA)分析由顶事件、中间事件和底事件3个部分组成。顶事件、中间事件和底事件通过各种逻辑门进行连接,不同的逻辑门代表不同的意义(使用不同的符号)。
故障模式与影响分析(FMEA)是产品开展维修性分析、安全性分析、测试性分析和保障性分析的基础,分析研究产品在使用阶段可能或实际发生的故障、故障原因及其影响,提高产品的使用性、可靠性,为产品的测试改进、质量评价以及使用维修决策等提供依据。在使用阶段FMEA包括硬件FMEA、软件FMEA以及过程FMEA等。
远程通信模块故障一般包括不能通信、通信不畅以及部分数据丢失。通过FTA方法进行机理分析可以得出发生故障的具体原因,例如电源开路、稳压芯片损坏、电容器损坏、光耦器件损坏以及TVS管损坏等。详细机理分析如图1所示。
图1 远程通信模块故障
现场运行的计量终端与上、下行通信单元等组成通信链路。主处理器通过下行通信单元抄读电表数据,对采集到的数据进行存储和处理并生成相应事件记录,其结果保存在存储器中,可以通过上行通信单元(GPRS/CDMA、10M/100M以太网)向主站提供数据、记录。其中,通信模块包括远程通信模块、485通信模块、载波/微功率无线通信模块以及相关的保护电路。由电源模块提供工作电源,电源模块是计量终端的电源管理部分,发挥隔离、保护、电压变换、稳压以及降噪等作用。其主要失效点如图2所示。
图2 通信模块故障机理分析
计量终端软件平台采用ARM平台、嵌入式操作系统以及模块化设计,一般由模组化终端硬件层、操作系统层以及业务应用层组成。上行通信可以辅助GPRS、CDMA和以太网互换通信模块,下行通信可以兼容RS485、MBus、载波、小无线以及ZigBee等通信方式,从而接入不同种类的能源计量设备。计量终端多采用层次化软件结构设计,层次化软件结构具有以下4个优点:1) 简化软件的设计、开发以及维护工作。支持基于抽象程度递增的系统设计,设计者可以按递增的步骤对复杂系统进行分解。2) 提高了重用率。将应用逻辑作为单独的构件从系统中分离出来,有利于这些构件在该系统甚至是以后的系统中得到重用。3) 有利于在开发者之间适当地分配不同层的开发任务。4) 具有较高的可维护性、可修改性以及可扩展性。实践证明,层次化体系软件结构设计具有便于增加新功能、系统具有可扩展性以及系统维护更方便等优点。因为每层只能与相邻的上下层交互,所以功能的改变最多影响相邻的上下层,可适用不断变化的业务需求。
通过上述对计量终端软、硬件设计架构的分析,充分解读了客户需求。客户未明确或存在隐含性需求就可能给产品设计带来质量风险。这些质量风险通常会在产品运行过程中显示为各类故障现象,收集、分析这些故障现象并形成产品故障现象库(简称故障库),结合现场发生的故障现象,综合分析得到故障库的故障现象,分析结果见表1。
表1 远程通信模块故障现象一览表
根据上述故障分析可知,远程通信模块故障现象主要体现在以下4个方面:1)通信信号性能。2) 电源影响模块通信的可靠性。3) 模块与终端的匹配性。4) 模块可靠性。根据失效分析设计测试用例及测试方案可有效降低由上述4个因素引起通信模块失效的概率。
根据通信信号性能指标可以对通信信号性能进行测试,如图3所示。
图3 通信信号性能测试原理
测试步骤如下:1) 通过频谱仪获取测试环境的背景噪声。2) 测试未经衰减的通信信号强度。3) 得到信号强度值=-。4) 将衰减器的值置为,测试信号强度。5)得到经过衰减后的信号强度值为,=-=-。因为功分器和程控衰减器存在插入损耗,所以-<-(注:每次衰减测试均测试模块是否在线)。
模块产生信号后,信号就分为2路,一路进入功分器后直接经过多路程控开关,由频谱仪直接测试其信号强度。图4为某通信模块的信号强度。
由图4可知,该信号的背景噪声约为-55 dBm,即模块信号强度为-33.65-(-55)=21.35 dB。
图4 通信信号强度
通过测试不同模块通信信号的强度,就可以比较远程通信模块信号的优劣。
远程模块测试原理如图5所示,包括电源、PC系统、串口服务器、控制测量板以及各电源控制开关等设备,主控模块对系统电源上电、下电、切换及通信模块供电电源变化等状态进行控制。同时,控制系统与通信模块之间的数据传输及主控与PC系统之间的数据传输等。
图5 远程模块测试原理图
通信模块电源为5 V(±5%),通信模块电源从5 V开始工作,每次电压的变化值为0.25 V,每次电压步进后测试通信是否正常,其电压变化如图6所示。
图6 电压波动图
步骤如下:1) 将电压降低至4.75 V,通信3次。2)将电压上升到5.25 V,通信3次。3) 将电压降低至4.5 V,通信3次。4) 将电压上升到5.5 V,通信3次。
如果在上述任一电压下通信不成功,就说明模块受电源电压影响较大,对比不同模块的通信情况,可以了解各模块的通信性能。由于模块电源是由采集终端体提供的,因此可以从侧面测量采集终端的电源性能及容量,及时了解采集终端电源提供不足时对远程通信模块通信效果的影响。
设置电源变化曲线测试模块通信是否正常,其电压变化如图7所示。电源在5 s、10 s、10 s以及20 s时,从0 V上升到5 V,在5 V保持15 s,以正常通信为截至时间。
图7 电压缓升缓降图
比较模块不同的电源电压升、降过程对通信的影响,从而比较不同模块的通信性能。模块工作电源是从0 V上升到5 V后开始稳定的,而模块内部其他芯片的工作电压一般为3.3 V,如果各电源之间的时序不匹配,那么模块就可能会进入死机状态,无法工作。
1 s内上电、1 s内下电循环50次后,系统给出5 V正常电源,测试模块是否能正常通信,电压变化如图8所示。
图8 快速上电、下电电压变化图
先上电5 V,持续3 s后掉电,然后上电持续4 s后掉电,再上电持续5 s后掉电,依次持续15 s后,再给出5 V工作电源,测试模块是否能正常通信测试系统读取电压并实时显示相关信息。由于模块内部芯片电源工作电压分别为5.0 V和3.3 V,因此,如果施加电源不停地通断,就可能会导致远程通信模块电工作异常,出现数据传输错误或报文/帧异常的现象。
该文提出了一种基于失效再现技术的远程通信模块可靠性测试方法,该方法结合现场发生的故障对故障进行失效机理分析,归纳失效的主要因素,并针对目前覆盖大部分运行现场故障现象的主要因素,设计了远程通信模块的测试系统,以验证通信信号性能及电源可靠性对远程通信模块通信可靠性的影响,将实际检测结果与检验数据结合起来,通过比较不同厂家的测试数据对各远程通信模块进行综合评价,可有效降低远程通信的综合故障率,通过测试数据可有效评价远程通信模块的质量并预估其寿命,为远程通信模块检测提供了一种可靠性测试方法。