陈 荣,刘 富
(北京卫星导航中心,北京 100088)
芯片信息加载故障诊断的故障树分析法
陈荣,刘富
(北京卫星导航中心,北京100088)
针对导航接收机芯片信息加载故障诊断中出现的依赖技术人员经验、诊断效率低下等问题,采用故障树分析法对芯片信息加载故障进行分析;通过芯片信息加载故障特性分析,建立故障树;进行定性、定量分析,根据故障统计结果给出各底事件的发生概率,计算得出顶事件发生的概率;并给出芯片信息加载故障的预防和诊断方法。结果表明该方法能够有效提高故障诊断效率,并减少故障发生率。
导航接收机;故障树分析法;芯片信息加载;故障诊断;故障预防
导航接收机芯片信息加载涉及到众多的环节。一方面导航接收机生产厂家较多较杂,部分厂家未严格按照协议实现;另一方面由于信息加载设备不够完善,芯片状态多变等原因,芯片信息加载过程时有故障发生,轻则无法加载,影响正常使用,重则造成芯片损坏,接收机返厂。特别是对异地接收机的芯片信息加载故障往往需要多次往返,不仅影响正常使用,而且会造成人员、经费、时间的极大浪费:因此对芯片信息加载的故障诊断显得尤为重要。
目前对芯片信息加载的故障诊断主要依靠技术人员的经验,诊断效率较低且依赖少数有经验的技术人员。本文采用故障树分析法对芯片信息加载故障进行定性和定量分析,以期提高故障诊断效率,并且找出容易造成芯片信息加载故障的薄弱环节,减少故障发生的概率。
故障树分析(fault tree analysis,FTA )法是故障诊断技术中的一种有效方法。FTA法是将系统的各种故障原因(包括硬件、环境、人为因素)由总体至部分、按树枝状结构自上而下逐层细化的分析方法,是用于大型复杂系统可靠性、安全性分析和风险评价的一种普遍、有效的方法[1-4]。20 世纪 60 年代初,文献[5]首先使用故障树分析方法,对民兵式导弹发射控制系统的随机失效问题成功地做出了预测。基于故障树的可靠性分析主要是通过定性和定量分析找出系统的薄弱环节,及时确定故障源。
对故障树进行定性和定量分析的目的是找出其所有最小割集,确定顶事件和底事件的发生概率。故障树的1个最小割集代表系统的1个故障模式,只要有1个最小割集存在,系统就处于故障状态。在对故障树进行可靠性分析之前,作以下假设:1)底事件之间相互独立;2)底事件和顶事件只考虑2种状态,即正常或故障。
设系统有K个最小割集K=(K1,K2,…,Kk),在K个最小割集中,只要有1个最小割集发生,顶事件就发生。为了便于对故障树作定性和定量分析,常采用结构函数对故障树进行数学描述。故障树的结构函数可表示为
(1)
式中每个最小割集Kj(1≤j≤k)是底事件Xi(1≤i≤n)(n:底事件数目)的积事件。通过结构函数可以分析故障树顶事件的发生概率 (系统不可靠度为FS,顶事件为T)为
P(T)=P(T)=p(k1+k2+...+kk)=
F1-F2+…+(-1)k-1Fk。
(2)
当每个底事件发生概率<0.01时,可近似地认为
FS≈F1-F2/2,
(3)
或者
(4)
影响芯片信息加载成败的环节共有4个,分别是信息管理系统、便携式信息加载设备、接收机、芯片。任何一个环节出问题都会导致芯片信息加载失败,如图1所示。
信息管理系统会导致信息加载失败的问题,包括系统内部错误和人为操作失误:系统内部错误指系统由于考虑不周、测试不充分导致的程序漏洞;人为操作失误指各种会导致信息加载失败的人为操作失误,包括提交数据错误、错下数据和漏下数据。
图1 芯片信息加载流程
便携式信息加载设备会导致信息加载失败的问题,包括设备硬件故障、设备软件故障和人为操作失误(设备电量低导致设备无法开机);设备内部数据错误的原因应该归因于信息管理系统,不属于便携式信息加载设备的错误。安全存储介质在信息加载时通常和便携式信息加载设备配合使用,会导致失败的原因包括安全存储介质硬件故障和人为操作失误(安全存储介质和便携式信息加载设备不匹配)。
接收机会导致信息加载失败的原因包括接收机硬件故障、接收机未按标准协议实现(使用旧协议导致信息加载报错、使用旧软件导致接收机显示错误、使用旧协议导致串口不通、未停止串口发送数据导致报错)。
芯片会导致加注失败的原因包括原发性芯片硬件故障、芯片软件出厂缺陷。
芯片信息加载不是一个像汽车发动机、运载火箭之类的硬件系统,芯片信息加载涉及到4种硬件设备、1种软件信息加载,以及一系列的人工操作。芯片信息加载成功的标志是:信息成功加载,同时接收机能够利用相关信息正常工作。由于芯片信息加载过程和一般硬件系统的差别,某些特定故障诊断方法,如基于物理化学现象的方法、基于信号处理的方法、基于传感器的方法,明显不适用于芯片信息加载的故障诊断。适合对其进行故障诊断的方法主要包括基于神经网络的方法、基于案例推理机制(case-based reasoning,CBR)的方法、模糊诊断法、基于故障树的方法。
基于神经网络的方法能够实现故障诊断的自动化和智能化;但是该诊断方法属于“黑箱”方法,不能揭示出系统内部的一些潜在关系,无法对诊断过程给予明确解释,无法给予清晰和一目了然的实践指导,无法利用工程师的经验和技术,网络训练时间较长,并且对未在训练样本中出现的故障无诊断能力[6-11]。
基于案例推理机制的方法是通过访问知识库中过去同类问题的求解从而获得当前问题解决的一种推理模式。该方法应用于故障诊断有广阔的前景,对曾出现过的故障的诊断有较高的效率;但是应用该方法需要积累起大量的故障诊断实例,同时对新机理的故障难以给出正确诊断:因此需要和其他故障诊断方法结合进行[12]。
模糊诊断法认为复杂系统的故障原因和相应症状之间的相互关系一般没有明确的规律可循,很难甚至不可能用精确的数学模型来描述;只能利用模糊数学分析方法来分析和处理。模糊诊断法一般和其他故障诊断方法结合使用。
基于故障树的方法的优点是:能够实现快速诊断;知识库很容易动态修改,并能保持一致性;概率推理可在一定程度上被用于选择规则的搜寻通道,提高诊断效率;诊断技术与领域无关,便于将工程师在工作和科研实践中获取的经验和技术应用起来;建立的故障树可以给人清晰直观的感受,便于指导实际的故障诊断。
基于各种故障诊断方法的分析比较,本文采用基于故障树的方法对芯片信息加载进行故障诊断。
4.1建立故障树
根据故障树顶事件的定义,确定“芯片信息加载失败”作为顶事件。根据芯片信息加载故障特性,按照建立故障树的基本规则和方法,依次列出中间事件,用或门连接各事件后从上而下推理出底事件,建立故障树图,如图2所示。可以看出我们建立的故障树是单调关联故障树。
图2 芯片信息加载故障树图
图2中各符号含义如表1所示,共有 9 项中间事件、17 项底事件。根据芯片信息加载故障记录,得出各底事件概率。
4.2故障树分析
利用故障树定性分析法中的上行法来求解故障树的最小割集,经简化、吸收,得到全部17 个最小割集分别为17个底事件{X1}、{X2}、{X3}、{X4}、{X5}、 {X6}、{X7}、{X8}、{X9}、{X10}、{X11}、{X12}、{X13}、{X14}、{X15}、{X16}、{X17}。
由式(2)可以计算出顶事件概率P(T)=20.625%。顶事件概率偏大主要是由2项底事件“芯片软件出厂缺陷”和“使用旧软件导致显示错误”概率偏大造成的。其他各项底事件概率均在可接受范围内。
从各中间事件、底事件概率中可以看到,中间事件“接收机未按标准协议实现”概率最高,这是符合目前芯片信息加载实际情况的。由于接收机厂家繁多,总会有部分厂家由于沟通原因未按标准协议实现,或者错误地使用了旧版本的协议和软件,这些都会导致芯片信息加载故障。
表1 芯片信息加载故障树图含义 (%)
“芯片软件出厂缺陷”概率较高,该事件虽是偶发事件,经过整改后可以解决;但是生产厂家必须要注意生产质量,否则影响范围会很大。
“信息管理系统内部错误”故障概率虽不高,但一旦出错,影响就是全局性的;生产厂家要提高责任心,加强测试力度,保证提交产品的质量。
4.3芯片信息加载故障预防与诊断方法
芯片信息加载故障预防措施:1)加强宣贯力度,保证新版本的协议及时下发到每一家接收机厂家;2)在接收机测试环节增加接收机协议一致性测试,确保接收机严格按照协议实现;3)芯片和信息管理系统生产厂家要加强测试,保证提交产品的质量。
芯片信息加载故障诊断方法:参照芯片信息加载故障树图,结合具体故障现象,逐项排查故障。排查顺序为接收机、芯片、安全存储介质、便携式信息加载设备、信息管理系统。
通过为期半年的实际应用,结果表明上述故障预防和诊断方法可以有效降低故障率、缩短故障诊断时间。通过实施故障诊断办法,业务人员可以更快速地实施故障诊断,故障诊断从动辄数小时乃至数天,到平均耗时控制在1 h以内;通过实施改进措施,故障率畸高的2项底事件“芯片软件出厂缺陷”和“使用旧软件导致显示错误”的概率大大降低;通过实施故障预防措施,底事件“未停止发送串口数据导致报错”和“使用旧协议旧软件导致串口不通”的概率也得以降低,顶事件的概率从而得以显著降低,达到了降低故障率的目的。
本文采用故障树法对芯片信息加载故障进行分析,通过对芯片信息加载故障特性的分析,建立了芯片信息加载故障树图,并进行了定性和定量分析,给出了芯片信息加载故障预防和诊断的方法。经过为期半年的实际应用证明,本文提出的故障诊断和故障预防措施是有效的,可以较好提高故障诊断效率,减少故障出现概率。下一步将开展故障树和模糊诊断、基于案例推理机制方法相融合的故障诊断方法的研究。
[1]王东,郭永,胡经民,等.基于故障树分析法火箭测量系统故障诊断研究[J].北华航天工业学院学报,2014,24(3):20-23.
[2]陈春俊,王雪梅.测控系统故障检测与诊断[M].成都:西南交通大学出版社,2008:21-22.
[3]国防科学技术工业委员会.GJB/Z 768A-1998:故障树分析指南[S].北京:国防工业出版社,1998:1-2.
[4]梁芬,姜宏伟,郭亚男,等.基于FTA的焊接机器人故障诊断技术研究[J].机电工程,2014,31(8):1067-1070.
[5]王玉刚,王海东.基于故障树的某型装备故障诊断专家系统[J].仪器仪表用户,2012,19(2):3-5.
[6]钦劲,董豆豆,孙权,等.基于故障树的导弹故障快速诊断决策支持系统[J].装备学院学报,2006,17(1):107-110.
[7]郭博.基于神经网络和故障树的运载火箭故障诊断系统的研究[D].成都:电子科技大学,2010:45-47.
[8]闫剑平.一种故障树模块的划分方法[J].北方交通大学学报,2000,24(5):63-66.
[9]蔡伟,王瑞林,李涛.基于模糊故障树的某型步枪卡弹故障机理分析[J].科技通报,2013,29(6):50-52.
[10]何桂青,陈英,范丽云,等.运载火箭故障诊断专家系统[J].北京理工大学学报,1998,18(6):685-688.
[11]王英,沙云东.航空发动机故障诊断技术综述[J].沈阳航空工业学院学报,2007,24(2):11-14.
[12]李晓辉,刘妍秀.基于实例推理机制(CBR)综述[J].长春大学学报,2006,16(4):68-70.
Fault tree analysis on fault-diagnosis of chip information loading
CHEN Rong,LIU Fu
(Beijing Satellite Navigation Center,Beijing100088,China)
Aiming at the problem of the experience dependency and diagnostic inefficiency in the process of the fault-diagnosis of chip information loading by the navigation receiver,this paper studied the fault-diagnosis of information loading based on the fault tree analysis:building the fault tree was built through analyzing the fault characteristics of chip information loading;the qualitative and quantitative analysis was carried out for fault-diagnosis,the bottom-event occurrence rate was given with the statistical results of faults and the top-event occurrence rate was calculated then;meanwhile,the prevention measure and diagnosis method were presented finally.Result showed that the proposed method could increase the fault diagnostic efficiency and decrease the fault incidence rate.
navigation receiver;fault tree analysis;chip information loading;fault-diagnosis;trouble-saving
2015-10-29
陈荣(1978—),女,江苏南通人,工程师,研究方向为卫星导航和装备可靠性及维修性。
10.16547/j.cnki.10-1096.20160302.
P228
A
2095-4999(2016)03-0006-04
引文格式:陈荣,刘富.芯片信息加载故障诊断的故障树分析法[J].导航定位学报,2016,4(3):6-9.(CHEN Rong,LIU Fu.Fault tree analysis on fault-diagnosis of chip information loading[J].Journal of Navigation and Positioning,2016,4(3):6-9.)