(成都天奥测控技术有限公司,成都 611731)
自动测试系统(ATS)是装备维修保障的重要手段,通过自动测试、诊断推理将故障隔离到内场可更换模块(SRU)或元器件,给出维修建议,指导维修,是ATS的主要使命,故障诊断性能是决定ATS 效能的关键要素。故障诊断技术是对系统、设备故障进行检测、识别、分辨和定位的技术[1],传统故障诊断方法有直接观察法、参数测试法等[2],在自动测试系统中采用的故障诊断方法通常有故障字典[3]、故障树[4]、神经网络[5]和专家系统[6]等等。
新一代的自动测试系统采用ATML系列标准用于信息交换,其核心在于利用XML语言按照规定的语法和结构描述测试系统、被测设备、测试流程和测试诊断结果等信息,ATML标准包括IEEE 1671、IEEE 1641、IEEE 1636和IEEE 1232等标准族谱,故障诊断遵循IEEE 1232标准[7]。IEEE1232标准推荐了贝叶斯网络、D矩阵推理、诊断逻辑和故障树等故障诊断模型[8],其中D矩阵模型建立较容易,易于工程实现,被广泛应用于故障诊断和测试性设计领域[9]。田横、段富海、江秀红等基于信息熵研究了一种D矩阵故障诊断新算法[10], 孙萌、景博、黄以锋等针对单特征量D矩阵的不足提出一种多特征量D矩阵模型[11],文献[12]在测试性D矩阵基础提出了单故障化的多故障诊断与维修策略。
IEEE1232“测试设备人工智能信息交换服务使用指南”标准定义的D矩阵推理模型主要用于测试-诊断依赖矩阵的信息交换,具体包含一系列诊断推理规则的编码,构建D矩阵推理模型的信息根源来自于系统测试-故障依赖性建模[8]。下文以图1所示的电铃电路为例,说明依赖模型建立过程。
图1 电铃电路图
电铃电路主要包括电池、开关、线圈和铃舌等4个部件。按下开关时,电路导通,线圈产生磁力吸引铃舌,铃舌与铃铛脱离接触,电路断开,线圈失去磁力,铃舌弹回,敲击铃铛发出声响,电路再次导通,如此循环产生连续敲铃声;松开开关,电路断开,铃声停止。电池、开关、线圈和铃舌故障会引起电路失效。开关故障可分为常闭和常开两种模式,常闭是指开关粘连或卡死导致开关不能弹回,一直处于接通状态。开关常开指开关卡死不能按下或接触簧片断裂导致开关不能接通,一直处于断开状态。电池故障指电量不足以驱动线圈,主要表现为电压低于规定值。线圈故障主要指线圈断开,不能形成电流回路,不能产生磁力。铃舌故障包括常闭和常开两种情况,通常为机械卡死导致不能来回移动,敲击铃铛发出声音。电铃电路故障模式如表1所示。
表1 电铃故障模式
当按下开关电铃不能发出声音或松开开关后声音不能停止,均为电铃电路失效。可以通过按压开关听取声音、测量电池电压、短接开关两端和直接给振铃施加激励电压等方法来检查和隔离故障。按压开关,若不能听到振铃音,则代表“按压”测试失败,可能的原因包括“开关-常开”、“电池故障”、“线圈-断路”、“铃舌-常闭”和“铃舌-常开”等;按压开关,若能正常听到振铃音,则代表“按压”测试通过,可排除“开关-常开”、“电池故障”、“线圈-断路”、“铃舌-常闭”和“铃舌-常开”等故障模式。连续按压、松开开关,若开关能正常弹起则“连续按压”测试通过,否则测试失败,测试通过可排除“开关-常闭”故障,测试失败则代表存在“开关-常闭”故障。利用万用表测量电池正极和负极两端电压,若等于或高于额定值,则“电压测量”通过,排除“电池故障”,若低于额定值,则测试失败,存在“电池故障”。利用导线桥接开关两端,若出现振铃音,则“桥接”测试通过,可排除“电池故障”、“线圈-断路”、“铃舌-常闭”和“铃舌-常开”故障;若没有出现振铃音,则“桥接”测试失败, “电池故障”、“线圈-断路”、“铃舌-常闭”和“铃舌-常开”可能故障。在振铃两端施加电压激励,若能听到振铃音,则“激励”测试通过,可排除“线圈-断路”、“铃舌-常闭”和“铃舌-常开”故障;若不能听到振铃音,则“激励”测试失败,“线圈-断路”、“铃舌-常闭”和“铃舌-常开”可能故障。电铃电路测试项目及诊断逻辑如表2所示。
表2 电铃测试项
依据表2诊断逻辑,可推导出“开关-常开”故障模式将导致“按压”测试失败;“开关-常闭”故障模式将导致“连续按压”测试失败;“电池故障”将导致“按压”、“电压测量”、“桥接”测试失败;“线圈断路”故障会导致“按压”、“桥接”、“激励”测试失败;“铃舌-常开”会导致“按压”、“桥接”、“激励”测试失败;“铃舌-常闭” 会导致“按压”、“桥接”、“激励”测试失败。这种“故障”将导致“测试”失败的关系,即为故障-测试依赖关系。“测试”与“测试”之间也存在依赖关系,包括:“电压测量”失败会导致“按压”、“桥接”测试失败;“激励”测试失败会导致“桥接”、“按压”测试失败;“桥接”测试失败会导致“按压”测试失败。根据这些信息可建立电铃依赖模型,如图2所示。
图2 电铃依赖模型
图2中矩形框为“故障模式”,菱形框为“测试项目”,箭头代表依赖关系。“故障模式”到“测试项目”的箭头表明“故障模式”会导致该“测试项目”测试失败。“测试项目”到“测试项目”的箭头表明该“测试项目”测试失败会导致连接的“测试项目”测试失败。根据电铃依赖模型可构建出表3所示的D矩阵。
表3 电铃D矩阵
表3上部分为测试-测试依赖矩阵,下部分为故障-测试依赖矩阵。矩阵中“1”代表直接依赖关系,对应图2中的1个箭头;“d”代表间接依赖关系,对应图2 中2个及以上的箭头。IEEE1232没有区别“1”和“d”,均代表依赖关系。
D矩阵中的行中的测试项目测试“失败”必然会导致具有依赖关系的列中测试项目测试“失败”,行中的故障模式“存在”必然会导致具有依赖关系的列中的测试项目测试“失败”。从D矩阵中行的测试失败和故障到列中的测试失败推理规则可表达为:
测试行:失败→与列(测试列:失败);
故障行:存在→与列(测试列:失败)。
例如“电压测量”测试失败必然会导致“按压”和“桥接”测试失败,“开关-常闭”故障会导致“连续按压”测试失败。
根据D矩阵中从“行”到“列”推理的逆反命题可推导出,列中的测试项目测试“通过”,则具有依赖关系的行中的测试项目必然“通过”;列中的测试项目测试“通过”,则具有依赖关系的行中的故障模式必然“不存在”;列中的测试项目测试“失败”,则具有依赖关系的行中的故障模式可能“存在”。“列”到“行”的推理规则可归纳为:
测试列:通过→与行(测试行:通过);
测试列:通过→与行(故障行:不存在);
测试列:失败→或行(故障行:存在)。
例如:“按压”测试通过,则“电压测量”、“桥接”、“激励”必然通过;“按压”测试通过,则“开关-常开”、“电池故障”、“线圈断路”、“铃舌-常开”、“铃舌-常闭”必然不存在;“按压”测试失败,则“开关-常开”、“电池故障”、“线圈断路”、“铃舌-常开”、“铃舌-常闭”至少存在1个故障。
测试-测试的推理规则通常用于测试序列优化,例如:当“按压”测试通过时则不需要再进行“电压测量”、“桥接”、“激励”测试,减少测试开销。测试-故障的推理规则用于故障诊断,根据测试结果推理出存在的故障模式。
诊断算法可表述为:
(1)
例如,假设“按压”测试失败,其余测试项均测试通过。按上述诊断流程,首先将测试通过的第1、3、4、5列进行逻辑加,取反后再与第2列进行逻辑与,结果如下:
即D矩阵中第2行 “开关-常开”故障模式存在,无其他故障模式。
某型电台由前面板模块、音频救生模块、数据处理模块、信号处理模块、频综模块、主接收机模块、激励模块、功放模块和柔板及电缆等内场可更换单元(SRU)组成,如表5所示。
表5 某电台SRU组成表
前面板模块提供电台对外接口、整机电源处理、EMI滤波、收发转换、音频接口适配、总线接口等功能;音频救生模块实现音频处理,接收救生频率点信号经变频、放大后输出至信号处理模块;数据处理模块完成话音编解码、信道编译码及数据组/分帧、解/打包等数据处理,同时承担电台整机控制、BIT、对外状态与控制接口;信号处理模块是电台的核心处理模块,要完成不同信号波形和工作模式下的中频信号处理;频综模块以高稳定晶振为频率源,产生电台需要的收发本振,为整机提供高稳定的时钟;主接收机模块完成对接收射频信号的调谐放大及滤波,经过二次变频、滤波及放大,送出符合接口要求的抗干扰中频和常规中频;激励模块完成电台发射频率变换、电调滤波、信号放大功能,为功放提供足够大的激励功率和保证在全频段内的功率均衡;功放模块主要完成功率放大、ALC、AM调制、功率调节和各种控制、保护、检测功能;柔板及电缆用于模块间的信号连接。
当电台工作在接收状态时,从天线接收的信号经过收发开关,进入接收机的电调高放进行选频放大,然后与频率合成器送来的收一本振信号进行一混频,产生一中频信号,经滤波,一中放;再与频率合成器送来的收二本振信号进行二混频,得到二中频信号,再经滤波,中频放大,进入信号处理模块进行相关调制方式的解调,解调出的音频信号经过静噪控制、音频处理电路、低放,得到额定功率的音频信号输出。
当电台工作在发射状态时,话筒送来的话音信号经过机上音响中心送到电台发音频处理电路进行处理,AM方式下,由信号处理模块产生中频信号经变频后,直接在功放进行AM调制,再经功率放大、滤波后输出;对于其他方式,经窄带A/D,转换为数字信号后再作信源编码,送入信号处理模块进行相关模式的调制,输出已调载波,最后由激励模块、功放模块进行上变频、滤波、功率放大后输出。
在电台内场中继级检测中需将故障隔离到内场可更换单元(SRU),测试项目一般包括功耗测试、1553B总线控制测试、自检测试、话音发射功率测试、AM调制度测试、FM频偏测试、AM侧音测试、频率误差测试、数传发射功率测试和接收灵敏度测试。测试通常在外部接口进行,不进行开盖测试,电台依赖模型如图3所示。
图3 某电台依赖模型
某型电台故障-测试D矩阵如表5所示,矩阵中“1”代表依赖关系,即“SRU”故障会导致相应“TEST”测试失败,“TEST”测试失败表明相应“SRU”可能故障,“TEST”测试通过表明相应“SRU”没有故障。
表5 某电台故障-测试D矩阵
假设“FM调制频偏”测试通过,则“前面板模块”、“音频救生模块”、“功放模块”、“柔板及电缆”均无故障,推理表达式为:
TEST6:PASS=>(SRU1:GOOD & SRU2:GOOD & SRU8:GOOD & SRU9:GOOD)。
在ATML标准中要求对D矩阵诊断推理模型的描述即是对此类推理表达式的描述,按照ISO 10303-28格式,采用XML语言描述如下,其中“i261”代表第6列测试通过,“i111”代表第1行无故障,“i121”代表第2行无故障,“i181”代表第8行无故障,“i191”代表第9行无故障。
xmlns:exp="urn:iso:std:iso:10303:-28:ed-2:tech:XMLschema:common"
xmlns:dim="urn:iso10303-28:schema/Ai_estate_dmatrix_inference_model"
targetNamespace="urn:oid:1.3.111.2.1232.100.2011.3"
xsi:schemaLocation=
"urn:iso10303-28:schema/Ai_estate_dmatrix_inference_model
Ai_estate_dmatrix_inference_model.xsd"
express="dim.exp">
假设“频率误差”测试不通过,则“前面板模块”、“频综模块”、“功放模块”、“柔板及电缆”其中至少存在1个故障,推理表达式为:
TEST8:FAIL=>(SRU1:BAD| SRU5:BAD| SRU8:BAD| SRU9:BAD)。
采用XML语言描述如下,其中“i282”代表第8列测试失败,“i112”代表第1行可能故障,“i152”代表第5行可能故障,“i182”代表第8行可能故障,“i192”代表第9行可能故障。
xmlns:exp="urn:iso:std:iso:10303:-28:ed-2:tech:XMLschema:common"
xmlns:dim="urn:iso10303-28:schema/Ai_estate_dmatrix_inference_model"
targetNamespace="urn:oid:1.3.111.2.1232.100.2011.3"
xsi:schemaLocation=
"urn:iso10303-28:schema/Ai_estate_dmatrix_inference_model
Ai_estate_dmatrix_inference_model.xsd"
express="dim.exp">
测试性指标主要包括故障检测率FDR和故障隔离率FIR,利用电台故障-测试D矩阵可快速计算出电台FDR、FIR,其中:
(2)
电台D矩阵中没有全为0的行,即行元素全为0的行个数为0,可计算出FDR=100%。
(3)
FIR(N)为模糊组大小为N的故障隔离率,即将故障隔离到N个SRU(内场可更换单元)的故障隔离率。模糊组是指某些SRU具有相同的测试影响,当这些SRU分别存在故障时,其测试结果完全一致,导致不能将故障精确的隔离到每个SRU。模糊组大小为N是指有N个SRU故障的测试影响是一致的,在D矩阵中的表现为行元素完全相同。某行与其它行都不相同则该行的模糊组1,两行相同则该两行的模糊组为2,3行相同则该三行的模糊组为3,N行相同则该N行模糊组为N。电台SRU模糊组如表6所示。
电台D矩阵中第一行与第九行元素相同,其模糊组大小为2,第二行到第八行元素与任何行都不同,其模糊度为1。则整个矩阵中模糊度为2的行的个数为2,模糊度组大小为1的行的个数为7。
FIR(1)=7/9×100%=77.78%,即将故障隔离到1个SRU的隔离率为77.78%。
FIR(≤2)=(7+2)/9×100%=100%,即将故障隔离到2个及以下SRU的隔离率为100%。
在电台D矩阵中由于“前面板模块”和“柔板及电缆”行元素相同,导致将故障隔离到1个SRU的隔离率较低,仅达到77.78%。为提高故障隔离率需对D矩阵进行优化,电台自检测试结果中包含除“柔板及电缆”之外的各个SRU模块的自检结果,可据此扩充D矩阵列,减少模糊组,扩充后的D矩阵如表7所示。
优化后FIR(1)=9/9×100%=100%,有效提高了电台故障隔离率。
按照本文公式(1)表述的诊断算法可以得到1个故障的集合DIAG[],其过程为在可能故障的集合中剔除必定不存在的故障。但是,DIAG[]仍然是一个可能的故障的集合,只有DIAG[]中元素的和为1时,才能确定1个必然存在的故障。为了分辨“必然”存在的故障和“可能”存在的故障,可分别将每个测试失败列(可能存在故障的集合)中必定不存在的故障排除,若此时当前列只剩下1个故障,则为“必然”存在的故障。将这些故障“加”在一起,则构成“必然”存在的故障集合DIAGCTN;若当前列剩下的故障超过1个,则为“可能”存在的故障,将这些故障“加”在一起,再剔除“必然”存在的故障,则构成“可能”存在的故障集合DIAGUNCTN。诊断算法可表述为:
表6 某电台SRU模糊组
表7 某电台故障-测试扩充D矩阵
(4)
(5)
假设表7所示的D矩阵中TEST1~11测试失败,TEST12~17测试通过,按照公式(1)计算得到:
即:SRU1“前面板模块”和SRU2“音频救生模块”故障。
按照公式(4)、(5)计算得到:
即:SRU1为“前面板模块”必定故障, SRU2为“音频救生模块”可能故障。
D矩阵推理是通过建立故障-测试依赖模型,从而建立故障-测试D矩阵,经过简单的逻辑运算,可完成故障诊断推理,过程比较容易,推理诊断算法简单,工程上可较快实现,已广泛应用于故障诊断领域。在装备中继级检测中,将SRU完全失效定义为故障模式并与测试项目建立关联,即可快速创建故障-测试D矩阵,实现故障诊断,将故障隔离到SRU。在实际应用中测试失败通常具备限定性,如功率高于阀值、低于阀值、远低于阀值等,自检测试失败可能包括SRU1自检故障、SRU2自检故障、SRU3自检故障等,据此细分可增加D矩阵列的数量;同理,对SRU内部器件、单元故障模式入手进行分析,可将SRU故障划分为部分功能失效和全部功能失效,增加D矩阵行的数量,进而提高故障检测率和故障隔离率。