杨新星,秦 赟,奚 俊,张志强
(1. 海军装备部驻南京地区第二军事代表室,南京 211153;2. 中国船舶集团有限公司第八研究院,南京 211153)
随着武器装备性能的日益提高及技术的快速发展,测试性受到越来越多的重视。GJB2547A-2012《装备测试性通用工作》中对测试性的定义:产品能及时、准确地确定其状态(可工作,不可工作,性能下降)和隔离其内部故障的一种设计特性。[1]
作为装备的一种设计特性,测试性具有与通用质量特性中可靠性、维修性、保障性、安全性等同等重要的位置,是构成武器装备质量特性的重要组成部分。良好的测试性分析与诊断能力是确保装备战备完好性、任务成功性的重要中间环节。
在目前的装备测试性设计过程中普遍存在以下问题:测试设计简单、故障检测率不高;测试点设计冗余、基本可靠性影响过大、资源费用浪费;测试点类型设计不合理、故障隔离率低。这些问题严重制约了装备的战备完好性、任务成功性。
本文研究了基于多信号模型的测试性建模仿真分析方法,并应用测试性分析软件TMAS,对典型装备进行了测试性建模、仿真与分析,为装备的测试性设计的提高提供了一种定性、定量分析支持方法。
测试性设计技术的快速发展经历了由外部测试到机内测试(Built-in Test,BIT)、智能BIT到综合诊断直至目前先进的预测与健康管理的发展过程。测试性设计是为了提高产品自诊断和外部诊断能力,能方便、有效地确定产品状态和隔离故障。测试性是产品的一种设计特性,是伴随功能原理设计时赋予产品的一种固有属性。
测试性设计技术主要有以下几种[2]:(1)固有测试性;(2)机内测试;(3)外部自动测试;(4)人工测试;(5)综合诊断;(6)健康管理。
目前,(1)~(4)项设计为常规测试性设计,其中固有测试性和BIT为目前装备设计的重点,外部自动测试和人工测试根据装备使用环境、装备测试条件等选择使用;(5)~(6)项是对现有测试性设计技术的重要扩展,也是装备测试性设计的发展研究方向。
本文研究的测试性建模仿真分析技术主要针对设计技术对象为固有测试性、BIT,以及用户可实现的人工测试和部分综合诊断。
测试性设计的性能参数有故障检测率、关键故障检测率、故障覆盖率、故障隔离率、虚警率、平均虚警间隔时间、平均故障检测时间、平均故障隔离时间、平均诊断时间、平均BIT运行时间、误拆率、不能复现率等[2],其中装备常用的测试性参数主要有:
(1) 故障检测率是指在规定的时间内用规定的方法正确检测到的故障数与被测单元发生的故障总数之比;
(2) 故障隔离率是指在规定的时间内用规定的方法正确隔离到不大于规定的可更换单元数的故障数与同一时间内检测到的故障数之比;
(3) 虚警率是指在规定的工作时间内发生的虚警数与同一时间内的故障指示总数之比。
本文研究的测试性建模仿真分析技术可分析预计的参数主要为故障检测率和故障隔离率。
作为一项重要的测试性设计工作内容,建立测试性模型包含在GJB 2547A-2012《装备测试性通用工作》的测试性设计与分析工作项目要求中,其目的是建立产品的测试性模型,用于分配、预计、设计和评价产品的测试性。[1]
在模型建立的基础上,可通过测试性仿真软件进行测试性辅助设计及仿真评价。测试性建模分析工作应在装备系统的初步设计阶段开展,随着设计的深入应该逐步迭代该项工作,不断细化模型以反映系统的变化。在初步设计阶段可通过建模仿真预计结果调整方案阶段测试性指标的分配,而在详细设计阶段可用于指导对测试性设计的优化。通过对测试点及测试方法的不断去冗余、增加必要测试等优化设计,或者发现系统功能结构流程中的问题进行调整修改和重新划分设计等工作,不断完善设计迭代仿真,直至仿真预计结果满足总体或任务书对测试性故障检测率和故障隔离率指标的要求,给出仿真条件下装备测试性评价,利用诊断策略可以直接建立用于BIT或ATE的诊断算法,或者用于人工测试的诊断流程。
美国DSI公司的创始人De Paul从20世纪60年代开始首先将相关性模型应用于装备的诊断开发。相关性模型是一种以相关性推理为基础按照故障如何被发现的过程来设计故障检测和隔离的方法,可以直接用于解决故障检测和隔离问题。
基于相关性的模型主要有相关性图示模型和相关性数学模型。相关性图示模型可以直观地图形化展示单元与测试之间的关系,而相关性数学模型则是用D矩阵方式描述了单元与测试之间的相关性。相关性图示模型、相关性数学模型示意图如图1所示。
图1中信号流比较简单,单元模块的故障模式F也比较单一,且故障模式F未设置功能概念,因此引入多信号模型(Multi-Signal Model)的概念。多信号模型为目前相关性图示模型中的一种常用模型, 也是常用测试性分析软件的基础模型,采用图1相关性图示模型中的带箭头指示的线段描述故障传递关系。考虑到多种故障模式,每种故障模式可以看成一种单一信号,故称为多信号模型。只需要对故障模式如何传递到各个测试点进行建模,并把故障模式分为功能故障和完全故障2种类型。[3]
图1 相关性图示、数学模型示意图
多信号模型图形化表示了装备的组成、结构层次、多信号流程、多种故障模式、功能等,将一组单信号的传递过程附加到结构模型上。所以,模型与系统原理流程图密切相关,更加接近于系统的物理结构。此外,由于模型中的信号是独立的,信号之间不会相互影响。这些特征使得多信号流图模型建模简单、模型的集成和验证都相对简单[4],特别适用于大型复杂系统。
目前,国内最具代表性的基于相关性模型的测试性分析工具是北京航空航天大学可靠性工程研究所的测试性建模与分析系统(Testability Modeling and Analysis System,TMAS)。
TMAS集测试性建模、测试性分析和诊断推理三大功能于一体,可广泛地应用于大型复杂电子、机械、机电系统等复杂系统的测试性设计与分析,可快速地建立符合相关性理论和多信号流图的层次化图形模型,并快捷完成分析、修改再分析工作。
通过测试性分析,TMAS可输出模型组成、模型汇总、故障源汇总、测试汇总、模型统计参数等建模汇总类信息;同步完成对装备的定性分析和定量分析,其中定性分析是指对不可检测故障、故障模糊组情况、冗余测试、反馈环、隐蔽故障等的分析。定量分析是指对测试性参数故障检测率和故障隔离率的分析。同时,TMAS还可输出图形或表格形式的诊断策略用于BIT或ATE的诊断算法建立和人工测试的诊断流程,并提供了D矩阵的自动化生成功能供设计师进行相关性数学模型的测试性分析。此外,测试性分析还能提出针对装备原有测试性设计不足的建议,分析结果便于下一步的测试性改进设计。
应用以上测试性基础研究及模型理论研究的成果,对某装备进行了测试性设计的建模仿真分析实例化操作。针对该装备TMAS测试性建模分析的主要流程如下:
(1) 资料收集
在进行测试性建模前,首先要进行相关信息的收集,主要包括:(1)该装备整机、分系统、模块等各个层次的可用设计信息,如装备研制总要求中规定的测试性指标要求;(2)整机、分机方案中设计的组成结构层次、功能原理流程、测试性指标预计值;(3)各层级FME(C)A分析结果等。本分析实例考虑故障率情况下的分析,还收集了各模块可靠性预计数据。考虑维修性相关分析还需收集操作说明、维护信息等。但是,这些不是测试性分析所必需的,本分析实例暂未考虑维修性相关分析。
(2) 故障模式与测试方法分析
在收集的资料尤其是FME(C)A分析结果的基础上,结合故障的相关信息在系统级别、分系统级别、模块级别依次开展测试性分析。分析内容主要包括故障模式、测量参数/测试点、测试方法的选择等,形成了基于FME(C)A分析的测试性信息分析报告。
分析中需注意装备各层次均应进行故障模式与测试方法分析以获取测试性设计信息。分析工作是逐步深入和细化的过程,经过了多轮反复迭代。该流程步骤是整个建模仿真分析的核心重点。输出的故障模式、测量参数、测试点(测试部位)、测试内容、测试方法等测试性信息是测试性仿真分析的基础数据。它们的详细、准确程度直接决定了仿真分析的结果。
值得说明的是,测试性设计中模块级故障模式分析更多的应该还是从功能故障模式去考虑。这其中涉及测试性设计是采用基于功能或数据流的测试还是基于硬件故障的测试方法选择。选择不是绝对的,而是根据具体情况。基于功能或数据流的测试往往比较复杂,但直接反映故障模式。基于硬件故障的测试简单,但往往间接反映故障模式,而且多故障原因下容易测试不全面导致漏报。
(3) 层次化建立装备的结构模型
根据装备收集到的组成结构层次框图以及要求测试性分析的层次深度建立装备的系统结构层次化模型。TMAS系统的层次化模型支持System、Subsystem、LRU、SRU、Module、Component、FailureMode几个层次,并可用户自定义层次配置。根据装备测试性指标要求的级别以及装备设计常用的划分灵活配置。本次分析的装备测试性指标要求检测隔离到LRU级,则选择了System、Subsystem、Cabinet(自定义)、LRU、FailureMode层次,对应整机、分系统、分机/插箱、可更换单元模块、故障模式共5个层次。基础FailureMode层次为LRU级FME(C)A分析的故障模式结果。
(4) 添加模块、故障模式、功能
根据收集到的组成结构层次框图,以及FME(C)A的分析结果,在TMAS中图示化建立层次,分析层次下添加功能模块、在功能模块下添加分析对应的故障模式。在TMAS中层次、模块、故障模式均由“模块”图元实现,在设置中选择属性加以区分。层次、模块必须设置名称、端口信息;故障模式必须设置名称、端口信息、可靠性参数(含严酷度等级),选择性设置功能、维修性技术数据、自测试等相关信息。
TMAS中的功能为一种特殊的信号:关联了某一功能的故障源只能被同样关联了该功能的测试检测到,而不能被没有关联该功能的测试检测到。简单理解可以将功能理解为具有特定处理的功能,而且可以设置专门对应的测试来检测该功能的失效。可在模块或故障模式设置界面中添加功能,并将其关联到故障模式中去。
(5) 在模块、故障模式间建立信号流连接
根据收集到的整机、分机功能原理流程图在模块之间添加单向信息流连线,使各个模块实现互联。此连线表示模块之间的信息传递关系,故障模式、功能可以通过连线进行传播,而且多种功能可以通过同一连线进行传播。
在此需要注意的是,建模所需的信息流程图能表明装备系统中主要信息流转的过程即可,与实际装备系统多类型复杂连线要有区别。主要考虑满足故障模式沿该信息流传播(故障对当前信息流造成影响)的需求,不能划分太粗,导致故障模式影响到本不会影响的信号,影响建模分析的结果;也不能划分太细,导致无谓的浪费、增加建模的难度及工作量。
(6) 添加测试点及测试
根据实际情况设置测试点。测试点指的是实际工程中设计、执行测试的位置。在同一个测试点可以执行多种测试。测试方法类型是必须设置的,可选择性设置测试费用、测试时间等。在TMAS中提供了两种测试点,即普通测试点与限定性测试点。两种测试点的分析结果有所区别。限定性测试点中的测试如果关联了某功能,则该测试只能测到关联了相同功能的故障源,而测不到未关联任何功能的故障源以及关联了不同功能的故障源。普通测试点中的测试如果关联了某功能,则该测试能测到关联了相同功能的故障源以及未关联任何功能的故障源,而测不到关联了不同功能的故障源。简单理解可以认为普通测试点基于故障模式数据流传递的测试,限定性测试点可以用于一些专有功能测试的情况。在使用选择时可灵活把握选用原则,一种典型的选择原则是基于数据流的测试可选择普通测试点,基于具体故障的测试可选择限定性测试点。
(7) 测试性自动分析及人工分析
模型建立完成后进行数据校核,确认无误后可进行测试性自动分析。选择分析范围、隔离层次、分析所用的测试类型;是否分析未检测故障、模糊组、冗余测试等;设置工作模式和配置的选择分析何种模式。软件可自动分析给出相关结果,主要如下:
• 建模汇总类信息:模型组成、模型汇总、故障源汇总、测试汇总、模型统计参数等;
• 定性分析:不可检测故障、故障模糊组、冗余测试、反馈环、隐蔽故障等;
• 定量分析:测试性参数故障检测率和故障隔离率(分别隔离到1、2、3个LRU)的分析结果;
• 图形或表格形式的诊断策略(故障诊断二叉树);
• D矩阵信息。
图2~4展示了本分析实例的部分仿真结果。
图2 测试性图形建模结果
(8) 模型修正和迭代分析
建立复杂电子系统的测试性模型通常需要根据实际情况进行修正。下面列出几种经常遇到的情况及修正方法:
• 如果一个系统存在冗余结构,可应用相关性模型的一个基本假设:“在任何时刻当被测单元处于故障状态时,认为只有一个组成单元发生了故障,即单故障假设”[2],结合建模分析的基本原理是故障在传递过程中的检测性,将冗余结构简单进行并联建模,即单一故障即全故障,同时在故障模式的可靠性参数中将严酷度等级下调;
• 如果一个系统有不同的运行模式,则使用“工作模式和配置”选项进行建模,分析时可针对不同工作模式单独分析;
• 反馈环即电路中的闭环设计,它将导致不可解决的故障模式模糊集合,需分析修正结构、流程以避免不必要的反馈环设计;
• 不可检测故障指利用现有测试不能检测的故障模式;冗余测试指具有相同特征(即检测同一个故障模式集)的测试。需仔细分析,通过增加、删除、修改测试点等措施加以修正;
• 故障模糊组指一组具有相同可观测特征的故障模式集合,故障模糊组直接导致故障隔离率的降低,需分析产生原因,选择性地通过调整测试点、修改信号流程等措施改进设计。
针对本分析实例的仿真结果进行分析:
(1) 将测试性图形建模结果(图2)、D矩阵结果与相关性图示、数学模型示意图(图1)进行对比,可以看出:在建模中每个模块均考虑了多种故障模式,信号流也多种多样,故障模式中也对应设置了功能模式。借助生成D矩阵信息,还可人工进行相关性数学模型的测试性分析。
(2) 故障诊断二叉树(图4)直观地以图形形式表达了当前建模的诊断策略,根据每一步测试结果进行下一步的诊断测试,直至进行到底层事件,即最终故障诊断结果。人工查看该诊断策略是否符合实际装备设计,最终结果用于BIT或ATE的诊断算法建立和人工测试的诊断流程。在本实例结果图中明显可看到下方底层事件有模糊度为3的故障模糊组。
图4 故障诊断二叉树
(3) 从测试性建模仿真结果(图3)可以看出,该分系统检测率及隔离率都不高。设计师可具体查看不可检测故障及模糊组等具体报告子项了解具体问题。
图3 检测率、隔离率、不可检测故障等仿真结果
结合TMAS软件提供的一种特殊的DFT模式,查看模型故障源信号传播路径以及故障、测试之间传递关联建立不当问题。分析不可检测故障产生的原因,是故障传递流程设置错误、测试点位置设置错误、测试类型设计错误还是实际工程中本故障就难以测试等等,针对性地加以修正改进设计。本例中网络模块原设计考虑只是一个对外接口传输通道,不方便检测,改进设计时可借由主机模块的初始化设置上电BIT,开机过程中利用板卡状态与外部数据流综合判断的周期BIT,以达到模块的可检测。双冗余电源原本设计是考虑没有供电,主机模块无法检测故障,改进设计可考虑电源的冗余性,互相支持检测,辅以人工检测电源指示灯的方法实现模块的可检测。
分析模糊组及反馈环等主要子项报告,查找形成原因并消除,即可提升隔离率指标。本例中视频发送模块、光纤接口模块、电源为模糊组,分析后主要原因为:(1)电源只设计了指示灯检测点,分析隔离率时未将该人工测试类别加入分析,非设计原因;(2)视频信息由视频发送模块传输至光纤接口模块,经接口转换后再输出。原测试设计采用了在光纤接口模块输出端设置检测数据流的测试方法,无法定位视频无输出故障具体是由两个模块中哪一个导致,模糊度为2。针对第2个原因,优化测试点设计,在前端视频发送模块增加设置测试点,测试前端视频发送模块送出的视频数据流,或者当前端无法设置测试点时可在后端光纤接口模块增加基于功能的测试点(该功能定义为“前端视频发送模块输出”,即在数据流中设计专门的前端数据流特征标识用于区分前端后端数据),均可以将模糊度提高为1。
经过以上分析处理,该分系统自身的检测隔离率指标均达到100%(基于当前分析的基础故障模式数据条件下)。通过对测试点及测试方法的增加必要测试、设置功能测试、去冗余、等优化设计,或者发现系统功能结构流程中的问题进行调整修改和重新划分设计等工作,不断模型修正、迭代仿真,直至仿真预计结果满足总体或任务书对测试性故障检测率和故障隔离率指标的要求。
本文介绍了基于多信号相关性图示模型的TMAS软件测试性建模仿真技术与应用研究过程,主要包括:
(1) 研究了测试性设计技术、测试性主要参数;
(2) 研究了测试性建模的相关性模型基础;
(3) 基于相关性模型中典型的多信号模型,实际应用TMAS软件对某装备进行了测试性建模仿真分析,研究了TMAS测试性建模仿真分析技术流程及每个步骤的重点关注事项。
通过对模型理论研究以及对仿真分析流程的构建研究,初步实现了对真实装备测试性设计的建模仿真分析,评估了装备目前的测试性设计水平,发现并解决了部分测试性设计问题,为装备的测试性设计提高提供了一种定性定量分析支持方法,有益于装备维修性、可靠性等的设计提高,对提升装备的战备完好性、任务成功性具有重要的意义。