基于马尔可夫链的空间站推进1553B通信系统可靠性分析*

2022-08-28 09:40仇存凯张晓慧吴鹏飞朱紫涵
飞控与探测 2022年3期
关键词:概率动态处理器

仇存凯,张晓慧,樊 弢,吴鹏飞,朱紫涵

(1.上海航天控制技术研究所·上海·201109;2.上海惯性工程技术研究中心·上海·201109)

0 引 言

1553B通信具有可靠性高、实时性强、易于扩展等优点,现已广泛应用于航天数据传输系统。但是,由于太空中各种不稳定因素的存在,如单粒子翻转等,若不对空间站推进1553B通信系统进行冗余设计,系统存在单点失效的可能,导致推进系统与外界通信异常,进而影响空间站正常运行。为避免单点失效对空间站造成的不良影响,利用冗余技术安全可靠、容错性能好的特点,对1553B通信系统中重要的电子元器件进行双余度冗余设计,以保证系统可靠性。

目前,可靠性分析研究方法主要包含威布尔模型法、贝叶斯网络法以及马尔可夫链法等。其中,威布尔模型法基于系统样本数据进行分析计算;贝叶斯网络法侧重于事件静态概率分析;马尔可夫链法则根据系统状态转移关系分析其动态可靠性。鉴于空间站推进1553B通信系统属于单件小批量产品,本文采用马尔可夫链法建立可靠性模型,分析1553B通信系统的动态可靠性,并引入可靠度以及平均无故障时间作为可靠性定量指标。

由于本文设计方案对空间站推进1553B通信系统中包含数据隔离芯片在内的远程终端及其处理器均进行了双余度冗余,系统状态组合随之增加,这将导致系统可靠度求解过程变得复杂。因此,本文将1553B通信系统故障树中的动态子树与静态子树进行分离,采用马尔可夫链求解动态子树,并在此基础上求解整个系统故障树,以简化求解过程,提高计算效率。

1 马尔可夫链简介

定义{(),≥0}为系统在时刻所处状态,其取值范围为可数状态集合={1,2,…,},其中(属于非零自然数)为系统状态总数,()在集合上随机取值。对于任意时刻(属于自然数),有0≤<<…<<+1,若+1时刻系统所处状态概率满足式(1),则将式(1)描述的随机取值过程称为马尔可夫链。

{(+1)=+1|()=,(-1)=-1},…,

()=}

={(+1)=+1|()=}

(1)

式中,为系统在时刻所处的状态,∈。

在任意≥0时刻,经过任意Δ>0时间,若系统状态转移概率满足式(2),则称满足式(2)的马尔可夫链为齐次马尔可夫链。

{(+Δ)=|()=}=(Δ)

(2)

式中,为系统在时刻处于状态条件下在+Δ时刻处于状态的概率;(Δ)为系统在任意时刻经过一定时间增量Δ由状态转变成状态的概率;,为系统所处状态,,∈。

齐次马尔可夫链具备以下式(3)所示性质。

(3)

2 1553B通信系统工作原理

基于空间站高可靠性要求,本文方案采用双余度冗余技术对推进1553B通信系统进行冗余,以保证空间站长期稳定地在轨运行。

1553B通信系统设计架构如图1所示,其中数据收发装置(远程终端和数据隔离芯片)为热备,处理器为冷备。具体工作原理如下:上位机根据通信状态自主选择总线1或总线2进行通信,选择总线1时,发出中断1至处理器;选择总线2时,发出中断2至处理器。当班处理器(当前处于热机状态的处理器,当处理器1通路故障时,由处理器1切换至处理器2)根据中断置出片选(片选1对应中断1、片选2对应中断2),选通数据隔离芯片1或数据隔离芯片2,进而控制远程终端1或远程终端2,从而实现与上位机之间的通信。

图1 1553B通信系统架构Fig.1 Architecture of 1553B communication system

3 1553B通信系统可靠性分析

3.1 故障树建立

根据1553B通信系统工作原理,分析可能产生通信系统故障的原因,其中可能失效的部件主要包含远程终端、数据隔离芯片以及处理器,并由此构建图2所示动态故障树。

图2 1553B通信系统动态故障树Fig.2 Dynamic fault tree of 1553B communication system

图2中:HSP为热备件门;CSP为冷备件门;为顶层事件;、、、为中间事件;、、、、、为底层(基本)事件。

各事件代号表示的具体含义见表1。

表1 1553B通信系统故障含义Tab.1 Failure meaning of 1553B communication system

将图2动态故障树分解为动态子树及静态子树,动态子树包含事件、事件;静态子树包含事件、事件以及以、为基本事件的顶层事件静态故障树,具体如图3 (a)~(e)所示。其中,HSP为热备门,CSP为冷备门。

(a) 顶层事件T静态故障树

(b) 事件A动态子树

(c) 事件D动态子树

(d) 事件B静态子树

(e) 事件C静态子树

3.2 动态子树求解

由于主路/备路收发装置由远程终端和数据隔离芯片串联构成,其中一个元器件失效即会导致整个收发装置的失效,因此收发装置的失效率由式(4)表示。

==+

(4)

式中,为远程终端失效率;为数据隔离芯片失效率;为主路收发装置失效率;为备路收发装置失效率。

假定系统不可维修,采用马尔可夫链分别建立事件、事件可靠性分析模型,对故障树进行求解。其中事件马尔可夫状态转移图如图4所示。

图4 事件A马尔可夫状态转移模型Fig.4 Markov state transition model of event A

图4中:00定义为无故障状态,其时刻概率表示为();01定义为主路收发装置故障状态,其时刻概率表示为();10定义为备路收发装置故障状态,其时刻概率表示为();11定义为主备路收发装置故障状态,其时刻概率表示为()。

根据图4所示状态转移图转移规律,在经过时间Δ后,事件各状态转移表如表2所示,表中的数据为由当前状态转移至下一状态的概率。

表2 事件A状态转移表Tab.2 State transition table of event A

由表2可得式(5)所示事件A状态转移方程组,≥0。

(5)

式中,为状态转移矩阵。

根据导数定义分别求解各状态概率的导数

′()、′()、′()、′()

(6)

由上述方程组可得事件A马尔可夫微分方程

(7)

式中,为事件状态转移速率矩阵;(0)、(1)、(2)、(3)分别为状态、、、初始时刻概率。

对事件A马尔可夫微分方程进行拉普拉斯变换得式(8)所示方程组。

(8)

将式(7)中初始条件(0)、(1)、(2)、(3)代入以上方程组,解得

在洛阳城里,从朝阳到夕阳,平时温暖的风,渐渐有了寒意,平时那些充满活力的翠绿叶子,也变成了经历人间沧桑的枯黄叶子,以往繁华热闹的街道也变得冷清了,洛阳城里一切都变了。

(9)

对上述方程组进行拉普拉斯反变换得

(10)

由式(10)可得事件A发生的概率()

()=()=1-2e-+e-2

(11)

定义收发装置的可靠度为(),则()表示为

()=()+()+() =2e--e-2

(12)

同理求解事件D动态子树,绘制图5所示事件D马尔可夫状态转移模型。

图5 事件D马尔可夫状态转移模型Fig.5 Markov state transition model of event D

图5中:00定义为无故障状态;01定义为主路收发装置故障状态;11定义为主备路收发装置故障状态。

依据马尔可夫链,分别计算处理器的事件D发生的概率()以及可靠度()

(13)

式中,λ为处理器失效率。

3.3 可靠性定量分析

采用二元决策图分析顶层事件T发生的概率,构建图6所示二元决策图对顶层事件T静态故障树进行分析求解。

图6 顶层事件T静态故障树二元决策图Fig.6 Binary decision diagram of top event T static fault tree

遍历图6所示二元决策图,得出最小割集为{}、{},由此计算出顶层事件发生的概率()

=1-(1-())(1-())

=1-(2e--e-2)(e-+e-

(14)

根据式(14)可得可靠度()

()=1-()

=(2e--e-2)(e-+e-

(15)

为简化计算,选取可靠性等级相同的电子元器件,令===,得

()=(1+)(2-e-2)e-3

(16)

由可靠度计算1553通信系统在双余度冗余情况下的平均无故障时间

(17)

(18)

由式(18)可知,采用双余度冗余设计方案,1553通信系统平均无故障时间增加1947倍。

依据1772-79,以选用可靠性等级为七级(=1×10h)的元器件为例,分别计算冗余和未冗余情况下1553通信系统的可靠度,并绘制可靠度随时间变化曲线,如图7所示。

图7 1553B通信系统可靠度随时间变化曲线Fig.7 Reliability curve of 1553B communication system over time

图7显示,15年(180个月)期间,未冗余情况下,1553通信系统的可靠度为0961866,发生故障的概率达38134;而在冗余情况下,1553通信系统的可靠度为0999262,发生故障的概率仅为00738,相比未冗余情况,系统可靠度增长389,故障概率则下降超98,极大提高了系统的可靠性。

4 结 论

1553通信系统是实现空间站推进系统与外界进行数据交换的关键部分,本文方案采用双余度冗余技术,对推进1553通信系统各组成器件进行冗余设计,以保证系统可靠性。

本文通过建立1553通信系统故障树,并将故障树分解为动态子树与静态子树,分析系统可靠性。其中对于动态子树,本文引入马尔可夫链建立1553通信系统可靠性模型,绘制系统状态转移图,分别对系统中冷、热备份模块动态子树进行可靠度计算,并在此基础上采用二元决策图求解整个系统故障树可靠度。

根据本文计算结果可以得出,随着双余度冗余技术的应用,1553通信系统平均无故障时间大幅增加,故障发生概率大幅降低,系统可靠性显著改善,由此验证了双余度冗余设计方案对1553通信系统可靠性提升的有效性。

猜你喜欢
概率动态处理器
国内动态
国内动态
国内动态
概率与统计(1)
概率与统计(2)
概率与统计解答题集锦
英特尔发布至强5500系列智能处理器
火线热讯
AItera推出Nios II系列软核处理器