刘存才,梁 禹,冯 伟
(1.中国电子科技集团公司第五十四研究所,河北 石家庄 050081; 2.中国人民解放军66061部队,北京 100144)
在军事领域中,信息与通信网络发挥着重要作用。随着信息战的快速发展,军用通信网的组成越来越复杂,数字化战场对网络类复杂系统的依赖性越来越大。在军事意义上,军用通信网一旦发生故障,对战役的影响将是巨大的,为此军用通信网可靠性研究的重要性不言而喻[1]。通信网可靠性研究在理论上和实践中虽然逐步受到重视,但是不同于已有一套较为成熟理论及实验方法的单个设备或元器件的可靠性研究,军用通信网由于其可靠性评价固有的复杂性,例如评估的NP-Hard问题[2]以及多种因素,例如设备可靠度、敌方干扰与攻击等都会对军用通信网的可靠性产生影响等原因,目前还没有令人满意的军用通信网可靠性评价方法,在实际军用通信网工程中缺乏可直接利用的成果。针对更加复杂的军用通信网可靠性研究,很难套用研究单个设备可靠性的经典方法,需要专门的理论和方法对军用通信网可靠性进行设计[3]。
传统意义上被广泛接受的可靠性定义是设备/系统在所处运行条件下,在预定的时间内充分完成其规定功能的能力(概率)。GB/T3187—94《可靠性维修性术语》[4]中对可靠性的定义是:产品在规定的条件下和规定的时间区间内完成规定功能的能力。对通信网络而言,其通信网可靠性可以理解为:在特定环境条件下,在规定的时间内通信网能够充分完成规定通信功能的能力。这里的特定环境、时间和充分完成功能三大要素则是工程判断问题,通常只有工程技术人员和用户才可能提供令人满意的有关信息;而描绘能力的参量就是可靠性指标,最常用的是概率。通信网络可靠性不仅与网络中每个设备的可靠性有关,而且与网络的拓扑结构及路由机制等都有很大的关系[5]。
通信网络可靠性的测度分为:网络的抗毁性、生存性、可用性和完成性4类[6],它们之间的关系如图1所示。
图1 通信网络可靠性测度
1. 2. 1 抗毁性
通信网的抗毁性描述的是网络拓扑结构在遭到敌方人为破坏下的可靠性,即在敌方破坏作用下,系统仍能完成任务的能力。主要测度有系统内聚度、连通度及其相应的脆弱度指标[7]。
1. 2. 2 生存性
通信网的生存性反应了网络在部件随机失效情况下的可靠性。其测度指标就是可靠度,定义是通信网在规定的条件下和规定的时间内,完成规定功能的概率。其测度指标主要分为两端可靠度、K端可靠度及全端可靠度[8]。
1. 2. 3 可用性
通信网的可用性或称为有效性,是与修复能力有关的可靠性指标,给出了系统故障状态和维修情况下的可靠性测度指标。其指标为可用度分为瞬时可用度(网络在某时刻的连通概率)和稳态可用度(稳态下任意时刻的连通概率)[9]。
1. 2. 4 完成性
通信网的完成性给出的是网络故障模式和网络本身引起网络业务性能下降时的网络可靠性指标。完成性指标是把可靠性和业务性能相结合考虑的一类可靠性指标,主要测度为有效度和完成度[10]。
以美军某战术通信网络为例,其有关系统可靠性指标要求如下:
① 网络系统处于正常使用时间大于720 h;
② 在执行一次任务中,由于设备故障对于任何一个用户无法使用系统的平均时间不超过90 min。
将系统要求指标等价转化为系统对任意2个用户通信的可用性指标AS,结果如下:
(1)
式中,n是用户数;ti是第i个用户的不可用时间,即系统定量要求指标转化为“系统任意2个用户通信的可用度大于0. 998”。
系统的主要功能是确保在一次任务时间内各节点(用户)的通信业务畅通,将系统可靠性测度指标定义为任意2个节点或用户之间的可靠性指标集合,即以综合的端-端可靠性水平来反映系统整体可靠性能。
军用通信网中的不同用户具有不同的等级,对系统可靠性要求不同,为更客观地评价系统的可靠性,给出一个加权的通信网可靠性模型:
(2)
式中,Rs为系统可靠性;Wij为节点i,j之间的可靠性加权因子;Rij为节点i,j之间的通信可靠性,即用户i,j之间的通信可靠性。
该模型的实质是将系统主要功能表示为所有用户通信的集合,将通信网可靠性指标定义为(Rij)n×n,即节点(用户)间通信的可靠性矩阵。因为各节点之间通信的中断对系统完成任务所造成的影响是不一样的,式(2)给出该矩阵的加权平均值作为综合衡量整个军用通信网的一个可靠性指标。
式(2)中的Wij的取值取决于节点i与节点j之间的信息流量以及它们之间的通信中断(故障)对军用通信网完成任务的影响程度,Wij的取值可以按式(3)求得,
Wij=Eij+Eji,
(3)
式中,Eij和Eji分别为i~j和j~i的业务流量。
在式(2)中,对于所有的i,j(i 2. 3. 1 设备可用性 节点设备或链路设备i的可用性指标计算公式为: (4) 式中,Ai为相应链路设备i的可用性;MTBFi为设备i的平均无故障间隔时间;MTTRi为设备i的平均维修时间。 2. 3. 2 链路可用性 干线链路和入口链路由相应链路设备串联而成,其可用性指标计算公式为: (5) 式中,Ai为相应链路设备的可用性。在可靠性理论中,对电子设备来说,通常的假设是设备可靠性服从负指数分布,链路可以等效为一个设备,仍服从负指数分布。 2. 3. 3 用户可用性数学模型 用户群x,y之间可用性数学模型为: Axy=Aij×A链路1×A链路2, (6) 式中,A链路1,A链路2为2个用户x,y相应入口链路的可用性;Aij为连接相应2个用户群的节点i,j之间的通信可用性指标,即式(2)中的Rij。 式(2)~式(6)组合便构成了传统通信网的系统可靠性数学模型。在实际工程应用中,这些组合模型除基本的端-端可靠性外,其他的都可以通过简单运算得到[11]。因此在复杂性方面,传统通信网可靠性评估都指向了网络的端-端可靠性模型。 需要注意的是,现代军用通信网的内涵正在向栅格化“信息网”扩展,通信网络已不再是单纯提供传送服务的通信网,而是逐步发展为提供信息服务的信息网,是由不同层次、不同使命的多个要素有机构成的一个完整的系统。例如,美军在2015年颁布的新版本《JP6-0联合通信系统》联合条令[12],强调了“通信网”到“信息网”的含义扩展,将通信系统的功能确定为:获取、处理、存储、传输、控制、保护、分发和呈现信息。因此,通信网端-端可靠性测度的含义需要根据特定通信网情况在2点之间的连通性基础上进一步扩展到能够与信息服务层的相应设备互动访问,即用户端点以及信息服务层的相应设备所连节点之间能够连通,意味着两端可靠性逻辑上等价为多端之间的连通性判断问题,具体判据和方法与特定通信网的每项任务具体业务流程和网络拓扑有关。 数学解析方法是利用图论、概率论和布尔代数等数学理论,精确计算网络的可靠性测度指标。目前较有效的计算方法主要有两大类:最小路集法[13]和因式分解法[14]。然而在已有的SDP[15]可靠性评价方法中,由于大量的布尔代数运算,尤其在内循环之间,导致许多冗余运算,对解决较大规模或复杂的网络是无效的。而因式分解法又将产生大量的分图计算,并花费大量的空间进行存储。在实际军用通信网工程中需要采用合适的评估算法。 结合大量实践工作,本文提出了一种高效的用于军用通信网可靠性评估的通信网可靠性算法。该算法基于最小路集,用对分割路集的操作代替了因式分解法中对分图的操作,依据自然过程对路径标号进行操作,不需要对所有分割路集进行记录,避免了因式分解法处理数量庞大的分图所花费大量的空间和时间。其基本原理如下: S=pxSp+qxSq, (7) 式中,S为系统所有最小路径的集合;x为系统任意部件(节点或链路);px为x成功的概率,算法中由它引出的点称为p节点;qx为x失效的概率,算法中由它引出的点称为q节点;Sp和Sq分别为相应p节点或q节点导出的系统所有最小路径的集合,它对应着相应节点的状态;{·}表示从相应p节点或q节点出发导致系统成功的不交事件概率之和,即系统成功的路径集合。 算法处理过程类似于对具有p节点和q节点的二叉树的操作,在累加计算可靠性过程中,依据路集分解自然累加,按其处理次序保持一条分枝状态,无需记录整棵树下面q节点的任何状态,节省了大量的空间和时间。 本算法目的在于寻找对大型通信网络的快速计算,由于网络可靠性计算的固有复杂性,算法也会产生大量的分割路集,但是这样的分割路集并不需要额外的空间和处理时间。本算法将SDP法与因式分解法的优点结合起来,可快速计算大型通信网络系统端-端可靠性。 精确计算一个大规模的复杂网络需要指数增长的时间,采用解析的方法极端耗时甚至得不到结果,因此在大型通信网络可靠性评估中,采用计算机模拟方法几乎成为必然的选择。蒙特卡罗模拟法[16]根据部件的可靠性通过随机数产生系统样本,判断样本成功与否,只要产生足够多的样本,即可近似得到网络可靠性。本文采用蒙特卡罗模拟方法用于军用通信网可靠性评估。 在可靠性结构模型中,假设共有n个可靠性单元(节点和链路),每个单元i(i=1,2,…,n)的成功概率(可靠度/可用度)为Ri,每个单元的有效性状态为: (8) 式中,r为连续产生的(0,1)区间上的均匀分布随机数。当Xi=1时,表示单元i处于正常状态;当Xi=0时,表示单元i处于失效状态。 定义系统结构函数X为: X=X1,X2,…,Xn。 (9) X对应着一个网络结构,其中当节点失效时,意味着其所有邻接链路失效;当节点正常时,相应链路的状态将取决于各自链路的状态函数值。 对系统进行多次(设为N次)模拟取样,在每次模拟产生系统样本,即结构函数X后,进行以下处理: 检查、统计相应的节点对(i,j)之间的连通情况,当i与j之间至少有一条通信路由存在时,记为成功,否则记为失败。设成功次数为Sij,则相应的端-端节点间可靠性评估近似值Rij为: Rij=Sij/N, (10) 将Rij代入式(2),即可求得系统可靠性指标Rs。 可以按照任务要求,统计k(2 Rk=Sk/N。 (11) 一般来说,军用通信网络系统可以分解成多项功能任务,每项功能任务场景可以分解成多种k端组合(2≤k≤n),按上述方法求取k端可靠性评估近似值后,取其均值作为该项功能任务的可靠性评估值。 网络拓扑由主干节点和用户节点构成,其中网络主干节点包括1级节点7个、2级节点8个、3级节点14个和用户节点46个,共75个节点。系统的功能任务主要分为6类,从可靠性角度来看,每类功能任务的完成情况可以等价成若干组多端用户节点之间的通信连通性判断问题。 在进行可靠性仿真评估验证中,针对每类功能任务设定了任务权重,依次为0. 16,0. 20,0. 18,0. 14,0. 18,0. 14,选取了若干组k端用户节点组合,取这些k端可靠性的平均值作为该项功能任务的可靠性评估值,最后对6类功能任务的可靠性进行加权平均得到系统整体可靠性评估结果。可靠性模拟次数设置为12 000,软件运行效果如图2所示。 图2 可靠性软件运行效果 可靠性软件可以导入编辑后的通信拓扑,并在仿真运行中动态显示拓扑节点以及链路的可用状态。在软件左上方可以统一设置或者修改每一个节点以及链路的可用性,在左下方可以根据具体功能任务选择任意k端的连通情况,设置好仿真次数后即可开始运行试验进行仿真。在软件的下方给出仿真进度,仿真过程及仿真后的仿真结果。试验可靠性仿真评估验证中的仿真结果如图3所示。 图3 可靠性仿真结果 仿真结果包含指定k端节点的可靠性仿真结果以及系统整体可靠性仿真结果,软件运行得出的仿真结果还能够以文本形式导出以便进一步分析评估。 基于实际系统中的应用,提出了从定义到建模,定量评估的方法,应用结果表明,该方法能够有效、快速地计算评估通信网的可靠性指标。本文提出的数学模型以及评估方法对进一步研究通信网可靠性提供了一定的思路。由于通信网络是非常复杂的系统,对它的可靠性研究在理论上还不完善,存在着许多困难,还有许多工作需要深入研究。2. 3 用户可用性模型
3 军用通信网可靠性评估方法
3. 1 数学解析方法
3. 2 计算机模拟方法
4 评估实例
5 结束语