杨锐
(北京铁路通信技术中心,北京 100038)
铁路GSM-R系统可用性分析方法的研究
杨锐
(北京铁路通信技术中心,北京 100038)
GSM-R系统承载着调度通信语音业务、列控业务、机车同步操控业务、专业维修人员语音通信业务、车次号校核信息传送、调度命令传送、监控信息传送等众多的业务。随着中国高速铁路的快速发展,GSM-R系统将承载更多的新业务。GSM-R系统的可靠运行直接影响到列车的正常运营秩序。从系统的可靠性与可用性理论出发,研究GSM-R系统的可用性和可靠性的分析方法。
GSM-R系统;可靠性;可用性;理论研究;分析方法
随着铁路GSM-R数字移动通信系统的快速发展,GSM-R系统已成为高速铁路、客运专线移动通信的基础通信系统,它承载列车调度通信、列车控制、调度命令/进路预告信息传送等重要的业务;既有普速线路也在逐步的更新GSM-R系统。为保证列车稳定、安全的运行,需要GSM-R系统提供更安全可靠的业务支撑。GSM-R系统相对传统的无线列调系统更复杂,系统包括核心网、GRPS网、无线网、终端等众多的网元,任何网元节点的故障都会影响业务的运用。在研究分析GSM-R系统可用性时,需要掌握可靠性原理并采用科学的方法。本文对可靠性原理进行说明,并结合GSM-R系统的现状,对GSM-R系统的可用性分析方法进行研究。
2.1 相关参数及说明
我们研究了可靠性的相关定义,发现有很多不同的解释说明,对这些说明进行总结:在特定的环境下、特定的时间范围内,可实现特定功能的能力。系统可靠性参数主要有:可靠度、可维护度、可用度。
可靠度参数定义为R(t),用来说明系统正常工作的时间,主要应用在复杂和难以修复的系统中。其概念是:在一定的时间范围内系统工作正常的概率,其公式为:“R(t)=P{X>t}”。
随着技术的发展,系统逐步发展为可维修系统,所以出现了可维修度M(t)的概念,来体现系统可维修的难易程度,其公式为:“M(t)=P{X≤t}”。
系统的可用度结合了可靠度和可维修度,把系统的生存周期和维修的概念进行综合。其概念为:系统正常工作的概率,用As来表示。系统的可用度即系统的可用性,表示系统能否正常提供业务的能力。
在讨论系统可靠性时,最常被提到的是:“平均故障时间(MTTF)、平均维修时间(MTTR)、平均故障间隔时间(MTBF)”,三者之间的关系为:“MTTR+MTTF=MTBF”。
2.2 盆曲线
盆曲线是用来描述系统生命周期过程中发生故障概率的曲线,其横坐标是时间、纵坐标是故障频率,如图1所示。盆曲线主要反映了系统周期的3个阶段:早期故障阶段、随机故障阶段和磨损故障阶段。早期故障类似于汽车的磨合期,系统中的各网元需要进行调试磨合才能达到最佳的状态;随机故障阶段是系统运行最稳定的阶段,一般故障率比较低,但随着时间的推移,网元不断的老化,逐步发展到了磨损故障阶段,系统的故障率会越来越高;可靠性好的系统,随机故障时间比较长。
所以我们在分析系统可靠性特性时,重点分析的是系统随机故障阶段,此阶段系统的可靠性是指数分布,其公式为:
图1 盆曲线示意图
在进行可靠性研究的过程中,最难的就是对可靠性进行定性和定量的分析,许多研究方法被提出,主要有2大类,组合法和状态法。其中,“可靠性框图法”、“可靠图法”、“故障树法”属于组合法、“连续时间Markov模型”、“离散时间Markov模型”、“随机Petri网模型”、“随机回报网模型”、“广义随机Petri网模型”属于状态法。(Markov模型以下简称M模型;Petri网模型,以下简称P网模型)。
3.1 组合法
组合法是一种对系统中网元之间的连接关系进行分析的方法。原理比较简单,也比较容易理解。
3.1.1 可靠性框图分析法
图2 可靠性框图
3.1.2 可靠图法
可靠图分析法,是通过点和线来进行逻辑分析。线表示组成系统的网元,网元故障在模型中以中断相应的线来表示。模型有源点和终点,当源点和终点之间通达的路径中断时,说明系统产生了故障。
图3由一系列的节点和边组成,这些边代表组成系统的器件。器件的失效在模型中通过切断相应的边来表现。它有一个源节点(没有输入)和终止节点(没有输出)。当源节点和终止节点之间没有可通达的路径时,系统便发生故障。图3所示的模型便代表了一个含有5个网元组成的系统,源点和终点之间有两个路径,网元5是个独立网元,网元1、2和3、4是互为冗余的网元。
图3 可靠图模型
3.1.3 故障树分析方法
故障树即用网元之间的逻辑关系来组成树,逻辑关系门包括:“与门”、“或门”、“k/n门”。故障树有2个事件:基础事件和上层事件。基础事件是组成系统的网元,上层事件是整个系统的运行状态。分析时有2种方法:从上层至基础,通过分析故障的情况而画出故障树;从基础至上层,分析网元的状态来画出故障树,图4是由与、或门画出的故障树。
图4 故障树模型
3.2 状态法
状态分析法是对网元状态之间变化关系进行分析的方法,它的分析过程其实就是随机分析的过程。主要采用M模型和P网模型这2种方法。
3.2.1 M模型分析方法
M模型属于随机过程的一种。简单概括其原理为:系统当前的状态与任何时刻都无关,只取决于系统前一时刻的状态。有离散、连续两种模型。如图5所示,圈形表示系统当前的状态,弧线表示系统在0、1两种状态之间转换的权量;离散瞬间转换的为离散模型,所有状态转换的概率之和是1,对于连续M模型,没有自循环的情况。
图5 两种M模型
3.2.2 P网模型分析方法
P网模型分析法利用图形工具进行建模,主要是为状态复杂且随机性较强的系统提供分析的方法和手段,图6是一个相对简单的P模型示意,圆形表示位置、长方形表示变化,位置和变化是P模型中重要的分析元素,他们之间通过有方向的弧线进行连接,不断的进行状态之间的转化来表示系统的行为。
图6 P网模型
3.3 分析方法对比
分析方法对比如表1所示。
表1 分析方法对比
GSM-R系统是一个由多网元组成的系统,包括:HLR(归属位置寄存器)、IN(智能网)、SMSC(短消息中心)、DNS(域名服务器)、RADIUS(远程认证服务器)、GROS(GPRS归属服务器)、MSC(移动交换中心)、SGSN(GPRS业务支持节点)、GGSN(GPRS网关支持节点)、BSC/PCU(基站控制器/分组控制单元)、TRAU(码速适配单元)、BTS(基站控制器)、终端等,在提供业务时根据不同的业务类型所经过的网元有所不同,所以按照可靠性原理GSM-R系统是多个网元组成的串联系统。结合上述对可靠性与可靠性原理的说明,以及GSM-R网络的特点,我们在分析研究中采用可靠性框图法。
4.1 GSM-R系统可用性现状
4.1.1 共用设备
铁路GSM-R网络中的HLR、IN、SMSC、DNS、RADIUS、GROS定义为共用设备(以下简称共用设备),共用设备采用集中设置的方式,在北京、武汉两地实现地理冗余。结合可用性框图法的原理,共用设备在框图中是并联网元,北京、武汉两地的任一设备节点故障不会影响系统的可用性,所以共用设备的As=1。
4.1.2 MSC、SGSN、GGSN设备
GSM-R网络的中的MSC设备有两种类型,一是R99架构;二是R4架构。R99架构设备是串联结构(单节点)As≠1,R4架构是并联结构(双节点)As=1。SGSN设备目前均是串联结构(单节点)As≠1。
4.1.3 BSC/PCU、TRAU、BTS
目前GSM-R网络中的BSC/PCU、TRAU、BTS设备均是串联结构(单节点)。个别铁路局设置的BSC实现了冗余,但是主备方式、业务恢复需要一定时间,所以不是严格意义的并联,所以As≠1。
4.1.4 终端
铁路GSM-R网络中的各类业务终端包括:CIR(机车综合无线通信设备)、GSM-R手持台、语音/数据等各种GSM-R模块,在业务实现上都是单模块工作方式(CTCS-3车载终端虽然采用双模卡,但不是同时工作),所以是串联结构As≠1。
4.1.5 网元之间互联的承载网络
GSM-R系统网元之间互联的承载网络主要是光传输系统和数据网系统,目前网元之间互联通道均采用了不同的传输径路及不同的传输系统,而且都配置了多条通道,所以承载网络的As=1。
4.2 GSM-R系统可用性计算方法
了解了GSM-R系统中各网元节点的结构及冗余方式后,在计算GSM-R系统的可用性时,需根据不同的业务类型,实现业务时经过的不同网元来分别计算。
4.2.1 智能网相关的语音呼叫业务
此类业务包括:调度通信语音业务和机车上不同身份用户间语音呼叫业务,业务实现时经过的GSM-R网元有BTS、BSC、TRAU、MSC/VLR/ SSP、HLR、IN,系统可用性要求计算方法如下:
4.2.2 列控数据业务
此类业务包括:CTCS-3列控业务、机车同步操控业务、ITCS列控业务,业务实现时经过的GSM-R网元有BTS、BSC、TRAU、MSC/VLR、IWF、HLR,系统可用性要求计算方法如下:
4.2.3 组呼业务
目前在GSM-R网络中应用的组呼业务包括:铁路紧急呼叫业务(299)和车站基站区组呼业务(210),业务实现时经过的GSM-R网元有BTS、BSC、TRAU、MSC/VLR/GCR、HLR,系统可用性要求计算如下:
4.2.4 普通语音呼叫业务
此类业务是GSM-R网络提供的最基本的语音呼叫业务,业务实现时经过的GSM-R网元有BTS、BSC、TRAU、MSC/VLR、HLR,系统可用性要求计算如下:
4.2.5 车次号校核信息、调度命令类GPRS数据业务
此类GPRS业务是CIR设备与CTC系统之间的数据传送,业务实现时经过的GSM-R网元有BTS、BSC、PCU、SGSN、GGSN、RADIUS、DNS、GRIS、GROS、HLR,可用性要求计算如下:
4.2.6 DMS类GPRS数据业务
此类GPRS业务用于将车载DMS的实时监控数据传送至地面监控系统,业务实现时经过的GSM-R网元有BTS、BSC、PCU、SGSN、GGSN、RADIUS、DNS、MGRIS、HLR,系统可用性要求计算如下:
4.2.7 库检和监控类GPRS数据业务
此类GPRS业务是GPRS终端间的数据传送业务,业务实现时经过的GSM-R网元有BTS、BSC、PCU、SGSN、GGSN、RADIUS、DNS、HLR,系统可用性要求计算如下:
经过对可靠性、可用性原理的说明,以及GSM-R系统可用性的分析,提高系统可用性最简单的方式就是对系统中各网元进行冗余设置,由串联结构改变为并联结构。目前GSM-R网络中的MSC、SGSN、GGSN、BSC/PCU、BTS等设备仍没有完全实现冗余,所以这些设备的冗余技术需要进行深入研究。对于GSM-R系统而言,终端的可用性直接影响整个系统的可用性,今后在研究网络冗余的同时,还需结合业务应用研究终端的冗余,来提高GSM-R系统的可用性。
[1]中华人民共和国铁道部.GSM-R数字移动通信系统总体技术要求[S].北京:中国铁道出版社,2013.
[2]金星,洪延姬.系统可靠性与可用性分析方法[M].北京:国防工业出版社,2007.
The services such as dispatcher's voice communication, train control, locomotive synchronous control, professional maintenance staff's voice communication, train number checking information, dispatching commands and monitoring information are currently transmitted based on the GSM-R system. With the rapid development of Chinese high-speed railways, the GSM-R system will carry more services. Reliable operation of the GSM-R system will affect directly normal operation of trains. The paper gives a research on the availability and reliability analysis methods of GSM-R system from the theory of reliability and availability of the system.
GSM-R system; reliability; availability; theory study; analysis method
10.3969/j.issn.1673-4440.2015.02.007
2015-01-03)
中国铁路总公司科技研究开发重大课题(2013X003-A1-1)