张宗峰
摘要:通信专业中的传输系统类似于铁路线路,对于信息的传递起到运输、枢纽的作用。在端到端通信流程中,需要从整网的角度对系统进行充分的保护。文章从可靠性的概念入手,分析了传输网络稳定运行的原理,介绍了可用性的计算公式,并由小及大,由物及人,从设备级别保护、网络级别保护、主动预防保护等方面,对通信传输系统的网络保护进行层层递进的探讨,给出问题对策。特别是主动预防保护,从人为的层面,本研究将主动预防纳入网络保护的范畴,未雨而绸缪,防患于未然。
关键词:网络安全;网络保护;可靠性;可用性;主动预防
中图分类号:TN914.34 文献标志码:A
0 引言
网络安全是近年来一直被探讨的话题,也是关乎行业生产、社会生活、国家安全等的重要举措。如何维护好网络安全,是每一位通信从业人员,特别是网络维护人员的重要使命。本文关注的通信传输系统的网络保护,正是网络安全的子课题之一。
早期的信息传输模式不过多涉及实体的网络结构,随着科学技术的指数级别发展,通信技术得到了飞速的发展和广泛的应用。在现代传输体系中,一张完整的传输网络,由纷繁复杂的传输设备、传输线路等组成,如何对传输系统进行可靠的保护就成了一个重要的研究内容。
1 问题分析
传输设备一般由设备硬件、软件等组成,不论是硬件还是软件都会有失效的概率,一般在计算机系统中,失效率α指单位时间内失效的事件数与事件总数的比例。其中,硬件类失效通常与产品质量、生命周期、环境因素等有关,软件类失效通常体现为软件BUG,可以通过每千行代码的缺陷数,即缺陷密度来表示。
虽然有上述失效发生的可能性,为了尽可能地达到使系统设备“用的时候一直能用”,人们提出了可靠性(Reliability)的概念。可靠性通常指在规定的时间内、在规定的条件下,系统无失效地执行规定功能的概率,与可靠性相关的几个指标如下:
平均失效时间(Mean Time To Failure,MTTF),即两次失效之间系统能够正常工作时间的平均值,MTTF=1/α(α为失效率)。一般来讲,MTTF越长,系统的可靠性越高。
平均修复时间(Mean Time To Repair,MTTR),即从出现失效到失效修复之间的这段时间。一般来讲,MTTR越短,系统业务恢复得越快。
平均失效间隔时间(Mean Time Between Failures,MTBF),即两次失效之间时间的平均值,MTBF=MTTF+MTTR。
在以上指标的基础上,人们又提出了可用性(Availability)的概念,可用性是在任意随机时刻需要执行任务时,系统处于可工作状态的概率,它的计算公式为:A=MTTF / (MTTF + MTTR)=MTTF / MTBF[1]。
为了组建一个高可靠性、高可用性的网络,需要在系统设计和使用的时候,对系统进行充分的保护。
2 问题对策
对于传输系统的保护,一般分为多个级别。在设备入网运行后,需要重点考虑网络安全的问题,例如:在网络中某个网元或链路发生失效时,可以不影响业务或者尽快地恢复业务。对于网元的保护,称为设备级别保护,可以通过增加“额外”的硬件设备来实现,例如:主备单板。现代通信网中几乎所有的设备都具有设备级别保护的功能;对于传输路径的保护,称为网络级别保护,当原有路径中断或者性能劣化时,系统可以利用预先分配好的路径容量继续传输业务信号;在设备正常运行的过程中,提前对网络失效进行预防,称为主动预防保护。
2.1 设备级别保护
传输设备在硬件架构上,长时期采用机柜、子架、单板的形式,对于单板的配置,通常采用主备冗余配置,即一块单板(主用单板)完成正常的业务处理,另一块单板在主用单板失效的情况下接管业务,这种设计在一定程度上降低了设备的使用效率,但是极大地提升了设备工作的可靠性和可用性。
以华为公司的智能光传输设备OptiX OSN 2500为例,OptiX OSN 2500 安装在欧洲电信标准协会(European Telecommunications Standards Institute, ETSI)“机柜”中(也可以安装在 19 英寸的标准机柜中),它的“子架”采用单层子架结构,分为处理板槽位区、接口板槽位区、辅助接口区、电源区和风扇区,设备支持不同类型“单板”,这些单板按功能可以分为 SDH 类单板、PDH 类单板、数据类单板、波分类单板和辅助类单板等类型,设备支持交叉时钟1+1保护、主控1+1保护、电源保护等,这种保护就是设备级别保护[2]。
在主备单板(两个单板一主一备)的基础上,N+1保护(N个单板主用,一个单板备用),端口主备保护(两个端口一主一备)、整设备主备保护(两台设备一主一備)也是一种冗余备份的思路。
2.2 网络级别保护
根据组网结构来划分,传输系统的网络保护基本分为链型网络保护和环形网络保护两种。
2.2.1 链型网络保护
链型网络保护类型有1+1保护和1∶N保护两种方式。1+1保护模式的每个工作信道都有一个冗余的保护信道,同设备级别保护相似,这两条信道是主用和备用的关系。在信息的发送端,业务信号被同时发送到工作信道和保护信道进行传输。在信息接收端,系统会持续监测两路信道的信号质量,然后根据信号的优劣选择一路信道进行接收,即“双发选收”。当工作信道信号中断或者性能劣化时,接收端将会切换到保护信道接收业务信号,从而实现了保护的功能。区别于1+1保护模式系统容量利用率不高的问题,1∶N保护模式的N个工作信道共享一个保护信道,在N个工作信道传送正常业务的同时,保护信道还可以传送优先级别相对较低的附加业务信息。传输系统通过复用段保护功能MSP(Multiplex Section Protection)监测到工作信道信号中断或者性能劣化时,会主动丢弃保护信道上的附加业务信息,在发送端将正常业务倒换到保护信道上发送,在接收端切换到保护信道接收正常业务信号。
2.2.2 环形网络保护
在传输系统多种网络拓扑结构中,环型组网是一个具有“传输特色”的架构,具有更灵活的自愈功能,自愈环(Self-Healing Ring,SHR)的概念就应运而生了。
本文以二纤单向通道保护环的实践案例为例,对自愈环的工作过程进行展开,其他环形网络保护的工作原理与此类似。
如图1所示,传输环中有4个网元A、B、C、D,现需要在A、C两个网元间进行业务传输,网元A、C两侧分别为网元B、D。两条光纤组成了传输方向相反的两个环,其中W为主用环,P为备用环,AC为A到C发送的业务信号,CA为C到A发送的业务信号。
在网络正常工作的情况下,AC业务信号在网元A插入时,是并行发送的,信号同时向P1光纤和W1光纤传送。在C网元接收时,系统选择性收取主用环W1光纤上的业务信号;类似的,CA业务信号在网元C插入时,也是并行发送的,信号同时向P2光纤和W2光纤传送。在网元A接收时,系统选择性收取主用环W2光纤上的业务信号。二纤单向通道保护环采用的是双发选收的保护策略,在备用环P上同时存在业务流,但是正常情况下不被接收使用,起到一个冗余备份的作用。
在网络发生故障的情况下,例如BC网元之间的传输线路中断,如图1(b)所示。在网元C上从W1光纤上传送的主用信号就丢失了,按照双发选收的原则,网元C在接收业务信号时,使用倒换开关从W1光纤倒换到P1光纤,从P1光纤接收来自网元A的AC信号,这样AC间业务信号就不会中断了。另一个方向,网元C发往网元A的业务信号,由于图中左侧线路没有发生故障,所以在网元A不会触发倒换开关,系统仍然从W2光纤上接收业务信号。
在网络故障恢复的情况下,系统可以根据网元的配置,选择倒换回故障发生前的组网或者保持现有业务流向不变。如果配置为可恢复式,系统在检测到W1环故障恢复后,将重新切换到主用环W1上接收信号,网络拓扑还原为故障发生前的状态[3]。
2.3 主动预防保护
传输设备建网后,为了保证设备的正常运行,常常需要进行被动性保护和主动预防保护等,其中被动性保护主要是指日常故障和突发故障的处理,主动预防保护主要是指为了防止故障的发生,主动进行设备的例行维护和周期性维护,例如重大事件保障巡检、节假日巡检等,将可能发生的故障扼杀在摇篮中。在主动预防保护中,重点关注以下几个方面的检查。
2.3.1 状态检查
定期检查相关传输设备的状态。设备状态应该为正常运行状态,在网元的逻辑板位图中,各种单板的图标颜色应该为正常示色。
2.3.2 告警检查
定期检查全网告警。对全网告警进行统计分析,根据告警的级别进行相应的处理动作,根据需要制定告警清零方案,避免告警级别提高影响业务。
2.3.3 性能检查
定期检查设备的性能指标。一般在网络建设阶段已经设置好性能监视的周期,即网管上设置的15min、30min、60min、24h等性能监控的启停时间,在传输设备性能检查中需要重点关注大误码、大指针以及光功率的变化,通过性能检查掌握网络运行的健康程度。
2.3.4 倒换检查
定期检查MSP属性和倒换状态、主控和交叉主备保护状态等。相关倒换属性正常工作的情况下,在主用发生故障时,设备才可以正常倒换,及时地恢复业务。
2.3.5 一致检查
定期检查设备数据一致性。检查设备侧数据和网管侧数据是否一致,避免在紧急业务恢复过程中,因为两侧数据不一致,导致的业务长时间受损。
2.3.6 时间检查
定期检查全网网元和网管的时间。为了保证设备告警等数据上报的准确性,需要保证网元与网管时间一致,如果不一致,需要及时与网管进行时间同步。
2.3.7 备份检查
定期检查设備的备份状态。网元的运行基于配置数据,配置数据的损坏或丢失,可能对业务造成严重的影响,在主动预防保护中需要做好数据的定时备份,并进行备份状态检查,必要时可以根据备份的数据进行业务恢复。
2.3.8 安全检查
定期检查维护人员账号、密码、授权等信息。维护人员的账号等是网络安全的关键信息,根据需要及时更新相关安全内容。
除以上几个方面外,还要进行机房现场定期检查,例如:机房温度、湿度等,并根据需要制定系列专项巡检行动。
3 应用分析
在工程设计阶段,根据网络需求进行网络保护相关设计,包括不限于单板备份设计、网络保护设计等。
在工程建设阶段,根据设计文件进行网络保护配置部署,现以二纤单向通道保护环的配置为例。
(1)启动传输设备网管。
(2)创建网元,安装单板,设备联调,组建如图1所示网络拓扑。
(3)配置各个网元的时钟。
(4)配置业务和保护路由,例如网元A到网元C之间1个E1业务。工作路由为:网元A配置1个E1的上下业务,网元B配置1个E1的业务交叉连接,网元C配置1个E1的上下业务。保护路由为:网元A配置1个E1的上下业务,网元D配置1个E1的业务交叉连接,网元C配置1个E1的上下业务。
(5)验证工作路由和保护路由配置的正确性,在工作路由失效的情况下,系统会自动切换到保护路由工作,从而起到网络保护的作用。
在运行维护阶段,需要制定网络主动巡检方案,包括不限于常规网络巡检、重大节假日巡检、重大事件保障巡检等,并根据具体的故障场景制定网络故障应急预案。
4 结语
通信传输网络不直接参与业务的终结,却是各种设备通信的纽带,对业务信息的传递起到“使命必达”的作用。本文从应用性的角度,分析了传输系统的各种网络保护机制,从设备本身包括单板、端口级别等,到传输路径包括链型保护、环形保护等,并结合二纤单向通道保护环的实践案例展开,对正常场景和网络故障场景进行信号流向的推演。按照未雨绸缪、防微杜渐的思想,将主动预防保护纳入整个网络保护分析的范畴,对网络的主动保护进行相关探讨,形成端到端的网络保护分析机制。
參考文献
[1]梅清晨,陆南耀,张金梅,等.MTBF和MTTR在设备预防保全中的应用[J].中国设备工程,2014(6):53-55.
[2]华为技术有限公司.OptiX OSN系列智能光传输系统产品手册[EB/OL].(2020-08-05)[2022-12-01].https://wenku.baidu.com/view/f581304f094c2e3f5727a5e9856a561253d32146.
[3]何一心.光传输网络技术——SDH与DWDM[M].北京:人民邮电出版社,2013.
(编辑 王永超)
Network protection analysis of transmission system
Zhang Zongfeng
(Nanjing Institute of Railway Technology, Nanjing 210031, China)
Abstract: The transmission system in the communication discipline is similar to the railway line, which plays a role of transportation and hub for the transmission of information. In the end-to-end communication process, the system needs to be fully protected from the perspective of the whole network. This paper starts with the concept of reliability, analyzes the principle of stable operation of transmission network, and deduces the calculation formula of availability. From the aspects of equipment level protection, network level protection, and active prevention protection, the paper discusses the network protection of communication transmission system layer by layer, and gives the problem countermeasures. In particular, active prevention, from the artificial level, brings active prevention into the scope of network protection, so as to prepare for the rainy day and take precautions.
Key words: network security; network protection; reliability; availability; proactive prevention