李嵩泉,蒋海玲
(1.中国电子科技集团公司第五十四研究所,河北石家庄050081;2.河北中烟工业有限责任公司,河北石家庄050081)
在基于资源按需分配策略的卫星通信系统中,网控中心是实施各种应用策略并实现系统智能化、自动化运行的核心,其维护着通信网的各种应用资源,负责监视和控制各地球站内设备的工作状态和参数,负责频率、功率等可控信道资源的分配和回收[1-3]。为保证卫星通信系统不间断的可靠运行,一般都配置多个网控中心,各网控中心之间通过预定义的策略分时或者协同完成网络管理和控制工作。
在卫星通信系统中,网控中心备份方式主要有冷备份、热备份以及介于两者之间的弱热备份3种常用方式[4]。
冷备份是指网控中心设备独立配置,之间没有任何自动化信息交互的接口,数据的同步靠人工拷贝复制等手段完成。主用网控中心出现问题后,备用网控中心由人工干预启动运行,重新对管理过程初始化。其特点是软件复杂度和开发成本低,但由于网控中心间缺乏数据的实时同步,备用网控中心启动时,原主用网控中心记录的实时信息会丢失,整个卫星通信系统恢复时间较长,而且带来通信业务中断。
热备份是指网控中心设备之间建立有自动化信息交互的接口,各网控中心设备之间一直保持着数据的实时同步。网控中心间通过握手信令等手段实时检测工作状态,并根据检测到的状态及预定策略自动进行角色切换。其特点是软件复杂度及开发成本高,数据同步及切换控制策略复杂,但实时的数据同步保持了主备网控中心之间的数据一致性,从而使主备切换时不影响现有卫星通信系统的状态,特别是不会中断正在进行的通信业务,提高了系统可用度。
弱热备份策略介于上述2种之间,在有些系统中被称为温备[5,6],即主备网控中心之间具备自动化信息交互的接口,但该接口传递的数据只包括握手信息和各种与数据库存储相关的配置信息,而不包含入退网、资源分配回收等实时的运行变化过程信息,在主用网控中心出现异常时,备用网控中心能自动检测并加载运行,接替主用网控中心的工作,但由于未记录通信系统的实时状态信息,因此会导致地球站重新入网和通信过程的中断。
该卫星通信系统主要由一个中央站和若干远端地球站组成。中央站配置大量的业务信道设备、2台网控中心计算机以及由网控中心控制的多路网络管理信道;远端站除配置少量业务信道设备外还配置了网控代理软件[7]和一路网管信道设备[8],网控中心通过网络管理信道与远端站的网控代理构成一个星形网络管理系统[9,10],网络管理系统组成如图1所示。
图1 网络管理系统组成示意图
网控中心之间通过以太网连接,网控中心软件主要由5部分组成,主备网控中心软件组成相同。网控中心内及相互间的软件组成关系如图2所示。
图2 网控中心软件组成示意图
链路控制层:主要负责网控中心主机与各网管信道设备之间的信息交互、网管信道状态检测、信令的可靠传输控制等功能。
资源控制层:主要负责对网控中心可调度的各种资源信息(地球站、信道设备、频率、速率、功率等)按各种应用策略进行计算分析处理,主要包括地球站的入退网认证、信道设备的可用性(根据状态监测可分析出信道设备的可用性)控制、电话及数据业务对资源占用的调度和回收等。
事物控制层:主要负责网控中心内各软件单元间共享资源的调度、配置和存储,协调网控中心内各软件单元之间的数据同步。
主备角色控制层:主要负责网控中心状态的监测、数据的同步转发和控制,并负责控制所属主机内其他软件单元的角色切换。
操作终端层:提供网控中心软件与网控中心维护人员之间进行信息交互的操作界面,用于各种参数的配置、网络运行过程及状态的展示等。
在卫星通信系统运行过程中,主用网控中心负责对整个系统进行管理控制,包括网络和地球站参数的配置、地球站的入退网控制、卫星信道资源配置和分配、网管信道的切换、链路性能的监视和调整、网络运行状态的监视以及故障管理等功能。
备用网控中心处于静默值守状态,保持与主用网控中心间的数据同步,并实时监视主用网控中心的运行状态。在检测到主用网控中心运行异常时,能够根据预定策略升级为主用角色,接管网络管理和控制功能,从而最大可能地保证卫星通信系统的业务不间断运行。
备用网控中心同主用网控中心一样,可实时接收来自各外围地球站通过网管信道向网控中心发送的信令,但备用网控中心在链路控制层收到这些信令后,并不向上转发到资源调度或者事物调度层进行处理,而只是将其作为收支路状态检测的参考。
网控中心计算机之间通过IP网络连接在一起,为了灵活地增加或者剔除某网控中心主机及确保网络规划的变化不影响网控中心的运行,在网控中心之间采用组播协议进行信息交互。
主备网控中心的实现有2个重要的环节:一个是网控中心间的数据同步;另一个是主备切换策略[11]。
数据同步是指备用网控中心从主用网控中心获取当前网络的运行及配置信息,以保持各网控中心记录的一致性,根据数据类型来分主要包括以下3个方面:
(1)配置数据的同步
配置数据主要存储在数据库中,主要包括网络参数、电话号码、设备参数、用户信息等保证网络运行的各种预定义参数。这类信息对网络运行有着至关重要的影响,必须保证主备网控中心间的一致,且实时性要求较高。该类型数据的同步方式有3种:①网控中心首次启动并在确认自己为备用时,主动向主用网控中心发送申请,获取这些信息;②操作员通过备用网控中心操作界面手动发起同步请求,获取信息;③操作员通过主用网控中心操作界面发起的网络参数配置变更命令后,主用网控中心主动向各备用网控中心发送同步更新命令。
(2)状态数据的同步
状态数据主要是指卫星通信系统运行过程中发生的各种实时过程状态数据,主要包括地球站入退网过程、资源占用申请及释放过程[11,12]以及通信系统运行过程中主用网控中心分析生成的各种异常信息等。这类数据变化往往较配置数据快,实时性和一致性要求较高,主用网控中心在状态数据变化时,需要及时向备用网控中心同步信息,如图3所示。
图3 状态数据同步流程
(3)日志数据的同步
日志数据主要指网络运行时产生的各种事件记录,包括:终端在线记录、终端话音通信记录、操作员操作记录等。这类信息相对次要,也不需要实时性,可以定时进行数据同步。
主备切换策略涉及网控中心初始角色确认和运行中主备角色切换两个过程。这两个过程都可以由操作员进行人工配置完成,主备角色由人工决定。本设计提供一种基于故障检测和自动协商的主备角色切换策略。
在网控中心启动运行初期,各个网控中心通过一定策略,自动协商获知自己的角色和启动顺序,本设计中以网控中心所在计算机配置的IP地址(在同一个网段的IP网络中,每台计算机或其他网络终端的IP地址是唯一的)作为角色协商的参考值,IP地址越小则优先级越高,IP地址越大则优先级越低。网控中心初始启动后,首先以组播的方式向网络上发送心跳信令,该信令中携带着本机的当前角色(在协商过程完成前都为:备用)、本机的IP地址等,各网控中心在接收到该信令后,存储到当前网控中心的有序列表中,经过一定时间协商后,进行角色确定,优先级最高的切换为主用状态,其他维持备用状态。
在卫星通信系统运行过程中,当主用网控中心出现故障时,备用网控中心可根据一定策略切换为主用网控中心,这一过程的核心是主备切换准则。对于一个热备份网络控制系统,切换判据必须准确可信,因此不能采用单一条件作为判断准则,而应定义两个以上的切换条件。在本设计中,以主备网控中心间心跳状态、网控中心传输通道状态两个方面来定义主备切换的判断条件。备用网控中心将接收不到主用网控中心的握手信令作为主备切换的必要条件,但传输通道状态正常是该准则可执行的充分条件。两个条件的判断流程如图4所示。
图4 主备切换判断流程
(1)心跳检测策略
备用网控中心(标识为B)在启动后开启心跳检测定时器Thb,在本机网络正常时,如果在超时时间内接收到心跳信息或者其他来自主用网控中心(标识为A)计算机的信令信息,则将超时计数器heartbeat_count清零;如果在超时时间内没有收到任何信令信息,则将该计数器加1;若超时计数大于预先配置的阈值,则认为心跳中断。
(2)传输通道检测策略
所有在线的网控中心都实时检测所在计算机的网络连接状态,判断本机的网络是否正常。备用网控中心在检测到所在计算机网络异常时,仍保持自己为备用状态;主用网控中心在检测到所在计算机网络异常时,自动将自己转换为备用状态,并通知其他各软件服务单元转入静默值守状态。
备用网控中心不需检测与主用网控中心之间的IP网络是否正常,因为IP网络的中断一定会带来心跳的中断,完全可以与主用网控软件异常带来的结果归为一类,不用单独检测。
网控中心承担着卫星通信系统运行、维护工作,是保证各信道设备、通信链路以及系统有效运行的重要组成部分。介绍了一种网控中心热备份的方法,给出了网控中心之间数据同步设计和主备切换的准则以及流程。
网控中心之间通过数据同步、自动检测及协商等机制实现了主备角色的快速切换。网控中心的主备切换不影响网络当前运行状态和通信过程,实现了网控中心各种管理功能的连续性,保证了卫星通信系统的不间断运行。可有效解决卫星通信网络管理控制的可靠性需求。
[1]马刈非.卫星通信网络技术[M].北京:国防工业出版社,2003.
[2]陈振国,杨鸿文,郭文彬.卫星通信系统与技术[M].北京:北京邮电大学出版社,2003.
[3]许星辰,张迎春,郭巍.基于FSM技术的地球站网控设计与实现[J].无线电通信技术,2011,37(4):10-11.
[4]朱建红,陈柯.数据服务多节点主备切换设计方法[J].指挥信息系统与技术,2012,3(6):55-57.
[5]王刚.网络管理系统温备份的切换检测技术[J].光通信研究,2008(4):28-29.
[6]柳鹏,何潇锐.备份技术研究[J].中国科技信息,2011(8):124-125.
[7]李想.嵌入式SNMP卫星网管代理软件设计[J].无线电工程,2011,41(1):5-6.
[8]梁金山.卫星网络管理系统控制信道设计[J].无线电工程,2010,40(4):52-53.
[9]崔姝.Ku频段卫星通信网网络管理系统的研究与设计[D].北京:北京邮电大学,2007:35-39.
[10]梁金山,刘薇.一种卫星通信网络管理系统设计[J].无线电通信技术,2010,36(2):11-12.
[11]王金海.MF-TDMA卫星通信系统网管研究与设计[D].西安:西安电子科技大学,2011:40-43.
[12]魏振宁.全IP应用卫星通信网络管理控制系统的设计与实现[D].西安:西安电子科技大学,2009:18-20.