王燕++李长德++李霖++王雁秋++闫超
摘 要宽带多媒体卫星网管负责整个卫星通信网络的配置、管理、告警等相关的网络管理服务。卫星网管具有高可用性、高可靠性要求,需要持续可靠的运行来提供监视管理服务,卫星网管故障可能会导致系统运行的不稳定甚至出现业务中断;同时,兼顾到业务的增长、网络规模的扩大,需要较为容易的对网管系统进行扩展。针对宽带卫星的上述需要,本文提出了一种高可用、可扩展的卫星通信网络管理体系结构。
【关键词】卫星网管 高可用 可扩展
1 概述
我国是世界上最适合发展卫星通信的国度之一,三分之二的国土面积处于不适合铺设地面光缆的地区,生活在那里的人民群众想要享受到宽带多媒体的信息服务,卫星通信无疑是一条可行的道路,在地面网络比较发达的地区,卫星通信不是主要的通信传输手段,但是依然可以作为地面通信网络很好的补充,特别是在地面网络出现故障的时候。
宽带多媒体通信卫星系统不同于传统的弯管式单星通信模式,能更好的提供多业务的接入和承载能力。而宽带多媒体通信卫星网络是具有高度动态特性的网络,随着用户数目的不断增多,网络结构变得复杂,网络规模逐渐扩大,网络中的资源不论是种类还是数目都有很大程度的增加,传统的卫星网络管理面临了越来越多的困难和挑战,在用户的访问量、突发量、高可靠性和可扩展性提出了新的要求。
宽带多媒体卫星网络管理需要更加快速、准确、高效的做出海量用户访问回应,以尽量减少因网络管理而引起的网络运行性能下降。而卫星网络管理系统的稳定、高效运行,离不开一个结构设计良好的系统架构的支持,它不仅能使卫星网络管理信息快速、高效化得到持久,也使得网络管理中的用户访问数据访问效率得到保障,还可以使系统的性能达到最佳。
本文提出了一种新的系统架构具有高可靠、可灵活扩展的卫星通信系统网络管理的体系结构,满足了宽带多媒体卫星网络管理的需求。
2 系统体系架构设计
宽带卫星网络管理的体系结构如图1所示,它由资源控制管理和地面设备管理两部分组成。其中资源控制管理主要实现通信业务信令业务处理和卫星带宽资源分配功能。地面設备管理主要实现网络管理功能,资源控制管理与地面设备管理之间通过管控接口完成信息的交互。
2.1 系统功能组成
资源控制管理负责实时通信业务的处理,是宽带卫星资源管理的业务处理核心。负责控制地面终端站的入网和退网;处理地面终端站的呼叫申请,为合法用户分配卫星通信资源,通信结束时——负责收回卫星通信资源;没有业务需要处理时,轮询地面终端站的状态;控制卫星上卫星链路的建立或拆除交叉连接;向地面设备管理报告系统运产的事件与结果。
地面设备管理包括性能管理、告警管理、配置管理、前台用户应用管理及负载均衡管理。
性能管理是对设备性能指标及关键设备的核心参数实时监视控制。
告警管理是记录、诊断系统内的告警信息记录。
配置管理是初始化、自动配置系统内的设备相关参数指标。
应用管理是用户前台应用请求管理。
负载均衡服务将用户的访问流量均衡至各功能管理服务器,当其中一台功能管理服务器出现故障时,负载均衡服务能够及时的将全部用户的访问流量转移至剩余可用的功能管理服务上。同时,当系统中的功能管理服务器的用户流量负载过高时,可以通过增加功能管理服务器并对负载均衡服务进行配置来均衡用户流量,实现宽带卫星网络管理服务的高可用以及可扩展。
同理,对于卫星网络中的性能管理、告警管理、配置管理、应用服务信息同样可以通过负载均衡服务将采集的性能流量、告警流量、配置信息、用户访问等信息负载均衡至性能、告警、配置、应用的集群中。
对于数据库的部署采用主从部署的方式保证数据库的高可用,在系统运行过程主数据库与备数据库定期进行同步,当主数据库出现故障时,系统能够使用备数据库进行提供服务。
2.2 资源控制管理功能设计
入网,退网,资源分配,等这些功能是基本的星上资源管理功能,相关设计本文中不再赘述。本文重点针对宽带卫星大容量管理的可扩展支撑进行设计。
星上资源管理中一个资源控制模块管理着8-10个网段(此处的网段是指共享相同一段卫星频段资源,逻辑上划分的一个组),每个网段支持1-2万用户信令交互和业务处理。每个资源控制模块对应着一个控制板块,当当前的系统配置无法满足用户量的需求时,只需添加控制板块的数量(增加相同的控制板块,将板块直接插入到卡槽中)。反之若当前的系统配置高于用户的需求量,可根据用户的需求量减少相应的控制板块数。从而可根据用户的需求量灵活的配置控制板块,提高系统对大容量管理的可扩展性。
2.3 地面设备管理功能设计
地面设备管理需对地面设备的主控站和全网所有的终端站的工作状态监视、控制和管理,对设备部件功能控制,对故障的诊断及对告警信息记录、卫星资源的动态按需分配等功能。
地面设备管理覆盖故障管理、配置管理,性能管理、设备管理、系统管理及用户管理等六大功能。
为实现这些功能,宽带多媒体地面设备管理采用分层、模块化设计,本文中把整个地面设备管理系统分成表示层(GUI)、应用层(Manager)、适配层(Adapter)三层构建。数据库作为数据保存和交换的媒介,为这三层提供数据存取支持。
其中下层为上层提供服务,各层之间通过异步消息方式进行通信,通过数据库交换数据信息。
由于各个厂家设备自成系统,互不兼容,缺少通用性,为提高卫星资源设备的利用率,便于后续的各厂家不同设备的扩展,针对各个系统设备,设计接口层封装的功能,将与设备相关的具体接口协议剥离出来形成单独的接口融合在适配层中,接口封装各类协议的具体实现,提高地面设备管理中设备的灵活扩展性和系统的高可用性。
地面设备管理具體实现的功能分层图如图2所示。
其中表示层:表示层运行在用户终端上,负责实现与客户端用户交互,表示层提供配置管理、告警管理、性能管理、资源管理、系统管理、用户管理等功能;
应用层:运行在卫星网管应用服务器上,提供网管系统应用服务,包括:配置服务、告警服务、性能服务等;
适配层:运行在卫星网管适配服务器上,直接与被管设备和网络进行通信;
数据库:数据保存和交换的媒介。
3 关键技术
3.1 卫星信道抗干扰软实现
宽带卫星与卫星网络管理系统之间利用卫星信道来业务传输交互和信令控制通信,即上行信道用于卫星网管向宽带卫星上传发送信令或者是业务交互的请求,下行信道用于宽带卫星向卫星网管发送信令或者是业务应答。
卫星信道在上行、下行的通信交互过程中,往往会因为环境、天气、人为因素等受到一定的影响,卫星信号被干扰,影响了卫星与卫星网管之间传递的控制信令与业务传输的可靠性,在一定程度上较严重的影响卫星业务,导致卫星业务的音视频、大数据传输等出现卡、顿、中断的问题。
除了传统的通过在地面加装卫星防干扰设备,如天线罩、金属网等,对一定频率范围内的干扰信号进行屏蔽,本文中在地面设备管理中的资源管理模块里,设置了冗余的卫星信道资源,当卫星信号被干扰的情况时,触发资源管理模块的一键抗干扰的软实现功能,快速的评估被干扰信号的频段范围,通过抗干扰模型在冗余的卫星信道中选择一个安全性最高和被干扰性最小的卫星信道,同时将要切换的卫星信道资源信息通过卫星网管的配置管理模块加密传输,下发到每一个地面中心的设备上,另外通过卫星信道的上行链路加密发送信令和业务交互的请求,建立一条新的卫星与地面的通信链路。软实现的卫星信道抗干扰,无需添加额外的抗干扰设备与手动更改室内外的设备及其参数,就能在用户在收到卫星信号被干扰报警短短几分钟内,迅速屏蔽卫星的干扰信号,快速进行不同卫星信道间的切换,恢复正常的业务传输和信令交互,保障卫星关键业务的正常应用。
3.2 告警压缩
随着全网设备的增加或者是扩容,网络规模会不断的加大,网络告警会同步激增,频繁出现大量重复的告警,导致真正有用的告警筛选率减低。针对卫星网络管理告警的要求,在告警管理模块中,制定了告警的分析、过滤、抑制的规则和模型。
对于频繁出现的同类型不同时间点的告警,调用告警模块的知识库,对告警信息进行分析,若分析告警为致命或者是严重等级,则告警提示加强(告警声音刺耳且一直蜂鸣报警)、告警等级加大(包括告警颜色升级为红色加粗且告警信息置顶),快速引起运维人员注意,根据告警分析出来的维护建议进行运维,消除告警后填写告警解决方案并入并更新知识库,触发告警消除(停止报警蜂鸣、告警状态为已解决)。
若经过分析重复出现的告警等级为一般告警,仅更新该告警的出现时间与出现次数,调用告警的知识库,对该重复告警的原因进行汇总并更新该类告警原因后,同时调用告警压缩模块对同类告警进行压缩,不增加告警的数量,以一条告警信息代替所有重复告警。
若经过分析重复出现的告警信息为冗余告警或者是为互斥告警(两类逻辑上不能同时存在的告警称为互斥告警,当一类告警出现的时候,则另一类告警为无用告警,应该清除),则调用告警压缩模块的过滤清除功能,对告警进行删除。
经过告警压缩,提高真正严重告警的筛选效率,及时发现并排除真正的系统故障,保障整个宽带卫星系统的安全稳健。
3.3 负载均衡
宽带卫星网络管理中,系统支持10万用户的并发访问,负载均衡技术可使卫星网管系统的性能和资源得到优化,合理分配用户突发的访问量和海量用户业务处理的性能,提高系统资源的高可用性。
卫星网管系统将告警、性能、配置、应用(前台用户应用)服务等部署在系统中的多台服务器上,并通过负载均衡服务器提供对外虚拟访问地址,将一组服务(如部署了性能服务的4台性能服务器)虚拟化为一台设备(一台性能服务器)。
当有大量的访问处理请求通过虚拟地址到达后,负载均衡通过策略查看每个服务存储节点的负载情况,将用户请求分配到存储节点清闲的服务器上,同时,当系统中的功能管理服务器的用户流量负载过高时,也可以通过增加功能管理服务器并对负载均衡服务进行配置来均衡用户流量,解决系统中因某一个服务设备出现故障或者的访问量出现超高异常时,出现单点故障而影响整个系统运行与用户访问的问题。
并且负载均衡策略持续学习在热点时间段关于服务类型、用户访问数量、服务的最佳负载量,来完善负载策略,提高在热点时间阶段智能应用均衡策略、系统的资源可用性以及用户与卫星通信系统交互的体验。
4 系统应用及验证
卫星网络管理系统在正式上线运行前,通过网络仿真测试系统对卫星通信系统的结构、行为的仿真,对网络管理进行行为测试、性能测试、陷阱测试、完整性测试、回归测试和测试分析,来验证卫星网管系统结构的合理性、系统的可靠性和抗毁性、功能的正确性和完整性、性能特性。通过人为地设置故障,网管系统能可在纳秒数量级实现用户请求的无缝分配,将用户请求合理均衡的分配到其它正常的设备上,对卫星通信系统的正常运行几乎没有影响,从而验证了网管系统体系结构的合理性。
在卫星网管系统正式上线实际运行的近两年的时间里,系统经受住了在热点时间用户数量、访问量爆发式增加、近730天每天24小时无间歇的运行、不同角色的用户对系统进行访问与使用的考验,在实践中也证明了卫星网管系统体系结构与功能业务实现的合理性、实用性及系统的高可用性。
其中卫星网络管理的登陆及其主功能界面如图3、图4所示。
5 结束语
高频段资源使用、多点波束技术、星上交换、星上处理的应用在提高卫星通信系统的带宽、处理能力和抗干扰能力的同时,也对卫星通信系统管理技术提出了更高的要求。文提出的一种一体化管理、具有高可用、可扩展的卫星通信网络管理体系结构,通过仿真测试系统的测试和正式的上线应用,验证了其合理性,对于卫星通信网管理系统的研究具有重要意义。
参考文献
[1]李斗,项海格.LEO/MEO卫星通信系统发展展望[J].电信科学,2003(02):48-51.
[2]倪桂强,吴礼发,胡谷雨等.基于多线程的VSAT卫星通信系统的网控中心的设计与实现[J].通信学报,1998,19(11):92-96.
[3]吴迪,王光兴.卫星综合信息网网络管理的研究[J].小型微型计算机系统,2001,22(05):544-547.
[4]杨云年.VSAT卫星通信网[M].北京:人民邮电出版社,1997.
作者单位
航天恒星科技有限公司 北京市 100089