南京地铁AFC系统车站服务器在线式容灾模式研究及应用

2020-09-10 11:26刘文静
交通科技与管理 2020年12期
关键词:服务器

刘文静

摘 要:AFC系统中的车站服务器(SC)是与终端设备紧密相连的设备,其主要功能是对车站终端设备进行状态监控、收集终端产生的交易和审计数据,规范系统的数据管理、运营管理及系统维护管理的技术要求。服务中的车站服务器向下提供正确的服务模式、参数分发、时钟同步等,向上提供交易数据、运行状态、客流报表等,起到了承上启下的关键作用,所以,车站服务器的正常运行是终端设备(TVM、GATE、POST)给乘客提供优质服务的保证。本文从增设硬件备份、应用虚拟化技术、既有设备复用的不同实现方式进行对比,研究了车站服务器在故障时如何能够快速恢复其功能,保证车站前后台正常运行。

关键词:AFC;SC;服务器;在线式容灾

中图分类号:U231 文献标识码:A

0 引言

随着地铁建设的发展,郊区线路的建设,使得线路呈分散、里程增长的趋势,在车站服务器出现故障时尤其在夜间,技术人员并不能够在第一时间赶赴现场维修解决故障,加上故障类型的不确定性,影响数据采集的时效性和终端设备的稳定性,基于此种情况,需研究SC故障后如何做到快速恢复其功能。为确保在车站服务器故障时终端设备能够继续为乘客提供服务,南京地铁准备通过建立一套容灾备份系统,在车站服务器无法正常工作时实现原服务器的部分功能,对终端设备进行接管,确保终端设备继续稳定运营。

1 实现方式探究

容灾系统是在各种灾难损害发生后, 仍然能够最大限度地提供正常应用服务的计算机信息系统。在发生灾难时,为了能够保证业务的连续性, 必须能够实现系统透明的迁移。国内AFC系统普遍采用在车站机房放置一台车站服务器的建设方式,通过星型网或者环网将SC与终端设备进行连接,SC与线路中心通过通信上层网相连,见图1AFC系统五层架构。此种设计层次清晰,明确各个层级分工协作,能够在线路里程不长的基础上保证维护的高效性。但是,随着城市轨道交通的发展以及郊区线路的建设,运营维护的问题逐步凸显,当SC出现故障,技术人员并不能够在第一时间赶赴现场维修解决故障,影响设备监控、实时客流数据等车站服务。

根据AFC系统五层架构,如果想实现SC在线式容灾备份系统的建立,可以采用以下两种方式:一是SC采取双机热备。双机热备是应用于服务器的一种解决方案,其主要实现方式是为服务器设置一主一备形式,主机和备机通过网络连接,正常情况下主机处于工作状态,备机处于监视状态,一旦主机出现异常,备机将会迅速代替主机,完全实现主机的功能。这种形式确实可以解决SC故障时功能受到影响的问题,这就需要为每个车站的SC增加备机,无疑要增加大量的硬件成本,性价比过低,这也是线路在设计和新建时期没有采用双机热备形式的重要原因。二是应用虚拟化技术。随着信息化的飞速发展,IT方面的投入在不断增加,服务器越来越多,机房空间越来越小,技术人员的管理难度也在不断提升,传统“一机一应用”的模式已跟不上时代的步伐,迫切地需要通过更为高效的信息化手段来实现。虚拟化技术能有效地实现物理资源的整合,通过共享资源的模式提高现有资源的利用率,减少了数据中心的投入,减少了空间需求硬件投入。但是虚拟化技术的应用通常适用于线路中心的各类服务器整合以取代原有的双机热备模式,若应用在SC上需要改变既有的架构设计,在线路中心为各SC增设集中共享设备,还需要突破车站局域网的限制,存在带来模式分发异常的隐患。

2 南京地铁的实现路径

通过上一章对SC容灾实现方式的分析,双机热备的形式无论对于既有运营线路的改造还是新建都不太现实,虚拟化技术作为新兴技术也需要投入大量的硬件成本,后期还需要投入长期维护的成本,不适用于既有线路对SC进行容灾。考虑到对乘客服务的优质要求及维护成本的控制,南京地铁从不更改原有架构设计、不花费大量成本投入的角度,考虑通过设计一套AFC车站服务器在线式容灾备份系统,在SC出现故障无法提供服务时,实现SC功能的临时接管。

(1)在线容灾系统的设计。基于以上需求,这就需要在既有架构中寻求可以替代SC接管其功能的合适的设备,由于容灾备份系统的目的是临时接替原SC的功能,因此对设备性能和长时间保存数据的要求相对较低,最终通过在车站工作站上安装虚拟机,在虚拟系统中部署容灾备份应用的所有功能,形成一台容灾系统计算机(如图2)。这样原工作站功能不受影响,并且应用程序都可以在相互独立的空间内运行而互不干扰,一旦SC发生故障,容灾备份系统可以立即接管,实现在线式容灾功能。

(2)容灾系统的切换。SC发生故障时,技术人员只需远程断开SC与AFC系统的连接,在替代工作站上启动虚拟机业务接入AFC系统,该工作站将全面接管故障SC的业务功能,实现设备监控、客流监控、交易管理、数据管理、通信服务、时钟管理、参数管理、设备管理、日始日终管理,同时可以实现客流数据实时衔接、交易文件断点续传、监控状态瞬间切换,真正实现在线容灾,为车站设备继续提供后台服务。设备故障时,若存在部分交易文件未正常上传的情况,容灾备份系统还对设备交易文件提供补传机制,确保交易文件上传。SC故障修复后,技术人员只需将在线式容灾系统断开,SC开机后即可继续工作,灾备系统转正常系统进行服务。若要保证SC交易文件和数据库中交易的完整性,只需灾备系统在故障期间的交易恢复至SC,对原系统不产生影响。

(3)容灾系统的维护。在线容灾系统的日常维护至关重要,为了在SC故障时能顺利接管,必须确保容灾系统中的业务功能与SC保持完全一致,这就需要在SC的业务软件功能包括配置发生变化时,容灾系统均需及时进行相应更新,与SC保持同步。而更新方式只需要远程连接容灾备份系统进行文件的替换即可实现,操作便捷。

3 结束语

通过研究SC在線式容灾系统,实现了利用车站工作站接管故障SC所有业务功能的方式进行容灾备份,确保现场服务质量和后台数据统计不受影响,也为故障排查争取足够的时间,缓解了故障处置的压力,真正实现了故障处理的“先通后复”,为“网络化运营”新形势下SC故障快速抢修探索了一种的新模式。

参考文献:

[1]李辉.基于Vmware虚拟化技术的服务器集群的架构与应用[D].湖南大学,2017.

[2]张金波.容灾备份与恢复平台的设计与实现[D].大连理工大学,2015.

猜你喜欢
服务器
高密度存储服务器可靠性设计与实现①
高密度存储服务器可靠性设计与实现
2019年全球服务器 出货量同比下降0.9%
2018年Q4中国x86服务器市场规模大幅增长
2018年全球服务器市场将保持温和增长
IBM宣布使用NVIDIA V100 构建云服务器
DNS权威服务器选择方式研究
用独立服务器的站长注意了
定位中高端 惠普8路服务器重装上阵