牛妍华,李婷婷,李 博
(国家新闻出版广电总局广播科学研究院,北京 100866)
有线电视网络灾备体系研究及方案建议
牛妍华,李婷婷,李 博
(国家新闻出版广电总局广播科学研究院,北京 100866)
分析了有线电视网络灾备需求,提出了有线电视网络灾备体系,包括业务系统的灾备、运营支撑系统的灾备和传输网络的灾备,分析了广播电视安全播出与有线电视网络灾备体系的关系,从省级和国家级网络公司的角度提出了有线网络灾备架构,从实际建设的角度提出了有线电视网络灾备系统的方案建议。
灾备;安全播出;有线电视网络
有线电视网络作为国家基础信息网,是通达千家万户的信息平台和最经济便捷的信息载体。目前,保险、银行等金融行业是对网络容灾能力要求最高的行业,金融行业对于灾备系统的投入为其信息系统总体建设投入的20%左右甚至更多。而有线网络公司对于灾备系统的投入相对较少,因此其容灾能力相对较弱。随着各类互动业务、金融支付等应用的成熟推广,有线网络公司逐步开展灾备系统的建设工作。由于目前尚未制定统一的技术规范和建设规范,各有线网络公司在灾备系统的选址规划、建设方案等方面差异较大。因此相关标准规范的制定工作非常重要,本文深入研究了有线电视网络灾备系统的建设方案,为行业标准的制定打下了重要的技术基础,对各有线网络公司的灾备建设工作提供必要的指导。
多年来,有线网络公司基本上以安全播出为目的建设灾备系统,主要集中在数字电视前端方面。随着双向网改造和省网整合,有线网络公司逐渐转型为多业务运营商,一旦发生任何人为灾难、技术灾难,对有线网络公司会形成重大的损失。事实上,各网络公司或多或少经历过缺乏灾备系统造成的后果,由于涉及播出事故,因此不公开公司名称举例如下:
1)某市级网络公司的有线电视前端采用相同物理地址的主备方案,由于机房发生火灾导致直播信号长时间中断,经过一周时间恢复,造成播出事故;
2)某市级网络公司机房主用电源损坏,切换备用电源,结果备用电源也已损坏,导致节目停播一天,造成播出事故;
3)某市级网络公司由于BOSS系统宕机修复时间将近一个月,所有业务授权无法进行,为了补偿免费赠送用户一个月的互动业务和宽带业务,造成重大的经济损失。
以250万用户的市级网络公司为例,每月收视费用26.5元/户;其中互动用户30万户,宽带用户20万户,宽带费用平均每月80元/户。用户上线需要BOSS系统授权,如果在未建设灾备系统的情况下,BOSS系统出现宕机,包括直播、点播、宽带等业务都无法使用。恢复时间一般需要1个月,不仅影响用户收看正常业务,重要的是会丢失账务交易信息,按照最低收视费估算,恢复成本为26.5元/(月·户)×250万户=6 625万元/月,对运营商造成较大的直接经济损失,除此以外,在竞争日益焦灼的时代,会大大影响用户粘着力,产生不可估量的间接影响。
诸如此类的事故在缺乏标准的现阶段经常出现。因此各有线网络运营商也逐渐重视起灾备系统的建设。但由于缺乏灾备建设行业规范,因此面临以下问题:
1)各地有线网络公司对于灾备系统的重视程度差异较大,根据调研,只有经历过播出事故或者造成经济损失的公司才会主动建设灾备系统。
2)由于缺乏相关的指导,灾备系统建设在选址规划、建设方案、灾备方式选择等方面差别较大。目前建立的灾备系统广泛存在监控分析、故障诊断自动化程度不高,应对突发事件和抗风险能力薄弱的问题。
3)灾备方案制定缺乏对于广电行业业务及网络特征的深入分析,更多借鉴其他行业的方案,造成灾备程度不足或过剩的结果。广电的服务系统可用性要求较高,传统的99.99%可用性指标不符合广电行业的特殊要求,而应急广播的可用性要求更高于其他广播电视业务。因此需要根据业务特点区分重要性,指定切合行业需求的灾备方案。
2.1 有线电视网络灾备系统的界定
广义上讲,任何提高系统可用性的方式,都可以称为灾备,例如系统主机集群,当某台主机出现故障,不能正常工作时,集群内的其他主机可以替代该主机继续正常工作;网络端口、传输路由的冗余,主用端口不能使用时,备用端口将取而代之。因此,本项目所述的灾备系统界定为远程灾备,即灾备中心和生产中心不在同一局址内。
有线电视网络灾备系统是在现有系统基础上,通过建设本地或异地的灾备系统,实现对主系统数据及应用的备份,从而增强有线电视业务、网络对风险的抵御能力,尽量保证系统
数据不丢失或面向用户的业务不中断,保障安全播出,提升服务质量。
2.2 有线电视网络灾备体系架构
灾备的全称是灾难备份与恢复,是通过技术、管理手段以及相关资源确保关键数据、关键数据处理系统和关键业务在灾难发生后可以恢复的过程[2]。
有线电视网络灾备体系包括业务系统的灾备、运营支撑系统的灾备和传输网络的灾备(见图1)。其中,业务系统的灾备包括数字电视前端、互动业务平台、增值业务平台等业务系统。传输网络主要指有线网络部分,包括光缆干线网和有线分配网的网络保护。运营支撑系统的灾备是有线电视网络灾备体系中最重要的组成部分。因此,有线电视网络灾备体系涉及各个层面的灾备,包括数据灾备、应用灾备和业务灾备,需根据业务重要性建设针对性的灾备系统。
图1 有线电视网络灾备体系
2.3 有线电视网络灾备体系与安全播出的关系分析
虽然行业内尚未制定有线电视灾备的相关规范,但在总局第62号令中提到了灾备系统的建设要求:对安全播出保障等级为一级的前端,明确要求配置灾备系统,当发生特别重大灾害或突发事件,播出系统短时间内无法恢复时,能应急播出重要节目。宜建立异地备份前端系统,或与相邻城市前端系统互为灾备[3]。灾备体系和安全播出的关系如图2所示。
图2 灾备体系与安全播出的关系
安全播出对电视中心、广播中心、卫星广播电视地球站、无线发射转播台、微波传输电路、光缆干线网、有线广播电视网进行了设备层面的约束。安全播出主要对以上内容进行了设备级的冗余保护规定,同时对于级别较高的前端机房,指出需要建立异地备份系统,但并未具体提供灾备建设方案。
灾备系统包括业务层、网络层、运营支撑层,包括数字电视前端、互动业务平台、增值服务平台、光缆干线网、有线分配网和运营支撑系统,主要对以上系统进行灾备建设的指导建议。
安全播出在光缆干线网和有线广播电视网(包括数字电视前端和有线分配网)方面与灾备系统形成交叉,在光缆干线网和有线广播电视网方面,灾备系统可以参考安全播出的规定,形成良好的网络保护机制;在数字电视前端需要严格满足安全播出的要求,按照机房级别建设异地灾备系统。
灾备系统必须满足安全播出的规定。同时,还应根据有线网络运营商的实际需求,对灾备需求进行深入分析,对不同种类灾害的影响进行评估,根据实际情况选择合理的灾备系统建设方案。对于占到93%的设备故障和人为故障,应建立本地灾备中心,对于占到7%的自然灾害带来的影响,可以根据需要建立异地灾备中心或者和其他地市共用异地灾备中心。
2.4 有线电视网络灾备系统结构
对于省级有线电视网络公司而言,灾备系统分两级,如图3所示。
图3 有线电视网络灾备系统两级结构
省公司以省级生产中心为基础,建设省级灾备中心,作为省中心数字电视前端、BOSS系统的备份,同时可以为全省各市级分公司提供异地灾备中心。市级网络公司可以建立本地灾备中心,也可以直接使用省级灾备中心作为异地灾备中心。
从国家公司的角度,可以采用每个省分别设置灾备中心的模式,也可以对某些省采用多对一的模式,即类似大区的方式建设灾备中心,如图4所示,可以节省部分投资,但是管理协调上比较复杂。
图4 国家级有线网络灾备架构
广电应该建立完整的备份和容灾机制,建立操作系统、重要文件、数据库详细备份方案,根据数据热度和成本同时提供包含在线实时数据复制方案、在线备份方案、离线备份方案的一体化数据灾备方案,根据具体业务系统的重要程度选择数据级灾备和应用级灾备,建立全国性的灾备数据中心,各省级中心可建省内异地应用级灾备中心,同时使用全国性的灾备中心进行数据级异地灾备。
有线电视网的灾备方案分两部分:
1)有线电视前端的灾备建设严格按照62号令的要求,使用有线、卫星、微波相结合的传输方式,保证信号的及时传达。
2)对于互动业务系统、增值业务系统、运营支撑系统等,可根据运营商的实际需求进行针对性的方案设计。
市级有线网络公司的灾备建设方案参考表1,根据需求和预算选择合适的方案,包括同城灾备、异地灾备、同城-异地灾备。表中分析了各种方案的特点和适用场景。对于下属于省公司的市级公司来说,可以依托于省公司的异地灾备中心,统一分配资源,避免重复建设,节约成本。
省级有线网络公司建议采用同城异地灾备方式,参考表2。根据运营商的需求可以选择同城建立数据中心或灾备中心。建议省级有线网络公司一步到位建设同城灾备中心、异地灾备中心的模式。
表1 市级网络公司灾备方案选择分析
灾备方案方案说明距离建议适用性分析建议必须建议可选成本分析同城灾备只备份数据仅建设数据备份。当生产中心的数据发生异常时,可实时获得灾备中心的备份数据。RTP=0;RPO=0。当生产中心的服务发生问题时,无法接管,业务中断。RTP>>0;RPO=01)生产中心和灾备中心的距离在100km以内;2)同城中心避免在同一机房,避免水、电、空调、通信、火灾等事故1)适用于预算低、业务中断影响可接受的运营商;2)主要防御数据丢失的场景,无法防御业务中断1)关键媒资内容;2)关键运营数据(用户数据、交易数据、计费数据等)1)全内容;2)全业务;3)全数据成本低数据和业务都备份提供数据备份和业务接管,辅助承担实时性不强的生产任务。当生产中心的数据发生异常时,可实时获得灾备中心的备份数据。RTP=0;RPO=0。当生产中心的服务发生问题时,灾备中心可以同步接管业务RTP=0;RPO=01)生产中心和灾备中心的距离在100km以内;2)同城中心避免在同一机房,避免水、电、空调、通信、火灾等事故1)适用于预算中等、部分关键业务的安全重要性较高、业务中断影响较大的运营商;2)主要防御数据丢失和关键业务中断的场景1)关键媒资内容;2)关键服务;3)系统的关键业务;4)关键运营数据(用户数据、交易数据、计费数据等)1)全内容;2)全业务;3)全数据成本较高,需要配合场地、人员、维护等,人力成本较高双中心生产中心和灾备中心互为灾备、负荷分担。当生产中心和灾备中心任何一方发生问题,可实时切换,RTP=0;RPO=01)生产中心和灾备中心的距离在100km以内;2)同城中心避免在同一机房,避免水、电、空调、通信、火灾等事故1)适用于预算高、全业务保护要求高的运营商;2)主要防御人为灾害和技术灾害的影响,无法防御自然灾害的影响全业务全数据—成本高,需配合场地、人员、维护等。人力成本较高,随着用户量的逐渐发展,双中心可共同承担业务,投资回报率相对较高异地灾备只在异地建设灾备中心;当生产中心的数据发生问题时,可以获取异地灾备中心的备份数据,由于距离较远,需要路由转发等延迟,RTO>0,RPO>0生产中心和灾备中心之间的距离在100km以上,200km左右为宜1)适用于业务实时性要求低,且地域性自然灾害影响较大的地区;2)一般情况不推荐1)关键媒资内容;2)关键服务;3)系统的关键业务;4)关键运营数据(用户数据、交易数据、计费数据等)1)全内容;2)全业务;3)全数据成本较高同城异地灾备同城建设数据备份,异地建设灾备中心1)生产中心、同城数据灾备中心、异地灾备中心的模式;2)当生产中心工作异常时,可获得同城数据灾备中心的备份数据,RPO=0,RTO>0;当生产中心和同城数据灾备中心都发生问题时,异地灾备中心会丢失部分数据,RPO>0,RTO>0生产中心和同城数据备份中心之间的距离在100km以内,与异地灾备中心的距离是100km以上200km左右为宜1)可以防御各类灾害;2)由于同城数据中心不支持业务接管,因此RTO>0,不适用于实时性业务要求较高的场景1)关键媒资内容;2)关键服务;3)系统的关键业务;4)关键运营数据(用户数据、交易数据、计费数据等)1)全内容;2)全业务;3)全数据相对于同城灾备,在保证RPO=0的基础上可以防御地域性自然灾害,成本收益率较高同城和异地都建设灾备中心1)生产中心、同城灾备中心、异地灾备中心的模式;2)当生产中心工作异常时,同城灾备中心可以接管业务,并实时同步数据,RPO=0,RTO=0;当生产中心和同城灾备中心都发生问题时,异地灾备中心可以接管业务,但会丢失部分数据,RPO>0,RTO>0生产中心和同城数据备份中心之间的距离在100km以内,与异地灾备中心的距离是100km以上,200km左右为宜1)适用于预算较高的运营商;2)可以防御各类灾害1)关键媒资内容;2)关键服务;3)系统的关键业务;4)关键运营数据(用户数据、交易数据、计费数据等)1)全内容;2)全业务;3)全数据相对于同城数据中心的模式,投资更高,人力成本非常高,需要同时维护本地和异地的灾备系统
表2 省级网络公司灾备方案选择分析
灾备方案方案说明距离建议适用性分析建议必须建议可选成本分析同城异地灾备方式同城建设数据备份,异地建设灾备中心,为市级网络公司提供异地灾备1)生产中心、同城数据灾备中心、异地灾备中心的模式;2)当生产中心数据发生异常时,可以实时获得同城数据灾备中心的备份数据,RPO=0,RTO>0;当生产中心和同城数据灾备中心工作异常时,异地灾备中心会接管业务,但会丢失部分数据,即RPO>0,RTO>0生产中心和同城数据备份中心之间的距离在100km以内,与异地灾备中心的距离是100km以上,200km左右为宜1)可以防御各类灾害。2)由于同城数据中心不支持业务接管,因此RTO>0,不适用于实时性业务要求较高的场景1)关键媒资内容;2)关键服务;3)系统的关键业务;4)关键运营数据(用户数据、交易数据、计费数据等)1)全内容;2)全业务;3)全数据从省网的角度为全省各市级网络公司提供异地灾备,极大地节约了灾备建设的成本。异地灾备中心需要提供场地、人员维护等,有一定的人力成本同城和异地都建设灾备中心,为市级网络公司提供异地灾备1)生产中心、同城灾备中心、异地灾备中心的模式;2)当生产中心工作异常时,同城灾备中心可以接管业务,并实时同步数据,RPO=0,RTO=0;当生产中心和同城灾备中心工作异常时,异地灾备中心可以接管业务,但会丢失部分数据,但RPO>0,RTO>0生产中心和同城数据备份中心之间的距离在100km以内,与异地灾备中心的距离是100km以上,200km左右为宜1)适用于预算较高的运营商;2)可以防御各类灾害1)关键媒资内容;2)关键服务;3)系统的关键业务;4)关键运营数据(用户数据、交易数据、计费数据等)1)全内容;2)全业务;3)全数据从省网的角度为全省各市级网络公司提供异地灾备,极大地节约了灾备建设的成本。异地灾备中心需要提供场地、人员维护等,有一定的人力成本
考虑到既有投资的保护,可以在现有系统到达生命周期前,建设新系统,将原有系统重复利用作为降级灾备中心。充分利用现有资源。
考虑到成本的控制,可以只对关键业务进行灾备,需要根据有线网络公司的实际运营情况分析服务的重要性,分析各类服务中断后可能带来的后果,综合分析经济损失和负面影响,根据需求确定关键服务[1]及其灾备方案。
灾备对于有线电视网的播出安全和数据安全起到了很大的作用。但是,对于有线网络公司来说,并不是必须建设一个数据零丢失、应用自动切换的最高级别的异地灾备系统,灾备建设要在严格满足安全播出的要求下,从实际需求出发,选择适合的灾备方案才最重要。
[1] GB/T 20988—2007,信息安全技术-信息系统灾难恢复规范[S].2007.
[2] 杨义先,姚文斌,陈钊.信息系统灾备技术综论[J].北京邮电大学学报,2010,33(2):1-6.
[3] 国家广播电影电视总局第62号令,广播电视安全播出管理规定[S]. 2009.
牛妍华(1981— ),女,高级工程师,主研数据网及安全;
李婷婷(1987— ),女,工程师,主研数据网及无线地面覆盖;
李 博(1982— ),工程师,主研数据网及安全。
责任编辑:薛 京
Research and Proposal of Disaster Backup and Recovery of Cable Network
NIU Yanhua, LI Tingting, LI Bo
(AcademyofBroadcastingScience,SARFT,Beijing100866,China)
The disaster backup requirement of cable network is analyzed in this paper, and the hierarchy of cable network disaster backup and recovery, including service system, supporting system and transport network is proposed. The relationship between broadcasting security and cable network disaster backup is also analyzed. As a result, the disaster backup structure and detail suggestion from national level and provincial level network are proposed.
disaster backup and recovery; broadcasting security; cable network
TN949
B
10.16280/j.videoe.2015.24.013
2015-07-22