路士华++刘冰
摘 要:教育部网络高清视频会议系统覆盖教育部本级、各教育厅、局(教委)、计划单列市教育局、兵团教育局及部直属高校,共计112个接入会场。由于会务频繁,参会级别较高,再加上整个系统接入点较多,各地保障能力、技术手段千差万别,带来了极大的管理与协调难度,使整个运维保障工作面临极大压力。视频会议系统主会场与各分会场运维团队经过近五年的努力与协同,形成了一套运维保障体系,覆盖管理制度、人员保障、技术手段等方面。通过实施预备测试、会前准备、会中调度、会后总结的全生命周期会务管理,以及采取定期巡检与分会场单点联调测试等日常保障方式,确保了整个系统安全稳定运行。通过本系统召开过多次重要会议,节约了大量的会务成本,取得了比较好的综合效益。
关键词:高清视频会议;教育部;网络;会务管理;运维保障
中图分类号:TP393 文献标志码:A 文章编号:1673-8454(2016)09-0012-03
一、引言
为了严格控制会议经费,越来越多的单位开始建设自己的视频会议系统,采用网络视频的方式召开工作会议,有三点明显的优势:一是成本节约,极大地节约了直接、间接会务、参会人员的经济与时间成本,如会务管理时只需预留视频会议系统、网络带宽、会议室等资源,而无需像传统会务考虑参会人员的各类保障问题;二是覆盖人员更广,能够覆盖更广泛的参会人群,理论上分会场只要网络可达且具备权限即可接入参会而不受场地限制;三是会议随时可安排,如数万人参加的会议,传统会议要耗费数月时间去组织协调,而网络视频会议则随时可以举办。
不过采用网络视频会议系统也带来了新问题,主要有:一是稳定性问题,由于网络、设备设施的故障,存在分会场、主会场掉线,会议全体或部分中断的情况,影响正常会务进程;二是安全性问题,会面临网络黑客入侵窃听等隐患。由于网络视频会议通常参会人员较多,出现问题后带来的负面后果也会比较严重,因此如何确保网络视频会议系统安全稳定运行变得十分重要,这也是本文着重讨论的问题。
二、教育部网络高清视频会议系统介绍
教育部网络高清视频会议系统作为教育信息化的重要应用,既是教育系统转变工作方式、改进会风、提高会议质量和工作效率的重要手段,也是教育系统应急指挥的重要平台。教育部作为国家主管教育工作的部委,非常重视网络视频会议系统的建设,早在2006年便开始使用一套纯软件的网络视频会议系统,其优点是建设成本较低,缺点是系统稳定性差,操作繁琐。随着技术进步以及老系统故障频繁,教育部于2010年开始启动了网络高清视频会议系统建设工作,于2011年4月建成并投入使用。
目前投入使用的教育部网络高清视频会议系统覆盖范围广,共有112个分会场节点。系统在设计时采用基于H.323协议标准的硬件MCU设备和硬件视频会议终端设备组网,设计标准是达到1080P的高清视频效果。
教育部网络高清视频会议系统由教育部主会场进行统一集中管理和控制。设备配备方面:主会场配备了两台MCU(一主一备)、录播服务器、会议管理系统、音视频设备等,每个分会场部署一台视频会议终端、音视频设备等;网络方面:为确保信息安全,由教育科研网提供逻辑独立的专网保障,主会场两条100Mbps双活接入、所有分会场至少10Mbps接入,每个会场的IP独立,各会场之间网络双向可达,但域外不可达,专网只限于网络视频会议系统使用。
教育部网络高清视频会议系统拓扑如图1所示。
作为备份和应急手段,除高清视频会议主系统之外,还建立起一套基于WEB的实时录播/直播系统,称之为备用系统,每次会议召开时两套系统同时运转,当某分会场无法访问主系统时,可以通过WEB在专网上收听收看备用系统直播。
自2011年建成到目前运转已接近五年,在实际运维过程中也发生过多次问题,这些问题集中体现在:
(1)核心设备不稳定。由于分会场较多,对于资源消耗较大,导致在实际运行时MCU设备本身存在运行不稳定、故障率偏高。
(2)会议协同调度难度较大。由于分会场数量庞大,协调与保障难度极大,以会前点名为例,完成上百个单位的会前点名需要耗费数小时。
(3)分会场保障能力不一。分会场保障能力各不相同,有些高校技术力量强,问题较少,有些省厅保障人员薄弱,问题多发;再加上分会场技术保障人员有一点流动性,经常面临接续的难题。
(4)终端设备返修率较高。每次开会都会有数个分会场视频会议终端设备出现硬件故障,影响参会。
(5)缺乏完善的监控与定位手段。出现问题之后难以在第一时间定位其产生的原因,一些重大问题发生时,经常出现瞬间主会场技术支持热线被打爆的局面。
三、保障思路与工作模式
经过认真梳理分析上面的问题,我们认为教育部网络高清视频会议系统参会级别较高,规模大,组网方式特殊,各个分会场环境条件多样,系统运行维护的难度和复杂性都比较大,在运维保障时不能头疼医头、脚疼医脚,必须形成一套体系化的运维保障模式,依托现有系统与手段,通过体系化去应对问题、缓解问题、解决问题。
整个体系化运维管理包括组织管理、人员保障、网络环境保障、设备设施保障、系统安全保障等多个方面。
下面具体谈一下我们采用的保障思路和工作模式:
(一)组织管理
1.由教育部办公厅、教育部教育管理信息中心、CERNET网络中心共同建立运行保障工作小组,对视频会议召开、系统运行、主干网络保障等进行统筹协调和管理。
2.建立规章制度,规范操作流程。建立起覆盖会务全生命周期的分阶段保障机制,制订了相应的应急预案,明确岗位职责并制定了相关管理制度。
主要包括:
(1)预备测试阶段,每次正式会议之前进行系统测试,测试工作完全按照第二天开会进行针对性模拟,会安排所有分会场的点名,主备MCU切换、主备链路热切换。
(2)会前准备阶段,会议开始前半小时所有单位上线,进行会前各项技术准备工作。
(3)会中调度阶段,对分会场进行轮询,对存在问题的分会场进行针对性记录、处置与隔离。
(4)会后总结阶段,每次会后要求分会场提交电子反馈单,并对反馈单进行统计分析,同时对每次会议的音视频材料进行及时归档。
每次会议后会统计存在的问题,由于组织大型视频会议需要各方配合,对不配合的分会场也会通过统计数据去进行针对性批评、通报等。
建立起日常巡检、单点联调测试工作机制,对于主会场核心设备设施进行例行巡检,对于分会场单点不定期或者应其要求进行单点联调测试,每年会定期安排工作人员去各分会场巡检与调研,协调解决发现的问题。
建立完善的沟通机制,教育部主会场设立了固定电话、移动电话,建立了视频会议专用即时通讯群,使教育部主会场和各分会场会议管理人员能够及时交流和沟通。特别是利用即时通讯手段,在会议召开期间,分会场可以随时向主会场反馈出现的问题,主会场管理人员也会将主会场的情况通报给各分会场。
3.人员保障。运维保障涉及视频会议系统管理、网络中心、行政管理等多个部门,涵盖视频会议核心设备、网络设备、音视频设备等,需要配备不同专业的人员。将视频会议进行岗位分工、阶段分工、工作流程化、标准化,集中体现为重新梳理视频会议各岗位,如主会场设立了视频会议操作岗、录播系统操作岗、音频操作岗、视频与摄像操作岗、接线与在线问题处理岗、主会场网络操作岗、机房保障岗、主干教育科研网协调岗、技术总协调岗,其中技术总协调员采用A、B角,人员岗位相互之间可轮换替补,一人兼多岗,组成一支五至八人保障团队。根据会议的规模、重要程度,灵活安排工作保障人员,最低五人,最高八人。
团队内部加强重要的技术文档管理,对业务技能进行定期培训;对分会场保障团队进行电话或网络指导,并借助于互动交流群,鼓励分会场之间相互解答、相互协同。
(二)设备设施保障
教育部网络高清视频会议系统涉及网络、视频会议专用设备、会场音视频设备等方面,任何一个环节出现问题,都会对视频会议的召开效果造成严重影响。
网络是视频会议系统的重要基础设施之一,网络的好坏直接影响到视频会议召开的效果,甚至能决定会议的成败。网络环境保障是视频会议系统保障的重要环节。教育部网络高清视频会议系统运行于中国教育和科研计算机网(CERNET),CERNET主干网通过网络带宽预留、优先级服务等措施,为教育部网络高清视频会议系统提供网络通信保障。
各分会场单位就近接入CERNET主干节点。视频会议会场使用独立的接入层网络设备,配置为独立网段,不与其他应用共享。会场网络以尽量少的跳数,如果条件允许,最好直接连接到本单位CERNET网络出口。在单位内部网络的各个环节采取有效措施,为视频会议系统预留10Mbps以上的有效网络带宽。加强网络安全管理,防止网络攻击,采用安全控制策略,从网络方面保证系统的整体安全。
对关键设备设施采取多重备份措施,包括对视频会议核心设备、光缆链路、网络设备进行冗余热备;建设录播系统、基于PSTN的普通电话会议等备份系统,一旦视频会议主用设备、主干光纤链路出现问题,利用备份系统保障会议的顺利进行。
对主系统进行经常性压力、功能测试,并详细记录每一次故障发生的原因以及应对措施,经过多年积累基本掌握主系统的实际能力,避免了系统手册上认为没有问题,但实际上会造成不可预见局面的操作。
(三)应急处理
在视频会议召开期间,时常会遇到突发事件。一旦出现故障,应在第一时间判断出故障的性质、发生的部位及影响的范围,分清是网络问题、视频会议设备问题,还是会场音视频设备的问题非常关键。
为了智能定位问题,自主研发了覆盖全体会场的网络监测系统,通过图形化方式即时定位问题,如对于一个分会场有可能是终端设备故障,也有可能是出口网关故障,也有可能是终端设备达到出口网关这一段网络故障,通过研发的监测系统能够三段式同步监测,通过不同的颜色标识可以定位故障发生的区域,如图2所示。
在制度层面建立了基本的应急保障预案,根据问题的级别进行预案响应。在日常测试时对预案进行定期演练,包括:模拟链路中断,进行热切换;模拟设备故障,进行主备切换等。
四、总结
经过上述体系化保障,有效提升了系统的整体稳定性,对转变作风、提升效益做出一定贡献,较好地保障了重要会议,取得了非常好的效果。如:部分重要会议突破场地空间限制,参会总人数可达数万人,能够将指示精神更准确传达至具体执行人员;某单位使用本系统进行出国留学行前培训,传统方法是分片对上万学生进行培训,耗费数月时间及几十万经费,采用本系统后,只需一天时间,节省了大量的时间与经济成本。
不过视频会议主系统从根子上不稳定的局面并未完全解决,终端设备故障率偏高问题也没有完全解决,但通过上述体系化运维保障尽量避开有可能带来不稳定的操作,尽可能提升主系统的稳定性。另外在下一步工作中也将重点考虑对现有系统的升级改造。
参考文献:
[1]张伟,丁朝晖.基于等级保护的高清视频会议系统保障体系研究[J].信息网络安全, 2012(z1).
[2]李伟.浅谈视频会议的风险管控[J].数字通信世界,2014(7).
[3]李立华.网络视频会议保障实施办法探索[J].中国信息化,2013(6).
[4]余前佳.国土资源视频会议系统技术保障方法探讨[J].国土资源信息化, 2011(5):35-37.