焦力
【摘要】 本文通过对高清视频会议系统故障分析,阐述了视频会议系統图像帧格式及使用专业软件进行分析处理数据包乱序的排查步骤,MSTP专网传输视频会议2M通道的配置方法,为今后视频会议系统专网通道的建设和应用提出了建议。
【关键字】 高清视频会议 MSTP 故障
引言
高清视频会议系统是承载在数据网络上集声音,图像,文本(双流)一体的图像通信系统,它可以使位于不同区域客户随时随地集中在一起进行实时的双向信息交流,节省了时间,,促进了沟通和交流,降低了办公成本和费用,在电力系统行政办公生产“上情下达,下情上达”,应急指挥,远程教育培训等方面发挥了巨大的作用。
一、电力系统视频会议使用现状
电力高清视频会议系统经过多年建设,经历了标清,高清格式的升级转换,目前已形成了网,省,地三级架构,会议常用形式为通过MCU级联视频会议终端入会,由于应急指挥中心使用和会议保障要求不断提高,为了达到在单一设备故障时仍能保障会议正常开展的“N-1”要求,目前各会场的配置均由主,备两套终端互为热备份运行。各地级市会议承载网络各有不同,主要有以下两种:1.承载在电力SDH光传输网MSTP平台的专用网络通道,特点为:固定带宽,物理上与其它业务实现隔离,无需进行复杂的网络IP地址规划;2.承载在电力综合数据网上,通过MPLS/VPN技术与其它办公生产业务实现隔离,可使用RSVP协议保障业务带宽,需进行较复杂的IP地址规划。目前运用较多的为第一种方式,即承载在MSTP专网上,如下图1所示。
二、运行中发现的故障及分析解决方法
在视频会议系统运行中,由于承载在数据网络上,网络信号的传输质量对系统影响很大,通常会反映在视频会议系统召开会议期间不定期会出现图像花屏或严重时个别会场图像停顿的现象。
2.1故障表象
11月XX分公司反映出现图像花屏或严重时个别会场图像停顿的现象,经16日,17日,18日3天在XX市局呼叫各下属终端与会,通过观察主会场图像并实时抓包监测,仅在17日下午16:时左右开始在市局主会场发现IP-10.193.51.194节点出现类似故障。此时在终端上查看不到相应的丢包信息,但是在实时抓包解码时发现该节点发往市局MCU的RTP码流中存在严重的错序现象。
经了解,该局之前使用2M带宽传输视频图像时,并未出现花屏情况,后来为实现会议终端设备“1+1”保护,新增了一台备用HDX8000会议终端,随之将带宽升级为4M,根据工程经验的统计初步认为捆绑多个E1链路的模式下传输视频流时其发生数据包乱序的问题是影响视频质量的重要因素。
2.2故障初步分析
包乱序是广域网传输中常见的现象,如各路径的传输时延不同导致数据包抵达终点时发生乱序;或者数据封包较小、重新分割等在网络流量较大时也会产生乱序;另外协议转换器对多链路的捆绑处理过程也有可能造成包的乱序。
2.3运用网络分析软件进行故障定位
视频会议中媒体流承载在基于UDP之上的RTP通道进行传输,不过RTP并不提供有效的机制来保证数据包准确投递,一旦传输网络出现异常就有可能导致对端收到的数据产生丢包、乱序、延时等现象,当网络质量不能满足规定时,则接收端不能解码还原出良好的音、视,甚至出现声音停顿或画面花屏、停顿等现象。通过专业软件监测的统计数据看出,XX市局的MCU 与各下属单位的终端之通讯正常,其封包的大小符合正常的分布情况:
17日下午16:00左右开始XX局本地会场观测到来自10.193.51.204会场的图像开始出现画面凝固或马赛克现象,同时在MCU侧镜像抓包可以实时统计到大量的RTP 乱序数据包。
在测试的过程中,将IP-10.193.51.204站点挂断,则RTP错序现象消失。重新呼叫入会后则RTP错序再次发生。
2.4实验室测试验证
经实验室长时间在100M 以太的环境下测试客户的MCU以及相关终端,并未发现以上故障情况。
通过实验室搭建相应的广域网环境模拟数据包乱序,配套与客户相应的MCU RMX1000以及终端HDX8000的软、硬版本,会议的等参数与客户日常开会模板(1080P/2560kbps)。
经多次测试,当传输链路带宽最高为4M且链路以小于3%(错序位移1-40)的数据包乱序时可重复客户现场发生的故障功现象,同时终端无丢包统计报告数据。如果错序位移幅度变小(如1-5)则错序的百分比将在10%以上时方会出现画面花屏或凝固现象。
2.5图像故障原理分析
通常视讯媒体流中的视频图像是由I帧、P帧、B帧这几种不同类型的视频帧组合而成。其中最重要的是I帧,它是关键帧, I帧包含了一副图像的完整信息,其数据量很大,一般只在视讯视频流信道初始化时或场景发生变更时发送(终端刚加入会议、MCU切换广播不同的会场)。
P帧以I帧的点阵描述编码为基础进行图像变化部分的编码,这种维持画面变化做更新用的的帧其数据量较I帧小,因此在会议中常见的是传送P帧。
当通过MCU召开多方会议时,如果会议中有的终端接收I帧数据时发生丢包或者其数据包在规定的时间后延迟到达而被抛弃,这些终端就会向MCU产生I帧请求,倘MCU无响应,则这些丢包终端由于没有完整的I帧作为参考帧,就可能无法解码或者出现花屏。
此外,如果MCU频繁的响应I帧请求,则势必会要发送大量的I帧数据,由于MCU发送的的I帧是广播给所有与会终端的,因此无论是丢包、RTP乱序、甚至是正常接收的终端都会出现图像更新的状态,当更新较慢或再次丢包或乱序时则可能出现停顿现象。
2.6 E1线路捆绑乱序的成因分析
MSTP多业务传输平台在进行多E1链路捆绑时将数据包在以太网板的VCTRUNK口对每个数据包重新分割成若干适合E1传输的64字节的小包在各个E1链路上负载分担,如果各E1链路的传输路径不同,时延差异较大时则会导致分配在不同链路上的数据包最终抵达对端的时序紊乱,则有可能导致数据重组错误和告警,此外远端的协议转换器有可能会因性能的原因在高带宽呼叫产生较大流量时其保序性能下降而导致错序,故此两端局域网内的RMX或HDX设备所接收到的数据包同样也会乱序。
视频会议的实时性要求设备在收到码流的时候需要立即进行解码处理,而网络中的乱序可能导致部分数据包无法按时到达设备(对视频、语音应用而言在后续收到这些延时到达的包后将其抛弃)这样就导致系统在解码过程中出现丢包从而出现会议过程视频停顿的问题。
通过分析发现,该局之前使用2M带宽传输视频图像时,一切正常,在将带宽升级为4M工作完成后,新增的2M与原使用的2M在传输路径上并不相同,因此2M时延不同,当视频信号在传输MSTP平台传输时,可能会有网络乱序现象产生。
2.7采取措施及成效
在MSTP传输网管上重新安排,使新增的2M與原使用的2M传输路径相一致,继续调试,发现误码消失,会议画面恢复正常。
三、结 语
会议电视系统画面花屏或凝固现象与IP链路的数据包错误有直接关系,决大多数故障都是网络传输性能差造成的RTP包误码,丢包,乱序所致,如有可能在业务投运前应通过专用的测试仪器测试捆绑后的链路的误码以及其在满负载的情况下是否乱序。
使用MSTP光传输设备以太网通道传输视频信号时为了减少承载2M之间的时延差异,应采取以下措施:
1.将承载同一信号的多个2M传输路径安排为一致 。
2.承载的多个2M在始端和末端最好安排在相邻顺序--即同一级别的虚容器内,减少指针处理的时间差。
参 考 文 献
[1]谭鹃,骆永春。会议电视系统及应用 人民邮电出版社,2012,3
[2]OPTIX T2000 操作手册(SDH)—华为技术有限公司