郑广宁 魏永静 田兵 孙丽丽 刘鸿雁
摘要
随着社会发展向着数字化和信息化迈进,人们工作交流的方式正与时俱进的朝着越来越智能的方向发展,高清视频会议正应网络时代的进步开始了领衔会议通信的发展时期,给用户带来了的更高品质的服务体验。高清视频会议终端产品是高清视频会议实现的重要组成部分,目前,各品牌的终端服务产品层出不穷,但关键技术要升级换代、赢得市场的青睐,并不是一朝一夕的事,需要坚持不懈的钻研和创新才能有所突破。来本文就高清视频会议终端产品的关键技术展开研究,旨在为行业的持续发展提供借鉴。
【关键词】高清视频会议 终端 关键技术 视频解码器 音频解码器
1 高清视频会议终端产品及技术发展现状
从2006年首款高清视频会议产品的720P问世,到2008年KEDACOM发布首款1080p高清视频会议系统,高清视频理念迅速铺开,视频会议系统已经进入到了高清时代。其高保真的画质和更为流畅的音质能为与会者带来更优质的视听体验和更有效的会议信息交流服务。随着科学技术的发展和市场需求的变化,高清视频会议系统在各领域特别是分布广、部门多、规模大的企业单位得到了极为有效的应用和推广。目前,高清视频会议终端产品厂商众多,但提供的产品也仅仅是基本能满足市场的需求,在关键技术方面还存在着很大的改良和提升空间。虽然高清视频会议终端产品越来越智能,但究其的本源,还是基于各种优秀的开源解决方案开发出来的,如开源项目WebRTC具有高成熟度、高代码质量、高品质抗网络抖动策略以及可跨平台和完整的音频处理算法等性能,当前国内包括高清视频会议在内的视频通信产品90%以上都是基于该项目开发的。目前,高清视屏会议终端视频产品的关键技术主要是视频和音频的效果的控制上。占据主流位置的视频编解码器依然是H.264,H.265因计算太过复杂和高昂的专利授权费,发展较为缓慢。Google也贡献了VPS、VP9等免费视频编码器,开源的X264和思科的OpenH264项目成为大多数中小厂家的最为垂青的视频解码方案,应用最为广泛。由于网络带宽是有限的,要保证高清视频的效果就必须在视频传输的抗网络异常性能上下功夫;音频编解码器方面,Google的Opus编码被公认是对适合网络传输编解码器,在抗分组丢失、变码率、VAD等性能上都远远超出其它编解码器,G711、G722、G729、SILK、SPEEX等也都是通用的编解码器。由于声音处理的效果会直接影响到用户的体验和产品功能的发挥,因此,高清视频会议终端产品厂商需要特别重视专业的声学和数字信号处理技术,它们是实现高质量的音频效果的关键。
2 高清视频传输的抗网络异常技术
高清视频的主要特点是高图像分辨率,在一定网络带宽的限制下,要实现大量图像数据的高效传输,就必须对视频进行编码压缩,并且根据网络质量实时优化编码码率,以保证高清晰度的图像质量和流畅的播放效果。这就需要着重对高清视频传输的抗网络异常技术进行研究。
2.1 网络分组丢失
高清视频会议实现的是实时性视频通话,为符合实时性这一要求,一般都会用到UDP传输实时视频分组的方法,但其缺点在于不能确保传输过程中的网络分组不会丢失。而任何一帧视频数据的不完整都会使解码出的视频图像出现严重的马赛克,而且马赛克会直到下一帧完整的关键帧传输到的时候才会消失。对此,解决这一问题的可行之法就是要统计输送到解码器的每一帧数据的完整性。
2.2 快速请求关键帧逻辑
高清视频会议的客户端会定时发送视频关键帧,如果发送关键帧间隔时间太短就会增大码率,快速请求关键帧算法就是解决这一问题可行技术。快速请求关键帧的原理就是当解码器返回解码错误信息时,在查询到视频缓存区内没有关键帧后,清空视频缓存区的同时向对方发送一个关键帧请求,对方接收到关键帧请求后,立即将下一帧编码为关键帧并发送虽然通过这种方式处理后网络分组如果丢失依然会造成视频轻微卡顿,但卡顿时间目前可控制在300~400ms左右,且不会出现马赛克现象,在网络分组丢失率不高时,这种技术是非常实用的。
2.3 图像渲染稳定度
高清视频会议终端显示的图像理论上是视频解码器解每出一帧图像就会立刻显示一帧出去,但实际上却会因发送端不稳定,网络延迟抖动等原因导致连续几帧图像之间的渲染间隔抖动严重,使视频画面时快时慢,显示效果不稳定。对于这种问题,则需要根据接收到视频平均帧率来估计出一个稳定的图像渲染帧率,以绘制出更均匀的图像,确保时间域图像的高质量。
3 高清视频会议终端的音频控制技术
声音质量是视频通信的基本要求,终端设备声学处理優化如果不到位,就会出现回声和底噪残留等声音质量问题,直接给视频通信的效果造成不利影响。网络是高清视频会议终端产品功能的基础,但网络传送的语音信号由于要经过编码、压缩、打包等一系列处理,不可避免的会造成回声路径的延迟及其延迟抖动问题,使得语音质量因回声问题而影响通话双方的主观听感。因此消除回声技术就显得十分重要了。目前,应用效果较好的回声消除算法(AEC)首先是基于扬声器信号及其产生的多路径回声的相关性的,在建立远端信号的语音模型,并利用该语音模型对回声进行估计,同时不断地修改滤波器的系数,使估计值更加逼近真实的回声,再从输入信号中减去回声估计值即可消除回声。AEC还通过对话筒的输入与扬声器过去的值相比较,来达到消除延长延迟的多次反射的声学回声的目的。而在通用回声消除算法基础上,增加扬声器端的自适应自动增益控制模块,能够通过扬声器自适应增益控制与回声消除的有效结合对近端和远端信号进行同时处理,双管齐下,更高效的实现回声消除的目的。这种优化技术对提升视频通话效果有着明显成效,值得借鉴和推广。
4 结束语
随着高清视频技术的不断发展与创新,其在视频会议领域的应用是时代的需求也是行业发展的必然。高清视频会议的实现离不开终端产品的大力支持,在这市场需求瞬息万变的时代,终端产品必须在关键技术上不断突破、持续领先,才能争得市场的一席之地,赢得与时代争锋的发展机会。未来,全数字化将是高清视频的发展方向,相信终端产品的关键技术也会应其发展而实现新的突破。
参考文献
[1]段震霞.多媒体会议系统设计技术与应用[M].中国建筑工业出版社,2009.
[2]王建.基于SIP的视频会议系统的设计与实现[D].北京交通大学,2009.
[3]毕厚杰.新一代视频压缩编码标准——H.264/AVC(第二版)[M].人民邮电出版社,2009.
[4]丁国强,罗庆国.高清视频会议系统技术及组网应用[J].数据通信,2016.