刘 彤
(北京数码视讯科技股份有限公司,北京 100085)
当前,“一云多屏”已成为广电行业乃至电信互联网行业的潮流趋势,其核心是用户体验,在不同终端形成无缝的视频资讯传输、互动和定制的统一服务,丰富用户在不同环境下的体验。鉴于广电网络、电信网络和互联网的改善,手机、平板电脑和数字电视的快速发展,网络和终端已经不再是用户体验视频服务的障碍,但如何将好的节目转换成为适合不同终端不同网络的节目源已经成为多屏业务发展的主要问题[1-4]。本文重点讨论如何提高转码系统的处理能力,以适应三屏合一这一市场需求。
多屏平台可用于IPTV、网络电视、手机电视和CMMB等,用户通过计算机、平板电脑和智能手机收看直播电视、视频点播以及时移电视等,良好的用户体验将吸引大量的客户购买广电的服务。随着用户数量的快速增长,预计在2012年,全球的三屏业务收入将达到186亿美元,将成为运营商增加收入的重要途径。随着用户数量的增加,三屏业务也必将为运营商带来丰厚的利润。现在,国内外多家运营商已经在这一领域开始发力,多业务、多终端的丰富运营模式成为未来发展的主流:在国外,AT&T已经开始运营三屏业务,向电视、电脑和手机用户提供电视业务;在国内,包括CNTV、百事通和华数等多家网络电视台都建立了相应的多屏转码系统,抢占了国内三屏市场。
面对多屏市场的机遇,运营商却面临着节目源转码能力的限制。随着新媒体内容的爆发性增长,受制于转码能力,用户却无法观看到需要的节目。怎样才能提高并且充分利用转码系统?答案是提高单台设备的视频转码能力,以及采用集群系统实现负载均衡。
从技术角度上讲,提高单台设备视频转码能力包括选择合适的码率转换方法、空间分辨率转换算法优化、提高时间分辨率转换和编码格式转换技术精确度。
为了适应不同网络的传输要求,转码设备需要通过一定的方法降低视频的码率,确保转换后的视频能够在不同的终端上播出。视频码率转换方法主要有4种,他们的难度依次递增,同时转码效果也和运算量成正比。第1种方法是通过丢弃部分高频DCT系数,截断高频部分DCT分量,虽然丢弃高频系数会导致图像部分细节的缺失,但在不影响观看的前提下,保证了码流输出符合要求。第2种是对第1种方法的优化,根据分析选择合适的量化步长,量化解码后的频域系数来降低输出码率。上述两种采用的是开环系统,计算的复杂度降低很多,同时也牺牲了图像质量。第3种方法是在不改变视频的编码模式和运动矢量的基础上对图像重新编码,避免在编码模式的重新选择和运动估计占用资源。第4种方法是这4种方法中效果最好的,但同时也是运算量最大的。需要从视频流中提取对应的编码信息,通过运动矢量优化并做一次IDCT和DCT,这样就提高了运动估计的精准性。后两种方法采用闭环系统,对解码图像进行了重建,对各宏块的残差进行了重新估计,虽然计算复杂度较高,但在反馈了参考帧图像基础上获得了较好的图像质量。
为了能够使高质量高分辨力的视频在分辨力较低的终端上显示,这就需要空间分辨力转换。通过添加模块,在“全解全编”架构中将视频的分辨力进行由高到低的变换。分辨力转换的算法有以下3种,分别是下采样算法、运动矢量映射算法和伸缩算法。下采样算法是通过改变原有的采样方式,减小图像的尺寸来降低分辨力,方法包括像素平均法,把原来2×2像素变为一个新的像素;滤波采用法,对通过滤波器滤波后的新像素进行抽样。运动矢量的伸缩算法和映射算法,是指通过运动矢量的缩放效应,对视频图像压缩,从而达到降低空间分辨力的效果,其低分辨力图像的新宏块与原来的多个宏块对应,之后采用一定的映射算法计算出这些新宏块的具体运动矢量,这些方法包括平均值法、中值法以及随机选取其中一个矢量作为参考宏块的当前运动矢量,最后将所得的该运动矢量与分辨力的压缩比作除,从而在低分辨力图像下获得最终的运动矢量。
时间分辨力转换是指把原来视频序列的帧率以一定的方法进行由高向低的变换,这样就会减少对解码设备处理能力的依赖,保证在终端设备分辨力低、处理能力弱、带宽小的情况下视频的正常播放。时间分辨力转换的方法主要有3种,分别是丢帧、帧类型转换和运动矢量合成算法。降低帧率的方法不是简单的丢弃帧,而是通过丢弃帧的运动信息合成新的运动矢量。由于丢弃B帧不会对I和P帧有任何影响,所以丢帧的策略是首先丢弃B帧。另外,跳帧策略是根据运动矢量的积累程度来选择。帧类型转换主要是指B帧到P帧的转换,多向的运动矢量变换为前向运动矢量。运动矢量合成算法是采集弃帧中的相关运动信息,通过合适的运动矢量合成算法,合成新的运动矢量,这种方法利用了运动矢量的相互关联关系。
为了将原始视频的编码格式转换成终端所需的解码格式,通过先解再编对编码格式进行转换。现在主流的视频编码格式包括H.264,MPEG-4,MPEG-2和AVS等,由于H.264的技术较为先进,在不降低画面效果质量的情况下大大降低了码率,也就是具有较高的编码效率,现在成为主流的高清乃至标清小屏幕设备主要视频编码格式。因此,在从其他编码标准到H.264编码转换的过程中,利用阵内图像预测、运动估计多模式选择等方法,通过多参考帧、多编码模式以及1/4像素运动估计等方法对视频图像进行优化,这样在保证图像质量的前提下降低了运算量。
基于以上的技术分析,在面对不同的转码需求时选择合适的转码方法,运用先进的算法,这样才能提高转码器的转码能力。
转码工作不仅仅需要转码器具有强大的转码能力,还需要通过转码集群管理平台管理转码器实现充分调度,使转码器的转码能力最大化。转码集群管理平台可同时管理多个转码器,负责检测系统中转码器的状态,当转码器出现故障时,从备份转码器中选取冗余的转码器进行热备。转码集群管理包括负载均衡、冗余备份、任务调度以及转码缓冲管理。
以一个来自CDN网络的转码请求媒资转码为例,内容分发网络向转码集群发送转码任务请求,转码集群服务器根据负载情况自动选择一台转码服务器,设置输入和输出目标,启动转码。转码服务器可以在向内容分发网络提供内容的同时向缓冲中写入文件,转码集群负责维护转码输出的文件Cache,下次当同一个转码任务发出时,如果转码结果存在于文件Cache中,转码集群管理服务器将不再启动转码,直接返回该文件的访问链接,通过这种方式,可大大降低转码集群的压力,节省运营商的投入成本。
转码集群管理服务器对于转码集群的管理采用分组调度的方式,典型的一种是在逻辑上根据不同的应用对转码服务器分组,对于一个任务的冗余调度在其组内实现,当有设备出现故障时,可以从冗余组中选择一台服务器进行备份,对于不同的组,用户可以选择不同的负载均衡策略,固定提供最大资源利用、平均分配等策略可供用户选择,其示意图如图1所示。
转码集群管理服务器对转码缓冲管理采用先进先出和热度调度两种策略,先进先出即简单的最先生成的文件当缓冲满时最先清除,热度调度策略类似于现在计算机内存管理策略,根据当前文件的热度和生成时间作为缓冲清除判断依据,两种策略应用于不同的应用场景,前者适用于内容分发网络屏蔽了用户请求的环境,后者适用于内容分发网络直接传递用户请求的场景。可根据用户的使用环境选择,并且易于扩展。
相对于传统的单机转码器,转码集群可以实现负载均衡、冗余备份、任务调度以及转码缓冲管理,可以将多台转码器的转码能力充分利用,解决传统多台转码器同时工作时无法调度、负载不均等缺陷。因此,集群系统将取代传统的多台设备叠加,成为未来技术发展的主流。
高性能的转码器和转码集群系统解决了运营商在推广多屏业务的转码较难处理等问题。为此,数码视讯推出了以xStream 2000为核心的多屏转码集群系统,提供高并发的任务响应,将各种输入转化为适合各种终端的视音频格式。随着国内三网融合步伐的迈动,各大运营商对三大网络业务应用的融合已经拉开了帷幕,多屏编转码集群系统通过将媒资和实时节目转化为适合各个网络传输的媒体格式,使得各大运营商能以较小的投入轻松打开现有网络壁垒,将为三网融合在业务层面的融合打下坚实的技术基础,为广大人民群众提供更加便捷、丰富的文化消费,提供更好的互动体验,从而满足广大人民群众日益增长的精神文化需要。
:
[1]上海贝尔.上海贝尔“多屏”解决方案[EB/OL].[2011-03-03].http://www.ccidcom.com/html/anliku/yewuwanga/201003/27-101463.html
[2]韦乐平.三网融合的思考[J].电信科学,2010(3):1-6.
[3]温建伟,王厚芹.国际三网融合进程评价与启示[J].电视技术,2010,34(6):113-115.
[4]张黎晨.“三网融合”:中国广播电视发展的新机遇[J].电视技术,2010,34(6):116-117.