陆安江,贺 松
(贵州大学计算机科学与信息学院,贵州 贵阳 550025)
随着因特网业务的快速增长,在速率起伏很大的IP网络及具有不同传输特性的异构网络上进行视频传输的要求和应用越来越多。在此背景下,视频分级编码的重要性日益突出,其应用非常广泛,且具有很高的理论研究及实际应用价值,因此受到人们的极大关注。但现有的分级编码存在诸多的不足,如算法复杂度高、计算量大、编码效率低等,并缺乏足够的灵活性[1,2]。基于小波变换的分级编码虽然具有很好的可分级性,但其算法结构复杂,与主要标准的架构差别较大,很少在实际中得到应用[3]。在AVS(Audio Video coding Standard)信源编码标准体系中,通过设置特殊的码流结构,对残差数据进行分级编码,这种分级方法并不影响在变换域中进行帧内预测,不会造成误差积累,可以将其很好地应用于实际[4,5]。而目前流行的IPTV视频播放系统,由于其网络交换环境复杂多样,传输视频质量必然受到网络环境因素的影响,特别是基于农村的终端用户,普遍传输环境条件较差,于是需要从源头上解决制约视频在传输过程中的问题。为了节省成本,同时在不影响视频质量的前提下,越来越多的目光将较差网络环境下高质量视频传输的解决方法转移到视频的编码上。
在本文介绍的系统设计中,由于拟将分级编码直接应用于适合边远农村信息服务体系远程多媒体视频架构的UT斯达康奔流系统,系统通过IP网络传送广播级视频质量的视频及互动娱乐服务,可以为用户提供端到端多媒体、语音等数据业务。系统整体采用分布式体系架构部署(如图1所示),分为存储分发平台、内容服务平台、网络分发平台、运营支撑平台、终端服务平台5部分。该解决方案主要包含内容存储、加密、分发、播放等[6]。
图1 IPTV分布式体系架构Fig.1 IPTV distributed system structure
在内容分发方面,该系统采用灵活、高效的宽带媒体内容分发协议来实现媒体站中的流媒体内容灵活分发。其充分利用IP服务的不保证服务质量特性,采用AVS视频分级编码进行优化设计,支持网络速率的容错控制管理。内容分发由媒体服务器、媒体引擎等共同完成。其中,分发策略的定制和设置主要由媒体内容管理来完成,支持PUSH、PULL分发机制,并按照预定的策略触发分发服务,通过媒体数据位置注册服务器记录整个系统中媒体内容的存储位置信息,并保持实时更新。在内容管理器的触发下,由媒体服务器、媒体引擎共同承担视频内容分发服务[7]。对于IPTV农村信息服务系统,视频推送速度及压缩质量也成为制约农村用户推广的瓶颈,而AVS分级编码通过优化视频的PSNR值和码率来解决此问题。
常用视频压缩标准方法如文献[4,5]中所述,将图像划分成4×4或8×8的小块,首先进行帧间预测或帧内预测,然后做离散余弦变换(DCT)变换,量化后按频谱进行分段,最后对整个图像的每一个分段统一进行熵编码[8]。
针对选取的系统架构,在同一频段内,将整个图像中所有宏块中的每一个分块的系数进行统一编码。所有宏块中的DC系数、宏块头、块头信息统一进行编码;针对其它层的AC系数,采用游程编码;对于DC系数,则采用DPCM进行预测编码。开辟一个独立的缓冲区来存放每一层编码的码流信息,然后将所有缓冲区联结在一起,并且在码流头部加上每个缓冲区的长度[6,7]。采用这种编码方式,解码器就可对每个编码层进行相应的解码。
由于块与块之间具有相同的特性,为了简化问题,可以只选取一个块来进行计算。将一个8×8像素构成的块记为Pix-cur[8][8],而将相应的参考块记为Pix-ref[8][8],记 DCT变换矩阵为 T,由于DCT变换也是线性变换,于是有:
式中,T-1表示T的转置。记Dctxi为除第i段的系数不变其它系数为零的矩阵,则有:
在编码器端按最高质量进行编码,因此,所有8个段的系数都要进行编码,并需要更新所有段的DCT系数。由于DCT变换的线性特性,更新等价于在像素空间域参考图像内进行,那么,就只需要在解码器端设置变换域内的参考块,不必在编码器端设置变换域的参考块。在编码器端沿用通常的像素空间域的参考图像,便于进行运动搜索[8]。
在解码器端,由于普通像素域内的解码器的参考图像只能用部分DCT系数来重构,而分级编码能够只对部分较低频段(n<8)上的系数求解,这时如果仍然采用空间域内的参考图像,势必造成编解码的参考图像不一致。因此需要在解码器终端增设一个位于DCT变换域内由每一个宏块中的相应块的DCT在每一个频段上的变换系数构成的参考图像。其中,每个像素为16 bit量化长度。当只有部分频谱的系数传过来时,将已收到的前n个(n<8)频段的DCT系数加到相应的参考块的系数之上,同时需考虑运动矢量后所对应的参考块,只将相应的DCT变换域参考块中前面8个频段的DCT系数进行更新。这样,就保证了编解码器在较低频谱(n<8)的参考图像的一致性。该方案有效地避免了误差积累。接下来,通过DCT逆变换来获得相应的解码图像。当收到所有频段上的信息以后,就可以获得一个质量较高的视频图像。
变换域的参考图像也是按相同的方法来划分,因此在作逆量化和DCT逆变换之前,先根据运动矢量信息将当前频段的差分系数加到相应变换的参考频段上,并更新参考图像的频段系数,然后组合所有分级频段n(n<8)的系数,进行逆量化与DCT逆变换,形成视频缓冲区[9]。在进行空间域变换过程中,如果使用通常的参考图像而不保存变换域DCT系数的参考块图像,可以将该参考图像相应的块进行DCT变换,然后只保留前 n段的系数,并设置其它系数为0。最后将接收到的前n个段的DCT系数加到变换后得到的前n个段的DCT系数,再做DCT逆变换,得到相应的解码图像。
通过在AVS的参考软件最新版本 RM52K-r1的基础上进行设计,选取视频图像测试序列如表1所示。分微度(Mother-daughter)、轻度(News)、中度(Foreman)和剧烈(Bus)变化程度进行仿真实验,得到的结果如图2所示。
表1 测试序列特性说明Tab.1 Test sample′s characteristic
图2 AVS-QSVC各级码率和PSNR比较Fig.2 Comparison between AVS-QSVC per-level code rate and PSNR
从图3(I帧后的第21帧)和图4(I帧后的第10帧)可以看到,从第0级到第8级,峰值信噪比值逐渐增大,码率也逐渐增加。这种能力使得编码后的码流具有了一定的可伸缩性,从而在带宽受限和信道不可靠等情况下能够进行可靠、有效的传输,因此可根据不同用户的网络带宽,选择相应码率的视频流传送给用户终端,从而保证了用户在不同的网络带宽下都能得到相应质量的视频服务。
图3 Foreman序列分级结果Fig.3 Scalable coding of Foreman sequence
图4 News序列分级结果Fig.4 Scalable coding of News sequence
针对IPTV在农村信息服务系统中存在的视频带宽受限问题,从实效的角度出发,在标准框架下提出了实用的视频可分级编码方法。该方法与基于小波变换的分级编码方法相比,其运算复杂度大大改善,能够很好地匹配AVS标准框架,可以与其它分级编码方法组合使用,得到更加灵活的分级编码方案,从而在实践中得到较好应用。另外,本方案很容易实现8级可调,使灵活性大大提高,能较广泛适应不同的网络交换环境。
[1] ITU-T Recommendation H.261,Video codec for audiovisual Services at p×64 kbit/s[S].
[2] ITU-T Recommendation H.263,Video coding for low bit rate communication[S].
[3] Wang Xianghai.Research on Spatial Scalable Video Coding Based on Wavelet[J].Computer Science,2002,29(7):115-117.
[4] ISO/IEC 14492-2(MPEG-4 Visual),Coding of audiovisual objects-Part 2:Visual[S].
[5] ITU-T Recommendation H.264 and ISO/IEC 14496-10(MPEG4-AVC),Advanced video coding for generic audiovisual services[S].
[6] 贺松,陆安江,张正平.农村信息化建设中IPTV系统存储技术研究与应用[J].贵州农业科学,2009,37(6):239-240.HE Song,LU An-jiang,ZHANG Zheng-ping.Research and Applicationof IPTV Storage Technology in Rural Information Construction[J].Guizhou Agricultural Sciences,2009,37(6):239-240.(in Chinese)
[7] 刘旭,陆安江,贺松.基于流媒体的农业信息化系统的设计及内容分发的研究[J].电脑知识与技术,2009,5(33):9496-9497.LIU Xu,LU An-jiang,HESong.The Design of Agricultural Information System and the Research of CDN Based on Streaming Media[J].Computer Knowledge and Technology,2009,5(33):9496-9497.(in Chinese)
[8] Luo L,Li J,Li S,et al.Motion compensated lifting wavelet and its application invideo coding[C]//Proceedings of International Conference on Multimedia and Expo.Tokyo,Japan:IEEE,2001:365-368.
[9] Secker,Taubman D.Lifting-based invertible motion adaptive transform(LIMAT)framework for highly scalable video compression[J].IEEE Transactions on Image Processing,2003,12(12):1530-1542.