一种基于标量量化分割的视频多描述编码方法

2015-02-23 02:34蔡旻欧扬胡伏原雷岩
关键词:编码方法标量信源

蔡旻,欧扬,胡伏原,雷岩

(苏州科技学院电子与信息工程学院,江苏苏州215009)

一种基于标量量化分割的视频多描述编码方法

蔡旻,欧扬,胡伏原,雷岩

(苏州科技学院电子与信息工程学院,江苏苏州215009)

多描述编码技术能提高编码的鲁棒性来保证视频流的高效稳定传输,是一种重要的差错复原技术。结合多描述编码理论和视频编码具体情况,提出了一种基于标量量化分割的视频多描述编码方法,通过归纳得到两张索引匹配表,并由此将DCT系数分割为两路,实现了在编码端的分割。而在接收端通过增加反映射模块,实现每一路都能单独解码,两路全部收到可以联合解码。最后通过实验证明:该方法是可行的,并取得比较好的图像效果。

视频编码;多描述编码;多描述标量量化

在无线、因特网等易发生误码的网络环境中,视频信号传输面临着很大挑战。多描述编码作为差错复原技术的一种,能解决传统编码方法在遭受误码或丢包后引起的视频质量下降问题。它将单个信源信号编码成两个或两个以上独立的比特流,这些独立的比特流被称为描述。多描述编码两个主要特征是:(1)可以独立的对每个描述进行解码,重构出可用的原始信号;(2)多个描述之间存在互补信息,随着正确的接收到的描述数量的增加,解码出的图像质量也逐步提高。

近年来多描述编码依然是视频、图像领域的研究热点。刘美琴等人[1]在分形图像编解码领域引入多描述编码方案,将变换后的分形参数形成两个独立描述,并利用图像相邻值域块均值的相关性减少比特率。王礽晓等人[2]针对图像的感兴趣区域进行非线性几何变换产生冗余形成多描述编码,达到保护图像重点区域的效果。王相海等人[3]将多描述编码与图像编码质量可分级机制相结合,提出了一种基于DCT分层结构的分级多描述编码方案并运用在遥感图像领域。该方案将包含图像细节信息的增强层通过下采样形成多个描述,将包含图像关键信息的基本层作为冗余引入到每个描述中,从而保证了在解码端获取遥感图像基本层信息的最大可能性。陈婧等人[4]提出了一种基于H.264和双树小波的分层多描述视频编码方案,在基本层采用H.264编码器对视频进行低码率编码,将此信息分别拷贝到各个描述;在增强层采用三维双树小波变换产生四组小波系数,再将码字分成两组编码后形成各描述的特有信息。董萌等人[5]对视频中每帧图像进行水平方向和垂直方向下采样得到四个子图像,将四个子图像构成的四个视频子序列两两组合形成两路描述,提出了基于模式复制的多描述编码算法。

随着压缩感知技术的成熟,刘丹华等人[6]也提出了基于压缩感知框架的多描述编码方法。而将空间亚采样技术和压缩感知技术结合起来,赵春晖等人[7]提出了基于交织抽取与分块压缩感知策略的图像多描述编码方法。郑海波等人[8]从测量值信息分布均匀且互不相关的特性入手,在编码端利用分块压缩感知技术对图像进行随机测量,将得到的测量结果矩阵按行平分从而实现多描述编码。

上述给出的多描述编码方法在具体实现上都有其独到之处。在实际应用中主要是从编码效率、编码质量、编码复杂度、丢包复原能力、主观效果等方面考察方法的优劣。笔者提出的一种基于标量量化分割的视频多描述编码方法,利用图像经DCT变换后的量化系数进行映射分割,得到两路视频信号,每一路都能单独解码,两路全部收到可以联合解码。经编解码平台测试该方法可行,并能取得较好的主客观效果。

1 多描述标量量化

一般意义上,多描述编码可以理解成:信源在发送端有多种描述形式,这些描述构成一个集合;接收端从集合的子集中尽可能的精确恢复出信源,这和多用户信息论中多址接入问题十分相似。多描述编码的模型如图1所示。信源通过多描述编码器得到S1,S2,…,Sn多个描述,各描述通过独立的信道传送到解码端,解码器最少接收0个描述,最多接收n个描述,总共有2n种接收情况。接收到的描述个数不同,解码器能恢复的信源程度也不同,当所有描述都收到时,可最大限度的恢复信源。

图1 多描述编码模型

以两个描述为例来阐述其原理,如图2所示。

图2 两描述编码的框图

码率失真函数描述了码率和失真之间的函数关系,是衡量多描述编码方法性能的重要指标。多描述率失真区域是指在多描述编码中同时获得的码率和失真的封闭集合。若用R1、R2分别表示信道1、2的速率,D0、D1、D2分别表示解码器1、2、3带来的失真,针对图2中两个描述的情况,多描述率失真区域为可获得的五元组(R1,R2,D0,D1,D2)的封闭集合。

率失真函数R(D)是在率失真区域中失真为D时可获得的最小码率。相应的率失真函数R(D)是在率失真区域中码率为R时可获得的最小失真。则对该封闭区域的最简单约束为

若信源是方差为σ2的无记忆高斯信源,那么(R1,R2,D0,D1,D2)满足如下条件

在式(4)中,若D1+D2>σ2+D0,则γD=1;否则

式(4)表明中央失真必须超过乘以因数γD后所得的失真码率的最小值。当一个或两个边缘失真很大时,令γD=1可以得到一个很好的中央重建值[9]。Vaishampayan[10]最早研究了两描述情况下的多描述标量量化的问题,并指出其中的关键在于找到一个匹配器来产生一路分成两路的映射,如图3所示。

图3 两描述标量量化框图

在图3中,x是信源产生的抽样,经过编码器得到索引l,a(·)是一个匹配器,将索引l匹配为索引对(i,j)。g0,g1是边解码器,分别收到i和j,解码产生。g2是中央解码器,收到(i,j)后解码产生。其中最难实现的是如何由索引l匹配索引对(i,j),并且从l到(i,j)必须是可逆的,只有这样才能保证解码端能准确恢复出信源抽样。

2 采用的方法

考虑到视频编码框架的具体情况,在DCT变换后的量化系数中引入多描述编码方案是合理可行的。一个8*8的图像数据,经过DCT变换,再经过正常的标准量化,得到64个8 bit的数据。这64个数据的取值范围是从-127~+127。考察这64个数据,其中零数据占了很大一部分,非零数据集中在数组的左上角。需要做的是对非零数据进行映射。

利用矩阵的直观性,笔者将原始数据映射到矩阵的行方向(或称水平方向)和列方向(或称垂直方向),这样就将一路数据映射为两路。这里面必定要考虑的问题是如何在矩阵中摆放数据。

如图4(a)所示,将8个数据沿主对角线摆放到8*8的矩阵中,这样任意一个数据可以映射到矩阵的行方向和列方向。反过来,如果任意收到行方向或列方向的数据,也可以通过查矩阵来得到原始数据。但这种摆放方式的问题是“太浪费资源”。比如图4(b)中同样是8*8矩阵,但可以摆放22个数据,摆放规律是主对角线加两条副对角线。同图4(a)一样,任意一个数据可映射到矩阵行方向和列方向。但区别是:任意接收到行方向或列方向的数据,不能精确恢复原始数据。举例说明,收到行方向的数据“4”,查矩阵,对应的原始数据有三种可能,只能在其中挑出一个作为恢复出的“有误差的原始数据”。图4(b)中还隐含着:如果收到行方向和列方向的两路数据,那么可以精确恢复出原始数据的。更进一步说明,如果为了追求“节约资源”,可以在图4(b)中再添两条副对角线,但这样会在恢复数据时带来更大误差。

图4 在矩阵中摆放数据

由此得到两张表,这两张表分别对应的是量化系数为正和为负时的映射情况,如图5(a)、(b)所示。

以图5(a)来分析说明。笔者把1~127这127个数据如图5(a)所示摆放到43*43的矩阵中,摆放规律是一条主对角线加两条副对角线。另外为了后面归纳公式,以“Z”字形从小到大摆放的。任意某个数据,比如“17”,它在水平方向映射为7,垂直方向映射为6。若接收端收到水平方向的数据7,则恢复出来的数据可以是“17,19,21”三者之一,一般取中值19;若接收端收到垂直方向的数据6,则恢复出来的数据可以是“15,16,17”三者之一,一般取中值16;若接受端同时收到水平方向的数据7和垂直方向的数据6,则可以查表立刻得到精确恢复值17。

图5 两张映射表

另外还需要说明的是:原本的一路信源,其中每个数据都要8 bit量化。经过如上表中映射后,每个数据只需7 bit量化,这样带来的结果是两路描述中的每一路数据比原始数据有不同程度的减少。

在真正的编解码程序中,上述的两张表要变换成相应的公式体现为:

在编码端,分解到水平方向(第一路描述)qcoeff[i]=qcoeff[i]/3+qcoeff[i]%3,

其中qcoeff[i]是标准量化后的DCT全部系数,i从0到63,(下同);

在编码端,分解到垂直方向(第二路描述)qcoeff[i]=qcoeff[i]/3+1;

在解码端,如果收到第一路描述,则恢复出带误差的信源解码为qcoeff[i]=3*qcoeff[i]-2;

在解码端,如果收到第一路描述,则恢复出带误差的信源解码为qcoeff[i]=3*qcoeff[i]-2;

在解码端,如果两路描述都收到,则恢复出精确的信源联合解码为qcoeff[i]=a[i]+2*b[i]-2;

其中a[i],b[i]为第一路和第二路描述中的数据。

需要说明的是,以上分析的是当量化系数为正时的情况,也即图5(a)中的情况。图5(b)中的情况略有不同,请读者自行分析。

3 实验结果

3.1 主观效果

由图6、图7可以看出,将一路视频分解为两路视频在主观效果上是可以接受的。另外,可以发现,第二路(数据垂直方向分解映射)的主观效果要略好于第一路(数据从水平方向分解映射),这和笔者在文中第2部分的分析是一致的。

图6 claire.cif序列分解为第一路的视频截图(连续三个截图,分别为I,P,P帧)

图7 claire.cif序列分解为第二路的视频截图(连续三个截图,分别为I,P,P帧)

3.2 客观效果

文中采用的实验测试平台是经典的H.263框架。在H.263标准中,量化步长QP是可以设定的,范围从1到31。量化步长的改变对码率(单位是kbit/s)和PSNR(对Cr,Cb,Y分量中的Y分量而言)有影响。在实验中,选取量化步长QP从6到26共11个数值,间隔为2。

由图8可以分析得出,分解出的第一路和第二路这两个单路情况下的编码效果(体现在PSNR上)要略逊于H.263的标准情况。但是,换来的是每路的码率都要比H.263情况下低,在牺牲编码效率的同时提高了编码鲁棒性。另外还可以发现,第二路的PSNR要优于第一路,这和3.1节中的主观效果一致。

图8 claire.cif序列两个单路与标准状况的比较

4 结语

文中分析了视频中的多描述编码技术,结合Vaishampayan提出的多描述标量量化方法,提出一种基于标量量化分割的视频多描述编码方法。在编码端将图像DCT变换后的量化系数进行映射分割,使一路视频数据映射为两路。解码端收到任一路都能独立解码,收到两路则可精确联合解码。实验结果表明:该方法是可行的,在牺牲少许编码效率的同时提高了编码鲁棒性,符合多描述编码的定义。

[1]刘美琴,赵耀.基于FGSE的快速分形图像编码算法及其多描述编码方案[J].电子学报,2010,38(3):658-663.

[2]王礽晓,倪林,刘权.感兴趣区域的非线性变换多描述编码[J].计算机工程,2011,37(6):215-220.

[3]王相海,方锦,宋传鸣.基于DCT分层结构的遥感图像分级多描述编码算法[J].遥感学报,2011,15(5):989-1007.

[4]陈婧,李莉,蔡灿辉.基于H.264和双树小波的多描述视频编码[J].信号处理,2011,27(8):1265-1270.

[5]董萌,蔡灿辉.基于模式复制的H.264多描述视频编码[J].信号处理,2011,27(11):1675-1679.

[6]刘丹华,石光明,周佳社,等.基于Compressed Sensing框架的图像多描述编码方法[J].红外与毫米波学报,2009,28(4):298-302.

[7]赵春晖,刘巍.基于交织抽取与分块压缩感知策略的图像多描述编码方法[J].电子与信息学报,2011,33(2):461-465.

[8]郑海波,朱秀昌.基于分块压缩感知与平均分组的图像多描述编码[J].数据采集与处理,2014,29(5):764-769.

[9]Goyal V K.Multiple description coding:Compression meets the network[J].IEEE Signal Processing Magazine,2001,18(9):74-93.

[10]Vaishampayan V A.Design of multiple description scalar quantizers[J].IEEE Transactions on Information Theory,1993,39(3):821-834.

A video multiple description coding approach based on scalar quantization division

CAI Min,OU Yang,HU Fuyuan,LEI Yan
(School of Electronic&Information Engineering,SUST,Suzhou 215009,China)

Multiple Description Coding(MDC)technology belongs to error-resilience,which ensures the good transmitting of video stream by enhancing the robust of coding.Considering MDC theory and situations of video coding,this paper proposes a video multiple description coding approach based on scalar quantization division by concluding two tables of index matching.In this way,we divide DCT coefficients into two pathways at the coding-end.At the decoding-end,each bit-stream can be decoded independently by adding the reverse module,joint decoding when both bit-streams were received.The result of the experiment shows that this approach is feasible,and can obtain good quality of the video.

video coding;multiple description coding;multiple description scalar quantization

TP391

A

1672-0687(2015)04-0046-05

责任编辑:艾淑艳

2015-03-16

国家自然科学基金资助项目(61472267);江苏省自然科学基金资助项目(BK2012166)

蔡旻(1978-),男,江苏张家港人,助教,硕士,研究方向:多媒体与图像通信,视频编码。

猜你喜欢
编码方法标量信源
基于极化码的分布式多信源信道联合编码
可变摩擦力触感移动终端的汉语盲文编码设计
一种高效的椭圆曲线密码标量乘算法及其实现
一种灵活的椭圆曲线密码并行化方法
毫米波大规模MIMO系统中低复杂度混合预编码方法
信源自动切换装置的设计及控制原理
应用动能定理解决多过程问题错解典析
灾难传播中的媒体人微博的信源结构分析
——以鲁甸地震相关新浪微博为例
一种新的星载InSAR直接地理编码方法
浅析公路工程物资的分类及编码方法