吴 伟,卿粼波,王正勇,杨 红
(四川大学 电子信息学院 图像信息研究所,四川 成都 610065)
DVC转码技术研究
吴 伟,卿粼波,王正勇,杨 红
(四川大学 电子信息学院 图像信息研究所,四川 成都 610065)
介绍了分布式视频编码(DVC)到传统视频转码的方案,该转码方案适用于移动终端设备之间的视频通信。着重讲述了DVC到H.264的转码,针对转码过程中复杂度高和时延长等问题,利用DVC解码端生成的运动矢量来减少H.264编码的工作量,在几乎不影响视频质量的前提下,极大地降低了转码的计算复杂度和时间,提高了转码效率。同时介绍了DVC转到其他传统视频的方法和方案,最后分析了DVC转码在当前移动视频通信市场中存在的巨大潜能,以及对转码技术的未来发展和方向进行了展望。
DVC;H.264;转码;移动视频通信
1.1 DVC的发展
随着数字视频的广泛应用,移动通信设备已由单纯的文字或语音通信向多媒体视频通信发展。尤其是现在4G技术的普及,各种手持移动设备之间的视频通信日趋频繁。通常这些终端设备因能耗资源和编码处理能力有限,而又要保证具有良好的抗误码性和压缩效率,因此要求视频编码器简单易实现。传统的视频编码方案如MPEG、H.26X因需要在编码端做大量的运动估计,以达到视频压缩的目的,编码端复杂度远高于解码端,而无法达到这一要求。于是,分布式视频编码(Distributed Video Coding,DVC)技术近年来被提出并得到广泛研究。在DVC方案中,对视频间的相关性的挖掘与利用从编码端被转移到解码端,使得各视频帧独立编码,并通过联合解码重建视频序列,将编码端的复杂度转移到解码端,因此对于需要编码复杂度较低的无线视频场合适用性很强。而现在手持移动终端设备直接端对端相互视频通信(如手机和手机之间),编码端和解码端都需要达到低复杂度、低成本和低功耗的要求。因此从DVC到传统视频的转码技术应运而生,对终端设备而言,发送方和接收方都只需进行低复杂度的编码与解码计算。
DVC转码是在2005年首次被提出[1],但当时只介绍DVC应用于转码方面的前景,并没有在上面做实际工作,2008年则最先实现了从DVC到H.263视频转码的策略[2]。DVC到传统视频的转码应用于手持移动终端设备之间视频通信的构架如图1所示。
图1 应用于手机之间通信的DVC转码
由于DVC与传统视频编码具有互补性,在基站安放一个视频转码器,可以实现在手机终端进行低复杂度编解码。该转码器负责接收DVC视频流,并对其进行转换编码以生成H.26X或者MPEG-X视频流,接收端将收到的H.26X或者MPEG-X视频流按照传统方式进行解码,最终得到所要的视频信息。
图1提供了一个方案,其中发送端和接收端都执行较低复杂度的算法,而把大量复杂工作留给中间作为转码器的网络中心结点。理论上,转码器拥有大量资源且没有电量的限制,不用担心功耗等问题,但在实际应用中,为了DVC到传统视频能实时有效的传输,需要对转码器执行过程做简单有效的处理。近年来,国内外学者提出了一些DVC到不同传统视频格式[3-5]之间的转码,包括H.263、H.264、SVC、AVS、VC-1等。虽然所转格式不同,但快速转码基本思想都是利用DVC解码端生成的运动矢量加速传统视频的编码,且其基本算法核心都相似。当前主流视频格式依然是H.264,并且从DVC转到H.264方案研究甚广且具有代表性,因此本文主要介绍从DVC到H.264转码的基本思想和方法。
1.2 DVC技术要点
分布式视频编码理论基于两大信息理论的,即Slepian-Wolf[6]的理论和Wyner-Ziv理论[7]。这两个理论指出:利用独立编码、联合解码的方法对两个统计相关信源进行压缩,可以达到与传统联合编解码方法相同的压缩效率。图2是分布式视频编码系统框图。其中,编码端将视频序列按一定间隔交替划分为关键帧(K帧)和Wyner-Ziv帧(WZ帧),两种帧交替的间隔由参数GOP(Group of Pictures)指定。其中关键帧K帧与传统视频编码中的帧内编码模式相同,码流直接传输到解码端。而WZ帧则采用Wyner-Ziv编码模式,首先将像素域的视频帧转换到变换域,常采用的算法是离散余弦变换(Discrete Cosine Transform,DCT),对变换后的数据进行量化,然后经过信道编码产生校验位。解码端先解码接收到的K帧编码的码流,然后将其作为参考帧对WZ帧做边信息估计。将获得的边信息也进行和编码端相同的DCT变换、量化作为信息位,使用编码端传输过来的校验位对其进行纠错解码。最后对解码重构后的序列进行IDCT(Inverse DCT)变换获得最终的重建WZ帧。
图2 DVC编解码系统
在该系统中,编码只进行计算复杂度较低的帧内编码和信道编码,而解码器需要进行帧内解码、边信息产生、信道解码和WZ帧重建。其中,边信息的产生算法较为复杂,因此该系统编码端的复杂度要远低于解码端。
1.3 H.264技术要点
H.264是目前广泛应用的数字视频压缩标准,其编码器的功能组成见图3。从图3可见, H.264和以前的传统视频编码(如H.261、H.263、MPEG-1、MPEG-4)在大体框架上并没有什么区别,主要不同是对功能块的细节方面做了一些改进。
图3 H.264编码系统
在H.264视频编码中,运动估计计算量最复杂,需要的时间也最长。H.264通过运动估计从之前已编码的帧中获得当前编码块的预测值。用当前编码块的像素值减去其预测值,得到预测残差,然后对残差进行编码,去除了视频序列间的冗余度实现了对数据的压缩。其中运动估计过程占据了H.264整个压缩编码过程的大约60%~70%[8]。因此如何在确保压缩图像质量的前提下,尽可能降低运动估计的复杂度一直是H.264研究的重点和难点。
DVC到H.264视频的的转码框架如图5所示,DVC解码是转码器的一部分。为了避免转码器第二部分即H.264编码工作的繁重,转码器利用DVC解码生成边信息过程所获得的运动矢量来加速H.264的编码。
图5 DVC到H.264视频转码器
边信息生成是DVC解码端的一部分,它是DVC快速转码的中间桥梁,起着至关重要的作用。一般边信息生成方案有运动补偿外推[9],运动补偿时域内插[10],基于哈希码(Hash)时域边信息生成[11]等算法。MCTI因为利用前后关键帧进行预测补偿生成边信息,效果较好,并且运用MCTI生成的运动矢量能在转码中直接为传统视频编码提供帮助,因此转码中DVC解码端边信息生成采用MCTI,具体模型如图4所示。设需要建立的边信息帧为Yi,已知其前后相邻的关键帧为Xi-t1和Xi+t2,其中t1和t2表示已知帧与边信息之间的时间距离。
图4 基于MCTI边信息生成
在该算法中,先对后向关键帧中的每个分块在前向关键帧中进行运动搜索,得到最佳匹配块后获得后向运动矢量MVb,进而得到插值值对应块的后向运动矢量,有了差值帧每一块的运动矢量,通过运动补偿可以得到一个差值帧Xb,其中寻找最佳匹配块时,运用绝对误差和公式
(1)
式中:B代表M×N宏块,(dx,dy)为运动矢量,fn和fn-1分别为当前帧和前一帧的灰度值。同理对前向关键帧做同样的计算获得前向运动矢量MVf,然后得到差值帧xf,有了前向运动矢量和后向运动矢量分别对应的补偿得到的差值帧后,该算法中假设运动是均匀的,因此中间边信息帧的计算方式为
(2)
2.1 运动矢量映射
在DVC视频编码中,视频序列分为K帧和WZ帧,而传统视频编码如H.264通常分I帧,P帧和B帧。分布式视频编码与传统视频编码帧的编码方式不同,GOP也不同,因此转码工作首先要解决的就是DVC到H.264视频帧之间的映射和GOP的映射方式。一般传统视频编码的GOP可以和DVC相等,也可以是DVC的若干倍[13]。DVC中K帧利用传统视频编码进行帧内编解码,它与H.264编码的I帧一致,因此转码时DVC的K帧直接转到H.264的I帧,不做任何处理。
2.1.1 P帧的映射
根据前文可知,在DVC解码生成边信息时会做大量的运动估计,以寻找当前帧各块的最佳匹配块而获得最优的运动矢量。当DVC的GOP大于2时,前后参考帧的间距将大于1,而此时产生的运动矢量将不适用于H.264编码阶段,因为参考帧距离较大时所获得的运动矢量若用于转码器第二部分(H.264编码)将不够精确,转码尽量要选取上一阶段最好的运动矢量。图6描述了DVC的GOP为4时转到H.264的GOP为IPPP形式P帧映射的范例[12-20]。
图6 DVC GOP 4到H.264 GOP IPPP的映射
最后,H.264 GOP为IPPP,P帧与参考帧的间距都为1,而第二步运动矢量都是在间距为2的情况下生成的,因此将得到的矢量V0-2和V2-4各取1/2对应到H.264 P帧的编码。对于DVC GOP更大的转到H.264 I11P形式同样适用,只不过是保存DVC最后解码阶段(即参考帧间距为2)所生成的运动矢量,来帮助转码时H.264中P帧的编码。
2.1.2 B帧的映射
H.264的B帧是双向预测帧,B帧是同时根据前面和后面的参考帧进行编码的帧,也是运用运动补偿预测技术来完成编码,其压缩效果更佳。B帧的映射方式和P帧类似,如图7所示。图7介绍了DVC GOP为4时转到H.264 GOP 为IBIB的大致流程[14,20]。前面两步和2.1.1节一样,只不过最后在H.264编码阶段有所不同。因为B帧是双向预测帧,它需要同时借助前后参考帧编码,因此前后预测都需要利用DVC最后阶段生成的运动矢量。
图7 DVC GOP为4到H.264 GOP IBIB
2.1.3 P帧和B帧的混合映射
上文分别介绍了P帧和B帧的映射,但实际视频编码中P帧和B帧混合的情况居多,性能也较好[14,17-18,20]。图8展示了DVC GOP为4转到H.264 GOP为IBBP的范例。
图8 DVC GOP为4到H.264 GOP IBBP
在此情况下,前面两步同2.1.1节,H.264编码时,先利用已解码的I帧来编码P3,P3是前向预测帧,离参考帧I0的距离为3,而DVC解码端两帧之间做运动估计时距离为2,因此获得的运动矢量V2-4需要乘以1.5才可以适用于P3帧的编码。然后编码B1帧,B1帧是双向预测帧,需要借助前后参考帧编码。B1与前向参考帧I0的距离为1,因此需要将DVC解码端生成的运动矢量V0-2乘以0.5做为B1帧前向运动矢量,而B1与后向参考帧的距离为2,可以直接借用V0-2做为B1帧后向运动矢量来编码。同理,编码B2帧时,V0-2乘以0.5作为B2帧后向运动矢量,直接借用V0-2作为B2帧前向运动矢量。
在文献[2,21-22]中的WZ帧映射到P帧和B帧时,DVC端边信息生成依旧运用MCTI,不同的是它保存了DVC解码端每一步生成的运动矢量,在H.264编码时根据编码帧与参考帧的间隔与DVC端生成运动矢量的间隔的比例设置权重因子,然后将运动矢量乘以权重因子就是H.264编码帧对应每一块的运动矢量,并且在编码B帧时同时分别利用了DVC解码端生成的前向运动矢量和后向运动矢量。最后将H.264得到的运动矢量进行优化处理,在视频质量下降很小的情况下大大增加转码的效率。
2.2 减小运动估计搜索范围
H.264视频编码复杂度高的主要原因是编码端要做大量的运动估计,因为需要寻找当前块的最佳匹配块,而对于物体运动量大的,所搜索的范围将增大,计算复杂度和所花费的时间也将增加。为了减少运动估计的工作量,可以利用DVC解码端生成边信息所做的运动估计来减少H.264定位最佳匹配块的时间。实际工作就是根据DVC解码端已有的运动矢量,灵活地减少H.264编码时运动估计的搜索范围[13-18,20,23-24]。减小搜索范围将作用于H.264每个宏块和子宏块。具体原理如下
A={(x,y)/(x,y)∈(T∩R)}
(3)
式中:A定义的是转码器中H.264运动估计需要搜索的范围;(x,y)是运动估计候选区域;T是H.264单独编码时运动估计所需要搜索的范围;R是转码过程中借助DVC解码端所做运动估计而H.264可以不必搜索的范围,R的搜索范围定义为
(4)
(5)
(6)
在式(5)和式(6)中,运动矢量来自DVC解码端生成的运动矢量(MVx和MVy),各自取运动矢量的二分之一,它们的权重为d,d代表着参考帧的间距(即H.264编码时当前帧和参考帧的间隔)。另外,为了避免运动估计搜索范围太小引起转码后视频质量的下降,在这里设置了最小运动估计搜索范围L。可以综合考虑转码的时间和质量,适当调整L的大小,一般在转码视频PSNR和码率几乎不变的情况下可以提高一半的时间。
2.3 模式选择
在H.264编码标准中,支持7种不同块大小的帧间编码模式。每个宏块可按照16×16,16×8,8×16,8×8进行分割,如果选择8×8块模式,还可按照8×8,8×4,4×8,4×4进行亚分割。图9直观地显示了这7种模式。另外,帧间编码还采用了直接拷贝模式SKIP和帧内预测模式[25]。当使用率失真优化(RDO)时,需要通过遍历所有的模式比较已选取RD代价最小的模式[26],虽然编码效果好,但计算量大耗时长。而在DVC转码中,可以运用DVC解码端已获得的信息来帮助H.264选择需要编码块的大小,在转码视频质量几乎不变的情况下,可以大大降低H.264编码复杂度,即降低转码的复杂度,提高转码的效率[29]。
图9 帧间宏块模式
一般而言,视频序列运动缓慢或平坦区域一般选择帧间编码的帧间模块(例如16×16,16×8或8×16)或者选择直接拷贝模式SKIP。另一方面,如果是纹理精细复杂或者是运动剧烈的图像就选择比较小的模块(如4×4)甚至选择帧内预测模式。
通常用绝对误差和SAD来判断相邻两帧的相似程度,SAD越大,相邻两帧的相似程度越小,说明运动越剧烈;SAD越小,相邻两帧的相似性越高,运动越缓慢。在转码器中,SAD不需要在H.264编码时计算,SAD的计算在DVC解码端运动估计寻找最佳矢量时已经完成,因此只需要对SAD数据进行保存传递到H.264编码时直接利用,来决定H.264编码时的最佳MV模块。
一般,SAD值很大时H.264编码会选择帧内预测模式,但在有些情况中SAD很大,选择帧间模式效果反而更好。例如,均匀快速运动中的物体对应的块会导致SAD变得很大,这种情况,最好模式仍然是帧间模式编码。因此,需要另外的参数来决定图像中宏块的相关性,即运动矢量的大小。
DVC解码端边信息实际上是对WZ帧的预测,如果图像纹理比较平坦或图像变化缓慢,生成的边信息也就越好,与WZ帧相似度也就越高,解码重建WZ帧时边信息落入WZ帧量化索引值对应的区间内的概率就越大。根据研究发现,边信息没有落入解码后WZ帧量化索引值对应的区间时,所对应的块的运动剧烈,生成的边信息的质量较差,因此在转码过程中H.264编码时一般选择4×4或者帧内模式。
H.264编码块模式选择本质上说是一个决策树的问题,因此可以根据DVC解码过程中得到的信息:SAD的值,运动矢量的大小,边信息落入量化区间的数量3个参数对编码模式选择的分块大小做出选择。其中模式选择的阈值确定是最为重要的,为了更准确地划分决策树中的阈值,文献[23-24,27-29]采用了WEKA[30]数据挖掘工具,采用机器学习的方法,输入大量的训练数据,得出最好的模式选择决策树。WEKA工具的数据序列输入采用ARFF文件格式,采用ASCII码,每行为一组训练数据,包括该次训练结果以及一系列相关属性[31]。通过机器学习的方法实现了DVC到H.264的快速转码。得到的决策树如图10所示。
图10 模式决策树结构
第1层,分为低复杂度的模块和高复杂度的模块。低复杂度模块包括{SKIP块,16×16,16×8,8×16},高复杂的模块包括{8×8,8×4,4×8,4×4和帧内块}。
第2层,将上一层低复杂度的模块又分为两个分支,即{SKIP,16×16}和{16×8,8×16}。将高复杂度的分支也分为两个分支,即{8×8,8×4和4×8}和{4×4和帧内块}。
第3层,继续将{8×8,8×4和4×8}分为两个分支:{8×8-4×4DCT,8×8-8×8DCT}和{8×4,4×8}。
在转码过程中,将编码块按尺寸大小分层做出模式选择,H.264编码时可以直接选择编码块的大小,避免了各个大小的块逐一编码,与全解全编的转码器相比,大大提高了转码器的工作效率,且基本保持了原有视频的质量。尤其对运动宏块较多,但是运动宏块包含的细节较少的视频序列有更好的表现。
文献[12]提出了一种利用GPU(图像处理单元)强大的并行计算能力来加速视频转码的算法,在开发GPU通用计算能力的时候,采用NVIDIA公司的CUDA(统一计算设备架构)计算平台,该算法将视频转码过程中耗时最多、最复杂的运动估计过程转移到GPU上并行执行,为DVC的转码提供了一个新的途径。文献[14]测试了DVC在VBR和CBR两种情况下转码到H.264结果,在不同指标下获得了良好的结果,为DVC在转码过程中码率控制方面提供了新的参考。文献[15,17]都分别介绍了在转码器第一部分(即DVC解码)来减少转码所需要的时间,利用现在计算机资源丰富的多核并行计算来进行DVC解码,大大降低了DVC解码所需要的时间,并且可以同时在转码器第二部分(H.264编码)利用DVC解码获得的信息进行H.264的快速编码,实现了整个转码器快速转码的需求。文献[19]根据H.264编码时宏块的分块尺寸大小与DVC解码端边信息的残差分布具有很高相关性这一特点,实现了快速的模式选择编码算法,在与利用减小运动估计搜索范围算法融合的情况下,使转码时间提高了大约93%。文献[16,18,20]中介绍了从DVC转到SVC(可伸缩视频编码)的策略,可伸缩视频编码有效地解决了之前编码标准输出码流的不灵活性,DVC转到SVC后,可以适应多种不同信道,使实际应用更加广泛。文献[32]实现了从DVC到VC-1的转码,提出了最佳矢量匹配选择(Best Matched Vector Selection,BMVS)算法,BMVS运用了多个参考帧做运动估计,来选择最佳的运动矢量,突破了以往快速转码中为借用DVC运动矢量,都只采用单个参考帧的局限。文献[33]首次将DVC到传统视频的转码过程放在云端进行实现,结合了当前热门的云计算,将DVC的转码和云计算有机结合,为DVC转码提供了更广阔的空间。文献[34]实现了DVC到AVS的转码,AVS是国内具备自主知识产权的第二代信源编码标准,也是数字音视频产业的共性基础标准。
随着人们视频通信的需要,客户终端设备在趋向于无线化、便携式方向发展的同时,也要求其具有对视频信号进行实时编码、传输等功能。而客户终端的计算能力和存储容量等资源又十分有限,因此如何实现终端设备视频编解码低复杂度算法一直备受关注,DVC转码技术的出现正好解决了这一问题,它综合了DVC编码端简单和传统视频编码技术解码端简单的优点,使发送端和接受端都只处理简单的过程,而将复杂的转码过程留给拥有强大计算和存储能力的网络中心结点,在手机与手机相互之间视频通信具有非常广阔的市场。因此DVC转码将是下一阶段研究的热门技术。本文详细介绍了DVC主要的几种快速转码技术以及DVC其他转码方法和方案。就目前来看,DVC快速转码还有待深入研究的方面有:
1)DVC到传统视频的快速转码矢量映射时,P帧和B帧分别只用了单个和前后两个参考帧进行编码。而实际传统视频编码中P帧和B帧都可以借用已解码的多帧进行编码,这样解码图像效果将更佳。因此对于转码中传统视频编码在借用DVC端运动矢量时选择多参考帧将是下一步研究的方向。
2)DVC转到其他传统视频格式都有良好的实现,目前主要是转到H.264,还没有转到HEVC的,而现在HEVC日趋成熟,在保证相同视频质量的前提下,HEVC的压缩率相比H.264提高了一倍左右,大有取代H.264之势。因此如何实现DVC到HEVC的转码还亟待探讨。
3)当前,云计算技术已经在互联网领域得到广泛应用并成为最热门技术之一。基于云计算平台的其他视频转码技术也有提及[35-36],云计算以其高效快速可扩展性强的特点,能为转码提供可靠的平台和空间。因此如何将DVC转码和云计算具体结合的应用研究是下一阶段研究的热点和难点。
[1] GIROD B,AARON A,RANE S,et al.Distributed video coding[J].Proceedings of the IEEE,2005,93(1):71-83.
[2] PEIXOTO E,QUEIROZ R L,MUKHERJEE D. Mobile video communications using a Wyner-Ziv transcoder[EB/OL].[2013-12-12].http://image.unb.br/queiroz/papers/vcip_2008_transcoder.pdf.
[3] SCHWARZ H,MARPE D,WIEGAND T. Overview of the scalable video coding extension of the H. 264/AVC standard[J]. IEEE Trans. Circuits and Systems for Video Technology,2007,17(9):1103-1120.
[4] GB/T 20090.2—2006,Information technology-advanced audio and video coding standard:video[S].2006.
[5] KALVA H,LEE J B. The VC-1 video coding standard[J].IEEEMultiMedia,2007,14(4):88-91.
[6] SLEPIAN D,WOLF J. Noiseless coding of correlated information sources[J].IEEE Trans. Inform Theory,1973,19(4):471-480.
[7] WYNER A,ZIV J. The rate-distortion function for source coding with side information at thedecoder [J].IEEE Trans. Information Theory,1976,22(1):1-10.
[8] 殷国炯,薛永林.MPEG-2到H.264转码的快速模式选择算法[J].电视技术,2010,34(1):26-29.
[9] NATáRIO L,BRITES C,ASCENSO J.Visual content processing and representation[M].[S.l.]:Springer Berlin Heidelberg,2006.
[10] WONG C K,OSCAR C A.Fast motion compensated temporal interpolation for video[C]//Proc. SPIE.[S.l.]:SPIE Press,1995:1108-1118.
[11] TOAN N D,GUEESANG L,JUNE Y C. Side information generation using extra information in distributed video coding[C]//IEEE International Symposium on Signal Processing and Information Technology.[S.l.]:IEEE Press,2007:138-143.
[12] CORRALES-GARCíA A,RODRíGUEZ-SáNCHEZ R,MARTíNEZ J L,et al. Hybrid Artificial Intelligence Systems[M].[S.l.]:Springer Berlin Heidelberg,2010.
[13] CORRALES-GARCIA A,FERNANDEZ-ESCRIBANO G,QUILES F J. Mapping GOPS in an improved DVC to H. 264 video transcoder[C]//Proc. Advanced Concepts for Intelligent Vision Systems.[S.l.]:Springer Berlin Heidelberg,2010:22-33.
[14] CORRALES-GARCíA A,MARTíNEZ J L,FERNáNDEZ-ESCRIBANO G,et al. Variable and constant bitrate in a DVC to H. 264/AVC transcoder[J]. Signal Processing:Image Communication,2011,26(6):310-323.
[15] CORRALES-GARCIA A,MARTíNEZ J L,FERNáNDEZ-ESCRIBANO G. Efficient mobile-to-mobile video communications using a multicore transcoder[C]//Proc. Mobile Multimedia Communications.[S.l.]:Springer Berlin Heidelberg,2012:74-87.
[16] CORRALES-GARCIA A,MARTíNEZ J L,FERNáNDEZ-ESCRIBANO G,et al. Scalable mobile-to-mobile video communications based on an improved WZ-to-SVC transcoder[M]. [S.l.]:Springer Berlin Heidelberg,2012.
[17] GARCIAAC,ESCRIBANOGF,MARTINEZJL,et al. Mobile video communications based on fast DVC to H. 264 transcoding[EB/OL].[2014-10-10]. http://cdn.intechopen.com/pdfs-wm/33731.pdf.
[18] CORRALES-GARCíA A,MARTíNEZ J L,FERNáNDEZ-ESCRIBANO G,et al. Temporal scalable mobile video communications based on an improved WZ-to-SVC transcoder[J]. EURASIP Journal on Advances in Signal Processing,2013,2013(1):1-10.
[19] CORRALES-GARCíA A,MARTíNEZ J L,FERNáNDEZ-ESCRIBANO G,et al. Wyner-Ziv to baseline H. 264 video transcoder[J]. EURASIP Journal on Advances in Signal Processing,2012,2012(1):1-19.
[20] CORRALES-GARCíA A,RODRíGUEZ-SáNCHEZ R,MARTíNEZ J L,et al. Multimedia Communications Using a Fast and Flexible DVC to H. 264/AVC/SVC Transcoder[J]. Journal of Signal Processing Systems,2015,79(3):211-232.
[21] PEIXOTO E,DE QUEIROZ R L,MUKHERJEE D. Mapping motion vectors for Awyner-Ziv video transcoder[C]//Proc. 2009 16th IEEE International Conference onImage Processing. [S.l.]:IEEE Press,2009:3681-3684.
[22] PEIXOTO E, QUEIROZ R L,MUKHERJEE D. A Wyner-Ziv video transcoder[J].IEEE Trans. Circuits and Systems for Video Technology,2010,20(2):189-200.
[23] MARTINEZ J L,KALVA H,FERNANDEZ-ESCRIBANO G,et al. Wyner-Ziv to H. 264 video transcoder[C]//Proc. 2009 16th IEEE International Conference onImage Processing. [S.l.]:IEEE Press,2009:2941-2944.
[24] MARTINEZ J L,KALVA H,FERNANDO W A C,et al. Effiecient WZ-to-H264 transcoding using motion vector information sharing[C]//Proc.IEEE International Conference onMultimedia and Expo.[S.l.]:IEEE Press,2009:1394-1397.
[25] 廖婷,许洁斌,丁月华. H. 264 快速帧间块模式选择算法的研究[J].电视技术,2006,30(11):16-18.
[26] ZHOU Z,SUN S J,LEI S M,et al. Motion information and coding mode reuse for MPEG-2 to H.264 transcoding[C]//Proc.IEEE ISCAS. Kobe,Japan:IEEE Press,2005:1230-1233.
[27] MARTINEZ J L,FERNANDEZ-ESCRIBANO G,KALVA H,et al. Wyner-Ziv to H. 264 video transcoder for mobile telephony[C]//Proc.Digest of Technical Papers International Conference on Consumer Electronics.[S.l.]:IEEE Press,2009:1-2.
[28] MARTíNEZ J L,CORRALES-GARCíA A,CUENCA P,et al. Advances in Computational Intelligence[M].[S.l.]:Springer Berlin Heidelberg,2011.
[29] MARTINEZ J L,FERNANDEZ-ESCRIBANO G,KALVA H,et al. Wyner-Ziv to H. 264 video transcoder for low cost video encoding[J].IEEE Trans. Consumer Electronics,2009,55(3):1453-1461.
[30] WITTEN IH,FRANK E.Data mining:practical machine learning tools and techniques[M]. 2nd Ed.[S.l.]:Morgan Kaufmann,2005.
[31] FERNáNDEZ-ESCRIBANO G,KALVA H,CUENCA P,et al. A fast MB mode decision algorithm for MPEG-2 to H. 264 P-frame transcoding[J]. IEEE Trans.Circuits and Systems for Video Technology,2008,18(2):172-185.
[32] LEE J Y,HAN J K,SIM D G. Efficient motion vector selection and mode decision schemes for transcoder between DVC and VC-1[J]. IEEE Trans.Consumer Electronics,2012,58(3):905-911.
[33] 张刚止,陈柏翰,李昌明.基于云端运算DVC到SVC快速转码系统[J].International Journal of Science and Engineering,2014,4(2):63-66.
[34] YI A,LIU X,FAN X,et al.Advances in Multimedia Information Processing-PCM 2010[M].[S.l.]:Springer Berlin Heidelberg,2011.
[35] 包盛,段保通,邵锋军. 三网融合下基于云计算的实时转码技术研究和应用[J]. 电信科学,2011,27(3):12-16.
[36] 张浩,孙淑霞. Hadoop 云计算平台在视频转码上的应用[J].电脑与电信,2012(12):36-37.
吴 伟(1990— ),硕士生,主研图像通信、视频编码;
卿粼波(1982— ),副教授,主要研究方向为图像处理、模式识别、多媒体通信;
王正勇(1969— ),硕士生导师,主要研究方向图像处理、模式识别、多媒体通信;
杨 红(1983— ),女,博士生,主研图像通信、视频编码。
责任编辑:许 盈
Research of DVC Transcoding Technology
WU Wei, QING Linbo, WANG Zhengyong,YANG Hong
(ImageInformationInstitute,SchoolofElectronicsandInformationEngineering,SichuanUniversity,Chengdu610065,China)
Some typical transcoding techniques from DVC(distributed video coding) to traditional video coding are introduced in this paper, these techniques are well suited for mobile to mobile communication. Especially, the transcoding techniques from DVC to H.264 are introduced in detail, in which the high complexity and long delay for transcoding process is one of the most tough issues. To solve it, the motion vector generated in DVC decoding is made full use to reduce H.264 encoding workload.In this algorithm, the encoding time is decreased and the computational complexity of the transcoder is reduced, which could improve transcoding efficiency under the premise of scarcely affect video quality. In addition, the transcoding methods and programs from DVC to other traditional video coding are also introduced. Furthermore, the application potentials of DVC transcoding in the currently mobile video communications are analyzed. Finally, the challenges and development directions in this filed are pointed out in this paper.
DVC; H.264; transcoding; mobile video communications
国家自然科学基金项目(61201388);高等学校博士学科点专项科研基金项目(20110181120009)
TN919.81
A
10.16280/j.videoe.2015.19.018
2014-11-19
【本文献信息】吴伟,卿粼波,王正勇,等.DVC转码技术研究[J].电视技术,2015,39(19).