码流域无参考视频客观质量评价方法的发展现状

2017-01-05 06:42雷霄骅姜秀华
关键词:码流主观特征

雷霄骅,姜秀华

(中国传媒大学理工学部,北京 100024)



码流域无参考视频客观质量评价方法的发展现状

雷霄骅,姜秀华

(中国传媒大学理工学部,北京 100024)

数字视频质量对人类视觉信息的获取影响很大,如何评价视频的质量是一个很重要的技术。由于在很多的实际应用环境中没有参考视频,因此无参考视频质量评价技术是最具有实用价值的一类技术。无参考视频质量评价技术按照提取特征的位置的不同可以分为像素域方法和码流域方法。本文综述了码流域无参考视频质量评价方法的分类和发展现状。文章首先介绍了视频质量评价的分类,然后按照不同的实验环节介绍了码流域视频质量评价的发展状况,最后总结了码流域视频质量评价的发展趋势并探讨了其未来的发展方向。通过本文研究人员可以较全面地了解码流域视频质量评价这一领域。

视频;码流;特征;无参考;视频质量评价

1 引言

随着网络带宽的发展,数字视频越来越成为一种主流的信息传播方式。数字视频在处理的过程中可能会因为各种原因产生图像质量问题,例如模糊、块效应、振铃效应等。视频质量评价就是研究这些图像质量问题对人主观感受影响的一门学科。本文总体上分成三个章节。第一章对视频质量评价的分类做一个概括性的介绍,第二章对其中的一个分支——码流域无参考视频质量评价的分类和发展现状做详细的综述,第三章总结了码流域无参考视频质量评价的发展趋势并探讨了其未来的发展方向。

2 视频质量评价的分类

视频质量评价可以分为两大类:主观评价方法和客观评价方法。人是视频的最终使用者,所以主观质量评价是最准确和可靠的视频质量评价方法。但是主观评价实验一方面费时费力,另一方面结果容易受到观察者自身认知水平的影响,所以并不适用于实际环境。客观评价方法弥补了主观评价方法的不足,采用数学的方法计算得到视频的质量。经过这些年的发展,客观评价方法已经可以比较精确地预测视频的质量。

2.1 主观评价方法

主观质量评价即观察者通过观看一批视频序列,对视频序列的质量进行打分。国际电信联盟在BT.500的标准[1]中推荐了DSIS法以及DSCQS法,以及几种替代方法。

(1) DSIS

DSIS(double-stimulus impairment scale,双刺激损伤量表)法每组需要观看两个视频。每组试验中观测者首先观看无损伤的原始视频,然后观看受损视频,随后根据第一个视频打分评价第二个视频。获得的分数称为MOS(mean opinion score,平均意见分)。MOS越高代表视频的质量越好。每组实验根据需要可以播放一遍或者两遍视频。图1显示了DSIS的实验过程。图中横坐标为时间,T1为无损伤的基准视频,T3为有损伤的视频,而T2为两个视频之间的灰场。

图1 主观评价视频播放顺序

视频的主观质量一般情况下从“优”到“劣”分成5个级别,分别对应从“不可察觉”到“很讨厌”5个级别,如表1所示。

表1 主观评价量表

(2)DSCQS

DSCQS(double-stimulus continuous quality-scale,双激励连续质量量表)法每组需要观看两个视频。与DSIS法不同的地方在于,观察者并不知道这两个视频中哪个是原始视频,哪个是受损视频。观察者在观看的过程中,对每组实验中的两个视频都进行打分评价。在统计实验结果的过程中,计算原始视频分数和受损视频分数之差,作为该受损视频的DMOS(degradation mean opinion score,平均意见下降分)。与MOS正好相反,DMOS越低代表视频质量越好。

2.2 客观评价方法

客观质量评价通过数学计算的方法对视频序列的质量进行打分。根据对原始视频信息的依赖程度,可以将客观质量评价方法分成3大类:全参考视频质量评价,缩减参考视频质量评价,以及无参考视频质量评价。其中全参考视频质量评价需要原始视频的所有信息,缩减参考视频质量评价只需要原始视频的一些特征信息,而无参考视频质量评价则不需要原始视频的信息。

2.2.1 全参考

全参考视频质量评价需要原始视频的所有信息,通过计算原始视频与失真视频之间的感知误差,综合得到失真视频的质量值。全参考视频质量评价的方法很多,最常用的两种方法是PSNR(Peak Signal to Noise Ratio,峰值信噪比)和SSIM(Structural SIMilarity,结构相似度)。

(1)PSNR

PSNR通过直接计算像素点灰度值之间的误差来衡量视频图像的质量。它的计算公式为:

(1)

式中L为图像灰度值范围,对于8bit位深的图像来说L=2^8-1=255;M*N图像块的MSE(均方误差)计算公式为:

(2)

PSNR取值一般在20到50之间,取值越高代表视频图像质量越好。该算法的优点是计算简单,缺点是不能很严格的符合人眼主观感知的质量。

(2)SSIM

SSIM是Zhou Wang等人提出的一种图像质量评价算法[2]。它综合考虑亮度、对比度、结构三方面的信息衡量视频图像质量。SSIM取值在0到1之间,取值越高代表视频图像质量越好。相对于PSNR来说,SSIM计算复杂了很多,但是它的结果更加符合人眼主观感知的质量。

2.2.2 缩减参考

缩减参考视频质量评价只需要原始视频的一些特征信息。缩减参考方法的优点主要是可以在传输少量数据的基础上对视频图像质量作比较准确地评估。缩减参考一个最典型的例子是VQM算法。

VQM(Video Quality Metric,视频质量算法)是VQEG(Video Quality Experts Group,视频质量专家组)组织的Pinson等人提出的一种图像质量评价算法[3]。它利用统计学原理模拟实际的人眼视觉系统,在提取参考及其对应的受损图像中人眼能够感知的图像特征值(亮度、色彩、时空变化等信息)的基础上,计算得出视频质量客观评价值。该评价值为人眼可感知的模糊、块失真、不自然的运动、噪音和错误块等损伤的综合反映。VQM取值在0到1之间,取值越小代表视频图像质量越好。

2.2.3 无参考

无参考视频质量评价完全不需要原始视频的信息。无参考视频质量评价是最有实用价值的一类视频质量评价方法,但也是最难研究的一种视频质量评价方法。由于缺少原始视频图像的对比,很难评价现有视频图像的质量情况,因此目前还没有国际上公认的无参考视频质量评价方法。无参考视频质量评价根据特征参数来源的不同可以分为像素域无参考视频质量评价和码流域无参考视频质量评价。

(1)像素域

像素域无参考视频质量评价从视频像素中提取特征参数,计算视频的质量。像素域无参考视频质量评价目前主要研究几种常见的损伤——模糊,噪声,以及块效应等。例如Marziliano等人提出了基于图像边缘宽度的模糊度估计算法[4],张旗等人提出的基于小波域高频系数的噪声估计算法[5],以及Wang Zhou等人提出的基于离散傅里叶变换的块效应估计算法[6]。除此之外,也有一些机构在尝试研究具有一定通用性的算法。例如德州大学奥斯丁分校研究人员提出的BIQI[7]、BRISQUE[8]等算法。

(2)码流域

码流域无参考视频质量评价从视频压缩码流中提取特征参数,计算视频质量。相对于像素域无参考视频质量评价,码流域无参考视频质量评价的准确度要高很多,但是它的应用只限于某种特定标准的压缩码流,而且评价的损伤形式也限定为视频压缩损伤。后文中将会对这一类视频质量评价方法做详细的介绍。

3 码流域无参考视频质量评价研究的现状

码流域无参考视频质量评价方法一方面计算结果比较准确,另一方面适用范围比较窄。因此码流域无参考视频质量评价方法通常用于针对某一种压缩编码标准进行精确评价。如图2所示,码流域无参考视频质量评价实验的研究过程从整体上可以分成两个实验:训练实验和测试实验。训练实验可以获得视频质量评价模型,而验证实验则用于验证视频质量评价模型的准确性。训练实验可以分成如下几个步骤:

1)选视频序列。选择一些用于训练实验的原始视频序列。

2)压缩。将这些测试视频序列压缩成不同的码率的码流。

3)提取特征。提取压缩码流中的特征参数。

4)质量评价。通过主观视频质量评价或者客观视频质量评价方法获得视频质量值。

5)建模。使用特征值和视频质量值进行建模,获得视频质量评价模型。

测试实验和训练实验的流程基本上是一样的。它们之间主要的区别在于测试实验在提取特征之后使用视频质量评价模型预测得到视频质量预测值,然后通过与视频质量实际值进行对比后就可以验证模型的准确性。后文中将会对上述各个步骤中的提取特征参数、质量评价、建模技术的发展情况进行综述。

图2 码流域无参考视频质量评价的研究方法

3.1 选视频序列

实验中使用的视频序列都是无损伤且无压缩的原始视频序列。常用的免费视频序列可以从Xiph[9]或者CDVL[10]等素材网站上下载使用。这些视频序列的数据量很大,通常以YUV444、YUV422、YUV420、RGB等格式进行存储。

3.2 压缩

实验中经常使用视频编码的标准参考软件将原始视频序列压缩编码为视频码流。例如HEVC对应的标准参考软件为HM[11],H.264对应的参考软件为JM[12]。在一些研究中也会使用一些其它的常用视频编码器,例如FFmpeg[13]、x264[14]等等。一个原始视频一般会压缩编码为多个损伤程度不同的视频码流,可以通过设定QP或码率来控制它们的损伤程度。

3.3 提取特征

特征用于作为视频质量评价模型的输入参数。由此可见特征的选择直接决定了视频质量评价模型的准确程度。目前无参考码流域视频质量评价主要是针对的是H.264码流,因此本小节以H.264为背景梳理一下常见的特征。这些特征一般以视频帧为单位进行提取,最后得到的整段视频的特征就是该段视频内视频帧特征的均值。例如一段H.264视频的QPavg的特征的计算方法如下所示:

(3)

式中QPavgseq为一段视频的QPavg,QPavgframe为一帧视频QPavg,N为视频帧数。

特征从大体上可以分为与QP有关的特征、与宏块类型有关的特征、与运动矢量有关的特征、以及其它特征四种类型。下文将会分别介绍这四种类型的特征。

(1)QP有关的特征

QP有关的特征是使用最为广泛的一类特征。该类特征中最常见的特征是QPavg,它代表了一帧视频中所有宏块的QP均值。在H.264中,每个宏块包含一个QP值,反映了该宏块的量化程度[15]。QP越大,代表该宏块的量化程度越大,一般情况下该宏块的图像质量也会越差。量化是视频编码中导致视频质量降低的最主要的原因。它的基本原理就是把图像样值映射为一个较小的数值,可以概括为下式:

(4)

式中,y为图像采样点数值,Qscale为量化步长,y’为量化值,round()为取整函数。

从量化公式中可以看出,量化步长Qscale越大,量化值越小,视频的数据量就越小。因此可知随着量化步长Qscale的增加,视频的压缩程度越大,相应的视频质量越差。在H.264码流中,Qscale的数值并不直接存储,而是通过QP进行存储。QP与Qscale之间的关系如下式所示:

Qscale=2(QP-4)/6

(5)

从公式可以看出,QP与Qscale近似服从指数关系。因此使用QP作为特征可以较好的反映出视频的量化程度,进而反映出视频的质量。文献[16]的研究中,Intotree、Amazon等几个视频的QPavg和主观质量DMOS之间的关系如图3所示。从图中可以看出视频质量随着QP的增加而呈现出明显的下降趋势(DMOS取值越大代表视频质量下降越严重)。

图3 QP和DMOS之间的关系

QPavg是最常见的与QP有关的特征。文献[16][17][18][19][20]等都使用了QPavg作为它们提出的模型的特征。除此之外,一些文献还使用了与QP有关的其它一些特征用于反映QP的取值情况。文献[21]选择了一帧视频中所有QP的中位数QPmedian、标准差QPstd、最小值QPmin、最大值QPmax、10%分位数QP10%、90%分位数QP90%等作为它们提出的模型的特征。

(2)宏块类型有关的特征

宏块类型有关的特征包括宏块的划分方式,宏块的预测方式,是否为Skip宏块等宏块属性。H.264在帧间编码的过程中可以将宏块划分为一些子宏块以提高编码效率。一个16x16的宏块不仅可以直接进行编码处理,而且可以划分为2个16x8,2个8x16,或者4个8x8的子块再进行处理。在视频场景运动比较复杂的时候使用尺寸较小的宏块可以达到更好的压缩编码效果。因此小尺寸宏块的百分比可以反应视频内容运动的复杂程度。文献[22][23][24][25]中使用了8x8P作为它们提出的模型的特征。8x8P表示一帧图像中划分方式为16x8,8x16,8x8的宏块占所有宏块的百分比。

帧间编码的过程中可以将一些难以使用帧间预测的宏块以帧内预测的方式进行编码。在运动比较复杂的场景中使用帧间预测很难找到合适的匹配块,这时候使用帧内预测反而能达到较好的效果。因此帧内预测宏块的百分比可以反应视频内容运动的复杂程度。文献[22][24][25]中使用了IntraP作为它们提出的模型的特征。IntraP表示一帧图像中使用帧内编码的宏块占所有宏块的百分比。

帧间编码的过程中还可以将一些编码代价极小的宏块以Skip方式进行编码。在画面静止的视频中很多宏块不需要传递任何信息,就会大量出现Skip类型宏块。因此使用Skip宏块的百分比可以反映视频内容运动的复杂程度。文献[18][20]中使用了skip_num作为它们提出的模型的特征。Skip_num表示一帧图像中Skip宏块的个数。文献[22][24][25]等使用了SkipP作为它们提出的模型的特征。SkipP表示一帧图像中Skip宏块占所有宏块的百分比。

(3)运动矢量有关的特征

运动矢量有关的特征包括运动矢量均值,运动矢量的标准差等。帧间编码的过程中,运动剧烈的视频帧中宏块的匹配块的距离其自身较远,因而通常有较大的运动矢量。因此使用运动矢量可以反映视频内容运动的复杂程度。文献[22][23][24][25]中使用了MVavg作为它们提出的模型的特征。MVavg为一帧视频中运动矢量长度的均值,可以反应出该视频整体的运动强度。除此之外,一些文献还使用了与运动矢量有关的其它一些特征用于反映运动矢量的取值情况。文献[24]中选择了X方向运动矢量长度、Y方向运动矢量、X方向运动矢量的差值,Y方向运动矢量的差值等作为它们提出的模型的特征。

(4)其他特征

除了上述三大类特征之外,一些论文还提出了一些独特的特征。文献[26]中使用了环路滤波的边界强度Bs作为特征。文献[27]使用了从DCT系数计算而来的TI和SI作为特征。

(5)示例

图4显示了上述几种特征的情况。图中的视频序列名称为Foreman,分辨率为352x288,编码方式为H.264。左上角的图像为解码后的一个视频帧。右上角的图像为该视频帧的QP信息,其中网格线代表了该视频帧的宏块划分情况,而其中的数字代表了该宏块的QP取值。左下角的图像为该视频帧的宏块类型信息,其中线段代表了宏块的划分情况,而“s”标出了Skip类型宏块。右下角的图像为该视频帧的运动矢量信息,其中的线段标出了运动矢量的大小和方向。

3.4 质量评价

质量评价的分值反映了视频质量的好坏。码流域无参考视频质量评价方法通常会选择使用两类视频质量评价指标:主观评价分值以及客观评价分值。

(1)主观评价分值

主观评价分值指的是主观评价实验得到的MOS分值(或者DMOS分值)。该分值通过对压缩码流进行主观评价实验后获得。主观评价分值的优点在于其结果与人眼主观感受直接相符;缺点在于其实验过程费时费力,难以得到大量的实验数据。有关主观评价的介绍在第一章已经做过介绍,在这里不再做过多介绍。文献[16][18][19]等使用了主观评价分值作为质量评价的指标。

视频帧图像 量化参数

宏块类型 运动矢量图4 几种常见特征的示意图

(2)客观评价分值

客观评价分值指的是客观质量评价算法得到的各种指标,例如PSNR值、SSIM值、VQM值等。该分值通过对压缩码流进行客观质量评价计算后获得。客观分值的优缺点和主观分值是正好相反的。由于客观分值获取方式相对容易,可以一次性计算大量的实验数据,因而适用于基于机器学习的这种需要大量实验数据的视频质量评价模型。文献[17]中使用PSNR值作为质量评价的指标。文献[22]中使用PSNR值、PEVQ值、VQM值作为质量评价指标。文献[24]中使用了SSIM值、PEVQ值、PSNR值、MSSIM值作为质量评价指标。

3.5 建模

建模用于在特征和视频质量之间建立一种对应关系。码流域无参考视频质量评价方法的模型大体上可以分成3种类型:线性模型,非线性模型,以及机器学习模型。

(1)线性模型

线性模型是最简单的一类视频质量评价模型。该模型直接将特征值以线性方程的方式组合起来。该种模型的形式如下所示:

Quality=w1*feature1+w2*feature2+c

(6)

式中feature1、feature2是特征值,w1、w2、w3是系数。

使用线性模型的视频质量评价研究的数量很多。文献[20]提出了基于QPavg和num_skip的视频质量评价模型。该模型如下所示:

Quality=w1*QPavg+w2*num_skip+c

(7)

式中QPavg是QP均值,num_skip是Skip宏块数,w1、w2、w3是系数。

文献[26]提出了基于QPavg和去块效应滤波器强度Bs的视频质量评价模型。该模型如下所示:

Quality=w0*PBS0+w1*PBS1+w2*PBS2+w3*PBS3+w4*PBS4+w5*QPavg+w6*Bitrate

(8)

式中BS0—BS4是5种滤波器边界强度的出现频率,QPavg是QP均值,Bitrate是码率,w1—w6是系数。

文献[27]提出了基于时域特征TI,空域特征SI,以及QPavg的视频质量评价模型。该模型如下所示:

Quality=w1*SI+w2*TI+w3*Qpavg

(9)

式中SI、TI是由DCT系数计算出来的特征,QPavg是QP均值,w1、w2、w3是系数。

(2)非线性模型

非线性模型的是相对复杂的一类视频质量评价模型。它考虑到一些特征与视频质量之间并非简单的线性关系,因而采用了其它形式的数学模型。例如下式即是一种非线性模型:

Quality=a*featurel*EXP(b*feature2)+c

(10)

式中feature1、feature2是特征值,a、b、c是系数,Quality是视频质量。

使用非线性模型的视频质量评价研究的数量相对少一些。文献[16]提出的视频质量评价模型如下所示:

Quality=bl*FB-b2*FQ

(11)

从模型的公式可以看出,该文章认为视频的质量受FQ和FB两部分因素的影响。其中FQ为量化影响因子,FB为码流分配影响因子,b1、b2为系数。FQ计算方法如下所示:

FQ=(a1*Cn+a2)a3*Qpavg

(12)

式中Cn为视频内容复杂度相关的特征,QPavg是QP均值,a1、a2、a3为系数。

FB计算方法如下所示:

FB=DB*CRC

(13)

式中DB和CRC是影响码流分配两个特征,在这里限于篇幅不再详细介绍。

文献[28]提出了一种基于考虑时间复杂度和空间复杂度的视频质量评价模型。该模型如下所示:

(14)

式中σS、σT是有关时间复杂度和空间复杂度的特征值,QPavg是QP均值,a1、a2、a3、b1、b2、b3是系数。

(3)机器学习模型

机器学习模型是最为复杂的一种视频质量评价模型。它通常将特征参数输入到一个人工神经网络或者支持向量机中,经过比较复杂的计算得到视频质量。由于机器学习一般需要大量的实验数据对模型进行训练,而主观评价实验一般无法提供大量的实验结果,所以经常使用客观评价实验的数据作为模型的训练数据。因而很多机器学习模型预测的是PSNR值、VQM等客观视频质量值。图5显示了一个基于人工神经网络的视频质量评价模型。该模型使用了5个特征作为神经网络的输入层参数,使用一个视频质量值作为神经网络的输出层参数。该网络中使用了1个隐藏层,其中包含了5个神经元。

图5 人工神经网络视频质量评价模型

文献[23]中提出了一种基于人工神经网络(ANN)的无参考视频质量评价模型。该模型选择了Bits/Frame、16×16P、QPavg等6个特征作为神经网络的输入。以视频的客观质量PSNR值、PEVQ值或者SSIM值为输出。其中神经网络使用了两层BP神经网络,并在隐藏层使用了6个或者10个神经元。

文献[24]中提出了一种基于最小二乘-支持向量机(LS-SVM)的无参考视频质量评价模型。该模型选择了QPavg、IntraP、SkipP等18个特征作为神经网络的输入。以视频的客观质量PSNR值、PEVQ值、SSIM值或者MSSIM值为输出。

3.6 实验结果验证

实验结果验证用于检验提出的视频质量评价模型的准确性。通常情况下选定一些已知视频质量状况的视频码流,以提出的视频质量评价模型的预测质量值和视频实际质量值之间的相关性来评价模型的优劣。模型预测质量值与实际质量值之间的相关性越强,说明评价的越准确。广泛采用的集中评价相关性的指标有:均方根误差,皮尔逊相关系数,斯皮尔曼相关系数。

(1)均方根误差

均方根误差(Root mean squared error,RMSE)计算方法如下式所示。

(15)

式中{x1,x2,x3,x4…}为视频实际的视频质量值,{y1,y2,y3,y4…}为视频质量评价模型的预测值。

(2)线性相关系数

线性相关系数(Linear correlation coefficient,LCC),也称为皮尔逊相关系数(Pearson correlation coeffcient,PCC)的取值在-1到1之间,绝对值越接近于1代表两列数据越相关。它的计算方法如下式所示。

(16)

式中为{x1,x2,x3,x4…}的均值,为{y1,y2,y3,y4…}的均值。σx、σy分别为他们的标准差。

(3)斯皮尔曼等级相关系数

斯皮尔曼等级相关系数(Spearman’s rankordered correlation coefficient,SROCC)的取值在-1到1之间,绝对值越接近于1代表两列数据越相关。它的计算方式如下所示。

(17)

式中rxi,ryi分别为xi和yi在各自数据序列中按照大小排序后元素的排序位置(等级)。

4 总结与展望

本文综述了码流域无参考视频质量评价方法的发展现状。从质量评价模型的角度来看,码流域无参考视频质量评价方法经历了从线性模型,到符合人眼感知特性的非线性模型,最后到基于机器学习的模型的发展。从模型选取的特征来看,它经历了从简单的一两个基于QP和宏块类型的特征,到大量、多角度、符合人眼感知的特征的发展。当前主要的码流域视频质量评价方法都是基于H.264标准的,还很少有基于HEVC标准的方法。在未来如何在HEVC标准下选择合适的视频质量评价模型将会是码流域视频质量评价研究的一个热点问题。

[1]ITU-T RECOMMENDATION P.Subjective video quality assessment methods for multimedia applications[S].1999.

[2]Zhou W,Alan Conrad B,Hamid Rahim S,et al.Image quality assessment:from error visibility to structural similarity[J].IEEE Transactions on Image Processing,2004,13(4):600 - 612.

[3]Pinson M H,Wolf S.A New Standardized Method for Objectively Measuring Video Quality[J].IEEE Transactions on Broadcasting,2004,50(3):312-322.

[4]Marziliano P,Dufaux F,Winkler S,et al.A no-reference perceptual blur metric[C]. International Conference on Image Processing,2002,3:57-60.

[5]张旗,梁德群,樊鑫.基于小波域的图像噪声估计新方法[J].计算机工程,2004,30(8):37-39.

[6]Wang Z,Bovik A C,Evan B L.Blind measurement of blocking artifacts in images[C].International Conference on Image Processing,2000,3:981-984.

[7]Moorthy A K,Bovik A C.A two-step framework for constructing blind image quality indices[J].IEEE Signal Processing Letters,2010,17(5):513-516.

[8]Mittal A,Moorthy A K,Bovik A C.Blind/referenceless image spatial quality evaluator[C].2011 Conference Record of the Forty Fifth Asilomar Conference on Signals,Systems and Computers (ASILOMAR),2011:723-727.

[9]Xiph org Video Test Media[DB/OL].http://media.xiph.org/video/derf/

[10]Pinson,Margaret H.The Consumer Digital Video Library[J].IEEE Signal Processing Magazine,2013,30(4):171-174.

[11]ITU-T RECOMMENDATION H.265.2.Reference software for ITU-T H.265 high efficiency video coding[S].

[12]ITU-T RECOMMENDATION H.264.2.Reference software for ITU-T H.264 advanced video coding[S].

[13]FFmpeg[DB/OL].http://ffmpeg.org/

[14]x264[DB/OL].http://www.videolan.org/developers/x264.html

[15]ITU-T RECOMMENDATION H.264.Advanced video coding for generic audiovisual services[S].

[16]林翔宇,陈耀武.双域无参考视频质量评价算法[J].华南理工大学学报:自然科学版,2012,40(4):64-70.

[17]Slanina M,Ricny V,Forchheimer R.A novel metric for H.264/AVC no-reference quality assessment[C].Systems,Signals and Image Processing,2007 and 6th EURASIP Conference focused on Speech and Image Processing,Multimedia Communications and Services,14th International Workshop on,IEEE,2007:114-117.

[18]史惠,孟放,姜秀华.基于H.264码流的高清视频质量评价算法[J].电视技术,2009,33(11):113-116.

[19]杨雪宜,孟放.基于H.264码流的高清视频质量评价模型的算法分析[C]. 第七届图像图形技术与应用学术会议,2012.

[20]Cheng Y,Jiang X,Wang C.HDTV Video Quality Objective Assessment Based on H.264 Compressed Domain[C].2011 Third International Conference on Communications and Mobile Computing (CMC),IEEE,2011:141-144.

[21]Shi Z,Chen P,Feng C,et al.Research on quality assessment metric based on H.264/AVC bitstream[C].IEEE International Conference on Anti-counterfeiting,Security & Identification,2012:1-5.

[22]Rossholm A,Lovstroem B.A new low complex reference free video quality predictor[C]. 2008 IEEE 10th Workshop on Multimedia Signal Processing,2008:729-731.

[23]Shahid M,Rossholm A,Lovstrom B.A reduced complexity no-reference artificial neural network based video quality predictor[C]. 2011 4th International Congress on Image and Signal Processing (CISP),2011:517 - 521.

[24]Shahid M,Rossholm A,Lovstrom B.A no-reference machine learning based video quality predictor[C].2013 Fifth International Workshop on Quality of Multimedia Experience (QoMEX),2013:176 - 181.

[25]Keimel C,Klimpke M,Habigt J,et al.No-reference video quality metric for HDTV based on H.264/AVC bitstream features[C]. IEEE International Conference on Image Processing,2011:3325-3328.

[26]Lee S O,Jung K S,Sim D G.Real-time objective quality assessment based on coding parameters extracted from H.264/AVC bitstream[J].IEEE Transactions on Consumer Electronics,2010,56(2):1071-1078.

[27]Sugimoto O,Naito S.A No Reference Metric of Video Coding Quality Based on Parametric Analysis of Video Bitstream[C]. International Conference on Image Processing,2011:3333-3336.

[28]Yang F,Wan S,Xie Q,et al.No-Reference Quality Assessment for Networked Video via Primary Analysis of Bit Stream[J].IEEE Transactions on Circuits & Systems for Video Technology,2010,20(11):1544-1554.

(责任编辑:王谦)

Review of Bitstream Domainno-reference Video Quality Assessment Method

LEI Xiao-hua,JIANG Xiu-hua

(School of Science and Technology,Communication University of China,Beijing 100024,China)

Digital video quality has great influence on human’s watching experience,so how to evaluate the quality of video is a very important technology.Because most ofreal environment is lack of reference video,no reference video quality assessment is the most practical kinds ofmethod among all video quality assessment methods.According to the different location of the features,no reference video quality evaluation method can be divided into pixel-domain method and bitstream-domain method.In this paper,we present a classification and review of published research work in the area of no reference bitstream-domain method.First,the paper introduces the classification of video quality assessment;and then according to different steps of experiment,it introduces development situation of bitstream-domain method;finally it summarizes the trend of bitstream-domain method and discusses its direction in the future.Through this paper,readers can fully understand the field of bitstream-domain method.

video;bitstream;feature;no-reference;video quality assessment

2016-04-16

雷霄骅(1990-),男(汉族),北京市人,中国传媒大学博士研究生.E-mail:leixiaohua1020@126.com

TN949.6

A

1673-4793(2016)06-0037-09

猜你喜欢
码流主观特征
根据方程特征选解法
离散型随机变量的分布列与数字特征
“美好生活”从主观愿望到执政理念的历史性提升
加一点儿主观感受的调料
高清网络摄像机图像延迟分析及解决方案
不忠诚的四个特征
如何对数字电视信号进行有效监测
对立与存在
一种比较ASN.1码流差异的方法
IRD对TS流的处理