王宇飞 刘琲贝† 胡永健 朱美能
(1. 华南理工大学 电子与信息学院, 广东 广州 510640; 2. 北京电子技术应用研究所, 北京 100091)
H.265/HEVC视频的时间域篡改检测
王宇飞1刘琲贝1†胡永健1朱美能2
(1. 华南理工大学 电子与信息学院, 广东 广州 510640; 2. 北京电子技术应用研究所, 北京 100091)
针对H.265/HEVC压缩编码视频中帧删除、帧重复及帧插入等时间域篡改问题,根据H.265/HEVC编码标准的新特点,文中提出了一种基于视频压缩特征的时间域篡改检测算法.该算法通过利用视频压缩域的相关参数,在不需对视频进行完全解码的情况下实现篡改位置的检测.实验结果表明,文中提出的算法对不同程度的帧删除、帧重复和帧插入篡改以及不同压缩码率的篡改视频都具有较好的检测效果,有效缩短检测时间.
H.265/HEVC;时间域;篡改检测;数据安全
随着高质量数字视频需求的增大,高效率视频编码(HEVC)[1]应运而生.同时,视频编辑软件的普及降低了视频篡改的难度.在各种篡改方法中,基于视频帧的时间域篡改(如视频帧的删除、插入、重复等)应用较为广泛,获得了较多的研究.现有篡改检测方法中,有不少是基于视频内容的[2-6],而对于压缩编码视频,该类检测方法需要对视频进行完全解码,且容易受到有损压缩的影响,效果不佳.利用压缩编码自身特性进行篡改检测成为一种新的研究思路.针对旧标准的检测方法已获得广泛的研究,如基于二次压缩量化特征的检测方法[7-9]、基于预测向量的检测方法[10]以及基于宏块预测类型的检测方法[11-13]等.然而,对于H.265/HEVC新标准的篡改检测研究尚未展开.随着该标准的应用越发广泛,对其篡改检测方法进行研究具有重要的意义和迫切的需求.
针对H.265/HEVC压缩编码视频中帧删除、帧重复及帧插入等时间域篡改问题,根据H.265/HEVC编码标准的新特点,文中提出了一种基于视频压缩特征的时间域篡改检测算法,并通过实验来验证该算法的有效性.
当发生时间域篡改时,篡改位置的视频内容往往会发生较大的突变,但由于现实中视频库往往数据量庞大,凭人工进行篡改的判断将十分困难.通过计算机自动检测出突变点,在检测出篡改存在的同时确定篡改的位置,将大大提高篡改视频检测工作的效率.H.265/HEVC编码视频通过帧间预测来去除时间域冗余以压缩码率,篡改突变点将可能引起视频码流中的参数出现各种特殊的现象,从而可以在不进行完全解码的情况下进行检测,有效缩短检测时间.
1.1 时间域篡改对预测模式的影响
在P和B帧中,各编码单元会根据实际情况选择预测模式.对于各种模式,编码器会计算其编码的代价[14]:
Jmode=Dmode+Rmode
(1)
式中,Jmode和Dmode分别为该模式的编码代价和引起的失真,Rmode为该模式下的码流长度,为拉格朗日乘子.代价最小者将成为最优的预测模式.
帧间预测代价往往较小,因此大部分视频帧会优先采用帧间预测:
F=P(Vm)+E
(2)
式中,F为解码后还原的帧,Vm为预测向量,E为预测误差,P为利用预测向量进行预测的方法.式(2)中的Vm和E的大小与式(1)中的Rmode相关,而F与原始视频帧的差异则直接影响式(1)中的Dmode.当发生时间域篡改时,E与Vm都可能增大,从而导致式(1)中Rmode的增加.同时,失真加剧也使式(1)中Dmode增加.此时,帧间预测的代价将可能超过帧内预测,导致预测方式的改变,成为可以检测篡改的特征.在H.265/HEVC标准中视频帧会被划分为大小不一的编码单元,文中选择非I帧亮度分量中帧内预测像素所占的比例作为检测的特征:
(3)
式中:Ra,i为第i帧亮度分量中帧内预测像素所占的比例;W与H分别为视频帧中亮度分量的宽与高;wi,j与hi,j分别为第i帧中第j个编码单元亮度分量的宽与高;mi,j为与预测模式相关的量,
(4)
由式(3)可知,Ra[0,1].计算视频中每个非I帧的Ra值,其中数值较大的位置可能预示着时间域篡改的发生.文中在常用实验视频库[15]中选择一段300帧的视频Mobile_cif.yuv,如图1所示.利用x265编码器对其进行编码,GOP尺寸选择为4,I帧的周期选择为32.之后解码并删除其第50至第59帧共10帧,生成篡改视频.然后运用同样的编码器及参数重新编码,并利用式(3)与式(4)计算各帧的Ra值.
图1 Mobile_cif.yuv视频内容示例
对于I帧,其Ra值必为1;而对于B帧,由于进行双向预测,可以从至少一个方向获得较为准确的帧间预测,因此其Ra值通常为0.能够反映时间域篡改对Ra值影响的主要为P帧.各P帧的Ra值如图2所示.上述篡改视频的突变点位于第49帧与第50帧之间,而图中显示第12个P帧的Ra值出现显著峰值,此处第12个P帧对应整段视频的第52帧,正处于第49帧与第50帧之间的突变点之后.利用此峰值可以大致判断时间域篡改引起的突变点位于第52帧与第48帧这两个P帧之间.
图2 随机访问模式编码的篡改视频Mobile_cif中各P帧的Ra值
Fig.2Ravalues of each P frame in the random-access mode forgery video Mobile_cif
1.2 时间域篡改对运动预测向量的影响
1.1节中的Ra值只能粗略定位时间域篡改引起的突变点.为进一步准确定位,必须利用视频中数量最多的双向预测帧B帧.时间域篡改对B帧的影响主要反映在预测向量上.在对B帧进行双向预测时,其每一个预测单元都会尝试得到一个前向预测向量Vm0及后向预测向量Vm1,通过前、后向的预测向量分别进行预测,即通过式(2)得到F0与F1,再将两者加权求和得到最终的结果.通常情况下,B帧中大部分预测单元都会同时进行前向与后向预测,以减小失真,缩短码流.然而,在某些情况下,某一方向的预测可能会使失真增加,此时预测单元会将此方向的预测摒弃,只从另一个方向进行预测.
在视频发生时间域篡改后,由于篡改位置前的B帧与其后的I帧或P帧间的实际距离较远,因而其预测单元中的后向预测向量往往会被摒弃,从而使此B帧中大部分预测单元只存在前向预测向量.同理,篡改位置后的B帧中大部分预测单元都只有后向预测向量.当视频中的运动情况比较平缓时,篡改位置旁的B帧仍可能利用篡改位置另一侧的I帧或P帧来进行预测,但通过式(2)进行帧间预测时相应方向的Vm必然大于另一方向,即该方向的预测向量必然显著大于另一侧的预测向量.根据这些特殊现象,可以检测时间域篡改发生的准确位置.
为了更准确地反映B帧中利用前后参考帧进行帧间预测的情况,文中根据各个预测单元的尺寸与其Vm0及Vm1计算B帧中进行前向预测和后向预测的像素分别所占的比例:
(5)
(6)
此外,预测向量的长度也是一种重要的特征.每个预测向量Vm都有3个参数,包括水平分量Vh、垂直分量Vv及参考帧索引Fr.同一帧中的不同Vm,其Fr取值可以不同[16].当视频内容的运动剧烈程度基本一致时,参考帧距离当前帧越远,其预测向量长度越大.为了避免这一因素的影响,文中在计算第i帧中预测向量的长度LV时考虑了参考帧的距离:
(7)
考虑到H.265/HEVC编码视频中预测单元尺寸大小不一的情况,对前向或后向预测向量的平均长度进行计算时,文中以像素为基本单位,有
(8)
式中,La,i,k为第i帧前向(k=0)或后向(k=1)预测向量的平均长度,Lv,i,j,k为第i帧第j个预测单元中前向(k=0)或后向(k=1)预测向量的长度.此处计算预测向量的平均长度时只对存在相应方向预测向量的像素进行计算,而非对所有像素进行平均.若第i帧中不存在某一方向的预测,则认为对应方向的La,i,k值为+∞.
以1.1节中提到的篡改视频为例,根据各P帧的Ra值可以确定在第48帧与第52帧这两个P帧之间存在篡改的突变点.对于第49至第51帧的3个B帧,其前向及后向的Rv值及La值如表1所示.由于I帧的Ra恒为1,可能会掩盖其前面的一个突变点,因此也应该检测I帧前的3个B帧.在1.1节例子中,文中选取第32帧I帧前的3个B帧(第29、30、31帧)及第64帧I帧前的3个B帧(第61、62、63帧)作为样本,观察其Rv及La值,结果见表1.
表1 Mobile_cif篡改视频中部分B帧的Rv及La值
Table 1RvandLavalues of partial B frames in the forgery video Mobile_cif
帧序号Rv,0La,0Rv,1La,1491.0002.4650.02031.750500.28911.7490.9492.872510.5192.7150.8772.716290.4282.9930.9853.042300.9033.1980.9713.076310.9102.8500.9192.938610.6232.5611.0002.724620.8352.8920.9762.940630.9253.0270.9692.950
从表1可见,处于突变点前的第49帧,其前向预测像素所占比例远远高于后向预测,后向预测向量的平均长度明显大于前向预测向量,而处于突变点之后的第50帧则情况完全相反.第51帧虽然整体偏向于后向预测,但差异远不如前面两帧明显.对于非篡改位置,从表1中可见,第29帧偏向后向预测,但差异并不显著,第30帧与第31帧偏向程度更小,前、后向预测的比例基本相同.第61至第63帧虽然都偏向后向预测,但其差异程度较小.图3直观地显示了篡改位置前后B帧与非篡改位置B帧的不同特点.从图中可以观察到,与其他非篡改位置的B帧相比,第49帧与第50帧具有明显的特殊性,因此可以认定在第49帧与第50帧之间存在突变点,从而准确地找出篡改发生的位置,并避免误检.
图3 示例B帧Rv及La示意图
Fig.3 Schematic diagram ofRvandLavalues of the B frame samples
上述情况中时间域篡改所引起的突变点位于两幅B帧之间,因此通过其前后B帧的前向与后向的Rv及La值可以明显观察到异常.除此之外,还可能存在突变点位于B帧与P帧/I帧之间的情况.此时突变点一侧的P帧/I帧并不适合利用Rv及La值来表现其前、后向预测的偏向情况.为了观察该情况时的相关特征,仍以前述视频为基础,分别删除其第49至第58帧,以及第52至第61帧,生成两段篡改视频,其中前一段的突变点在第48帧与第49帧之间,即在P帧之后B帧之前,后一段的突变点在第51帧与第52帧之间,即在B帧之后P帧之前.计算两段篡改视频中第49至第51帧的Rv及La值,结果如表2所示.从表中可见,当突变点位于第48与第49帧之间时,除了第49帧以外,第50帧也出现了明显的后向预测偏向,这与不存在时间域篡改时GOP中间位置B帧(如表1中的第30帧与第62帧)的偏向性区别很大.类似地,当突变点位于第51与第52帧之间时,第51与第50帧均呈现出非常显著的前向预测偏向.
文中通过上述的特殊现象就可以将位于B帧与P帧/I帧之间的突变点检测出来.需要注意的是,上述提到的Rv与La值均为B帧的特征,而篡改造成的突变点位于两帧之间的间隔中.由于间隔自身难以提取特征,因此必须借用间隔附近的B帧来对间隔进行描述.
表2 突变点位于B帧与P帧之间时附近位置B帧的Rv及La值
利用前述两种特征,可以对H.265/HEVC视频中时间域篡改的准确位置进行检测,主要步骤如下.
首先,利用式(3)计算待测视频中各P帧的Ra值,组成特征向量c1(n).其中n[0,Np-1],Np为待测视频中P帧的总数.若某一P帧由于时间域篡改而产生明显的Ra峰值,则对应的c1特征应超过一定的阈值T1,
(9)
式中,a1为根据需要设定的正实数.将大于阈值T1的特征值作为候选篡改位置,并作进一步判定.考虑到视频中运动突然加速等情况,若连续数个P帧的Ra值都较大,则该情况很可能是由视频内容而非时间域篡改所引起的.为了避免这种情况造成误检,根据通过T1选取得到的初始候选值c1(N1)计算进一步检测的阈值:
T2=a2max(c1(N1-1),c1(N1+1))
(10)
式中,a2为正实数.需要注意的是,当初始候选的P帧邻近I帧时,c1(N1-1)与c1(N1+1)中将有一者不与候选P帧相邻,在计算T2时应将不相邻的P帧的c1特征值去除,只用相邻P帧的特征值来进行计算,以避免跨越I帧的P帧对检测造成影响.
若初始候选值c1(N1)>T2,则可得到篡改突变点的大致位置.然后利用1.2节中的预测向量特性来进行准确定位.通过c1特征值得到突变点后第1个P帧序号N1后,可以把突变点定位到该P帧与其之前的一个P帧或I帧之间.另外,考虑到I帧可能对Ra峰值造成掩盖,对于I帧与其之前一个P帧间的位置也要进行考察.由1.2节可知,时间域篡改所引起的突变点存在于两个视频帧之间,突变点前后帧的预测偏向性差异较大,为此,文中首先定义各B帧的预测偏向性c2.从表1及表2可以看到,B帧预测的偏向性与Rv及La值有关,因此可以从两部分来描述预测偏向性.首先对于Rv值,可直接用前、后向的Rv值之差来描述偏向性,即
c21(i)=Rv,i,0-Rv,i,1
(11)
式中,c21(i)表示第i帧中由Rv值描述的预测偏向性,取值范围为[-1,1],正数表示预测偏向前向,负数表示预测偏向后向.除此之外,La值的差异也可用于描述预测的偏向性.在利用La值差异描述偏向性时需要注意视频分辨率的影响,分辨率较高的视频预测向量较大,在非篡改情况下的La值差异也较大,若直接以La值差异的绝对大小作为判断标准,则分辨率较高的视频将较易出现误检.另外,La值差异在不同的取值范围对偏向性的影响也有所不同.当La值差异相对较小时,其值的增加应对偏向性的计算产生较大的影响,以便将篡改产生的差异值与正常视频的差异值进行有效区分.而当La值差异相对较大时,其差异值基本上已确定是由篡改引起的,其值的增加对偏向性计算的重要性将有所下降.综上,La值差异较小时对偏向性计算的影响较大,较大时则影响较小,而采用对数形式进行计算将能使结果较好地符合该特点.具体计算式如下:
(12)
式中,c22(i)表示第i帧中由La值描述的预测偏向性,VF为与视频分辨率相关的数,
VF=min(H,W)×0.02×4
(13)
其中0.02表示当预测向量的长度达到视频的宽和高中较小值的2%时,即呈现出明显的偏向性.由于视频帧亮度分量的像素之间会进行插值以进行1/4像素精度的预测,因此式(13)中还需要乘以4.当La值差异的绝对值大于等于VF时,表明该帧预测的偏向度已足够大,因此将此时的c22(i)绝对值设定为1,即偏向性最大的情况,从而使得到的c22(i)取值范围也为[-1,1].在得到两部分的偏向性数值后,B帧总体的预测偏向性c2(i)计算式为
c2(i)=α1c21(i)+α2c22(i)
(14)
式中,α1与α2是权值,且α1+α2=1.最终得到的B帧预测偏向值c2(i)的取值范围也为[-1,1].在1.2节中确定了检测对象为两帧之间的间隔,因此需要将B帧的预测偏向性特征转化为间隔的特征,为此文中引入两帧之间的分离度D.计算分离度D时需对前后帧均为B帧、前帧为P/I帧后帧为B帧以及前帧为B帧后帧为P/I帧3种情况分别处理.
(15)
对于前帧(第i帧)为P/I帧而后帧(第i+1帧)为B帧的情况,第i帧与第i+1帧之间的分离度为
(16)
对于前帧(第i帧)为B帧而后帧(第i+1帧)为P/I帧的情况,第i帧与第i+1帧之间的分离度为
在确定篡改点的大致范围后,可利用式(11)-(17)来计算其间每两帧之间的分离度.从c2的取值范围可知,分离度D的取值范围为[0,2],据此可设定阈值T3,将分离度大于该阈值的间隔作为可能的突变点.为避免误检,还需计算其前后各一个GOP的间隔分离度.如果初步确定突变点位于待测视频的第N2帧与第N2f帧之间(N2f (18) (19) 则可认为在第N2帧与第N2f帧之间具有最大分离度的间隔即为篡改导致的突变点.式(19)中的b为正实数.考虑到实际篡改带来的突变点极少会在少数几帧之内多次出现,因此可利用式(19)消除视频内容可能带来的误检.若由c1特征值确定的初步位置邻接着I帧,则基于同样考虑,在利用分离度作进一步检测时将只考虑由c1特征值所确定的GOP中的间隔.此外,若由c1特征值确定的初步位置位于视频的开头或结尾的GOP中,其前方或后方可能不存在其他GOP,则此时只计算实际存在的间隔的分离度即可. 为验证文中所提算法的有效性,文中利用经典视频数据库[15]进行相关的实验.选取长度为300帧的CIF分辨率(352×288)非压缩视频27段,利用x265编码器进行压缩编码,得到原始压缩视频.27段视频的名称为:akiyo_cif、bowing_cif、city_cif、coastguard_cif、container_cif、crew_cif、deadline_cif、flower_garden_cif、football_cif、foreman_cif、galleon_cif、hall_cif、harbour_cif、highway_cif、intros_cif、mobile_calendar_cif、mobile_cif、mother-daughter_cif、news_cif、pamphlet_cif、paris_cif、sign_irene_cif、silent_cif、soccer_cif、students_cif、vtclnw_cif以及washdc_cif. 对原始压缩视频进行解码并对其进行帧删除、帧插入及帧重复3种时间域篡改,之后利用x265编码器重新压缩编码,得到待测压缩视频.文中着重研究时间域篡改对H.265/HEVC压缩视频编码特征的影响,因此重新编码时的各项编码参数均与首次编码时保持一致,以避免引入额外的影响.式(14)中取α1=α2=0.5.在视频(帧数为N)的N-1个间隔中寻找突变点,可以视为一个两类的分类问题,即将帧间间隔分为突变点与非突变点两类.因此,在计算各阈值时,对于式(9)、(10)与(19)中的a1、a2与b可以选取不同的数值,并画出对应的ROC曲线,以展示算法的性能. 目前尚无其他利用H.265/HEVC压缩视频编码特征进行篡改检测的研究,因此文中算法难以找到直接对比的对象.为了展现利用新标准特点的重要性,文中选取文献[10]中同样利用压缩域特征的算法作为对照.该算法利用H.264/AVC标准中B帧的双向预测向量幅度来检测篡改点两侧的特殊帧,没有利用H.265/HEVC标准的新特点.另外,文中也选取了文献[5]中基于速度场连续性的视频篡改检测算法进行对比.该算法利用视频空间域的特征进行检测,相比基于编码特征的算法通用性更强,但计算复杂度因需要进行完全解码而变得更高. 3.1 帧删除篡改检测 对于帧删除篡改,文中将选取的各段视频分别从前段(0-99帧)、中段(100-199帧)和后段(200-299帧)随机删除10、15及20帧,生成243段篡改视频.为了查看不同编码码率对检测效果的影响,文中对篡改视频分别使用3种不同码率(300、1 000及3 000kb/s)进行H.265/HEVC压缩编码. 首先查看固定码率时删除篡改长度对检测效果的影响.选取300kb/s的篡改视频,分别用3种算法进行检测,绘制出ROC曲线.考虑到实际应用的需要,文中只关注各条ROC曲线中误检率低于0.10的部分,具体结果如图4所示.从图中可见,文中算法对删除15帧的篡改视频检测效果最好,对删除10帧的效果次之,而对删除20帧的效果最弱,检测性能与帧删除篡改的长度并无直接的相关性.根据文中算法的原理,篡改位置前后的视频帧内容相差越大,则用于检测篡改的特征越明显.对于内容变化较为剧烈的视频,在删除帧数较少的情况下即可获得较为明显的检测特征;而对于内容变化较为平缓的视频,即使删除帧数较多,检测特征依然会较弱.由于实验中的篡改视频包含不同变化剧烈程度的内容,且篡改的位置完全随机,因此删除篡改的帧数与检测效果并不相关.文中算法在各种情况下的检测效果均远优于文献[10]算法,这主要是由于文献[10]算法只针对宏块尺寸固定、B帧双向预测灵活性较低的H.264/AVC标准,对预测灵活性大大提高的H.265/HEVC标准的适应性不佳.文献[5]算法虽然通用性较强,但其对视频内容较为敏感,对内容变化较剧烈的视频误检情况较多,造成性能下降.而文中算法利用的预测编码特征则较好地避免了正常视频内容所带来的误检,使其检测性能有所提高.实验结果充分表明了利用新标准的新特点进行检测的重要性. 图4 300kb/s码率时删除不同帧数篡改视频的ROC曲线 Fig.4ROCcurvesofforgeryvideosdeleteddifferentnumberframesatbitrate300kb/s 然后对固定删除帧数时不同压缩码率对检测效果的影响进行研究.选取删除15帧的篡改视频,对3种不同码率的帧删除篡改进行检测,并绘制出ROC曲线,结果如图5所示.从图中可见,文中算法在误检率较低的情况下对码率较高的篡改视频具有较好的检测效果.随着误检率的升高,此趋势逐渐逆转.当误检率高于0.03时,码率较低的篡改视频反而具有较好的检测效果.这一现象是由H.265/HEVC压缩编码的特点造成的.当压缩码率较高时,视频的预测更为准确,由于视频内容突变而造成的预测向量幅值变化将更加明显.同时,由于帧内预测块通常比帧间预测块具有更长的码流,因此当压缩码率较高时,由于视频内容突变而造成的P帧Ra值增加也会更为明显.总体而言,随着压缩码率的提高,帧删除篡改所带来的特征越明显.因此,当误检率较低时,对应的检测阈值较高,文中算法对特征较为明显的高码率情况具有较好的检测性能.然而,在篡改带来的特征更加明显的同时,由于视频自身内容剧烈变化所带来的误检点的特征也会得到加强.因此,随着检测阈值的下降,高码率的篡改视频在命中率逐渐增加的同时,被误检的位置也随之增加,且误检增加的程度要高于低码率的篡改视频.当命中率增加到一定程度时,高码率视频的误检率将大于低码率视频,出现如图5中ROC曲线的性能变化.与文献[10]算法相比,文中算法具有较大的性能优势.另外,文献[5]算法由于利用的是空间域特征,对不同码率的视频检测效果较为稳定,但依然受到空间域特征对视频内容敏感度较高的影响,其整体性能弱于文中算法. 图5 不同码率下删除15帧篡改视频的ROC曲线 Fig.5 ROC curves of forgery videos deleted 15 frames at diffe-rent bitrates 3.2 帧重复篡改检测 对于帧重复篡改,文中选取的视频分为前半段(0-149帧)及后半段(150-299帧),分别从前、后半段的随机位置选取视频段,复制替换另一半段随机位置的相同长度视频段.重复的视频段长度包括10、15及20帧3种情况,总共生成162段篡改视频,对每段篡改视频分别使用3种码率(300、1 000及3 000 kb/s)进行压缩编码.首先选取码率为300 kb/s的篡改视频,对不同长度的帧重复篡改分别利用3种算法进行检测,ROC曲线如图6所示.从图中可见,文中算法对不同重复帧数的篡改检测性能较接近.这是由于帧重复篡改为视频内部篡改,篡改点两侧帧的差异程度与篡改帧数并无很强的相关性. 然后选取重复15帧的篡改视频,对3种码率下的帧重复篡改分别利用3种算法进行检测,ROC曲线如图7所示.从图中可见,文中算法对不同码率下帧重复篡改视频的检测性能与3.1节中提到的情况类似,存在码率较高视频在较低误检率时检测效果较好、而码率较低视频在较高误检率时检测效果较好的现象,且成因也是H.265/HEVC压缩编码的特点,只是高低码率性能逆转的位置有所差异,在误检率大于0.01时已出现低码率篡改视频检测性能较优的情况.与文献[10]算法相比,文中算法依然具有较大的性能优势.而文献[5]算法对不同重复帧数及不同码率下的视频检测结果较为稳定,且在重复15帧的情况下其命中率在误检率高于0.09时与文中算法对3 000 kb/s码率视频的命中率基本一致,但其整体性能依然与文中算法有一定的差距. 图6 300 kb/s码率下重复不同帧数篡改视频的ROC曲线 Fig.6 ROC curves of forgery videos duplicated different number frames at bitrate 300 kb/s 图7 不同码率下重复15帧篡改视频的ROC曲线 Fig.7 ROC curves of forgery videos duplicated 15 frames at different bitrates 3.3 帧插入篡改检测 对于帧插入篡改,文中从原始视频中选取多对内容相近的视频组成篡改对,以其中之一作为主体,从另一段视频的前段、中段及后段分别随机选取长度为10、15及20帧的视频段插入到主体视频的对应位置,共生成198段篡改视频,并分别使用3种码率(300、1 000及3 000 kb/s)进行压缩编码.首先选取码率为300 kb/s的篡改视频,对不同长度的帧插入篡改分别利用3种算法进行检测,ROC曲线如图8所示.从图中可见,文中算法对不同插入帧数的篡改视频的检测性能较为接近.这是由于帧插入篡改点两侧的帧来自不同的视频,内容变化均相对较大,且与插入篡改的帧数相关性不强.对比图6与图8可以发现,文中算法对帧插入篡改的检测效果要优于对帧重复篡改的检测结果,这也是由帧插入篡改点两侧的帧差异较为显著引起的. 图8 300 kb/s码率下插入不同帧数篡改视频的ROC曲线 Fig.8 ROC curves of forgery videos inserted different number frames at bitrate 300 kb/s 接着选取插入15帧的篡改视频,对3种码率下的帧重复篡改进行检测,ROC曲线如图9所示.从图中可见,文中算法对不同码率帧插入篡改视频的检测性能与前述两种情况类似,也出现了由于H.265/HEVC压缩编码特点而造成高码率与低码率视频分别在较低误检率与较高误检率情况下具有较好检测效果的现象.相比文献[10]算法,文中算法依然具有较大的检测性能优势.由于帧插入篡改造成的内容变化通常远大于正常视频自身的内容变化,因此文献[5]算法对帧插入篡改视频也具有较好的检测性能.从图8及图9可知,大致在误检率低于0.005时文献[5]算法的命中率较低,随着误检率的增加,其命中率迅速提高,与文中算法的检测性能相当接近.但综合整体性能,文中算法的检测性能依然优于文献[5]算法. 图9 插入15帧时篡改视频在不同压缩码率下的ROC曲线 Fig.9 ROC curves of forgery videos inserted 15 frames at diffe-rent bitrates 针对H.265/HEVC压缩编码视频中帧删除、帧重复以及帧插入等时间域篡改,文中根据编码标准的新特点提出了一种基于视频压缩域的篡改检测算法,在不需要对视频完全解压的情况下能迅速准确地检测出篡改位置.目前对H.265/HEVC视频的篡改检测研究仍处于空白状态,文中通过与运用在其他压缩编码标准视频中的压缩域篡改检测算法进行比较,发现利用了H.265/HEVC视频特点的文中算法具有显著的检测性能优势.在后续的研究中,将进一步探讨提高检测准确率、降低视频内容所带来的误检方法.另外,文中检测算法虽然利用了H.265/HEVC视频特有的压缩域特征,但由于目前的压缩编码标准大部分采用相似的混合编码架构,通过针对其他压缩标准的帧内及帧间预测技术对特征提取方法进行改进,可以将文中算法推广到其他压缩编码标准中. [1] ITU-T Rec.H.265 and ISO/IEC 23008-2,High efficiency video coding [S]. [2] WANG W,FARID H.Exposing digital forgeries in video by detecting duplication [C]∥Proceedings of the 9th ACM Multimedia and Security Workshop.Dallas:ACM,2007:35-42. [3] HU Y,LI C,WANG Y,LIU B.An improved fingerprinting algorithm for detection of video frame duplication forgery [J].International Journal of Digital Crime and Forensics,2012,4(3):20-32. [4] YIN L,BAI Z,YANG R.Video forgery detection based on nonnegative tensor factorization [C]∥Proceedings of the 4th IEEE International Conference on Information Science and Technology.Shenzhen:IEEE,2014:148-151. [5] WU Y,JIANG X,SUN T,et al.Exposing video inter-frame forgery based on velocity field consistency [C]∥Proceedings of 2014 IEEE International Conference on Acoustics,Speech and Signal Processing.Florence:IEEE, 2014:2674-2678. [6] 张珍珍,侯建军,李赵红,等.基于MSSIM商一致性的视频插帧和删帧篡改检测 [J].北京邮电大学学报,2015,38(4):84-88. ZHANG Zhen-zhen,HOU Jian-jun,LI Zhao-hong,et al.Video-frame insertion and deletion detection based on consistency of quotients of MSSIM [J].Journal of Beijing University of Posts and Telecommunications,2015,38(4):84-88. [7] WANG W,FARID H.Exposing digital forgeries in video by detecting double MPEG compression [C]∥Procee-dings of the 8th ACM Multimedia and Security Workshop.Geneva:ACM,2006:37-47. [8] WANG W,FARID H.Exposing digital forgeries in video by detecting double quantization [C]∥Proceedings of the 11th ACM Multimedia and Security Workshop.New York:ACM,2009:39-48. [9] STAMM M C,LIN W S,LIU K J R.Temporal forensics and anti-forensics for motion compensated video [J].IEEE Transactions on Information Forensics and Security, 2012,7(4):1315-1329. [10] 黄添强,陈志文.基于双向运动矢量的数字视频篡改鉴定 [J].山东大学学报(工学版),2011,41(4):13-19. HUANG Tian-qiang,CHEN Zhi-wen.Digital video forge-ries detection based on bidirectional motion vectors [J].Journal of Shandong University(Engineering Science), 2011,41(4):13-19. [11] VAZQUEZ P D,FONTANI M,BIANCHI T,et al.Detection of video double encoding with GOP size estimation [C]∥Proceedings of 2012 IEEE International Workshop on Information Forensics and Security.Tenerife:IEEE,2012:151-156. [12] GIRONI A,FONTANI M,BIANCHI T,et al.A video forensic technique for detecting frame deletion and insertion [C]∥Proceedings of 2014 IEEE International Conference on Acoustic,Speech and Signal Processing.Flo-rence:IEEE,2014:6226-6230. [13] SU P,SUEI P,CHANG M,et al.Forensic and anti-forensic techniques for video shot editing in H.264/AVC [J].Journal of Visual Communication and Image Representation,2015,29:103-113. [14] OHM J,TAN T K.Comparison of the coding efficiency of video coding standards—including high efficiency video coding(HEVC) [J].IEEE Transactions on Circuits and Systems for Video Technology,2012,22(12):1669-1684.[15] Xiph.Org Foundation.Xiph.org video test media (derf’s collection) [DB/OL].http:∥media.xiph.org/video/derf/. [16] SJÖBERG R,CHEN Y,FUJIBAYASHI A,et al.Overview of HEVC high-level syntax and reference picture mana-gement [J].IEEE Transactions on Circuits and Systems for Video Technology,2012,22(12):1858-1870. Detection of Time Domain Forgery of H.265/HEVC Video WANGYu-fei1LIUBei-bei1HUYong-jian1ZHUMei-neng2 (1. School of Electronic and Information Engineering, South China University of Technology, Guangzhou 510640, Guangdong, China;2. Beijing Institute of Electronics Technology and Application, Beijing 100091, China) In order to solve such time domain forgery problems as the deleting, duplication and insertion of frames in H.265/HEVC compressed videos, according to new features of H.265/HEVC coding standard, a time domain forgery detection algorithm on the basis of video compression features is proposed. In the algorithm, with the para-meters in the compressed domain of the videos, the position of forgery can be detected without decoding the videos completely. Experimental results show that the proposed algorithm shows good performance in detecting varying degrees of deleting, duplication and insertion of frames as well as different bitrates of forgery videos, and it can also shorten detection time effectively. H.265/HEVC; time domain; forgery detection; data security 1000-565X(2017)01- 0026- 09 2016- 05- 10 广东省应用型科技研发专项基金资助项目(2015B010130003);广州市科技项目(201510010275) Foundation item: Supported by the Special Fund for Applied Science and Technology Research and Development of Guangdong Province(2015B010130003) 王宇飞(1987-),男,博士生,主要从事数字视频篡改检测研究.E-mail:w.yf05@mail.scut.edu.cn † 通信作者: 刘琲贝(1980-),女,博士,讲师,主要从事数字多媒体取证、模式识别研究.E-mail:eebbliu@scut.edu.cn TP 391 10.3969/j.issn.1000-565X.2017.01.0043 实验及结果分析
4 结论