陈雪艳,时 黛
(内蒙古民族大学 机械工程学院,内蒙古 通辽 028000)
随着三网融合工作的不断深入推进,媒体业务量随之剧增,一些运营机构,如地方电视台,出于商业利益,在原有电视节目的基础上嵌入或插播其他商业信息的现象比较普遍,另外不法分子对媒体业务进行篡改或插播等恶意操作现象也时有发生。2014 年8 月温州有线电视台遭“黑客”攻击,用户在收看电视节目时,屏幕中插播了大量的非法图文信息,产生不可估量的负面效应,且造成严重的经济损失。由于受众群体规模庞大,多媒体业务的恶意操作会带来恶劣的社会影响,已成为一个关系国家安全的问题。
国外很多学者针对视频篡改检测进行了深入的研究,并取得了一定的成果。Weihong Wang 和Hany Rarid 提出了多种视频篡改检测算法:针对MPEG 视频二次压缩的篡改检测[1]、基于灰度向量协方差的视频篡改检测[2]、一种用于隔行扫描和非隔行扫描的视频篡改检测[3]、二次量化MPEG 视频篡改检测[4]。Michihiro 等人根据各类型相机的噪声模式相当于其指纹这一特征,提出通过检测篡改视频中隐藏的噪声特征不一致性判断视频是否被篡改[5]。Kancherla 等人根据篡改视频和原始视频帧差异性特征,通过提取帧运动残留信号,利用Markov 模型提取每帧324 维特征,采用支持向量机进行分类。由于特征维数较高,计算较复杂,所以此方法的分类准确率较低[6]。
近年来,国内对视频篡改检测的关注度也越来越高,研究范围也逐渐拓宽。秦运龙等人提出了一种针对MPEG 格式视频[7],通过判断视频P 帧运动矢量幅度与均值运动矢量的偏移量来检测视频是否发生插入或删除篡改,并定位篡改点。Chao 等人利用视频光流一致性特点,提出基于光流一致性的篡改检测算法[8]。根据成像传感器像素不均匀的特性,郭琳琳[9]等人采用小波滤波器提取视频帧中的残留噪声,通过分析噪声的频谱差异实现抠像视频的检测。刘雨青[10]等人针对视频中运动目标从固定背景中移除的情况,通过篡改前后帧的能量分布连续性来检测是否存在帧内目标的删除,并根据能量可疑度大致对篡改区域进行定位。
通过提取视频特征进行篡改检测也是当前的研究热点,如提取时空特征、颜色特征及纹理特征[11]等进行视频篡改检测。在特征提取的过程当中,每一种特征都有其不足之处,单一特征往往不能全面表达图像的可视信息。目前已经有学者意识到了多特征融合的重要性,并提出了多特征融合的解决方案。如针对帧内插入异源视频的情况,李富贵等人提出一种多特征融合的异源视频篡改检测[12],利用二维相位一致性及噪声模式,提取视频特征,并进行特征融合,通过支持向量机分类实验证明检测的有效性。多特征融合使得问题得到了较好的解决。如何对视觉特征进行有效融合,从而实现高效准确的视频篡改检测,是该领域需要研究的关键问题。本文介绍一种新的多特征融合的篡改检测算法:结合LM 算法对BFGS 进行改进,用改进的BFGS 神经网络对视频特征进行融合篡改检测,实现了良好的检测效果。
为了快速有效地鉴别视频是否被篡改,应选取视频特征量,平均梯度和信息熵对视频帧信息的评价较为全面,并且算法简单,所以本文选择平均梯度和信息熵作为特征量。
平均梯度[13](average energy gradient)是图像质量的评价函数,指图像的边界或影线两侧附近灰度有明显差异。它反映了图像对细节对比的表达能力。平均梯度Aeg 定义为
式中: F( i,j) 为图像的第i 行,第j 列的灰度值; M 为图像的总行数; N 为图像的总列数。
熵用来表征图形灰度分布的聚集特性,也是一种信息量的描述,假设信息量为I(xk),则I(xk)在离散数值上的平均值称之为信息熵(information entropy)。信息熵H(X)定义为
但是一维信息熵不能反映图像灰度分布的空间特征,为了将这种空间特征有效的表示出来,需要在一维熵的基础上引进能够反映灰度分布空间特征的特征量来组成图像的二维熵,其定义式为
通常,单一特征不能很好地表现出每幅图像的显著特征,从而影响检测效果,多特征融合能够改善这种情况,进一步提高检测效率,如图1 所示。
图1 单一特征检测效果
BFGS 神经网络学习算法是最优化理论中一类典型的拟牛顿法,但该算法计算Hessian 矩阵时很复杂,虽然精确度高,但代价也很大,而相对于BFGS,LM 算法的收敛速度快,所以本文从Hessian 矩阵入手,在BFGS 算法中的近似Hessian 矩阵不满足迭代要求时引入LM 算法进行融合改进,以弥补BFGS 算法的不足。
2.1.1 BFGS 算法
BFGS 算法公式为
其中,δk=xk-xk-1,γk=gk-gk-1,gk为函数f 在xk处的梯度值。
Al-Baali 和Fletcher 提出如下测试公式,用来表征近似的Hessian 和Hessian 之间的误差。
2.1.2 算法步骤
BFGS 算法收敛所需的步长较小,所以迭代过程中所需要的储存空间及计算量比LM 大,因此在保证Hessian 矩阵误差可接受时,选择LM 算法。采用本算法的结果可以保证γk比较大时Bk同样具有对称正定性,保证结果可靠性。
步骤1:确定初始点X(0)和初始矩阵B0=In及精确度ε >0;
步骤2:若 Δf(x(0))<ε 停止,返回极小值点;
步骤3:取p(0)=-B0Δf(x(0));
步骤4:通过线性搜索法,不断迭代求出极小值点x(k);
步骤5:更新Hessian 矩阵
其中:LM(A,λ)=(AAT+λATT),ATT=diag(AAT),λ 为阻尼系数,A 为Jacobian 矩阵。λATT的引入是为了防止BK在极值点的附近出现病态。
步骤6:返回,继续迭代。
为了证明本文算法的优越性,选取一简单二元二次方程作为实验函数,在不同初值的情况下,通过LM 算法,BFGS 算法和改进的BFGS 算法进行求解,得到的收敛次数如图2 所示。可以看出,本文算法要比原有算法收敛快。
图2 收敛次数对比图
神经网络的工作原理和结构特点决定了它非常适于进行特征融合的检测。提取特征向量输入改进的BFGS 神经网络进行融合分类,使用训练好的BFGS 网络对查询视频进行篡改检测。具体流程如图3 所示。
图3 检验流程图
首先提取参考视频的特征,即平均梯度和信息熵,进行融合,并作为测试样本集训练BFGS 神经网络;对于查询视频,采用相同的方法选提取视频特征,进行特征融合,用训练好的神经网络对查询视频进行训练,得到多特征融合检测结果。
本文首先选用一段正常场景的视频,记为视频A,将它导入MATLAB2014a 中,然后在Simulink 中进行视频篡改,在视频的上方添加游走字幕,得到视频B,如图4 所示。
图4 视频篡改图
各提取A、B 视频的前1 000 帧特征,训练BFGS 神经网络,将训练好的神经网络用于20 段不同场景所拍摄视频的篡改检测。将该算法与文献[14]中基于SURF 的视频篡改检测算法进行比较,实验结果如图5 所示。由此可见,本文算法对视频篡改进行检测的效果良好,准确率在98%以上。
图5 视频篡改检测率对比图
在实验过程中发现,若采用复杂光线下拍摄的视频,会使得篡改检测率偏低,对此进行深入研究时发现,在提取纯色视频帧和正常视频帧的特征值时,复杂光线情况下的视频特征值变化大,从而使BFGS 神经网络在篡改检测时出现较低的检测率。如表1 所示。该复杂光线现象因光线短时间内发生急剧变化而导致,对于正常拍摄的视频,通常不会出现此现象。
表1 视频检测率
本文将BFGS 神经网络进行了改进,并应用于视频篡改检测,通过不同设备和不同环境下的视频的检测结果可知,准确率平均达到98%以上,且该方法可以应用于所有情况下的帧内复制-粘贴视频篡改检测。
[1]WANG W,FAFID H. Exposing digital forgeries in video by detecting double MPEG compression[C]//Proc. International Multimedia Conference on Proceeding of the 8th Workshop on Multimedia and Security.Geneva,Switzerland:[s.n.],2006:37-47.
[2]WANG W,FARID H. Exposing digital forgeries in video by detecting duplication[C]//Proc.International Multimedia Conference on Preceeding of the 9th Workshop on Multimedia and Security. Dallas,Texas,USA:[s.n.],2007:35-42.
[3]WANG W,FARID H. Exposing digital forgeries in interlaced and de-interlaced video[J].IEEE Trans.Information Forensics and Security,2007,2(3):438-449.
[4]WANG W,FARID H. Exposing digital forgeries in video by detecting double quantization[C]//Proc. the 11th ACM Workshop on Multimedia and Security. Princton,NJ,USA:[s.n.],2009:39-48.
[5]MICHIHIRO K,THKAHIRO O,YOICHI S.Detecting video forgeries based on noise characteristics[C]//Proc. the 3rd Pacific Rim Symposium on Advances in Image and Video Technology.Germany:springer Verlag,2009:306-317.
[6]KANCHERLA K,MUKKAMALA S. Novel blind video forgery detection using Markov models on motion residue intelligent information and database systems[M]. Berlin Heidelberg:Springer,2012.
[7]秦运龙,孙广玲,张新鹏.利用运动矢量进行视频篡改检测[J].计算机研究与发展,2009,(46):227-233.
[8]CHAO J,JIANG X H,SUN T F. A new video inter-frame tampering detection method based on optical flow consistency[C]//Proc.the 11th International Work-shop on Digital-forensics and Watermarking.Shanghai:Springer,2012:25-27.
[9]郭琳琳,张静,苏育挺.一种基于模式噪声的视频抠像检测算法[J].四川大学学报:自然科学版,2011,48(4):777-782.
[10]刘雨青,黄添强.基于时空域能量可疑度的视频篡改检测与篡改区域定位[J].南京大学学报:自然科学版,2014,50(1):61-71.
[11]陈秀新,贾克斌,魏世昂.基于关键帧颜色和纹理特征的视频拷贝检测[J].电视技术,2012,36(15):36-39.
[12]李富贵,黄添强,苏立超,等.融合多特征的异源视频复制-粘贴篡改检测[J].山东大学学报:工学版,2013(4):32-38.
[13]陈超,江涛,徐文学.基于平均梯度的多聚焦图像融合方法研究[J].山东建筑大学学报,2009,2(24):133-137.
[14]谭茂洲.基于时空特征的视频篡改被动检测技术研究[D].上海:上海交通大学,2012.