孙 鹏 王方明 郎宇博 刘 磊 单大国
(1 中国刑事警察学院声像资料检验技术系 辽宁 沈阳 110035;2 江西省经济犯罪侦查与防控技术协同创新中心 江西 南昌 330103)
随着视频图像处理技术的不断发展,各类视频编辑软件不断涌现,比较常见的有Adobe Premiere、Adobe Effect、会声会影等专业视频编辑处理软件和爱剪辑等普通视频制作软件。这些视频编辑软件将视频编辑变得方便、高效、高质量的同时,也成为许多犯罪活动的常用工具。在一些犯罪活动中,犯罪嫌疑人为了达到其目的对视频资料进行篡改,这些篡改的视频经常出现在案件侦查与司法审判过程中,严重影响了公检法机关对案件相关线索的寻找认定与证据的采集固定,对视频证据鉴定工作提出了极大的挑战[1]。
近年来,国内外针对篡改视频的检测研究已经有了诸多成果。文献[2]提出通过检测I帧(关键帧)是否经过双重JPEG压缩来判断MPEG格式视频是否经过了重压缩,但其过程需要检验人员的干预,因此有可能出现人为因素导致的错误。文献[3]针对量化DCT系数的水平,垂直,主对角线和次对角线方向的差异将一阶马尔科夫统计量建模,以此识别视频是否经过重压缩。文献[4]利用SIFT(Scaleinvariant feature transform,尺度不变特征变换)算法和k-Nearest Neighbors(k-NN)算法检测空间域中是否存在copy-move篡改,而在时域中使用噪声残差的相互关系检测是否存在篡改,综合上述两方面的检测结果来判断视频是否存在帧内篡改。文献[5]通过计算当前帧和非篡改参考帧之间的差异,使用k-SVD(k-奇异值分解)提取特征,并将其投影到由k-means聚类的较低维子空间中,从而检测静态背景下移动前景删除这种特定的帧内篡改方式。文献[6]运用Lucas-Kanade光流算法,比较两帧之间光流的一致性,从而检测视频是否存在帧间篡改。5个文献中所提出的视频篡改检测方法代表了视频篡改领域的前沿理论成果,这些方法具有较强的针对性,对于特定的视频篡改方式或特定的视频格式具有很好的适用性,但是很难将其推广应用到一般性检验。另外一个突出问题是,视频真伪性的司法鉴定过程对涉案视频缺少科学、规范的描述和度量。问题的产生是由于我们缺乏对视频篡改类型的数学模型及其特点相关的基础理论研究,从而导致检测手段局限在了具体的应用模式当中,过多的依赖于人工经验,从而增加了鉴定意见出错的可能性,也在一定程度上降低了视频证据的证明力。
视频是以数字形式记录于存储设备之中,对视频的篡改操作实际上是将这些存储的数字信息重新进行修改、拆分、删除、排列和组合。建立模型的意义在于,将视频的篡改过程抽象化,用简洁而有逻辑的数学语言表达,力求能够近似地刻画视频篡改过程,并通过此途径寻求检验视频是否经过编辑篡改的方法。一段视频可以将其抽象为一个由不同变量构成的函数,通过建立数学函数模型,我们可以更直接地对篡改视频的影响因素进行独立的、更加深入详细的分析,提高对各种篡改过程的认识,从而寻求一种更加准确严谨的尺度、标准和语言在视频篡改检测的司法实践中运用。因此,本文将常见的视频篡改方法的篡改过程单独列出,从时空域角度建模,以期通过建立的模型,对这些单一的篡改方式进行研究,以便更好地认识和研究多种篡改方法联用而制作出来的视频,使今后的视频篡改检测方面的研究更具科学性、逻辑性、客观性,为司法鉴定过程中准确严谨地论证、表述视频是否被篡改提供基础性的理论依据。
与图像经常压缩为常见的JPEG(Joint Photographic Experts Group,联合图像专家组)格式[7]一样,视频为了节省空间,便于网络传输,也需要压缩编码,绝大多数常见的视频格式都是基于图像的压缩编码产生的。常见的例如MPEG(Moving Picture Experts Group,动态图像专家组)压缩编码格式就基于JPEG而来,MPEG视频格式的结构分为6个层次:视频序列、GOP(Group of pictures,图像组)、图像、片、宏块和块[8],如图1所示。
图1 视频的6层次结构图
不管以何种压缩编码方式制作的视频文件,在通过以Adobe Premiere为代表的非线性视音频编辑软件解码编辑时,为了方便用户使用并使软件交互界面更加友好,各操作在形式上均建立在视频6层次之上,但是一般仅对视频序列、图像组、图像和片这4个层次进行操作。在非线性视音频编辑软件中,视频序列即为在视频轨道上进行添加标记、裁剪等操作的一段视频;图像组即为视频序列中的某时间段内的视频;图像即为每一帧的全部画面内容;片即为每一帧画面中的部分内容。视频篡改就是篡改者对能达到其目的的视频层次进行有针对性的编辑操作,以得到所需视频画面的活动。
视频篡改的方式有很多种,根据复制源视频、粘贴目标视频和具体篡改手段的不同,可以大致分为帧间篡改和帧内篡改两大类。
帧间篡改是一种最常见的视频篡改方式,其操作简单便捷。在非线性编辑软件中仅需在同一视频轨道上对时间轴操作即可。根据篡改所需帧的来源以及对帧图像的整体操作方式不同,它又可以继续分为同源帧间复制插入篡改、同源帧间复制粘贴篡改、同源帧间删除篡改、异源帧间复制插入篡改以及异源帧间复制粘贴篡改。其中同源帧间复制插入篡改指的是在同一视频序列中,复制一段图像组,将其插入在原视频序列的某一时间点,插入点后的原视频向时间轴正向顺延与图像组持续时间相同的一段时间。同源帧间复制粘贴篡改与同源帧间复制插入篡改的区别在于它在复制所需图像组后,在某时间点粘贴时将该时间点后等时的图像组覆盖而不是向时间轴正向顺延。同源帧间删除篡改是在同一视频序列中,删除一段图像组,再将因此分割开的两段视频组接为一个新的视频序列。异源帧间复制插入篡改与异源帧间复制粘贴篡改与其对应的同源篡改方式的区别仅在于复制的图像组来源于另一视频序列。
相对于帧间篡改来说,帧内篡改是一种使用起来较为复杂,需要篡改者具有较高视频编辑技巧,但篡改效果较好的视频篡改方式。在非线性编辑软件中,帧内篡改需要多个视频轨道同时操作,并且组合一些视频画面的裁剪和移动等辅助手段才能完成,根据篡改所需画面内容的来源不同,它可以继续分为同源帧内复制粘贴篡改和异源帧内复制粘贴篡改。其中同源帧内复制粘贴篡改指的是在同一视频序列的一个或几个帧图像中,复制部分感兴趣的内容(片),将其粘贴在目标篡改的帧图像中。异源帧内复制粘贴篡改与同源帧内复制粘贴篡改的区别也在于复制的内容所在的图像组来源于另一视频序列。
为了科学、客观的描述上述视频篡改类型,下面将从时空域的角度分别对它们建立函数模型,来刻画上述7种篡改方法的篡改过程。
视频是由多个变量构成的动态连续图像,这些变量一般包括画面像素的横纵坐标、视频录制时的光亮度、各像素的颜色和视频持续时间等。各变量之间还有较为复杂的关系,例如光亮度影响像素颜色、视频持续时间影响光亮度等。本文将视频序列简化、抽象为以画面像素集(x,y)和持续时间构成的模型,来描述不同视频篡改方法的篡改过程。
4.1.1 同源帧间复制插入篡改
对上述三种情况分别建立时域模型,发现这三种篡改方式均可用一个模型表示,其模型可以表示为:
4.1.2 同源帧间复制粘贴篡改
对上述情况分别建立时域模型,发现这四种篡改方式均可用一个模型表示,其模型可以表示为:
4.1.3 同源帧间删除篡改
4.1.4 异源帧间复制插入篡改
4.1.5 异源帧间复制粘贴篡改
4.2.1 同源帧内复制粘贴篡改
图2 同源帧内复制粘贴篡改过程示意图
其时域模型可以表示为:
4.2.2 异源帧内复制粘贴篡改
图3 异源帧内复制粘贴篡改示意图
1.4.1.2 方法 总RNA提取参照Trizol试剂盒说明书进行,每样本取1 μg总RNA作逆转录模板合成cDNA,严格按照反转录试剂盒说明书操作进行,β-Actin作为内部控制使用。结果采用2-ΔΔCT相对定量法,确定特定荧光域值对应循环数的Ct值,对目标基因定量。
为了证明7种视频篡改模型使用的参量及过程简化的科学性与可行性,分别将7种视频篡改方式进行实际操作。
5.1.1 实验环境
PC:Dell Inspiron 14R SE 7420;操作系统:Windows 10专业版;视频编辑软件:Adobe Premiere Pro CC 2017。
5.1.2 实验对象
如表所示实验对象及其基本属性。
表 实验对象及其基本属性
对实验对象运用7种视频篡改方法,并将篡改前与篡改后的操作界面截图,得到图4中的a1~e2和图5中的f1~g2。它们展示了7种方法在篡改过程中体现的分类以及引起的视频序列时间轴和视频画面内容的变化。
5.2.1 帧间篡改(对单一视频轨道操作)
图4 帧间篡改方法篡改前后操作界面对比图
5.2.2 帧内篡改(对多个视频轨道操作)
图5 帧内篡改方法篡改前后操作界面对比图
实验中得到的篡改视频的压缩编码方式均为MPEG-4,分辨率均为1920×1080,帧率均为25fps。实验结果根据篡改时视频轨道操作数量的不同证明了将视频篡改方法分为帧间篡改和帧内篡改两大类的科学性,并且展示了以Adobe Premiere为代表的主流非线性编辑软件在篡改视频时,将时间和画面内容的变化引入进来的事实,从而证明了文中将各种视频篡改方式简化、抽象为以画面像素集和持续时间 构成模型的科学性与可行性。也进一步说明针对时间和画面范围检测视频是否被篡改的相应思路、算法的科学性与合理性。
常见的单一视频篡改方法可分为帧间篡改和帧内篡改两大类,并且均能用函数建立时域模型。但司法实践过程中遇到的篡改视频大多使用了多种篡改方法,以达到篡改者的目的。因此,我们可以在视频篡改的分类与时域模型的基础上对复合多种篡改方法的篡改视频进行认识和研究,还可在此基础上深入挖掘针对视频时间和画面范围变化的视频篡改一般性检测方法。最终得以在司法鉴定实践过程中用数学语言准确,严谨地以量化的方式进行分析论证,表述鉴定意见,使得鉴定意见更加具有说服力,发挥视频资料证据应有的证明效力。
参考文献:
[1] 孙鹏,周继冰,杨洪臣.同源复制粘贴伪造图像的检验研究[J].中国刑警学院学报,2011(4):40-42.
[2] Wang W, Farid H. Exposing digital forgeries in video by detecting double MPEG compression [C] // The Workshop on Multimedia and Security. New York:ACM,2006:37-47.
[3] Jiang X, Wang W, Sun T, et al. Detection of Double Compression in MPEG-4 Videos Based on Markov Statistics[J].IEEE Signal Processing Letters,2013(5):447-450.
[4] Pandey R C, Singh S K, Shukla K. Passive copy-move forgery detection in videos[C]// International Conference on Computer and Communication Technology. Allahabad: IEEE, 2014:301-306.
[5] Su L, Huang T, Yang J. A video forgery detection algorithm based on compressive sensing [J]. Multimedia Tools and Applic ations,2015(17):6641-6656.
[6] Chao J, Jiang X, Sun T. A novel video inter-frame forgery model detection scheme based on optical flow consistency[C]//International Conference on Digital Forensics and Watermarking. Heidelberg: Springer,2012:267-281.
[7] Wallace G K. The JPEG still picture compression standard[J].Communications of the Acm,1992(1):18-34.
[8] 刘洁. 基于MPEG-2运动补偿边缘效应的视频篡改检测研究[D]. 天津:天津大学,2010:12-13.