徐子栋,张 中
(中国政法大学 证据科学研究院,北京100088)
视频篡改取证是取证过程中的一个重要研究方向。利用视频水印判断视频的真实性时,需要将数据嵌入原始数据中,从而破坏原始数据的结构[1]。根据视频取证的特点,可以将其分为3类:自然视频统计特征、伪造痕迹和成像设备一致性。但大部分视频取证方法的计算过程较为复杂,且只对某种篡改伪造视频有效,在转角、裁减等篡改手段中被动取证技术难以改变固有操作方式,因此是无效的[2]。在实际生活中篡改者通常会采用多种方式对视频进行篡改,因此需要对数字视频篡改取证方法进行分析和研究。
郭继昌等[3]提出基于马尔科夫特征和LBP(Local Binary Patterns)的视频篡改取证方法,采用LBP算子对视频进行处理,通过压缩处理获取数字视频的JPEG(Joint Photographic Experts Group)矩阵,并计算矩阵在不同方向中对应的一阶差分矩阵,在一阶差分矩阵的基础上获取视频图像的马尔科夫特征,利用支持向量机完成取证。但该方法无法消除数字视频中存在的噪声,导致取证结果的误差较大使取证偏差大。梅腊腊等[4]提出基于噪声水平估计的数字视频篡改取证方法,该方法首先利用小波变换处理各视频帧,其次由傅立叶变换其时域序列,根据计算结果对幅频谱在视频帧中对应的峰均比进行计算,对数字视频是否被篡改进行识别,实现数字视频篡改取证。但该方法在取证过程中容易受到噪声的干扰,提取的视频证据缺失值较大。李猛等[5]提出基于TCS-LBP(Temporal Center-Symmetric LBP)算子的数字视频篡改取证方法,该方法利用TCS-LBP算子分析不同像素帧在空间中存在的位置关系,根据分析结果对TCS-LBP特征值进行计算,将其作为判断值对数字视频中的篡改区域进行检测,实现数字视频篡改取证。但该方法对篡改视频进行取证前没有消除数字视频中存在的噪声,导致提取的视频片段变形严重。为解决上述方法中存在的问题,笔者提出基于人工免疫的数字视频篡改取证方法。
基于人工免疫的数字视频篡改取证方法是结合块和低秩张量实现数字视频的去噪处理。
张量属于矩阵和向量的高阶推广,通常情况下最小需要3个变量描述张量元素所处的位置,高维数据的结构可通过这种多线性的结构得以体现[6]。用D∈RI1×I2…×IN描述N阶张量,其大小为I1×I2…×IN。
按照第n维重新对张量D中存在的元素进行排列,获得大小为In(In+1…INI1…In-1)的n-模式展开矩阵D(n)=unfold(D,n),矩阵中(in,j)处的元素与张量中(i1,i2,…,iN)处的元素相对应。
重新对n-模式展开矩阵D(n)中存在的元素进行组合,获得张量D=fold(D(n),n)。
用rankn(D)描述张量D的n-秩矩阵D(n),Tucker秩表示张量D中的N个n-秩构成的集合。
对低秩张量矩阵进行恢复处理。其中λ为固定常量。在Tucker分解原理的基础上用凸优化问题代替张量恢复问题
5)设定收敛条件‖D-Ak+1-Ek+1‖F/‖Di‖F<ε2,其中参数ε2为大于零的正数。
张量D通过上述过程分离出低秩部分A和稀疏部分D。
基于人工免疫的数字视频篡改取证方法对数字视频去噪的过程如下。
1)当视频中存在大量噪声时,噪声会对相似块的匹配过程产生干扰[8]。针对上述问题,基于人工免疫的数字视频篡改取证方法采用中值滤波器预滤波处理含噪视频,提取去噪处理后的视频序列。
2)设置di,j为参考块,其大小为n×n,在参考块的基础上选取窗口Ω(i,j)=l×(n×n)×f,其中f为视频帧数,l为正整数。在窗口中利用l2范数获取与di,j相似度较高的图像块dx,y,构建集合Γi,j
设DΓi,j=(dΓi,j(1),dΓi,j(2),…,dΓi,j(m))为三阶张量,由相似度较高的m个图像块构成,其中di,j为第k个与参考块相似的图像块。
3)通过
基于人工免疫的数字视频篡改取证方法采用人工免疫算法构建数字视频篡改取证模型,实现数字视频的篡改取证。
人工免疫系统结构如图1所示。
图1 人工免疫系统结构Fig.1 Structure of artificial immune system
处于未成熟状态的免疫细胞经过耐受期后会进化为成熟的免疫细胞,处于成熟状态下的免疫细胞的生命周期轻易不会发生改变,若免疫细胞在生命周期内不能匹配抗原,就会逐渐死亡;反之,则会被激活。当细胞处于活化状态时,如果不能被共刺激,就会产生误认,即抗原被识别为自身的抗原,错误的免疫细胞需要被清除;反之,处于活化状态时,则会变成记忆细胞。如果记忆细胞找到合适的抗原并与之匹配,它们就会被激活。在免疫过程中,成熟的免疫细胞或记忆细胞与相应的抗原匹配,激活取证细胞,进行数字视频篡改取证。
基于人工免疫的数字视频篡改取证方法通过集合代数法描述时间变化下记忆细胞集合Mb、抗原集合G、自体集合SSelf、成熟细胞集合Tb、未成熟细胞集合Ib和动态取证细胞的整个演化过程。
1)自体动态演化模型。通过模型
描述自体在时间变化下的动态演化过程。其中xi∈D为自体在初始进化过程中构成的集合,δ为抗原更新周期。自体集合SSelf在抗原更新周期δ内保持不变,新的自体集合在抗原周期δ结束后会代替自体集合SSelf。
动态自体模型的主要目的是分析自体在网络环境中的演化情况。
2)抗原动态演化模型
其中集合sG为由一定比例η自体和非自体元素构成的,GNonself(t)为非自体抗原,时在免疫网络中获取的,Mnew(t)为新生的记忆细胞。
3)数字视频篡改取证模型
其中Γnew(t)为t时刻收集的视频篡改证据,x为被截获的数据,y′为间接证据呈供,s′为证据对应的数字签名。
为验证基于人工免疫的数字视频篡改取证方法的整体有效性,需要对基于人工免疫的数字视频篡改取证方法进行测试,实验所用的计算机配置为Windows7系统、处理器3.6 GHz。分别采用基于人工免疫的数字视频篡改取证方法(方法1)、基于马尔科夫特征和LBP的视频篡改取证方法(方法2)以及基于噪声水平估计的数字视频篡改取证方法(方法3)对相同数字篡改视频进行取证,测试结果如图2所示。
图2 不同方法的取证结果Fig.2 Forensic results of different methods
图2中虚线框是不同方法的取证结果。对图2进行分析可知,采用方法1对3段视频进行取证时,取证结果就是视频被篡改的部分,采用方法2和方法3对3段视频进行取证时,难以准确圈定视频被篡改的区域。通过上述分析可知,方法1可以准确地实现数字视频篡改取证,因为方法1对数字视频进行取证前,对数字视频进行了去噪处理,可以在无噪声干扰下准确实现数字视频篡改取证。
对不同方法的有效性进行测试,将视频缺失值和视频变形情况作为测试指标,测试结果分别如图3和图4所示。
图3 视频缺失值测试结果Fig.3 Video missing value test results
图4 视频变形情况测试结果Fig.4 Video distortion test results
由图3可知,方法1提取的视频帧的缺失值均在50以下,对取证产生的影响极小,可忽略不计,方法2和方法3提取的视频帧的缺失值在100~150内波动,影响取证结果。根据图4可知,方法1提取的视频变形系数在0.2附近波动,方法2提取的第3帧视频的变形系数高达0.6,方法3提取的第2帧视频的变形系数高达0.7。通过上述分析可知,方法1提取的视频证据存在轻微的变形,可准确实现视频篡改取证。
总之,笔者采用基于张量的增强拉格朗日乘子方法重建视频稀疏低阶部分,将噪声与数字视频分离,避免了取证过程中的噪声干扰导致视频丢失和变形,从而提高了整体性能。
图像视频处理软件功能日益强大,数码相机的质量不断提高,在此背景下,越来越容易对数字视频进行篡改,人眼难以发现被篡改的数字视频,因此需要对数字视频篡改取证方法进行研究。目前数字视频篡改取证方法存在取证误差大、视频缺失值高和视频变形严重的问题,为此,笔者提出了基于人工免疫的数字视频篡改取证方法。首先对数字视频进行去噪处理,其次采用人工免疫算法构建取证模型,完成数字视频的篡改取证,解决了目前方法中存在的问题,提高了视频的真实性。