孙 鹏 冯鹏定 于 彤 ,2 单大国 王 素
(1 中国刑事警察学院声像资料检验技术系 辽宁 沈阳 110035;2 现场物证溯源技术国家工程实验室 北京 100038;3 江西省经济犯罪侦查与防控技术协同创新中心 南昌 330103)
近年来,快速普及的视频监控系统在维护地区稳定、提高城市管理水平、预防打击违法犯罪等方面发挥了关键作用。监控视频也以其直观可见的特点,成为公安机关研判案情、获取犯罪嫌疑人线索的主要手段。但在既往视频侦查过程中,犯罪嫌疑人人脸目标比对易受面部大小、表情、倾斜、遮挡以及监控视频场景、天气、光照等因素影响[1-2],比对的误配率较高,导致监控视频所能提供的人脸比对效果与侦查工作的实际需求有较大差距。相较于人脸目标,犯罪嫌疑人人体目标的颜色、形状、轮廓等特征更为突出,受各种环境变化因素的影响较小,则更有利于比对识别[3]。
现阶段,人工查看监控依然是公安基层跟踪监控视频中犯罪嫌疑人最常用的手段。这种人工追踪的方式主要是通过卡口照片获得犯罪嫌疑人目标,然后在监控视频中寻找该犯罪嫌疑目标或者在没有卡口照片时直接在监控视频中寻找犯罪嫌疑目标。当涉案监控视频较少时,这种方式确实能在犯罪嫌疑人追踪过程中发挥重要作用,但是当涉案监控视频较多时,视频侦查人力资源有限,查看大量的监控视频反而容易导致视频侦查人员视觉疲劳,追踪效率不高。因此,本文提出一种面向视频侦查应用的监控视频人体目标比对方法,该方法对与案件有关的海量卡口照片和监控视频进行科学处理,减少了视频侦查人员在无用监控视频上的时间浪费,从而实现对监控视频中犯罪嫌疑人人体目标相似性的快速比对,提高监控视频中犯罪嫌疑人追踪的效率。仿真实验表明,使用本文方法快速的对不同视频图像采集设备采集得到的犯罪嫌疑人人体目标进行科学量化比对,可以进一步丰富视频侦查的技术手段,提高视频侦查工作时效性。
巴氏距离在相似性度量方面研究较为成熟,既有针对视频监控人脸识别、人体目标识别研究,也有针对医疗彩照、能源勘探研究等。其中,文献[4]在LPP_SIFT算法的基础上采用巴氏距离对降维的样本进行迭代,降低了最小错误率的上界,从而提高人脸识别率;文献[5]提出基于视觉单词优化仿射尺度不变特征变换的视频人脸识别算法,通过计算视觉单词之间的巴氏距离以最大相似性原则实现识别;文献[6]对颜色特征和超像素特征配以不同权重然后利用EMD(Earth Move’s Distance)距离和巴氏距离实现人体目标的相似性度量;文献[7]利用不同目标的图像直方图巴氏距离值的大小来区分每个图像的接近程度,以此为后续匹配比对提供参考数据;文献[8]在探讨连续视频流中基于统计特征的场景变化检测问题基础上对巴氏距离场景度量进行优化,以提高检测性能;文献[9]和文献[10]提出巴氏距离与K_L变换相结合的方法,先利用K_L变换对样本特征进行特征降维,然后用巴氏距离进行特征选择,降低了仅使用K_L变换特征选择的错误率;文献[11]提出了使用巴氏距离与PCA相结合的算法来进行人脸识别,同时也利用K_L变换降维,用巴氏距离迭代算法获得最小错误率上界;文献[12]利用彩色舌图像R通道的直方图巴氏距离结合最小距离分类器的方法实现对正常舌与异常舌的分类;文献[13]利用巴氏距离计算待判定图像颜色和纹理的相似度,以综合相似度来实现岩心荧光图像含油级别的判定。
以上文献利用巴氏距离时充分考虑到算法复杂度低,运算效率高,因而可以将其运用于公安实战当中来解决公安机关在海量监控视频中犯罪嫌疑目标的同一认定问题,从而更加快速有效的获取侦查线索和方向,减轻视频侦查人员的工作量,提高监控视频资源利用率。
巴氏距离是一种基于离散或连续概率分布的相似性计算方法[14],它可以对两种概率分布的重叠量进行近似计算,以此实现两者的相关性度量。图像的直方图描述了图像中不同灰度值像素的分布情况,它反映了像素中各个灰度的分布概率,也可以看作是一个概率函数,两个直方图的比对匹配可以看成是对两个概率函数进行对比,因此可以通过计算两副图像直方图概率分布之间的巴氏距离来判断两帧图像的相似性,其算法原理如图1所示。
图1 巴氏距离度量原理流程图
监控视频可以看做是一段连续的图像序列,如果令V表示为包含犯罪嫌疑人人体目标的一段监控视频,f(t)表示构成监控视频V的图像帧,一段监控视频中包含很多图像帧;令S表示包含待识别人体目标的单帧抓拍图像库,g(k)表示构成S的图像帧[15];t,k表示图像序列,则有:
式中M表示监控视频图像的最大帧数。
式中N表示单帧抓拍图像的最大帧数。
令P表示为V中第t帧图像的直方图概率估计,Q表示为S中第k帧图像的直方图概率估计,则二者满足下面的公式:
令BC定义为巴氏系数,满足:0≤BC≤1,其关系式定义如下:
令DB是度量监控视频V中的犯罪嫌疑人人体目标与单帧抓拍图像库S中待识别人体目标相似性的巴氏距离,并且满足:0≤DB≤+∞。则有下面的公式:
需要说明的是:DB值越趋近于0,两个概率分布之间重叠量越高,相似度也就越大;DB值越趋近于+∞,相似度也就越低。
在获取待识别人体目标和犯罪嫌疑人人体目标后,统计人体目标的直方图概率估计并求得巴氏系数,就可以得到单帧抓拍图像库S中待识别人体目标与监控视频V中犯罪嫌疑人人体目标之间的巴氏距离,然后对该结果设定阈值进行取舍。阈值T的选择非常重要,即有:
假设R(P,Q)是阈值选择后的结果值,则有:
当巴氏距离DB小于给定阈值T时,R(P,Q)取值为1,则判定待识别人体目标与犯罪嫌疑人人体目标相似;当巴氏距离DB大于给定阈值T时,R(P,Q)取值为0,则判定待识别人体目标与犯罪嫌疑人人体目标不相似。
Farenzena等人将人体分割成头部、躯干和腿部三部分来进行比对,第一类是“人脸”比对;第二类是“人脸+躯干”比对;第三类是“人脸+躯干+腿部”比对。本文进行的是“人脸+躯干”比对仿真实验,实验采用Matlab2016作为仿真实验平台,实验步骤如下:
(1)用iPhone 6s后置1200万像素摄像头拍摄3张包含人体目标的单帧抓拍图像帧,再分别将单帧抓拍图像帧中的3个人体目标视为待识别目标“A”、“B”、“C”。
(2)用相同设备拍摄实验视频,逐帧读取该实验视频并对实验视频所包含的人体目标和图像帧进行统计,统计的结果显示有9个人体目标,且通过分析研判,确定其中3个人体目标为犯罪嫌疑人目标。
(3)对待识别人体目标图像帧和犯罪嫌疑人目标图像帧进行处理,只提取包含完整“人脸+躯干”的人体目标图像。
(4)利用巴氏距离计算待识别人体目标与犯罪嫌疑人目标之间的相似性。
对实验视频逐帧读取,共有473帧图像,每一帧图像大小为544×960像素,实验视频主要技术指标如表1所示;对实验视频所包含的人体目标和图像帧进行统计,统计结果如表2所示;实验视频中共出现了9个人体目标,怀疑目标“4”“8”“9”为犯罪嫌疑人目标,其中待识别目标“A”对应犯罪嫌疑人目标“4”,待识别目标“B”对应犯罪嫌疑人目标“8”,待识别目标“C”对应犯罪嫌疑人目标“9”。
对待识别目标和犯罪嫌疑人目标图像帧进行处理,获取只包含完整“人脸+躯干”的人体目标图像。其中,处理后的犯罪嫌疑人目标“4”图像共有32张,每一张大小为581×495像素,图像帧序列是145至176;处理后的犯罪嫌疑人目标“8”图像共有40张,每一张大小为611×512像素,图像帧序列是339至378;处理后的犯罪嫌疑人目标“9”图像共有32张,每一张大小为681×331像素,图像帧序列是412至435。
表1 实验视频主要技术指标
表2 人体目标和帧序列统计表
统计获取待识别人体目标与犯罪嫌疑人人体目标的直方图特征,由于待识别目标和犯罪嫌疑人目标总共107个目标,而每一个目标的直方图特征数据是一个256×1的矩阵,直方图特征的数据量比较大,无法在本文中全部列出,这里只列出待识别人体目标的部分直方图特征数据如表3所示。通过直方图特征结合式(5)就可以获得待识别目标“A”与犯罪嫌疑人目标“4”之间的巴氏系数值,如图2所示;待识别目标“B”与犯罪嫌疑人目标“8”之间的巴氏系数值,如图3所示;待识别目标“C”图像与犯罪嫌疑人目标“9”图像之间的巴氏系数值,如图4所示。
表3 待识别目标直方图特征数据
在求得巴氏系数后,通过式(6)式(7)可求得待识别目标“A”与犯罪嫌疑人目标“4”之间的巴氏距离如图5所示;待识别目标“B”与犯罪嫌疑人目标“8”之间的巴氏距离如图6所示;待识别目标“C”与犯罪嫌疑人目标“9”之间的巴氏距离如图7所示。其中,平行虚线为阈值线,如果巴氏距离低于阈值线,且越趋近于零,目标相似程度就越高,则判定相似;如果巴氏距离高于阈值线,目标相似程度就越低,则判定不相似。
图2 待识别目标“A”与犯罪嫌疑人目标“4”之间巴氏系数值
图3 待识别目标“B”与犯罪嫌疑人目标“8”之间巴氏系数值
图4 待识别目标“C”与犯罪嫌疑人目标“9”之间巴氏系数值
图5 待识别目标“A”与犯罪嫌疑人目标“4”之间的巴氏距离
图6 待识别目标“B”与犯罪嫌疑人目标“8”之间的巴氏距离
图7 待识别目标“C”与犯罪嫌疑人目标“9”之间的巴氏距离
实验设定阈值T为0.1401,依据该阈值,将低于该阈值的目标判定为相似,将高于阈值的判定为不相似,并对104个比对结果值统计得到比对表4。
表4 比对结果统计表
通过表3得到此次实验待识别目标“A”与犯罪嫌疑人目标“4”之间的比对识别率为93.33%;待识别目标“B”与犯罪嫌疑人目标“8”之间的的比对识别率为97.50%;待识别目标“C”与犯罪嫌疑人目标“9”之间的比对识别率为75.00%;此次实验待识别目标与犯罪嫌疑人目标的比对总识别率为89.42%。实验结果表明,本文方法计算效率高,比对识别率较好,可以实现监控视频中犯罪嫌疑人体目标相似性的快速比对,提高监控视频中犯罪嫌疑人跟踪的时效性。
本文为解决公安机关在海量监控视频中犯罪嫌疑人目标的同一认定问题,将犯罪嫌疑人人体目标作为比对研究对象,使用巴氏距离对犯罪嫌疑“人脸+躯干”目标进行相似性度量,实验表明巴氏距离在解决人体目标相似性度量时能够快速得到比对结果,计算简单,易于实现。当前还很少对“人脸+躯干+腿部”目标进行比对实验,下一步研究将会在算法上进行改进,优化监控视频中犯罪嫌疑人体目标的提取方法,以获取更高的比对识别率。