李 康,尹津引,吴 浩
(1.浙江警察学院,杭州 310053;2.公安部物证鉴定中心,北京 100038)
目前,全国公安机关指纹自动识别系统存储十指指纹总量已达1.4亿余人份,各地公安机关每年利用指纹信息比中案件12万余起,抓获犯罪嫌疑人5万余人,一批大要案件通过指纹技术得以侦破。通过指纹查明犯罪嫌疑人真实身份、深挖犯罪嫌疑人余罪、发现破案线索等工作已经成为一种科学、高效、便捷、规范的侦查基本技战法[1-3]。而指纹自动识别系统作为完成指纹同一认定的重要辅助工具,极大地提高了指纹筛选、匹配的效率,因此通过研究提高指纹自动识系统识别效率的方法加快指纹认定的速度,也是高效辅助侦查破案的手段之一。但是,我国对于指纹自动识别系统尚未建立全国统一的指纹大库,存在各地各自为政、各自建库的情况,各种系统标准的不同和研发人员的主观影响使得我国指纹自动识别系统系统化程度较低。此外,因版权原因各个系统使用的算法不公开,导致技术人员进行特征标注的方法因人而异,也没有相应的标准,操作者需要通过经验或前期实验来找到对应系统的最佳标注方法[4-7]。当前,指纹细节特征的人工标注方法以GA 774.5--2008《指纹特征规范(第5部分):指纹细节特征点标注方法》中的标注方法[8]和指纹工作者在长期实践过程中的习惯标注方法为主。由于系统不同,人员素质不同,对于习惯标注方法也不能一概而论,本文中提及的习惯标注方法主要是指“分歧结合标主线,主从不明标中间;小点小棒和小眼,两端标注尾相连;小桥连接两岸线,不标桥上标岸边;小钩标注似小桥,平行标注最重要”[9]这一常用标注方法。而模拟系统自动提取的标注方法作为由捺印指纹自动提取逆推而来的人工标注方式未被特别地重视和全面系统地总结,人机差异不能有效地减少。因此,本研究希望通过比较实验的方法得到与PU-AFIS系统最为匹配的标注方法,明确标注过程中需要注意的事项,最大程度优化查询比对结果。
计算机(公安网专用)、高性能服务器、北大高科指纹自动识别系统PU-AFIS 3.2版、Photoshop(ps5)软件、指纹信息管理系统。
在省级现场指纹库中随机抽样选取可以在目标捺印库中比中相应捺印指纹的200枚指纹。指纹特征点的选取主要遵循清晰、稳定、不变形的原则,保证实验的可靠性。为此,选取条件相对较好的现场指纹进行实验,并且特征点最好位于指纹中心部位,清晰、完整、不变形。
本次实验涉及的细节特征,即起点、终点、分歧、结合、小桥、小勾、小点、小孔、小棒,为行业标准所定义的乳突纹线上的九大细节特征[10]。
先对指纹自动识别系统自动提取特征的标注方法进行统计研究,根据统计结果提炼出自动提取特征的最佳标注方法,作为模拟自动提取方法,再对三种方法进行比较研究。
在PU-AFIS系统中随机选择800枚捺印指纹,在系统自动提取特征后观察并统计这800枚指纹中终点、起点、分歧、结合这四个最常见特征的标注规律。此外,在这800枚指纹中分别找到有小桥、小勾、小点、小眼出现的指纹200枚,有小点出现的指纹120枚,分别对每个特征自动提取后的标注规律进行统计,分析得到系统自动提取标注方法。
先对三种细节特征标注方法进行比较,找出九大细节特征中标注的异同点,再对不同的细节特征标注方法对比对结果的影响进行比较研究。三种指纹细节特征编辑方法对同一指纹具体标注方法如图1所示。查询完成后,记录所选取现场指纹三种标注方法比较实验结果。
图1 三种标注方法对同一枚指纹细节特征的标注(a:行业标准;b:习惯标注方法;c:模拟自动提取)Fig.1 Three methods to label the same fingerprint's minutiae points (a: one required by professional standard; b: the accustomed;c: simulating the way adopted by AFIS's automatic extraction)
在200枚指纹中,小桥的标注方法出现三种,小勾的标注方法出现两种,小点的标注与习惯标注差异较大,但标注方法唯一。三种细节特征的具体标注方法及出现概率如表1所示。除以上三种细节特征外,其余六种细节特征的标注方法都符合标注习惯。
表1 具体标注方法与统计结果Table 1 Specific labeling methods and statistical results
在观察统计系统自动识别特征并标注的过程中还发现,指纹自动识别系统在自动提取特征过程中存在以下问题:
1)特征点漏提。在系统提取特征点时,存在部分特征点被忽略或者提取不全的现象,如图2蓝圈内所示。
2)特征点误提。由于现场指纹模糊或严重变形导致指纹照片质量较差,个别细节特征点在图像预处理阶段没有被准确识别,因此在细节特征抽取阶段往往将这些点作为特征点错误提取,如图2蓝框内所示。
3)特征点提取偏差。在自动提取结束后,很多标注并非准确地标注在纹线上,标注的位置存在细微甚至几根纹线的偏离并且标注的方向也会发生细微的偏差,如图2蓝色箭头所示。
4)点特征无法识别,系统无法识别点特征与小于一个纹线宽度的小勾,也使得小点与小勾的自动提取标注方式与小棒近似。
此外,还存在系统因无法识别小桥而将其视为一个分歧和一个结合,以及细微的连接点较难识别等问题。这些系统识别特征时产生的问题是造成自动提取特征与日常习惯标注方法存在差异的根本原因。
图2 自动提取中存在的问题示意图Fig.2 Indication for the problems occurring in automatic extraction
3.2.1 标注方法相同的细节特征
通过比较发现三类标注方法在起点、终点、小眼、短棒四类细节特征中标注方法完全相同,具体标注方法如图3所示。
图3 标注方法相同的细节特征示意图Fig.3 Sketch of the minutiae points which have the same labeling method
3.2.2 标注方法不同的细节特征
在剩下的五大细节特征中,行业标准和习惯标注方法只在分歧和结合存在主线时标注有差异,其他特征标注方法都相同。而自动提取与另外两个方法比,除了分歧和结合的标注方式与习惯标注方法完全相同以外,其余小点、小桥、小勾三类细节特征标注差异较大。标注方法不同的特征具体标注方式如图4所示。
在三种标注方法的比较实验中,我们共选择现场指纹200枚,先后对200枚现场指纹用三种标注方法分别进行标注并发送查询,共发送查询600次。其中行业标准得分最高的指纹共8枚,占全部指纹的4%;习惯标注方法得分最高的指纹共16枚,占全部指纹的8%;模拟自动提取得分最高的指纹共171枚,占全部指纹的85.5%;其余的5枚现场指纹存在不同标注方法之间得分相同的情况,三种标注方法得分都相同的3枚,占全部指纹1.5%。行业标准和习惯标注方法得分相同且高于自动提取标注方式的2枚,占全部指纹的1%。部分指纹的比较实验结果如表2所示。
图4 标注方法不同的细节特征示意图Fig.4 Sketch of the minutiae points which have the different labeling methods
表2 部分指纹的比较实验结果Table 2 Comparative results of the selected fingerprints
此外,主线识别错误会使得分大幅度降低,在使用三种方法对指纹细节特征进行编辑的过程中,发现对现场指纹的主线判断存在一定的难度,且会增加标注特征的时间。而主线标注错误的指纹匹配效果较差,比对的得分也大幅度降低。针对主线判断错误对系统造成的影响,选择指纹50枚,对每一枚指纹用两种方法进行标注。一种方式为正确识别主线,另一种则错误识别主线,将两种标注方法进行比较研究。发送查询100次。部分指纹两种标注方法的具体结果见表3。根据实验结果可明确,在准确识别主线的情况下用习惯标注方法标注分歧与结合会大大提高指纹的匹配率,但是若在运用公安行业标准时错误识别纹线主线会大大降低系统的匹配率。
表3 主线识别实验结果Table 3 Results of recognition against main lines of the selected fingerprints
将由捺印指纹自动提取统计的标注方法逆向运用到现场指纹的细节特征标注中去,使得捺印指纹和现场指纹在细节特征上最大程度匹配,指纹比对的准确率更高,排名、得分和比中概率等指标均最优。
分析使用不同标注方法排名和得分相同的现场指纹,发现行业标准和习惯标注方法的差异只是在能否区分主次线的分歧和结合上,在其他的特征标注上是不存在差异的。并且在实验研究过程中发现仅有少量指纹可以区分主次线的分歧或结合,根据存在可区分主次线的分歧和结合的现场指纹分析可以得到,习惯标注方法优于行业标准。