国中正,陈维娜,王晓宾,付钧泽
(中国人民公安大学 侦查学院,北京 100038)
书写墨迹的种类鉴别是法庭科学领域的重要研究内容之一,不仅可以为添改文件检验提供依据,还能够鉴别相应的书写工具,缩小侦查范围,为庭审提供证据。一般采用仪器分析法采集墨迹数据,采用化学计量法[1-2]进行鉴别归类。仪器分析法主要包括色谱法[3-4]、质谱法[5-6]、红外光谱法[7-8]、紫外光谱法[9-10]等,化学计量法主要包括聚类分析法和主成分分析法。其中系统聚类法是一种常见的无监督分类方式,能使类间对象的异质性和类内对象的同质性最大化,从而达到物以类聚的目的,同时对传统视觉分类方法起到良好的补充作用;主成分分析法的中心思想是将数据降维,从而实现低维数据代替高维数据的效果。超光谱成像技术是在多光谱成像技术基础上发展起来的新型遥感技术,具有“图谱合一”的优势,目前已经在生态[11]、军事[12]、文物保护[13]、医学诊断[14]等方面获得广泛应用。近年来,超光谱技术结合化学计量法已经在文件检验领域的油墨种类鉴别方面取得不少突破[15-19]。
目前,关于蓝色圆珠笔、蓝色中性笔、黑色记号笔、钢笔等工具笔的墨迹鉴别分类的文献较多,但还没有关于直液式走珠笔墨迹种类区分的文献。直液式走珠笔的储墨和出墨结构类似于钢笔,笔头类似于圆珠笔,在使用时,墨水流经笔杆的毛细结构直接到达笔尖,不需要借助笔芯,兼备钢笔和圆珠笔的优点,笔墨流动性好、书写稳定、储墨量大,深受大众欢迎,逐渐成为主流的书写工具之一,因此,建立该类书写工具的墨迹种类鉴别的方法对于法庭科学领域中工具笔墨迹鉴别的应用实践具有重要意义。本工作采用超光谱技术采集了直液式走珠笔墨迹样品的光谱数据,采用聚类分析进行了分类,并采用主成分分析对聚类分析的分类结果进行了验证,可为涉及此类书写工具的案件侦破提供思路。
VSC 8000型超级文检工作站,搭载扫描范围为400~1 000 nm 的超光谱模块,光学分辨率为1 nm,装配连续干涉带通滤色镜点光源,电源功率100 W。
收集市面上常见的29种直液式走珠笔,笔墨颜色均为黑色,笔头直径均为0.5 mm;书写衬垫物和书写载体均为尖兵牌A4纸。
选择反射光谱模式,超光谱扫描范围为400~1 000 nm,扫描步进值为4 nm。
1.3.1 墨迹样品的超光谱试验
将10 张A4 纸作为书写衬垫物,平放在桌面上,另取一张A4纸置于衬垫物上部,用收集的29种直液式走珠笔在A4纸上依次书写序号1~29,共计29个墨迹样品,将墨迹样品放于载物台上,选择3个墨迹均匀的点作为采样点,按照仪器工作条件进行超光谱试验,采用The Unscrambler X10.4软件对光谱数据进行平均滤波平滑处理,以消除噪声的影响,取3组数据的平均值。
1.3.2 聚类分析试验
采用SPSS.25 中的系统分类模块对光谱数据进行聚类分析,聚类方法为沃尔德法,测量区间为平方欧式距离,转换值为标准化中的Z得分,得到聚类集中计划表和树状图。
1.3.3 主成分分析试验
使用主成分分析法能够对光谱数据进行有效的降维处理,得出各类墨迹样品在主成分特征空间中的独立分布,从而对系统聚类的结果进行对比,验证分类效果[20]。采用SPSS.25中的因子分析模块进行主成分分析,变量为400~1 000 nm 范围内的波长,从相关性矩阵出发,提取大于1的特征根与其所对应的主成分。
29个直液式走珠笔墨迹样品的超光谱曲线图见图1。
图1 第Ⅰ大类和第Ⅱ大类墨迹样品的超光谱曲线图Fig.1 Hyperspectral curves of ink samples of the first category and second category
由图1可见:在400~650 nm 的范围内,29种墨迹样品均在440 nm 和480 nm 处形成了明显的向上的反射峰,在460 nm 处形成了向下的吸收峰;在650~850 nm 的范围内,1~14号、16号、17号、20~24号等21个样品的反射率随波长的增大而急剧上升,而15号、18号、19号、25~29号等8个样品的反射率随波长上升趋势较为平稳,与前21条曲线对比差异明显。根据这一特征,可将前面21条曲线对应的墨迹归属为第Ⅰ大类墨迹样品(图1a,曲线对应的墨迹序号分别1,2,3,4,5,6,7,8,9,10,11,12,13,14,16,17,20,21,22,23,24);后面8条曲线对应的墨迹归属为第Ⅱ大类墨迹样品(图1b,曲线对应的墨迹序号分别为15,18,19,25,26,27,28,29)。
分别对上述两大类墨迹的光谱数据进行聚类分析,并根据聚类集中计划表绘制聚合系数随分类数变化的散点图,结果见图2,将曲线变化趋势开始变得平缓的点作为分类数。
由图2可知:两大类墨迹样品均在分类数大于4时,曲线的变化趋势变平缓,因此将第Ⅰ大类和第Ⅱ大类墨迹样品都分为4小类。
两大类墨迹样品聚类分析树状图见图3。
如图3所示:当平方欧式距离为4时,可将第Ⅰ大类21种墨迹样品分为4 小类:第1 类为6 号、8号、10号、24号;第2类为2号、3号、4号、12号、14号、20号、21号;第3类为1号、5号、7号、9号、22号;第4类为11号、13号、16号、17号、23号。当平方欧式距离为5时,可将第Ⅱ大类的8种墨迹样品 分 为4小类:第5 类 为15 号、18 号、19 号、28号;第6 类 为25 号、29 号;第7 类 为26 号;第8类为27号。
图2 第Ⅰ大类和第Ⅱ大类的聚合系数随种类数变化图Fig.2 Diagrams showing the change of coefficients of the first and second category with the number of categories
图3 第Ⅰ大类和第Ⅱ大类墨迹样品系统聚类树状图Fig.3 The hierarchical clustering dendrograms of ink samples of the first and second category
由上面结果可知:运用系统聚类的方法,可将29种直液式走珠笔形成的墨迹样品分为8类。
用SPSS.25 分析软件分别对第Ⅰ大类(1~4类)、第Ⅱ大类(5~8类)光谱数据进行主成分分析,得到的分析结果见表1和表2。
表1 第Ⅰ大类墨迹样本主成分分析结果Tab.1 Analytical results of principal component analysis of ink samples of the first category
由表1和表2可知:在第Ⅰ大类墨迹样品的光谱数据提取到的7个主成分中,前2个主成分累计贡献率为87%;在第Ⅱ大类墨迹样品的光谱数据提取到的4个主成分中,前2个主成分的累积贡献率为97%。这两大类墨迹样品前两个主成分均已包含了绝大部分的光谱信息。因此,基于前2个主成分绘制了这两大类墨迹样品的超光谱数据的主成分得分图,见图4,以对系统聚类的分类结果进行验证。
表2 第Ⅱ大类墨迹样本的主成分分析结果Tab.2 Analytical results of principal component analysis of ink samples of the second category
图4 第Ⅰ大类和第Ⅱ大类墨迹样本主成分得分图Fig.4 The score charts of principal component of ink samples of the first and second category
如图4所示:运用系统聚类所得出的8种分类结果在主成分得分图中区分明显,第1~8类所包含的样品都能聚集在一块,说明聚类分析的分类结果是合理的。
采用超光谱技术采集了29种直液式走珠笔墨迹数据,通过光谱曲线的走势将其分为第Ⅰ大类和第Ⅱ大类,系统聚类又将这两大类各自分为4小类,并得到了主成分分析结果的验证。该方法可对传统形态学分类鉴别方法起到了补充作用;在刑事案件以及民事纠纷中,还可为涉及此类书写工具的添改文件检验、书写工具鉴别提供数据支持和方法。