刘英霞,袁德强,郝艳丽,贾硕果
(1.重庆警察学院,重庆 401331;2.法庭科学湖北省重点实验室,武汉 430035;3.福建警察学院,福州 350007)
在各类刑事、政治、民事和经济等案件中,鉴定可疑文件(如合同、票据、反动标语等)的真伪、书写的时间等工作较为常见,其中墨迹种类及书写时间的鉴定是法庭科学亟待解决的热点和难点问题之一。墨迹种类繁多且成分复杂,近年来相关可疑案件逐年增加,发展科学、快捷、高效、无损的墨迹检验方法至关重要。
20 世纪30 年代以来,各国法庭科学工作者尝试将各种现代分析仪器应用到墨迹分析中,为墨迹的种类鉴别及文件形成时间的鉴定提供了新的检验方法和手段。目前常用的墨迹检验方法、研究内容如表1 所示。
表1 目前常用的墨迹检验方法
随着科学技术的发展,各种检测方法更新速度较快,但在数据分析方面的发展较为缓慢,尤其在对墨迹种类的鉴别中,研究人员通常将获得的结果进行直观分类,而没有对方法和数据进行信号处理,在信息的深入挖掘方面比较薄弱,这可能会导致分类结果不够准确,有时可能会影响鉴定结果。因此,结合现代仪器检测方法,建立科学严谨的信号数据解析方法是墨迹分析鉴别的重点。
近年来墨迹品牌日趋增多,墨迹成分、配比越来越复杂。墨迹组分的检测易受到纸张、保存环境的干扰,且在光谱、色谱检测信号中易产生背景干扰和谱峰重叠等现象,这种复杂信号对墨迹组分信息的提取和分析造成了极大的阻碍。无论采取何种检测技术,所获得墨迹组分的信息数据均难以采用常规方法取得科学标准的分析结果,而化学计量学对复杂组分以“数学分离”替代“物理分离”,可最大限度地处理和分析检测所得信号,从而实现对研究物质组分的定性、定量分析。因此,化学计量学方法被应用于采样理论、实验设计、选择和优化试验条件、背景基线的校正、噪声的滤除、校正模型的建立和信号的解析、数据分析等。笔者对近年来各种现代分析仪器结合化学计量学在墨迹分析中的应用进展进行综述,从试验条件优化、信号处理、墨迹种类鉴别和书写时间等方面对墨迹分析进行归纳总结,并提出了未来墨迹分析的发展方向。
实验条件优化是实验成功与否的首要条件,也是化学计量学的重要分支之一。一个好的实验方案可以有效地简化实验过程,获得可靠数据,保证试验质量,从而促进文件检验技术走向科学化、标准化、规范化。
目前在墨迹分析中,实验设计与条件优化研究主要集中在色谱和电泳的条件优化方面,常用的方法有正交设计和均匀设计。史晓凡等[39]采用正交设计和均匀设计法优化了展开剂的组分和配比,并用优化的展开剂成功地对28 种黑色签字笔色痕进行了分离鉴别。李心倩等[40]采用正交实验设计法,优化了高效液相色谱法分析蓝色圆珠笔油墨字迹色痕的实验方法及条件,并在此条件下分析了105 种蓝色圆珠笔油墨的字迹色痕。齐宝坤等[41]采用液相色谱法对20 种黑色圆珠笔油墨进行了检测,并用正交实验选择色谱流动相条件,对不同蓝黑墨水进行了有效区分。Neumann 等[42–43]采用高效液相色谱法分析油墨,并提出了一种基于标准染料的校正方法,以提高分析的重现性,同时对油墨样品在不同条件下重复性的影响因素进行了研究。Ellen Rohde等[11]利用毛细管区带电泳法对水溶性墨水进行检测,优化色谱条件(pH 值为8 的硼酸盐缓冲液,其中甲醇体积分数为20%)后,墨水中各组分均能达到基线分离。
采用光谱法对墨迹成分进行分析时,易受仪器、样品、实验环境等因素影响,从而导致光谱信号中存在噪声、背景干扰、基线漂移等问题。一般采用数据平滑、小波变换、导数校正、傅里叶变换等化学计量学方法实现噪声滤除、基线校正等目的。
刘猛等[27]采用高光谱图像技术对6 种激光打印墨粉进行了种类鉴别。为达到较好的种类鉴别模型,在对光谱数据解析前,分别采用Savitzky Golay(基于最小二乘的卷积拟合算法)平滑滤波、标准化、多元散射校正和标准正态变量变换4 种方法对样品的光谱数据进行了预处理,然后分别建立随机森林、K 最近邻模型、支持向量机模型、偏最小二乘判别分析模型和簇类独立软模式模型,实现了对激光打印机墨粉的种类鉴别。结果表明,支持向量机模型和偏最小二乘判别分析模型的识别效果最佳。
王岩等[14]采用紫外可见光谱法检验了红色圆珠笔油墨,依据不同峰位将52 种红色圆珠笔油墨分为3 类,对于利用特征峰位法和K 值比对法不能区分的样品,采用一阶导数光谱R 值法进行鉴别,这是因为一阶导数能对紫外可见光谱图上的某些细微变化进行放大,而不同红色圆珠笔油墨的染料不同,一阶导数光谱图上的吸光度最大值与最小值比值的绝对值也不同,由此可对其进行种类认定。
傅里叶变换技术是信号处理中较为成熟的一种化学计量学分析方法,可以高效、快速地去除光谱噪音、降低荧光背景,该方法已在墨迹分析中得到了广泛应用。王俭等[44]采用傅里叶变换显微红外光谱法对108 种蓝色圆珠笔油墨色痕进行了系统解析,为探究油墨时间的变化机制奠定了基础。王宁等[45]采用傅里叶红外光谱技术获取10 种激光打印机墨粉的光谱图,以各样品的吸收峰面积及其一阶、二阶导数和自卷积值为指标,通过相关系数,运用模糊综合判别法达到了客观鉴别墨粉种类的要求。结果表明,基于傅里叶红外光谱图形相似的模糊鉴别法鉴别激光打印机墨粉类型是科学可行的。
Geiman 等[46]用常规拉曼光谱技术和表面增强拉曼光谱对10 种合成染料和圆珠笔油墨进行研究,首先用3 种激光器进行常规拉曼光谱分析,然后针对常规拉曼光谱分析荧光背景高、光谱质量差等问题,采用滴液沉积技术对染料和圆珠笔油墨进行表面增强拉曼光谱分析,有效降低了荧光背景。为了减少荧光干扰,李江春[47]将表面增强拉曼光谱技术引用到圆珠笔油墨的检验中,发现表面增强拉曼光谱技术能较好地区分圆珠笔油墨种类,但在实际检案中,需要结合其它方法进行系统鉴别。
油墨是由染料、树脂等组成的复杂混合物。油墨种类鉴别是法庭科学的一项重点研究内容,不仅用于鉴别文件真伪,更是判断文件形成时间的前提条件。近年来,关于现代分析仪器结合化学计量学鉴别油墨种类的研究已有较多报道,主要集中在对色谱、光谱的数据解析方面,常用的方法主要有主成分分析和模式识别,具体应用见表2。
表2 现代分析仪器结合化学计量学在墨迹种类鉴别中的应用
主成分分析是1903 年由Pearson 首次提出,后于1933 年经Hotelling 扩展了的一种多元统计学方法。随着现代科技的快速发展,尤其是数据存储、检索及处理速度的提升,使得主成分分析成为数据分析中一项不可或缺的技术,即使是大数据也不例外,它能对复杂的数据进行降维处理,并能排除相互重叠的化学信息,因此被广泛应用于食品、生物、医疗、石油等行业中。
Souza 等[48]运用拉曼光谱结合化学计量学方法区分蓝色圆珠笔油墨,首先用化学计量学方法对光谱进行预处理,再采用主成分分析和层次聚类分析探讨了依据拉曼光谱区分不同油墨的可行性。结果发现,油墨可通过主成分分析树状图的不同层次逐渐区分。该研究表明,拉曼光谱结合化学计量学可区分相似度较高的圆珠笔油墨,该方法快速无损。王晓晖等[15]对紫外可见光谱测定的圆珠笔数据进行主成分分析,并将分类结果与薄层色谱法的分类结果进行比较,结果表明,采用主成分分析技术可以达到对圆珠笔油墨字迹的良好识别。张清华等[18]采用红外光谱分析并比较了31 种原装黑色墨粉的差异,同时用主成分分析结合系统聚类法,对同种树脂不同激光打印的墨粉进行聚类分析与建模预报,结果准确。Gál 等[49]采用可见–红外高光谱仪检验19 种黑色喷墨打印墨水,并建立主成分模型。结果表明,主成分分析法能将以炭黑为主要着色剂的油墨与使用其它着色剂的油墨进行分离。Denman等[50]采用质谱法对油墨进行分析鉴别,并利用主成分分析法成功地鉴别了41 对(占91%,共45 对)钢笔墨水。结果表明,在不影响分辨率的情况下,质谱法能给出具体的化学成分结构,是其它方法不可比拟的。
以上研究表明,采用色谱法、光谱法、质谱法获得的数据均可采用主成分分析法进行分类研究,鉴别率均显著高于采用单一仪器检测技术的鉴别率。将主成分分析应用于墨迹种类的鉴别,可有效获取墨迹信息,从而提高鉴别的准确性。
模式识别是通过分析测量数据,对其中隐含信息进行提取,从而研究物质的分类、识别和构效关系,一般分为无监督学习和有监督学习。
无监督学习采用探索方式对数据进行解析,其根本目的是找出样品间的相关性和相似性。在油墨种类鉴别中,采用的无监督识别法主要是聚类分析法[18]。刘柏林等[51]采用模式识别法对16 种圆珠笔油墨的高效液相色谱数据进行研究,以相关系数法计算色谱图相对峰的相似度,以最小相似度(0.92)作为判定是否源于同种样品的阈值,从而将所有样本分为3 大类,再进一步利用系统聚类法,依据相似度的大小将第一大类样品分为3 小类。与高效液相色谱鉴别圆珠笔墨迹相比,采用高效液相色谱–相似度联用评价识别方法能够对数据进行更加细致地分类,可得到更加可靠的结果。王志勇等[12]采用非水毛细管电泳法测定了96 支蓝色圆珠笔油墨中的染料含量。在系列优化试验条件下,根据染料数的差异将样品分为6 类,然后依据同类样品中染料含量进行聚类分析,可使分类结果更加细致准确。牛凡等[52]采用气相色谱–质谱联用和薄层色谱法测定圆珠笔油墨中溶剂和染料的组成,对所得样品数据进行系统聚类分析,将110 支不同品牌的圆珠笔分为29 类,达到了品牌间的区分和认定,分类结果比采用单一检验手段的结果更加精准、系统。系统分类后,采用判别函数对未知色痕进行分类,由于实验样品量较少,从而导致分类正确率仅为47.7%,表明采用化学计量学方法时要有足够的样品量,才能保证分析结果的准确性。
有监督学习技术要考虑被测样品的特性,其目的是形成数据的加权线性组合,使同类样品间的变异降到最小,同时放大不同种类样本间的差异。墨迹分析中常采用判别分析法。Oravec 等[53]采用傅里叶变换近红外光谱法对22 种喷墨打印机墨水进行分析,并用线性判别分析和二次判别分析对未知样品的分类精度进行评价。在构建各自的线性判别模型时,采用主成分分析法对每种线性判别方法进行检验,结果表明,线性判别方法对独立样本的预测精度明显优于二次判别分析,说明红外光谱结合线性判别分析是喷墨打印机墨水种类鉴别的一种快速、无损的检测方法。Kher A 等[6]采用高效液相色谱法和红外光谱法对圆珠笔油墨进行了分析,并用主成分分析法和线性判别法对分析结果进行解析。结果表明,高效液相色谱的数据对圆珠笔的识别率为97.9%(线性判别)和96.4%(主成分);而红外光谱法的数据对圆珠笔的识别率为62.5%(线性判别)和60.7%(主成分),说明与红外光谱相比,高效液相色谱与化学计量学联用技术对圆珠笔油墨具有更好的鉴别能力。
此外,其它的模式识别方法也在墨迹分析中得到了广泛的应用。Khan 等[54]提出了优化的稀疏选择技术,该法可有效选择信息量最大的频带,与主成分分析法相比,精确度提高了15%。吴国萍等[55]采用显微分光光度法和显微红外光谱法,可在一定程度上对不同的黑色中性笔进行区分;再进一步利用聚类分析和色差分析,可以从墨迹的成分和色度两个角度将不同型号的中性笔完全加以区分,该项研究为鉴别黑色中性墨水提供了新的思路和方法。牟小彬等[56]采用图像扫描分析系统对由制造工艺等因素引起的微观特征进行量化和分析,并建立数学模型,从而对18 台不同型号激光打印机样本进行分类,正确率高达99.8%。
油墨形成时间的鉴定主要有薄层色谱法、高效液相色谱法、毛细管电泳法、拉曼光谱法等,其中薄层色谱法是较为常用的方法。采用不同的分析仪器,对随时间变化的墨迹成分数据进行分析,建立相关的工作曲线,从而探讨文件的形成时间[57–60]。近年来,化学计量学被广泛用于医疗、化工、食品等领域,并发挥了重要作用,因此法庭科学工作者尝试将化学计量学应用到油墨形成时间的鉴定工作中。杨旭等[61]在一起印章印文时间鉴定的案例中,建立线性模型、最小二次判别分析法等统计学方法,分析了印文的定量特征与印文盖印时间的关系,为运用统计学方法定量分析文件形成时间提供了一种新的研究思路。张平等[62]采用近红外光谱技术采集了40个不同书写时间的黑色签字笔字迹样本,并建立了字迹形成时间与近红外光谱数据的偏最小二乘定量模型,得到模型的预测标准偏差为0.884 3,然后采用相对分析误差评价模型的预测能力。结果表明,模型的定量分析具有可行性。何子瑛[63]依据热敏文件的图文会随时间逐渐变淡至消失的原理,采用photoshop 图像处理技术对字迹灰度值进行系统测量,并计算了热敏文件形成时间与灰度的关系。
现代分析仪器结合化学计量学为复杂的墨迹分析体系提供了强有力的数据解析工具和分析方法。目前,现代分析仪器结合化学计量学方法在墨迹分析中的应用日趋广泛,这也是未来墨迹分析发展的方向。但由于墨迹种类繁多、成分复杂,且会随温度、湿度等环境的影响而变化,因此仍需要对墨迹分析做更多、更深入的研究工作,以期在实际检案中能更好地完成鉴别工作。鉴于化学计量学方法的各种优势,法庭科学工作者应充分借助化学计量学的不同方法,扩大其在墨迹分析中的应用范围,积极开拓新的应用领域,如笔迹、印章、朱墨时序等,促进文件检验技术的发展和实际应用研究,并对检测标准进行明确规定,同时应扩大实验范围和样品量,促使文件检验走向无损化、标准化、规范化、科学化。