俞 文, 马晓贇
(1.甘肃政法学院, 甘肃兰州 730070; 2.中国刑事警察学院, 辽宁沈阳 110035)
2016年10月11日,最高人民法院等五部委提出并实施《关于推进以审判为中心的刑事诉讼制度改革的意见》,这一重大改革意味着鉴定人的任务不单单是要为侦查破案提供线索,更要以强有力的证据将嫌疑人送上法庭,依法宣判。
笔迹检验研究的重要性在于通过对纸张或其他书写介质上记录字迹的研究,使笔迹可以作为法庭证据来使用,最常见的就是认定笔迹书写人。目前,特别是在国内,在绝大多数的法庭审判中,法官及公诉人都希望文检鉴定人能给出“认定同一人书写”或“否定同一人书写”的明确鉴定意见,以增强证据效力,加速审判进程。但是,受到鉴定人水平、检材损坏、时间久远、花费较大等主客观因素的影响,检材笔迹与样本笔迹之间总会存在不同程度的差异,这就从某种程度上决定了文检鉴定人要明确地做出认定同一或否定同一的鉴定意见几乎不可能。同时,从法庭科学证据的发展历程来看,即便被誉为“证据之王”的DNA,在同一认定中也出现过错误,因此,依靠经验积累所作出的笔迹检验鉴定意见的科学性也受到了质疑。
随着科学技术的发展,对于法庭证据的认识也愈加深刻,法庭证据评估体系随之有了极大的提升。其中,基于统计学中似然比的法庭证据评估体系得到了国内外的广泛认同。其在逻辑上和法律上都是正确的,因此可以向法官提供准确的证据效力评估结论[1]。本文尝试将似然比检验引入到笔迹量化检验中,为笔迹检验鉴定探求新的方法与思路。
设由n个观察值X1,X2,…,Xn组成的随机样本属于密度函数f(X,θ)的总体,其中θ为未知参数。要检验的原假设是H0:θ=θ0,备择假设是H1:θ≠θ0;检验水准为α。则似然函数在θ=θ0处的值与在θ=θ(极大点)处的值(即极大值)之比,记作LR,亦称为似然比[2]。本文谈及的似然比为广义似然比。
似然比检验(Likelihood ratio test)是反映事件真实性的一种指标,同时具备灵敏性和特异性以反映事件性态。其实际上是贝叶斯决策理论(Bayes’ theorem)的推广,而贝叶斯决策理论基于条件概率的概率推理。条件概率是指在两个事件彼此独立的前提下,事件A在另一个事件B已经发生条件下的发生概率,记为P(A|B)。这一基础使得贝叶斯决策理论包括3个部分,即先验概率、似然比和后验概率[3]。假定在一检验鉴定中,除去现场勘查过程中发现的手印、足迹、DNA等物质性物证E外,还有现场走访调查中取得的被害人陈述、其家属及其他目击者证言等言语证据F。则先验概率为假定无物证E发现时,仅考虑言语证据F所得到支持原假设H0成立的概率。后验概率为先验概率与似然比之积,即同时考虑物证E与言语证据F的情况下,支持原假设H0成立的概率。似然比是假定现场提取到的犯罪证据由罪犯形成的概率与该证据由其他人形成的概率之比,以此将证据强度数字化,量化证据对检验鉴定结论的支持力度。似然比公式为:
其中,E为现场物证,定义现场物证E为犯罪嫌疑人所留的假设为H0,为其他人员所留的假设为H1。P(E|H0)为H0假设条件下的概率,表示相似性;P(E|H1)为H1假设条件下的概率,表示典型性。也就是说似然比LR为相似性与典型性的比。在检验鉴定中,P(E|H0)近似于1,通常情况下假定为1;P(E|H1)则需要收集犯罪区域关联总体的样本,并建立相关数据库统计求取。似然比LR的值与1的距离从侧面反映了证据力度的强弱;LR越远离1,则该证据的证据力度越强;LR越逼近1,则该证据的证据力度越弱[4]。
(1)实验对象
收集某警院300名师生的笔迹样本。其中男性152名,女性148名,男女比例较均衡。实验对象身体健康,无习惯于左手书写者。
(2)实验材料
①书写工具。钢笔、中性笔、签字笔、圆珠笔等硬笔书写工具。
②书写纸张。A4打印纸、草稿纸。
③实验仪器。佳能700D单镜头反光相机、放大镜。
(1)样本收集
第一步,记录实验对象的性别、年龄,以便对数据统计、分析。
第二步,令实验对象使用给定的书写工具书写。
根据国家语言文字工作委员会、国家教育委员会发布的《现代汉语常用字表》,使用频率前十的汉字分别为“的、一、是、了、我、不、人、在、他、有”。故将其组合,令受试者在纸张上书写语句“他不在的时候,我一个人,是有些害怕了”两遍,以保证实验样本特征的普遍性(由于“一、人、了”笔画较为简单,不具备比对条件,因此只选择“他、不、在、的、我、是、有”7个字作为特征字)。
第三步,收集所有样本并编号,分析其笔迹特征。
(2)特征选取
不同的人书写技能和书写习惯既有共同性又有特殊性的双重属性[5]。笔迹区别于其他物证的一个重要特点就是任意两份笔迹,必然是既有符合、又有差异。笔迹检验就是通过检材笔迹与样本笔迹之间系统的对比分析,寻找其特殊性,发现其内在的联系和本质的不同,以此来认定同一人书写或非同一人书写。由于笔迹特征能反映个体的书写技能和书写习惯,它是笔迹检验鉴定的根本因素,故恰当地选取笔迹特征尤为重要。检验中一定要吃透检材,从整体到局部、从宏观到微观、由外及里、由表及内,在一定深度和广度上选取特征。笔迹特征包括概貌特征、局部安排特征、写法特征、错别字特征、搭配比例特征、笔顺特征、运笔特征和笔痕特征[6]。检验中应重点把握和挖掘特征字的结构、偏旁部首间的搭配比例关系、笔画先后次序、运笔过程中弯笔的弧度大小、起收笔时的细微笔痕和相交笔画的交角位置和大小等。
由于似然比在笔迹检验鉴定中反映的是笔迹特征相似性与典型性的比值,故在似然比检验中不是所有的笔迹特征均能采用。笔迹检验多年的研究和实践表明,较为稳定和典型的特征如特征字笔画的长度、宽度、角度,字的大小和字形,字行间距,字间、字内搭配组合,运笔速度,笔尖压力等。对于特征字的笔画长、宽、角、字的大小和字形、字行间距等可直观测量或明显看出的特征,通常使用量角器、刻度尺或直接观察得出。而对于特征字字间和字内搭配组合关系、运笔速度、笔尖压力大小等只能定性研究的笔迹特征,实际上无法通过相应的工具测量,可按其特征反映的强弱转换为等级形式表达。即将各特征依照本身的性质建立为由弱至强的3个等级的评价体系,并按样本所反映特征的情况归类,由此实现笔迹特征从定性到定量的转化。为便于统计分析,将各特征分别以T1(特征字笔画长度)、T2(特征字笔画宽度)、T3(特征字笔画角度)、T4(特征字的大小)、T5(特征字字形)、T6(字行间距)、T7(特征字字间、字内搭配组合关系)、T8(运笔速度)、T9(笔尖压力大小)表示。表1显示了各选取特征定量分组标准。
表1 笔迹特征定量分组标准
(3)建立数据库
研究过程中共收集到总计300份实验样本,统计实验样本中以上几种特征的频数,并建立相应的数据库,并分别计算该9种特征在样本总体中的概率。
针对似然比值,Association of Forensic Science Providers (AFSP)将其按等级转换成言语形式表达[7],即表2所示的6个似然比等级[8]。将得到的似然比值与表2比较分析,获得各笔迹特征在同一认定中的支持力度。
表2 似然比等级
对300份笔迹样本进行统计,得到表3的统计结果。可以看出,对于笔画长、宽特征,样本笔迹均表现出中等长、宽居多,笔画很长或很宽的出现较少;对于笔画角度来说,大多数特征字书写笔画均呈现出一定角度的倾斜,这是人的书写习惯决定的,个体很难长时间控制笔画横平竖直,与此同时,书写机能又受到大脑神经中枢的限制,不会产生较大斜率的倾斜笔画,因此笔画平缓和出现极大斜率的频率较低;对于特征字的大小,样本笔迹中中等字和大字占绝大多数,而小字极少;对于特征字字形,观察发现方形、长形字最多,扁形字次之,而圆形字更少,超长、超扁字则微乎其微,特别是极不规则字出现率为0,究其原因,应是本实验在某警院内部进行,受试者均有本科以上文化程度,受过长期规范的书写训练,导致这几种类型的字形出现率可能低于实际情况,但差距并非很大;对于3种字行间距分组出现率基本持平。对于字间、字内搭配组合,整体来看一般和整齐的较多,出现凌乱的较少,这亦是受到受试者文化程度的影响;运笔速度中等及偏快较多,较慢的很少,应是由于实验对象均为人民警察或预备警官,他们在入警或入校前都经过了严格的体检,因此反应快、协调性好,且实际情况与样本总体差距应不大;在笔尖压力大小的统计数据中,中等笔压分布最多,轻微和较重笔压出现概率较少,并且基本持平,这也与实际情况是吻合的。
(1)独立性检验
基于似然比检验实际上是贝叶斯决策理论的推广,故应服从条件概率的假设前提,即保证相关的各个事件均相互独立。利用上述实验中的笔迹特征统计数据,可统计出9种笔迹特征的频数以及每份笔迹中各特征的组合关系,以此来测试9种特征是否相互独立。利用SPSS ( Statistical Program for Social Sciences ) 19.0统计分析软件在Windows 10操作环境下对数据库进行交叉列联表分析,在显著性水平下,对9种笔迹特征进行卡方检验及Fisher精确检验,所得到的Sig双尾检验概率P值均小于0.05,证明各笔迹特征之间相互独立,可以用于似然比检验鉴定。
表3 特征典型性
(2)案例应用
下面以具体实例说明利用似然比进行笔迹量化检验的方法。图1为检材笔迹a,图2为样本笔迹b,需要检验鉴定a与b是否系同一人书写。对检材和样本笔迹特征字逐个对应于9种笔迹特征,通过比较分析,得到表4所示的结果。
图1 检材笔迹a
图2 样本笔迹b
表4 检材样本特征字笔迹特征比较分析结果
可以看出,对于特征字“他”而言,T2(笔画宽度)、T5(特征字字形)、T6(字行间距)、T7(字间字内搭配组合)4个特征指标表现一致。分别计算出笔画宽度、特征字字形、字行间距、字间字内搭配组合4个特征的似然比值,即:
LR(T2)=1/0.26=3.85
LR(T5)=1/0.17=5.88
LR(T6)=1/0.373 3=2.68
LR(T7)=1/0.146 7=6.82
累积似然比值LR(“他”)=LR(T2)×LR(T5)×LR(T6)×LR(T7)=3.85×5.88×2.68×6.82=413.77。属于100~1 000的范围内,为第三级似然比等级,即中等以上强度的支持。
对于特征字“不”而言,T1(笔画长度)、T5(特征字字形)、T7(字间字内搭配组合)、T9(笔尖压力大小)4个特征表现一致。分别计算出笔画长度、特征字字形、字间字内搭配组合、笔尖压力大小4个特征的似然比值,即:
LR(T1)=1/0.113 3=8.83
LR(T5)=1/0.396 7=2.52
LR(T7)=1/0.496 7=2.01
LR(T9)=1/0.453 3=2.21
累积似然比值LR(“不”)=LR(T1)×LR(T5)×LR(T7)×LR(T9)=8.83×2.52×2.01×2.21=98.84。属于10~100的范围内,为第二级似然比等级,即中等强度的支持。
对于特征字“在”而言,T1(笔画长度)、T2(笔画宽度)、T3(笔画角度)、T4(特征字大小)、T7(字间字内搭配组合)5个特征表现一致。分别计算出笔画长度、笔画宽度、笔画角度、特征字大小、字间字内搭配组合5个特征的似然比值,即:
LR(T1)=1/0.833 3=1.20
LR(T2)=1/0.26=3.85
LR(T3)=1/0.23=4.35
LR(T4)=1/0.43=2.33
LR(T7)=1/0.496 7=2.01
累积似然比值LR(“在”)=LR(T1)×LR(T2)×LR(T3)×LR(T4)×LR(T7)=1.20×3.85×4.35×2.33×2.01=94.12。属于10~100的范围内,为第二级似然比等级,即中等强度的支持。
对于特征字“的”而言,T1(笔画长度)、T4(特征字大小)、T6(字行间距)、T7(字间字内搭配组合)、T9(笔尖压力大小)5个特征表现一致。分别计算出笔画长度、特征字大小、字行间距、字间字内搭配组合、笔尖压力大小5个特征的似然比值,即:
LR(T1)=1/0.113 3=8.83
LR(T4)=1/0.43=2.33
LR(T6)=1/0.373 3=2.68
LR(T7)=1/0.496 7=2.01
LR(T9)=1/0.296 7=3.37
累积似然比值LR(“的”)=LR(T1)×LR(T4)×LR(T6)×LR(T7)×LR(T9)=8.83×2.33×2.68×2.01×3.37=373.49。属于100~1 000的范围内,为第三级似然比等级,即中等以上强度的支持。
对于特征字“我”而言,T1(笔画长度)、T2(笔画宽度)、T3(笔画角度)、T4(特征字大小)、T6(字行间距)5个特征表现一致。分别计算出笔画长度、笔画宽度、笔画角度、特征字大小、字行间距5个特征的似然比值,即:
LR(T1)=1/0.833 3=1.20
LR(T2)=1/0.26=3.85
LR(T3)=1/0.23=4.35
LR(T4)=1/0.43=2.33
LR(T6)=1/0.373 3=2.68
累积似然比值LR(“我”)=LR(T1)×LR(T2)×LR(T3)×LR(T4)×LR(T6)=1.20×3.85×4.35×2.33×2.68=125.49。属于100~1 000的范围内,为第三级似然比等级,即中等以上强度的支持。
对于特征字“是”而言,T2(笔画宽度)、T3(笔画角度)、T4(特征字大小)、T5(特征字字形)、T6(字行间距)5个特征表现一致。分别计算出笔画宽度、笔画角度、特征字大小、特征字字形、字行间距5个特征的似然比值,即:
LR(T2)=1/0.26=3.85
LR(T3)=1/0.23=4.35
LR(T4)=1/0.43=2.33
LR(T5)=1/0.396 7=2.52
LR(T6)=1/0.373 3=2.68
累积似然比值LR(“有”)=LR(T2)×LR(T3)×LR(T4)×LR(T5)×LR(T6)=3.85×4.35×2.33×2.52×2.68=263.54。属于100~1 000的范围内,为第三级似然比等级,即中等以上强度的支持。
对于特征字“有”而言,T2(笔画宽度)、T4(特征字大小)、T5(特征字字形)、T6(字行间距)、T7(字间字内搭配组合)5个特征表现一致。分别计算出笔画宽度、特征字大小、特征字字形、字行间距、字间字内搭配组合5个特征的似然比值,即:
LR(T2)=1/0.26=3.85
LR(T4)=1/0.43=2.33
LR(T5)=1/0.396 7=2.52
LR(T6)=1/0.373 3=2.68
LR(T7)=1/0.496 7=2.01
累积似然比值LR(“有”)=LR(T2)×LR(T4)×LR(T5)×LR(T6)×LR(T7)=3.85×2.33×2.52×2.68×2.01=121.77。属于100~1 000的范围内,为第三级似然比等级,即中等以上强度的支持。
综合评断,支持检材笔迹与样本笔迹系同一人书写的力度极强,结合其它证据(先验优势),本案可作出认定同一的检验意见(后验优势),即a与b系同一人书写。
本文针对利用似然比检验对笔迹进行同一认定进行了研究尝试,结果证明该方法在笔迹检验领域是可行的。但仍存在诸多待完善之处,例如选取特征较少、主观误差较大等,下一步将完善实验数据,保证定量分析的数据准确率,并结合其他关联物证,对笔迹同一认定做进一步的系统量化检验,从而得到更精确的分析结果。