从数据库搜索争论看DNA统计评估
张智杰,吕德坚
(中山大学中山医学院法医学系,广东广州510089)
摘要:综述了DNA数据库搜索结果匹配证据力统计学评估的两次争论。争论的内容在于如何评价从数据库搜索到相匹配DNA分型的证据强度。第一次争议始于两种有冲突的方法:似然比法认为数据库越大证据力越大,而np法则认为数据库越大证据力越小。第二次争论是关天DNA数据库搜索匹配是否会减弱DNA证据力和错误认定概率。争论涉及各种各样法医学统计方法:似然比法、np法、后概率法和频率论法等。不同学者从不同的角度出发得到不同结论或看法。尽管数据库争议似乎已经得到解决,但是审视这两次争议中不同作者的观点和对问题的看法,有助于我们准确理解DNA统计评估结果,并正确对待统计学评估与法律实践的结合。
关键词:法庭DNA数据库;DNA统计评估;法医DNA分析
法医DNA数据库已成为寻找罪犯的重要工具之一。例如,假设某一案件中,现场留有来自于罪犯的生物检材,通过DNA分析得到基因分型(假设为A)。用基因分型A与已知的DNA数据库中的基因分型搜索比对,假设能得出唯一的匹配结果,即数据库中恰好有且只有一个人(假设是张三)的基因分型为A。那么有多大证据力度来证明张三正是要找的那个罪犯呢?早先,对于这个问题,假定有两种场景:
场景一:现场遗留检材的DNA基因分型与DNA数据库中的张三基因分型匹配,并且有其他证据(人证、物证等)也可以用来证明张三就是罪犯,称为“合理根据案件”。
场景二:现场遗留检材的DNA基因分型与DNA
数据库中的张三基因分型匹配,但没有其他证据,仅能通过匹配结果认定张三是罪犯,称为“数据库搜索依赖案件”。
对这两种场景的证据力度,不同的学者从不同角度分析得出不同的结论,引出了DNA数据库搜索争论。
争论始于1996年,大量法医统计学家各抒己见。总结有两种观点:
(1)1995年Balding和Donnelly[1]、1996年Dawid 和Morterra[2]用似然率进行比较,得出场景二的证据力略大于场景一;(2)NRC的两个报告[3]和1999年Stockmarr[4]则运用贝叶斯定理得出场景一的证据力远大于场景二。
1.1似然率法
运用似然率(LR)解决上述问题的学者作了如下一组假设:
Hp:是张三在犯罪现场留下的生物检材;
Hd:是数据库中其他人在犯罪现场留下的生物检材。
假设基因分型A出现在所有人中的概率是p,人口总容量为N,已知数据库容量为n,以及事件Hp发生的概率δ和事件Hd发生的概率π,可以得到:
而我们知道,该组假设的前提是所有人都属于总人口中的一员,故可知δ=1/N、π=n/N,代入得
这个公式表明:随着n的增大,似然率随之增大,DNA的证据力也就增大了。
1.2 np法则
上面的结果看起来很合理,但1999年Stockmarr[4]批评上述的假设Hp和Hd是“依赖数据库的”,因为没有说清楚为什么张三恰好就在数据库中,所以是不合理的。作为替代,Stockmarr[4]提出了新的一组假设:
H'p:犯罪现场遗留的DNA基因分型的来源者在数据库中;
Hd':犯罪现场遗留的DNA基因分型的来源者不在数据库中。
根据这组假设,同样运用似然率的计算方法,可得:
显然,随着n的增大,似然率成倍减小,DNA的证据力也随之减小。与NRC报告[3]相符:数据库搜索的每一次比对有两个结果:匹配或不匹配。而每两次比对之间没有联系、不互相干扰。若单次匹配成功的概率为p,那么n次匹配成功的概率将会增加。换句话说,对于数据库容量越大,似然率将会被削弱n倍。数据库越大本应越容易找到罪犯,但其证据力却下降,从而形成了法医DNA数据库悖论,出现争论。
争论出现以后,各抒己见的文章相继发表。然而在2001年正如Dawid[5]指出,“似然率”这个概念只是被用来当做针对不同假设作出选择的规则,而不能被定义为一种衡量证据价值高低的工具。因此,对于“似然率”这个概念应该有一个正确的认识。2003年,Ronald和Marjan[6]在前人的基础上根据“双痕迹”问题(two-stainproblem)用后验概率来解决数据库搜索争论。
2.1“双痕迹”推导出后验概率的解法
众所周知,后验概率有下列关系:后验概率=LR×先验概率
根据先验概率概念,可以得到对于假设Hp和Hd的先验概率为δ/(1-δ),而假设H'p和H'd的先验概率为π/(1-π),从而得出两组假设的后验概率均为这表明,随着数据库容量n的增加,后验概率也随之增加,证据力度亦增加,也就是数据库越大越容易从数据库中找到匹配结果。
这就意味着以上两组假设的出发点是不同的,通过比较各自的假设而得出的似然率(LR和LR')也就不同,因此所作出的针对问题的判断也就不同了。但是两组假设都是针对同一件事情做出假设,所以从本质上来说是一样的,是等价的,称之为“有条件等价”(conditionally equivalent)。
2.2频率论的解法
2007年,Storvik等[7]提出用贝叶斯定理中的后验概率和频率论中的假定值相结合的方法来量化证据、评判证据力度的大小,用频率论的理论再次证明了后验概率对于两组假设是“有条件等价”的。
至此,关于合理根据案件的匹配结果和数据库搜索依赖案件的匹配结果哪个具有更大的证据力度的讨论暂告一段落。
争论看似结束,其实不然。到了2010年,Schneider 等[8]再次提出了np法则仍然适用。2011年,Fimmers 等[9]则抛开了np法则与似然率方法之间的争论,直面论题。
在以前的争论中,人们往往会先假设真正的罪犯的DNA基因分型在数据库中已有收录。而Fimmers等则提出假设真正的罪犯不在数据库中,甚至根本不在根据其他刑事侦查证据所圈定的犯罪嫌疑人之中,那么问题变得复杂了。前面所争论的两组假设因此失去了价值。
Fimmers等首先假设人群中有N=108个人是犯罪嫌疑人,数据库的容量则为n=106。因为有可能真正的罪犯不在这N个人中,但是每一次数据库搜索却又能得到匹配结果,那么就存在错误匹配的情况(假设错误匹配概率为γ)。而根据Fimmers等的实践,对于数据库搜索依赖案件,它的错误匹配概率γ=0.368。至于合理根据案件,因为有其他证据的支持,错误匹配概率γ≤10-6,远远小于前者,也就是说这样的证据更可信。由此可以看出,合理根据案件匹配结果的证据力度远远大于数据库搜索依赖案件的匹配结果,与np法则观点一致。
在上述争论再现的2011年,很快就有文章反驳上述观点,针对Fimmers等所使用的错误匹配(即匹配到的结果不是真实的结果),也可说是“错误认定”(false individualization)。Taroni等[10]认为,错误认定的概率不应该等同于偶然出现的错误匹配概率,即理论概率不应该等同于仅根据小样本量的观察而得出的事件发生频率。所以运用决策论的方法,即在假定有一个决策者(比如法官)对“合理根据案件”和“数据库搜索依赖案件”两种场景进行证据力比较时,他会首先有自己的一个“损失函数”(loss function)和“判定阈值”(decision threshold)(决策论中的概念)。不同的决策者有不同的阈值,同一个决策者阈值固定,那么对两种场景的判断起点是一样的,最终在做出决定时的基础也是一样的。根据Taroni等的方法,“合理根据案件”得到的错误认定概率与“数据库搜索依赖案件”的错误认定概率是一致的。
由此,DNA数据库搜索争论有了一个新的结论:两个场景中的证据力度在决策者看来是等值的。
(1)统计学指标受假设条件的限制
第一阶段所谓的悖论其实是因为在假设时忽视了DNA数据库组成的前提条件(也就是先验概率)而造成的。假设的角度不同,先验概率也就不同,似然率也就随之改变,因而产生悖论。至于后一阶段的争论,则是由于条件的扩大导致以往结论的不适用从而产生了分歧。在经过十几年的争论之后,目前国际上主流的观点是:在统计学的角度,“数据库搜索依赖案件”的DNA数据库搜索匹配结果的证据力度略微比“合理根据案件”的证据力度高;而在法医学角度来看,两者之间没有差别。
(2)统计学与法医学的结合
早在2002年Balding[11]指出,法律的要求有时候是与统计学理论相互矛盾的,应该以法律实践为重点。Donnelly和Friedman[12]在1999年指出“法律体系应是统计学等相关科学的消费者”。2012年,Nordgaard 等[13]提出,对于陪审团(法庭或法官)而言,相同DNA样本的基因分型所具有的证据力度是没有区别的。本文开头的两个场景所作出的假设其实是割裂了DNA证据与其他证据之间的关系。例如第一次争论中,似然率仅仅是针对两个假设,而在法律实践中,法医上的身源认定面对的是大量假设,这时单一的似然率是难以解决问题的,甚至会带来新的问题。
其实在实践中,大部分案件还是合理根据案件。在法庭上,很少存在孤证(即只有一个DNA数据库匹配结果这一项证据)的情况。
(3)统计学与证据力的关系
人是评估证据力度的主体。在法庭上,是陪审团和法官来决定证据力的大小以及是否采信,而似然率只是让陪审团或法官可以更加全面地评估证据价值。在法律实践中联系统计学理论是可行的,但并非不可或缺,过多依赖统计学理论而忽略了其他证据易造致错误结论。统计学终究是协助判案而不是决定判案,毕竟判案的是人而不是各种演算得出的数据。
参考文献:
[1]Balding,D. J.,Donnelly,P.Inferenceinforensicidentification[J]. Journal of the Royal Statistical Society,Series A,1995,(158):21-53.
[2]Dawid,A. P.,Mortera,J. Coherent analysis of forensic identification evidence[J]. Journal of the Royal Statistical Society,Series B, 1996,(58):425-430.
[3]National Research Council. The Evaluation of Forensic DNA Evidence[M]. Washington,D. C.:National Academy Press,1996,(2):31-32.
[4]Stockmarr,A. Likelihood ratios for evaluating DNA evidence when the suspect is found through a database search [J]. Biornetrics,1999,(55):671-677.
[5]Dawid,A. P.. Comment on Stockmarr’s“Likelihood ratios for evaluating DNA evidence when the suspect is found through a database search.”[J]. Biometrics,2001,(57):976-980.
[6]R. Meester,M. Sjerps. The evidential value in the DNA database search controversy and the two-stain problem [J]. Biometrics,2003,(59):727-732.
[7]G.Storvik,Thore Egeland.The DNADatabase Search Controversy Revisited: Bridging the Bayesian-Frequentist Gap [J]. Biometrics,2007,(63):922-925.
[8]P.M. Schneider,H. Schneider,R. Fimmers. Recommendations of the German Stain Commission regarding the statistical evaluation of matches following searches in the national DNA database[J]. Rechtsmedizin,2010,(20):111-115.
[9]R. Fimmers,H. Schneider,M.P. Baur,Reply to the letter of Taroni et al. Recommendations of the German Stain Commission regarding the statistical evaluation of matches following searches in the national DNA database[J]. Rechtsmedizin,2011,(21):57-60.
[10]F. Taroni,A. Biedermann,R. Coquoz,T. Letter to the Editor with reference to Schneider et al. Recommendations of the German Stain Commission regarding the statistical evaluation of matches following searches in the national DNA database[J]. Rechtsmedizin,2011,(21):55-57.
[11]Balding,D. J. The DNA database controversy[J]. Biometrics,2002,(58):241-244.
[12]Donnelly,P.,Friedman,R. D. DNA database searches and the legal consumption of scientific evidence[J]. Michigan Law Review,1999,(97):931-984.
[13]Anders,N.,Karin,H. Letter to the Editor [J]. Forensic Sci Int 2012,(217):e32-e33.
(本文编辑:李成涛)
鉴定制度
Forensic System
The Controversies on Database Searching in the Statistical Evaluation of DNA
ZHANG Zhi-jie,LV De-jian
(Department of Forensic Medicine,Zhongshan Medical College of Sun Yat-sen University,Guangzhou 510089,China)
Abstract:This paper reviews two controversies on forensic DNA database searching. The issue concerns the evidential value of a DNA profile match when the match result is obtained from the search of database. The first controversy starts on the conflicts of two different assessments of evidence. While the likelihood ratio strengthens the evidence with increasing n(size of database),the np rule decreases the evidence dramatically. The second controversy focuses on reducing the value of a database match and false probability of conviction. The arguments involve the likelihood ratio approach,np rule,Bayesian approach and Frequentist approach. Different scholars conclude different conclusions or opinions based on their standpoints. Although the database debate seems to be addressed,review of the two controversies will be helpful for understanding the forensic DNA statistics and evaluating value of a DNA profile match in forensic and legal theory and practice correctly.
Key words:forensic DNA database; DNA statistics; forensic DNA analysis
作者简介:张智杰(1992—),男,学士,主要从事法医DNA数据库研究。E-mail: tomatozzj@qq.com。
收稿日期:2015-03-08
文章编号:1671-2072-(2015)05-0079-04
doi:10.3969/j.issn.1671-2072.2015.05.015
文献标志码:A
中图分类号:DF795.4