付 凤,任景禹
(中南财经政法大学,湖北 武汉 430000)
侦查实践中,当已有证据难以确实充分地证明犯罪事实时,多道心理生理测试(俗称“测谎”)对案件的侦破能起到一定的助推作用。许多有重大社会影响且实物证据收集困难的案件(比如2021 年8 月阿里集团女员工性侵案),在侦查过程中都有测试技术的参与,其也常被媒体追捧为突破侦查僵局的神兵利器。①据《新京报》报道:在“阿里集团女员工性侵案”中,警方在办案过程中对涉案人员采取了测谎等辅助手段进行侦查。参见:https://baijiahao.baidu.com/s?id=1708163362509482358&wfr=spider&for=pc,网站访问日期:2021 年8 月21 日。但同时,每当有冤假错案曝光,测试又常被当作错案形成的罪魁祸首而饱受攻诘。②如媒体常以《测谎仪“揪出”假元凶,无罪男子两次被错判死缓》《亳州农民莫名成杀人犯,测谎结果成“直接证据”》等为标题,将错案的生成归咎于测试。有测试人员用“发挥作用时不明就里,搞错案子又一棒子打死”来形容当前测试在法庭科学界的尴尬地位。2020 年8 月,最高人民法院发布《关于人民法院民事诉讼中委托鉴定审查工作若干问题的规定》(法〔2020〕202 号),更是明令禁止法院在民事案件审理过程中委托鉴定机构进行测试,理由是测试可能影响案件公正审理,酿成错案。
尽管媒体公众和司法机关常将错案原因归咎于测试,但我国测试理论与实务界对该技术与错案的关系,却有着截然相反的认知:一方面,测试实务界因为偏重研讨测试在侦查中的重要作用,乐于分享测试成功的案例,而缺少对错案的自省和纠错机制。对于错案形成往往用“难免出错”“错的都是别人,自己完全没错”一笔带过,模糊了测试技术应用与错案的关系。另一方面,测试理论界认为,测试在侦查中所起的作用十分有限,其主要是提供证据线索和帮助审查判断其他证据,即以测试技术现有的证据能力和微弱的证明力,尚不足以导致错案。也正是在这种观点的影响下,当前许多基层测试人员仍以测试不能直接作为证据为由,不愿出具书面的测试意见,以此规避后续可能引发的错案责任,致使测试在侦查中虽然大量应用,但却是“隐形”适用。这既无益于测试技术自身准确性的精进,也使测试对错案的实际影响被隐藏或忽视。
司法实践中,测试究竟在多大程度上影响甚或导致了错案的生成?侦查过程中,测试是破案利器,还是错案推手,抑或与错案的关系微乎其微?我们该如何客观评判测试在案件审理中的证据形式和证明价值?为解答这些问题,我们尽可能收集了近些年媒体所报道的因测试酿成的刑事错案,并借助裁判文书网对这些案件证据适用和事实认定部分的真实性予以核实,在系统分析案件致错原因的基础上,探究这些错案与测试技术应用的关系,反观测试技术在刑事司法中的应用生态及自身存在的现实问题。
收集和研究与测试相关的错案,首先必须明确错案的标准。理论界对于刑事错案的界定有客观标准、主观标准、综合标准、三重标准等各类学说。①客观标准说认为错案指公安机关、检察机关、审判机关、监狱管理机关违反职权,在认定事实、适用法律上确有错误的案件。主观标准说认为在刑事诉讼过程中,司法人员故意或者过失违反程序法、实体法的都属于错案。综合标准说认为刑事错案的标准应当采取主客观相统一的方式,既要求客观上错案发生的现实性,也要求主观上存在故意、过失的心态。三重标准说认为认定刑事错案的标准分为错案纠正、错案赔偿、错案追究三种。我们采用了错案纠正与赔偿相结合的标准,即选取的错案是司法机关认定事实或法律适用有误,导致没有犯罪或没有充分证据证明有犯罪行为的人被刑事追诉,最终进行了国家赔偿的案件。这些案件都经过侦查、起诉、庭审,最终被认定无罪。有些案件在侦查阶段虽然使用了测试技术认定犯罪,但审查起诉或一审时排除了该证据,或者一审认定无罪,鉴于其相应的致错因素在司法运作过程中已得到及时预防和纠正,不属于我们的研究范畴。
为保证样本的典型性与全面性,我们最初设定了两层搜索圈,先通过中国裁判文书网检索所有与测试相关的刑事案件;在此基础上进行二次搜索,找出其中申请了国家赔偿的错案。为此,我们首先通过中国裁判文书网以“心理测试”并“刑事案件”为关键词、截止日期2021 年6 月20日,检索到与测试相关文书168 份,其中包括118份判决书、48 份裁定书、1 份决定书、1 份通知书。118 份判决书中剔除一审和二审重复的案件后,共114 起与测试相关的刑事案件。对114 起案件以“国家赔偿与司法救助案件”为关键词进行二次检索,却并未发现相关错案。考虑到“多道心理测试技术”在司法实践中多被称为“测谎”,我们又以“测谎”并“国家赔偿与司法救助案件”为关键词,检索到6 起与测试相关的赔偿案件(1 起刑事和5 起行政赔偿),其中这1 起刑事赔偿未在此前我们检索到的114 起与测试相关刑事案件之列。即二次检索后,我们获取测试相关刑事案件115起,但仅包含1 起符合研究条件的错案。
显然,受裁判文书网实际上传文书数量的限制,我们无法借助该平台找到所有与测试相关的刑事错案。为此,我们改变了最初的检索思路和方法,由原来“从文书到案件”改为“由案件到文书”的检索方式,通过公信力较高的官方主流媒体如央视、省属、市级法治类、时事类新闻平台;②央视、省属、市级法治类、时事类新闻平台指主体单位为中央新闻单位、中央新闻宣传部门主管单位、地方新闻宣传单位的以传播法治类新闻、时事政治类新闻为主要内容的信息平台。本文数据来源平台:人民网、中国青年报、新华社、新京报、央视国际、中国经济网、中安在线、国际在线、人民政协网等。央视、省属、市级法治类、时事类节目①央视、省属、市级法治类、时事类节目资料指主体单位为中央新闻单位、中央新闻宣传部门主管单位、地方新闻宣传单位的以电视、网络节目为载体,访谈、讲解为方式传播法治、实事内容的节目。本文数据来源节目:《法治在线》《今日说法》《央视新闻》《法制播报》等。的报道以及我国核心期刊文章②本文参考文章来源为知网平台,通过关键词:心理测试、刑事错案、实证等词进行检索。本文参考文章:付凤.多道心理生理测试技术证据能力的纠缠与厘定——从2020 年司法部与最高法的规范冲突谈起[J].证据科学,2021(2):242-254 ;稂志诚.中国刑事错案中的鉴定问题——基于50 例案件的实证研究[J].中国司法鉴定,2016(3) :8-19 ;张桂勇.对杜培武一案的分析[J].刑事司法论坛,2002(7):238-243;陈梦.认识综合测试法CCT 与准绳问题测试法CQT的比较研究[D].兰州:甘肃政法大学,2015;李学军.诉讼中专门性问题的解决之道——兼论我国鉴定制度和法定证据形式的完善[J].政法论坛,2020(6):37-54;付凤.刑事法官视角下测谎证据的审查与采信——以2010 ~2018 年刑事裁判文书为研究样本[J].中国人民公安大学学报(社会科学版),2020(1):36-46;余军.心理测试技术在日本的研究与应用现状[J].证据科学,2018(2):245-253.、案件辩护律师的回忆录③律师回忆录来自律师对案件的具体回忆并以书本、互联网为载体所发表的案件具体信息。本文回忆录数据来源:洗冤网(金宏伟律师日志)、济南刑事辩护网(朱明勇辩护词)、王亚林律师博客辩护词、笔者与任艳红律师微博私信交流信息等。、学者著述等多种渠道检索收集到与测试相关的错案20 起。经比对,我们发现这20 起错案没有一起与裁判文书网上的115 起案件重合,由此我们推断,司法实践中实际完成了测试的案件数量可能大大超过了裁判文书网所呈现出的案件数量。尽管这20 起官方媒体报道的错案,从信息来源角度讲已具有较高的公信力和可靠性,但为保证研究的严谨性,我们仍坚持以“国家赔偿”为确立错案的金标准,过滤掉2 起无法找到赔偿文书或具体赔偿信息的错案;④排除的两起案件:一是内蒙古张国祥故意杀人案,其在(2016)内刑终122 号二审刑事附带民事裁定书中表明,该案一审判决(2015)兴刑一初字第12 号采纳了测试技术形成的结论性意见,判定被告人张国祥犯故意杀人罪。但由于我们无法查找到一审判决书全文及赔偿文书而将该案排除;二是河南高铁钢故意杀人案虽有大量官媒报道,但因涉及案中案,且年代久远,无法查到判决书和国家赔偿书,而未纳入本次研究的范围。最终,这18 起官媒报道且证实获得国家赔偿的刑事错案,加上从裁判文书网直接检索到的1 起刑事赔偿错案,共19 起,构成我们此次刑事错案的研究样本(参见表1)。
表1 错案基本信息表 ①测试时间以文献记载进行测试时间为第一标准,拘留时间为第二标准。无罪时间以获取国家赔偿书为第一标准,司法机关审判认定为第二标准。具体年月日的精确以搜集的文献内容为准。其中湖北省钟祥投毒案、河北省李久明故意杀人案、安徽省王什彩故意杀人案虽然未找到相应裁判文书,但为社会影响力较大且公开报道的刑事错案。
1.案件类型、犯罪地区与测试对象
19 起错案包括13 起故意杀人罪、3 起投放危险物质罪、1 起强奸罪、1 起抢劫罪、1 起绑架罪,可见测试案件均涉及侵害人的生命健康权,呈现社会危害性强、犯罪行为隐蔽、实物证据少且言词证据占比大、证据证明标准高、侦查难度大的特征,需要测试技术辅助侦查破案。
19 起错案以案件审判地为标准,发生在四川1 起、河南3 起、云南1 起、浙江1 起、陕西2 起、湖北1 起、福建1 起、山东1 起、安徽6 起、河北2 起。案件具体发生地多为农村、偏僻的郊区及住宅,例如“浙江省张氏叔侄强奸杀人案”案件发生地为“杭州市西湖区留下镇留泗路东穆坞村路段僻静处”;“陕西省刘自龙绑架案”被害人尸体发现地为“神木县麻家塔乡红柳林村小喇嘛渠”,周围目击者少、客观证据提取困难。
19 起错案中,测试均针对犯罪嫌疑人,不涉及被害人和其他证人。其中,9 起嫌疑人即测试对象的职业为农民,受教育程度较低。在年龄结构上,“安徽省孙长娣故意杀人案”“安徽省巢湖虾笼少年故意杀人案”两起案件,还涉及对未成年人进行测试。
2.到案时间、测试时间与国家赔偿时间
19 起刑事错案的测试时间往往和宣告无罪时间间隔久远。其中,测试时间最早为1996 年安徽省刘明河故意杀人案,其在2001 年被无罪释放后获得国家赔偿。最晚为2013 年四川省孙兴富故意杀人案件,其在2014 年被重审无罪后获得国家赔偿。这些错案中,审判时间最晚的是河南省吴春红故意杀人案,其2004 年接受测试,2020 年无罪释放,获国家赔偿。整体而言,19 起错案测试时间集中在2006 年之前。
大部分案件的测试时间与嫌疑人到案时间联系密切。例如“四川省孙兴富故意杀人案”中,孙兴富被测试后未通过,立即被认定为犯罪嫌疑人;“安徽省巢湖虾笼少年故意杀人案”中,巢湖四少年测试后未通过,警方将其认定为犯罪嫌疑人。“河北省李久明故意杀人案”中,李久明被认定为嫌疑人后,主动配合警方进行测试。
任何技术的应用都有其适用范围和条件,这些条件能否落实或者说在司法实践中得到理性尊重和严格遵守,直接关乎技术应用的可靠性和准确性。测试技术的科学应用,离不开整个刑事司法体系所提供的理性应用大环境和状态,即应用生态。不幸的是,相比其他刑事技术,测试技术从引入我国刑事司法体系伊始,就不得不面对更为复杂和矛盾的应用环境:测试究竟是破案利器还是虚假科学、有效还是无效、合法还是非法的争论,不绝于耳。处在争议漩涡中的测试技术,要在迷信盲从和偏见质疑声中寻求提升可靠性和准确性的方法,实现经验探索、认识升华、知识验证的体系化过程,更为不易。对此,我们将借助测试技术在错案中的应用时机及其在案件证据体系中的地位和作用,略知一二。
1.测试多为高强度讯问的前置程序
19 起错案中,侦查机关多在测试对象未通过测试后,将其锁定为犯罪嫌疑人,对其展开高密度讯问。如“四川省宋兴富故意杀人案”中,被告被带到泸州进行测试,并在发现其有重大嫌疑的当天接受讯问。“河南省李晋飞等抢劫案”中,11 名重点嫌疑人被厂里安排的面包车送到南召县公安局指定的宾馆接受测试,随后李晋飞等人被锁定为作案人接受讯问;“陕西省柯长桂投毒故意杀人案”,在案发半年后,“公安机关通过测谎的方式排查出了犯罪嫌疑人柯某某”,随后对其讯问;“山东省任艳红投放危险物质案”案发15 天后,由于被告未通过测试,当天被讯问;“安徽省代克民故意杀人案”案发4 年后对代克民进行测试,因未通过而被讯问。这些案件中,未通过的测试结果在很大程度上都增强了讯问人员持续高强度讯问的内心确信,甚至成为侦查人员违法刑讯的诱因。
2.测试成为破解案件侦查僵局的兜底技术
错案中也存在嫌疑人被讯问后,侦查人员采用测试技术补强言词证据证明力的情况。如“河北省李久明故意杀人案”中,因无法查明嫌疑人供述真实性而进行测试;“河南省吴春红投毒故意杀人案”中,经商丘市中级人民法院三次一审,省高院三次以事实不清发还重审。律师日志记载:“由于案件三次发回重审,侦查机关弄了一个测谎”。①详见赵凯迪.三次死缓三次驳回,河南民权“投毒”案犯喊冤14 年获再审[N].新京报,2018-10-16. https://baijiahao.baidu.com/s?id=1614438450563147811&wfr=spider&for=pc,网站访问日期:2021 年6 月20 日。可见,实践中在无法借助其他刑事技术获取更有力犯罪证据的情况下,测试成为侦查人员证明犯罪事实的最后希望。
3.相互冲突的测试意见被选择性使用
在“河南省马廷新故意杀人案”中,公安机关对马廷新做了两次测试,且两次测试的结果恰好相反:第一次测试结论为通过,等于排除了马廷新的作案嫌疑;第二次由另一测试机构完成,但给出了不通过的结论。对此,侦查机关本应基于客观义务既收集有罪证据,也收集无罪证据,将两次相互冲突的测试结论性意见都附卷,避免带有主观偏向性地选择性使用。但遗憾的是,该案中侦查机关直接采信了第二次不通过的测试意见,认定测试对象为作案人[1]。
综上,从测试技术在案件中的应用时机来看,实践中测试技术在侦查过程中能否被应用、何时被应用以及能否证明案件实质性问题,并不取决于测试技术自身的适用条件和范围或者测试人员的专业意见。其很大程度上受案件侦查讯问和取证难易程度的影响,若讯问对象配合或者案件取证进展顺利,侦查机关多不会启用测试。测试技术之所以被侦查机关用于“攻坚克难”,不是因为相信和尊重测试技术的可靠性和准确性,而是怀着“死马当活马医”“用用试试看”的心态,将测试作为扭转侦查僵局的一种手段。
1. 测试意见所属的证据形式及审查标准混乱
19 起错案对应的裁判文书,对测试意见的证据形式表述存在很大差异,有的将其看作证人证言、当事人供述,有的又将其当作鉴定意见,还有的将其列为其他证据。不同种类的证据有不同的审查规则和切入点。比如对证人证言的审查,仅需考察其年龄、认知能力、作证时的生理和精神状态,以确保其能亲身感知案件事实;对鉴定意见的审查,更侧重审查所鉴定内容是否为法律领域之外的专门性问题、鉴定人及鉴定机构的鉴定资质,审核鉴定人作为专家证人是否具备某一专业领域的技术和知识。可见,测试意见所属的证据种类和证据形式若不明确,将不利于对其进行科学的审查判断,做出合理的排除或认定。
不仅如此,测试意见证据形式不明确,也会影响司法机关对该证据证明力的判断。比如,测试若作为鉴定意见,就应遵循“科学不讲完整故事”的规律,其对法律事实的证明作用往往只能是片段式的、间接的[2]。即测试意见可作为间接证据增强证据链的证明力,但不能视为像嫌疑人供述一样的直接证据。测试技术只能证明嫌疑人记忆中存在对犯罪现场的情景认知,无法直接证明嫌疑人就是凶手。但在“安徽省王什彩故意杀人案”①由于中国裁判文书网未能查找到“安徽省王什彩故意杀人案”相关文书,文章中涉及该案的细节来源为安徽网及其他官方媒体的报道。参见冯兰友.亳州农民“杀人犯”被羁押4 年多,三次上诉讨回清白[EB/OL].(2013-07-22).[2021-06-20]. http://www.ahwang.cn/p/1298758.html.中,侦查机关却不适当地将测试结论性意见作为了定案根据(此案定罪存在三份主要证据,分别是测试结论、作案工具和有罪供述)。由此可见,若测试意见证据形式不明确,极易被“工具化”运用,夸大其证明力。
2. 错案酿成源于测试与其他刑事技术的叠加作用
依照物证、书证、证人证言和被害人陈述、犯罪嫌疑人、被告人供述和辩解、鉴定意见、勘验检查辨认笔录、视听资料和电子数据的证据分类,我们对19 起错案终审判决书和赔偿书列明的存疑证据逐一进行了归类,从表2 我们可以看出,这些错案中存在问题的证据既有证人证言,被害人陈述,嫌疑人、被告人供述等言词证据,也有物证等实物证据。
表2 错案中存疑证据分类
从表3 中我们可以进一步看出,19 起错案在侦查过程中,除使用测试技术外,还涉及法医病理、DNA、痕迹、毒物、警犬鉴别等多种刑事技术或侦查鉴定,且案件在物证提取和鉴定方面都存在不同程度的问题,诸如应当DNA 鉴定的没有鉴定、鉴定取材以及送检程序不规范、鉴定内容不完整等。
表3 致错鉴定意见分类 ①表中鉴定意见的归纳以搜集的数据为基本参考,一些案件中也存在其他类型鉴定意见致错的情况,但由于相关数据难以证实,因此选择留白处理。鉴定意见分类依照中华人民共和国公安部令第十二条鉴定项目类别分类为标准。http://www.gov.cn/gongbao/content/2020/content_5483873.htm,网站访问日期:2021 年6 月22 日。
“四川省宋兴富故意杀人案”①宋兴富案测试内容来自刑事判决书:(2014)内刑初字第4 号;国家赔偿书:(2015)内法赔字第2 号。中,嫌疑人在隆昌公安局的传唤下被带到泸州进行测试后发现其有重大嫌疑。“第二十七项证据证人胡某某证言:测试结束后宋兴富没有和侦查人员交流,在从泸州回隆昌路上,他长叹一口气,说事情是他干的。回到隆昌公安局,他们依法对宋兴富进行了讯问,讯问中保障了宋兴富的正常睡眠。9 月13 日,宋兴富指认现场后,他们把宋兴富送到看守所关押。9 月14 日,由于看守所无条件进行同步录音录像,所以他们将宋兴富外提,但写的出所事由是指认。”最后法院认为:“当事人陈述合法性存在问题,侦查人员对其第一次、第二次讯问限制人身持续时间长达24 小时,并出现笔录雷同、没有同步录音的情况;当事人供述与尸体检验、现场勘查不吻合;凶器无法找到;被害人身上无法找到嫌疑人DNA 痕迹,且送检提取程序性有问题。”
在“浙江省张氏叔侄强奸杀人案”②浙江张氏叔侄故意杀人案内容来自判决书:(2013)浙刑再字第2 号;央视新闻《面对面》2013 年4 月7 日。中,“根据杭州市公安局2003 年6 月23 日作出的《法医学DNA 检验报告》,所提取的被害人王某8 个指甲末端检出混合DNA 谱带,可由死者王某和一名男性的DNA 谱带混合形成,排除张辉、张高平与王某混合形成。”公安机关提供的张辉首次有罪供述的审讯录像不完整,侦查人员在审讯时存在对嫌疑人不在规定羁押场所关押、审讯的情形。“再审认为,本案没有证明原审被告人张辉、张高平强奸杀人的客观性直接证据,间接证据极不完整,缺乏对主要案件事实的同一证明力,没有形成有效的证据链。重要的技术鉴定不能排除勾某某作案的可能。公安机关在侦查本案时,侦查程序不合法,相关侦查行为的一些方面确实存在不规范或个别侦查人员的行为存在不文明的情况,不能排除公安机关在侦查过程中有以非法方法获取证据的一些情形。本案定案的主要证据两原审被告人的有罪供述,依法不能作为定案的依据。”
在“安徽省代克民故意杀人案”[3]中,有罪判决的主要证据在于一把菜刀和口供。但被告人在侦查阶段、庭审时均翻供,供述之间矛盾之多,无客观证据相互印证,且根据被告人供述的作案凶器与侦查机关伤情鉴定的凶器推断不吻合。
在“安徽省于英生故意杀人案”[4]中,现场提取被害人内裤上的精液③参见贾鹏.于英生17 年洗出的清白[N/OL].新京报,2014-05-29[2021-06-20]. http://epaper.bjnews.com.cn/html/2014-05/29/content_514567.htm.并进行鉴定比对时,现场提取精液不是于英生的。在现场于英生家梳妆台的抽屉边缘提取到了两枚外来指纹,但这一重要证据却被有意隐瞒。
在“福建省念斌投放危险物质案”④福建省高级人民法院刑事附带民事判决书(2012)闽刑终字第10 号。中,本院认为:铝壶、高压锅的提取送检存在问题。现场勘验检查笔录记载的提取送检时间为“7 月28 日”,与检验鉴定委托书记载的“8 月9 日”相矛盾。侦查人员出庭说明系“8 月8 日傍晚”提取送检,与庭前说明提取送检时间是“8 月9 日”前后不一,而且现场照片、指认现场录像显示,8 月9 日晚现场厨房还存在相同的高压锅,此无法合理解释。
在“云南省杜培武故意杀人案”[5]中,泥土检测只能说明杜培武到过与作案现场土壤成分相同的地方,但不能证明其到达的就是案发现场,更不能证明就是在杀害的时间段内到达了案发现场或其周边。此外,该案在警犬鉴别、射击残留的火药鉴定等方面存在问题以及讯问人员刑讯逼供等,这些因素共同作用最终导致错案的酿成。
3. 测试在错案中的作用被片面夸大
对19 起错案涉及的问题证据进行分析,我们不难发现其源于多种证据的互相作用,致错因素不能简单归咎于测试技术。但对19 起错案的报道,媒体却更偏向于以“测谎”二字博人眼球。例如,大河报⑤新浪新闻转载大河报http://news.sina.com.cn/c/2001-08-12/326997.html,网站访问日期:2021 年6 月22 日。以《民警杜培武遭逼供“生不如死”,测谎仪撒谎成帮凶》为文章题目撰写;京华时报⑥人民网转载京华时报http://yuqing.people.com.cn/n/2014/0505/c210107-24975865.html,网站访问日期:2021年6月22日。以《安徽男子因测谎没过关蹲7 年冤狱,曾被连审20 昼夜》为题描写代克民案全过程;中安在线①民主与法制网转载中安在线http://www.mzyfz.com/cms/fazhixinwen/xinwenzhongxin/fazhijujiao/html/848/2013-07-22/content-814773-2.html,网站访问日期:2021 年6 月22 日。以《亳州农民莫名成杀人犯,测谎结果成“直接证据”》为标题记录王什彩羁押4 年到无罪释放的历程。北京青年报②央视国际转载北京青年报http://news.cctv.com/society/20070216/100606.shtml,网站访问日期:2021 年6 月22 日。以《测谎仪“揪出”假元凶,无罪男子两次被错判死缓》为标题叙述谭富义错判死缓经过。
我们以百度为搜索引擎,分别以19 起错案+“测谎”③检索方式依照百度标准检索指导进行,由于百度搜索依照以上方式仍然会出现某些不符合检索方式的内容(这是因为百度数据模型具有模糊性搜索设置),对于案件的检索数量可以体现出大众对于检索内容的关注度和检索内容的热度。为精准检索方式,逐一进行数据检索,得出每一起错案添加“测谎”和未添加“测谎”关键词时前后搜索数量的差异,从中我们选取了部分前后检索比例差异性较大的案件(见表4),直观地说明媒体对案件报道的偏向性。以代克民案件检索为例,仅以“代克民案”为关键词检索,获得相关结果为63 条;以“代克民案”+“测谎”为关键词检索,相关结果就猛增为5920 条(检索日期为2021 年6 月30 日),其社会关注度大幅度提升。可见,在侦查机关运用测试技术破案的报道中,媒体容易过度神化测试技术的作用;反过来,在冤假错案报道中,媒体又过分夸大其对错案的影响。
表4 错案百度检索数量对比表
一方面,测试技术在刑事司法中的应用大环境堪忧;另一方面,19 起错案表明测试技术自身在测试条件、测试方法、技术标准及测试意见的表述方式等方面,仍存在诸多问题。
多道心理生理测试与指纹鉴定等物证技术不同,后者是对物理痕迹的鉴定,具有稳定性,比如人的指纹,与生俱来且伴随到老。测试检测的对象是人,通常情况下人的心理结构也具有相对稳定性。但当人的认知能力不足、情绪状态不稳定甚至出现心理异常时,测试结果就难以准确客观。为此,我国刑事科学技术协会心理测试技术专业委员会于2013 年颁布的《多道仪测试技术指南》(以下简称《指南》)已对测试对象自愿测试原则、禁用条件、暂缓测试条件、年龄限制等做了详细规定。对精神疾病发作期、不完全缓解期或迁延期的;患有高血压、心脏病、神经疾病、哮喘等慢性疾病、可能影响测试通过治疗仍无法达到测试要求的;已怀孕妇女;14 周岁以下的未成年人等,规定均不得进行测试。年龄在18 周岁以下且已满14周岁的,一般不安排测试。确因需要,须经其法定监护人书面同意才能进行测试,并应在测试记录和报告中注明。
但在19 起错案中,我们发现,“安徽省孙长娣故意杀人案”④参见孙长娣2014 宿中法赔字第00001 号赔偿决定书。接受测试的少年未满16 周岁;“安徽省巢湖虾笼四少年故意杀人案”[6]155中,警方测试的对象有三名未成年,年龄最小仅为16 岁。这些针对未成年人的测试最终都未形成书面的测试报告,更不用说取得法定监护人书面同意和在测试记录和报告中注明了。
目前我国测试界对测试格式即问题刺激的有效性和准确性并未形成统一认识。有学者曾比较CCT 测试法(认知综合测试法)与CQT 测试法,发现运用CQT 测试法对排除无辜的准确率只有50%,CCT 测试达到80%。CQT 测试法对实施者测试的准确率为65%、对知情者测试的准确率为55%(图1)。
图1 两种测试方法准确率比较[7]
我国测试界也普遍认为,测试过程中若单一使用CQT 测试格式,其结论的准确性将难以保证。但19 起错案中,河北省李久明故意杀人案、安徽省刘明河故意杀人案、河南省吴春红投毒故意杀人案、安徽省巢湖四少年故意杀人案,所运用的测试方法均为单一的CQT 测试格式[6]43。
此外,测试技术的本质是借助生理参数检测人是否存在特殊的犯罪记忆。而与犯罪相关的记忆,可能不仅作案人有,案件发生时所有在场的知情人或事后为犯罪提供帮助的人可能都有。例如“陕西省刘自龙绑架案”中,刘自龙与死者为父子关系,死者生前与刘自龙有亲密接触,刘自龙因想与其前妻复婚,便有让表哥控制其儿子的想法,且在被害人失踪当日刘自龙与表哥通话8次。作为其子被害前最重要的关系人,刘自龙若记住其子被害前的若干细节实属正常,测试中的问题刺激若对此考虑不周,很容易使测试出现假阳性错误。
受所收集资料的限制,我们无法逐一查明19起错案中测试技术应用标准是否达标。但从现有资料显示的测试地点和时间上看,部分案件仍存在测试人员对测试技术标准选择性忽视的问题。如部分测试的地点在当地酒店,但对酒店条件是否满足测试环境标准并未予以说明。“河南省吴春红投毒故意杀人案”在证据不足、三次发回重审后,才进行测试。“陕西省柯长桂投毒杀人案”中,嫌疑人在案发半年后被带去测试。“安徽省代克民故意杀人案”中,嫌疑人在案发4 年后进行测试。测试技术是对测试对象是否存有犯罪记忆的检验,这些案发数年后的案件,不仅可能因为遗忘使测试对象产生记忆模糊和认知错误,即记忆信息的“漂白”;而且更可能因为案件物证缺乏而使测试对象提前接受过高强度讯问,造成记忆信息的“污染”,难以满足测试的技术标准。当然,此种情形下可进行“有偏测试”,但尽管测试行业将评估测试案件和测试对象的信息污染程度分为了五个等级,但具体如何进行每个等级的精准评估,对应的结果可靠性如何,至今测试行业内部都未形成统一规范的执行标准。
令人欣喜的是,2021 年全国刑事技术标准化技术委员会已颁布《多道心理生理测试通用技术规范》(GA/T544-2021)(以下简称《通用技术规范》)及《多道心理测试实验室建设规范》(GA/T1780-2021)两项行业标准,对测试环境和测试系统的参数设置进行了初步的标准化设计。比如《通用技术规范》,不仅规定了测试系统(传感器、主机及测试软件)进行气候环境性能实验和机械环境性能实验的技术标准,而且明确了测试系统正常工作的条件:环境温度:-10°C ~ 40°C;相对湿度:45% ~ 75%;大气压力:86 kPa ~ 106 kPa(645 mmHg ~ 795mmHg)。有关测试方法、操作规程和质量管控的另三项技术标准也正在加紧制定中。这些技术标准的确立是为保障测试技术应用的有效性和可靠性,在测试中应当予以严格遵守。
对于侦查阶段实施测试的数量与庭审阶段最终提交的测试报告数量极不相称的问题,我们已在另一篇文章中予以详细说明[8],在此不做赘述。19 起错案中,“四川省宋兴富故意杀人案”被告宋兴富在泸州曾接受测试,①在宋兴富案件刑事判决书中,心理测试内容多次以口供的形式出现。但测试不是以专门的报告而是夹杂在证人证言中,以只言片语的形式出现:证人唐某乙证言“宋兴富说警察让他喝了什么矿泉水,带他去测谎”;证人姜某说“公安还带他到泸州去做了测谎”。这些都说明,侦查机关虽然一直使用测试技术,但在审判阶段却极少提交正式的测试意见或报告,其测试程序和结果都处于不受司法审查的盲区。
任何一项鉴定最终会以鉴定意见的形式呈现,鉴定意见所呈现的内容当然也会影响其作为证据的可信度。指纹鉴定中,鉴定报告或意见不仅会列出案件基本情况、检验过程、分析说明、鉴定意见,还会附上特征比对图片,客观全面地向委托方说明整个鉴定过程及得出最终结论的理由。DNA 鉴定中也会列出基本情况、案件摘要、检验过程(一般采用文字、图片的形式)以及结论性意见,以便委托方查阅时清晰明了。19 起错案中,我们发现仅少部分测试报告在形式上同其他鉴定技术一样,详细地列出了基本情况、案件摘要、测试结果、测试格式和数据参数。但在测试报告规范性上存在很多问题:比如“河南省吴春红投毒杀人案”中,吴春红律师日志为我们呈现了该案中测试报告的部分内容:“四、测谎方法:对吴春红采用CQT 测试法(准绳问题测试法)进行测试。五、测谎过程:对吴春红设问(相关问题):‘王战胜家厨房里的药是不是你下的?’吴春红回答:‘不是。’六、测谎意见:经过对吴春红三遍测试,发现吴春红在相关问题的回答上有说谎反应。我们倾向认为:吴春红所称的‘王战胜家厨房里药不是我下的’系说谎。”②参见吴春红律师日志:http://www.xiyuanwang.net/html/cgal_1247_2085.html,网站访问日期:2021 年4 月22 日。此案中由于测试人员出具的测试报告缺乏更具说服力的生理数据对比,对测试结果以及格式的表述也过于概括和缺乏专业性,难免引发律师的误解,质疑测试的客观性和科学性。
1. 测试不应是讯问的附属品或前置程序
尽管自2004 年多道心理生理测试就已单列为一门独立的刑事技术,但与其他刑事技术相比,实践中其与侦查讯问有着更加紧密的联系。我们认为其中缘由可能有三:一是测试技术是所有刑事技术中唯一直接针对嫌疑人的技术(大多数刑事技术针对物证展开;法医精神病鉴定虽然针对人,但多为心理异常的人,而不是心理正常具备刑事责任能力的嫌疑人)。测试人员与测试对象之间这种特殊的面对面关系,更易使人联想到讯问人员与嫌疑人间的面对面关系。二是测试技术引入我国初期,曾作为打破嫌疑人沉默的道具,成功地帮助讯问人员获取了有罪供述,所以早期的测试人员往往就是负责讯问的一线侦查人员,而非专职技术人员。早期的测试培训追求“测审结合”的创新审讯方法,希望讯问人员“多一技傍身”,而非就此摆脱讯问“自立门户”。测试对于讯问人员而言,往往有着更为特殊的情感和吸引力。三是测试方法中的准绳测试格式,其提问方式与讯问人员的指控性问话也颇有几分相似。如前述“河南省吴春红投毒杀人案”采用准绳格式,相关问题为“王战胜家厨房里的药是不是你下的?”,若抛开参照问题(C)和中性问题(I)的编题规则,单看这个相关问题(R),其提问方式与讯问人员的问话几乎无异,难免让人误以为测试就是戴上生理传感器后的升级版讯问。
受此影响,普通公众甚至法官心目中,自然而然形成“测试与讯问相关”,甚至“测试与刑讯相关”的刻板印象。法官在审查判断证据时将测试报告作为“被告人供述”的一部分;媒体报道常将测试当作刑讯逼供的替罪羊。以致前述《民警杜培武遭逼供“生不如死”, 测谎仪撒谎成帮凶》《安徽男子因测谎没过关蹲7 年冤狱,曾被连审20 昼夜》类似的报道,延续至今。为此,我们应当从这19 起错案中汲取教训:明确测试作为一门独立刑事技术的自身价值,而不是讯问的附属品,测试意见应当作为鉴定意见,而不应作为嫌疑人供述或者普通的证人证言加以审查判断。将测试与讯问彻底分离,才能最终扭转公众将测试与刑讯关联的刻板印象,为测试技术的发展提供良好的应用生态。当然,我们也仍需要牢记,认定犯罪事实依靠的是证据链的完整性。一次测试和一份测试报告并不能还原整个犯罪过程和事实。侦查人员可以在分析测试意见的基础上,确定侦查方法或改变讯问技巧,但不能将测试意见当作讯问的一部分,甚至选择性地采信不利于讯问对象的测试意见,忽视有利于证明讯问对象无罪或罪轻的测试意见。
2. 测试结论性意见应体现其专业技术性
测试意见与讯问笔录最大的区别即测试所具有的专门性和意见性,这也决定了两种不同种类的证据在庭审质证环节具有完全不同的审查判断方式。详言之,测试意见的形成源于专门知识,这些专门知识独立于法律知识之外,所解决的问题是法官依据法律、经验、常识和逻辑无法判明的问题,由于这些问题影响了法官在案件审理过程中的认识能力,法官不得不交付有专门知识的人进行专门性活动。测试意见的出具就是典型的独立于诉讼之外的专门性活动:其需要专业人员借助专业设备即多道生理心理记录仪,基于心理学和神经科学中心理和生理相统一性原理,运用专业的刺激方法得到被测者客观可靠的生理图谱,再由测试人员运用自身的专业学识和经验形成最终的结论性意见。相比而言,讯问笔录的形成是典型的诉讼活动,讯问人员作为诉讼参与者所需要具备的知识和应遵守的规范主要是法律法规,而非法律之外的其他专门性知识。也正因此,庭审质证环节对讯问笔录真实性和可靠性的审查判断,不需要专家辅助人,属于法官依靠自身法律素养及逻辑常识就能独立完成的任务。与之不同,由于测试意见涉及设备、方法、原理、图谱分析的专业性,在庭审质证环节,法官需要专业测试人员的参与,解释和证明所运用的具体方法、操作过程和测试结果的可靠性与准确性。
然而,19 起错案中不仅鲜有测试人员出具书面的专门性意见,即便出具,其表达方式也没有科学地体现测试的专业性。仍以“河南省吴春红投毒杀人案”为例,其最后的结论性意见为:“经过对吴春红三遍测试,我们倾向认为:吴春红所称的‘王战胜家厨房里药不是我下的’系说谎。”显然,认定或排除被告人是否谎供或者说是否做出了如实供述,本就是侦查人员和法官事实和法律判断的职责范围,是法律分内之事,又如何能体现测试所解决问题的专门性?事实上,得出类似结论的测试意见近些年在民事诉讼领域也颇为常见,以致最高人民法院在2020 年8 月14 日发布的《关于人民法院民事诉讼中委托鉴定审查工作若干问题的规定》(法〔2020〕202 号)中明确否定测试的专业性,指出“测试技术对原被告进行谎言的审查判断,不属于法官需要借助其他科学知识所要解决的专门性问题。……以避免测试影响案件事实的认定和司法公正。”①该规定明确指出测试“不属于查明案件事实的专门性问题,人民法院不予委托鉴定”。
因此,将测试技术与侦查讯问完全分离,改变测试结论性意见不科学的表达方式,使其真正体现测试所解决问题的专门性,是测试技术获得法庭准入资格和法官认可的前提,也是测试技术体现其科学性的关键。②如何出具测试意见以体现其专业性问题,可参见笔者今年年初在另一篇文章中的论述。付凤.多道心理生理测试技术证据能力的纠缠与厘定——从2020 年司法部与最高法的规范冲突谈起[J].证据科学,2021(2):242-254.
1. 理顺刑事技术与司法鉴定的关系
实践中,部分不愿出具书面测试意见的测试人员仍认为,测试作为刑事技术,仅为后续侦查取证提供证据线索,但测试本身并不能成为鉴定意见,不能与DNA 鉴定、法医病理鉴定、痕迹鉴定等司法鉴定相提并论。对此,我们无法苟同,也认为其未能正确理解刑事技术和司法鉴定的关系。
作为一项刑事技术,测试不仅在2004 年成立了专业委员会,而且在公安部2005 年颁布的《公安机关鉴定机构登记管理办法》(以下简称《办法》)中作为公安机关可登记开展的鉴定项目之一;2020年修订后的《办法》保留了此项规定。③参见2005 年《公安机关鉴定机构登记管理办法》第12 条第七款 ;2020 年修订后的《公安机关鉴定机构登记管理办法》第12 条第(十)款。2015 年修正的《全国人民代表大会常务委员会关于司法鉴定管理问题的决定》(以下简称《决定》)第7条规定:“侦查机关根据侦查工作的需要设立的鉴定机构,不得面向社会接受委托从事司法鉴定业务”,确立了侦查机关内设鉴定机构从事司法鉴定的合法性与正当性。而且司法部《法医类司法鉴定执业分类规定》(司规〔2020〕3 号)(以下简称《执业分类规定》)也将多道心理生理测试归为法医类司法鉴定的一种。④参见《法医类司法鉴定执业分类规定》(司规〔2020〕3 号)第33 条。
当然,公安部刑事技术分类与司法部《执业分类规定》在测试的专业归类上略有差别,前者将测试称为“心理测试”,认为法医类鉴定与心理测试为平级关系,不是包含与被包含的关系。即法医类鉴定(包括法医临床、法医病理、法医人类学和法医精神病鉴定)在公安部的鉴定项目中序列号为“(一)”,心理测试序列号为“(十)”。而司法部《执业分类规定》将测试归为法医精神病鉴定的一种,其隶属于法医类司法鉴定。尽管对测试具体所属专业门类的认识有差别,但公安部和司法部都认同测试属于司法鉴定,而且司法部《执业分类规定》体现出对人大常委会《决定》的具体化。因此,依据《决定》《办法》和《执业分类规定》,测试属于侦查机关从事的鉴定项目之一,其形成的结论性意见理应属于鉴定意见。
2. 测试意见的证明力应为庭审质证的核心问题
任何一种鉴定,从鉴定客体或对象的获得,至原理、方法的使用,及具体的操作和结果的得出、意见的形成,都有各种出错的可能。测试意见也不例外,不具有预先证明的效力,必要时仍需要测试人员出庭作证,辅佐法官公正科学地评判测试意见。但当前我国刑事诉讼中,针对测试意见进行庭审质证的案件还非常少,且审查内容大多仅涉及测试意见的形式问题,如测试人员和测试机构的资质问题,侦查机关进行测试是否存在自侦自鉴的问题等。对此,我们特别赞同李学军教授的观点,认为庭审质证中围绕测试意见的审查判断,需要撇开单纯看有无资质证书等惯常表面做法,避免机械地纠结于其形式上是否合法的皮毛问题,而应切入本里从测试的具体方法、操作过程、测试图谱生成及评图意见形成层面,审查测试意见是否真实可靠即证明力问题,以及是否能实质性解决诉讼中争议的专门性问题[9]。
尽管从2004 年始,我国测试技术就从刑事科学技术协会中单列出来成立分会,有了独立稳定的学术交流阵地,并且从业人员也在逐年增多,学术研究成果日益丰富。但坦诚地讲,当前测试技术的研究仍呈现内部化和小众化特点,培训交流多局限于测试人员各自的小圈子,测试人员之间的分歧背后还伴随着师承关系、学源背景等力量的交织角逐,远未形成紧密的职业共同体。因此,我们需要从这些错案中汲取教训,借助行业平台和测试人员的集体智慧做好以下三方面的工作,真正促成测试技术原理方法的科学化、从业人员的专业化和技术标准的统一规范化。
1. 夯实测试原理和方法的基础性研究
对测试技术原理可靠性和方法准确性进行扎实地实证研究,是测试在法庭科学中保持技术生命力的根基和前提,是庭审质证环节测试意见能被法官采信的核心与关键,但这恰恰也是我国当前测试技术研究最薄弱、被质疑最多的环节。测试技术在司法实践中的科学应用与持续发展,离不开测试人员对测试结果准确性的科学分析,更需要通过基础性研究积累实验环境和真实案例中不同测试格式和编题方法灵敏度(表征假阳性错误)和特异性(表征假阴性错误)的数据,验证并解释测试结果的结构效度与标准效度、实验效度与生态效度的一致性与差异性。
2. 完善测试人员的学历教育与在职培训
尽管我国《公安机关鉴定机构等级管理办法》和《公安机关鉴定人登记管理办法》,都对测试技术规定了与法医鉴定、DNA 鉴定等相同级别的准入机制,但实践中测试人员的准入门槛设置仍不尽如人意。不难想象,如果测试人员没有接受严格的科学训练,仅通过一项考试获得了资格证便上手,将难以保证测试技术操作的可靠性。因此,我们需要建立系统科学的测试人员培养体系。目前,我国测试专业人才的培养大体包括学历教育与在职培训。学历教育方面,自1998 年中国人民公安大学设立犯罪心理测试技术专业方向后,甘肃政法大学也设立了测试技术专业硕士点,大部分公安院校和政法院校侦查专业也陆续将测试技术纳入专业课程中。我国测试技术的院校教育正逐步形成规模发展起来,但相比物证技术等其他刑事技术,我国测试技术在院校教育方面仍缺乏深入扎实的基础研究,也就难以为测试实践提供深厚的理论解释力。
在职培训方面,除同方神火、中科院心理测试工程中心等测试技术研发单位和企业,通过线下和线上等多种方式对初学者进行短期培训和学术研讨外,中国刑事科学技术协会测试分会每年也都会举办全国性的专业技能培训和学术研讨,培训内容多为测试专家们的案件分享和经验介绍,对初学者而言颇为受益;但由于内容缺少测试错案的反思和测试基础研究的拓展,对有一定经验的中高级测试人员的提升和帮助有限。相比而言,美国和日本实施测试的历史较长,所建立的测试培训体系也相对完备,其学员培训期间不仅要参加基本的笔试,还要完成一定量的临床实测。主测人员在职业生涯中的不同阶段需要接受不同类型的培训:基础阶段课程、专业类课程、高级课程、研究型课程、管理型课程,且每类课程的授课时间也有所区别[10]。为提升测试技术在我国应用和研究的品质,这些经验都值得我们借鉴。
3. 纠正公众对测试技术的偏见和夸大认知
前述错案分析已表明,当前测试在自身的学科和技术发展上虽不断突破,但并不意味着已获得了大众或社会的认可,加之媒体报道偏向以“测谎”“读心术”为噱头。每当出现冤假错案,媒体的放大效应就会使人们将注意力聚集到测试上,而忽视了案件中其他鉴定意见和证据存在的问题。因此,一方面,媒体报道应尊重测试所蕴含的心理生理学基础知识,正视其是基于人体皮肤电、呼吸、脉搏、血压等多种反应指标进行的生理检测,而不是仅仅关心它的用途和功能,夸大其“能测出人说话的真假”,视其为超乎现实的“幻术”。过度消费或神化了的测试,容易失去科学性的光辉,反而降低公众对该技术的接受性和信服度,影响律师、法官和其他法律职业者对该技术的认知和司法判断。另一方面,针对测试参与侦查实践,但司法人员却很少有机会真正了解测试技术原理的现状,测试行业专家也应齐心协力向社会公众特别是司法人员科普测试技术,客观地阐明该技术的基本原理和应用条件,借助技术研讨会、互联网媒体宣传、相关案件意见发表等多种方式,加强与外界沟通;通过与司法机关的交流互动,消除误解,还原测试技术自身的科学性和客观性。
本文以刑事错案为样本探讨了测试在侦查办案中的应用时机、证据形式和证明价值等方面的规律性问题,反思了这些司法教训背后存在的测试条件、程序、方法、技术标准等方面的共通性不足。19 起刑事错案虽算不上大样本研究,但样本选择严格遵循错案纠正与国家赔偿相结合的筛选标准,所选错案具有较大社会影响力和典型性。当然,由于本文是基于裁判文书的研究,无法窥探当年这些错案发生时有关测试技术应用的所有细节以及全貌,对测试技术实践中存在问题的解读也或有偏颇之处。但本文是从错案视角探讨测试技术科学性及纠错机制的首次尝试,若能为测试技术的错案研究提供些许基础性实证资料,已深感欣慰和庆幸。