□赵 娇,张德智
(中国刑事警察学院,辽宁 沈阳 110035)
博弈论用严谨的数学模型来解决冲突对抗情况下的最优决策问题,其最初广泛应用于经济领域,将博弈论应用到侦查过程中是近些年的事,并且收到了卓有的成效。其中,“囚徒的困境”作为博弈论的经典模型是“利益的二难选择”在侦查讯问活动中的基本运用,其解决的是侦查讯问过程中侦查人员与犯罪嫌疑人之间的行动选择问题。
1950年,数学家艾伯特·塔克给斯坦福大学心理学系学生做了一场有关博弈论的报告,由于听众缺乏博弈论的背景知识,塔克便巧妙地运用故事的形式介绍了自己所讲的内容,这样就产生了今天广为人知的二难推论故事。后来,塔克把它起名为“囚徒的困境”,最经典的模型如下:犯罪团伙的两个成员被逮捕,且被单独关押,因而不可能互相交换任何信息。警察没有足够的证据证明这两个人的罪行,初步打算以较小的罪名提起公诉,可能会判处两人各1年监禁。同时,警方许诺每人都可以以出卖同伙为条件谋求减轻自身的刑罚。如果其中一人作不利于同伙的证明,该人将被释放,而其同伙则将因主要罪行被判3年监禁,如果两个犯罪嫌疑人都作不利于对方的证明,那么二人都将被判2年监禁。两人都允许有一段考虑的时间,但在作出不可改变的决定之前,绝不可能知道对方的决定,两人也都被告知,另一人也有同样的待遇,因此每个犯罪嫌疑人都只关心自己的福利——自己服刑的时间最短。可能出现的情况如下表所示:
AB B拒绝与警方交易B供出对A不利的证据A拒绝与警方交易1年,1年3年,0年A供出对B不利的证据0年,3年2年,2年
图1:A、B支付矩阵
由上表可以看出,两个犯罪嫌疑人可以这样推理:“如果我作出不利于对方的供述,而对方拒绝与警方合作,那么我就可以被释放了;如果我作出不利于对方的供述,对方也这样做,那么我俩各坐2年牢,在这两种情况下,我作出供述都是有利的,而不论对方如何选择(其推理如下图所示)。[1]”关键在于,对方可能而且正要作出完全相同的结论。因此,双方都会作出与警方合作的决定,这个结果就是“那什均衡”(Nash Equilibrium)*“纳什均衡”指的是一种策略集合它虽然是单个人的最优策略所组成的,但并不是说这是一个总体最优的结果。在“囚徒的困境”中,每一方都会怀疑另一方会出卖自己以求自保,这是个人追求利己行为而导致的最终结局,对于每个人而言是理性的选择,但是,对于集体来说却是非理性的,这就是个人理性与集体理性的矛盾。,也称非合作博弈。
图2 A、B对支付可能性的推理
美国著名学者丹尼尔·塞德南和亚力克斯·斯戴尼总结了侦查讯问具有博弈性的三大特征:一是被讯问人与其他参与人之间的信息都互相不知道,被讯问人知道自己有罪或无罪的所有信息,但是,侦查人员并不知道这些信息,这需要通过讯问来核实。二是各参与人对“定案证据可获得性”的了解。定案证据的可获得性是指获取用以认定案件事实的证据的可能性。三是侦查人员出于理性的反应,通常怀疑被讯问人所声称的无辜,被讯问人对侦查人员已经掌握足够证据的声称也同样表示怀疑。[2]这三大特征说明了侦查讯问的博弈性,也正是理性决策者进行决策的三个特性。因此,侦查讯问便有了应用博弈论的前提条件,两位学者也因此将博弈论运用于侦查讯问当中。毕希茜教授在《侦查讯问中博弈原理探析》一文中从侦查讯问活动的本质出发,从另一个角度总结出侦查讯问所具有的三大博弈特性:即互动性、利益性和信息性。[3]侦查讯问活动是一种对抗性行为,其本身存在较强的利益冲突性,侦查人员和犯罪嫌疑人在言语、行为、心理等方面进行较量。讯问人员为了揭露犯罪,被讯问人为了隐瞒犯罪,双方的博弈行为直到被讯问方转变态度供述犯罪事实为止。
博弈论对参与人的基本假设是:人是理性的,理性的人在具体的策略选择时其基本的目的是使自己的利益达到最大。也即所谓的“两害相权取其轻,两利相权取其重”。它反映出大多数被讯问人员在面对侦查人员的讯问时所具有的趋利避害心理。
信息的可知性是进行博弈行为的基本条件,侦查讯问就是侦查人员与被讯问人在不断获得对方信息的基础之上进行相应决策的博弈过程。信息的不对称性是指侦查人员与被讯问人之间的信息不对称,以及被讯问人之间的信息不对称,这是侦查讯问得以进行有效博弈的基础,也是侦查讯问博弈的魅力所在。
在以上“囚徒的困境”模型分析当中,犯罪嫌疑人双方都未达成某种有约束力的契约或默契,双方是在非合作的情况下,为了自身的利益而进行决策。显然,如果犯罪嫌疑人双方曾达成攻守同盟,那么他们的最优策略将是“都拒绝与警方合作”。因此,侦查讯问中“囚徒的困境”的运用就要防止、打破犯罪嫌疑人之间的合作,促使犯罪嫌疑人达成“那什均衡”。所谓静态博弈,是指所有博弈方同时或可看作同时选择策略、采取行动的博弈。在静态博弈中,一方不可以根据另一方所做的策略选择来决定自己的策略。“囚徒的困境”中,两名犯罪嫌疑人被隔离在不同的房间进行讯问,他们之间没有信息交流,双方都不知道对方将会如何选择,这是一种静态博弈状态。
在侦查讯问中引入“囚徒的困境”模型来获取犯罪嫌疑人的口供,不仅要求其具有科学性,而且还要有法律的支撑和保障。“囚徒的困境”给出了一个重要的启示就是:要想使一种制度发生效力,就必须使所有参与方能够达成“纳什均衡”,否则这种制度便不能有效地运作并发挥作用。[4]因此,要从法律层面设立相应的“激励制度”,促使犯罪嫌疑人出于自私的天性积极地去相信招供所带来的利益,防止他们存有侥幸心理而试图通过拒供来逃脱法律的惩罚。同时,在侦查讯问的过程中也应注意对犯罪嫌疑人权利的保障,从而确保搜集口供的合法性与有效性。
讯问具有法律强制性。我国法律明确赋予侦查人员对犯罪嫌疑人进行讯问的权力,具有法律强制性。《刑事诉讼法》第116条规定:“讯问犯罪嫌疑人必须由人民检察院或者公安机关的侦查人员负责进行。”侦查讯问是侦查办案的基本活动之一,是刑事案件的必经法律程序。[5]讯问作为法定的侦查措施之一,其法律强制性主要表现在两个方面:一是外在强制性;所谓外在强制性是指外在可见的执行强制措施等强制手段,具有限制犯罪嫌疑人人身自由的强制力。二是内在强制性;所谓内在强制性是指不以被告人是否供述来定罪的强制力。即没有口供,其他证据确实充分并形成证据体系的,也可以对被告人进行定罪处罚。
作为指导我国刑事司法实践的基础理念,宽严相济的刑事政策强调“根据犯罪的具体情况,实行区别对待,做到该宽则宽,当严则严,宽严相济,罚当其罪,要正确把握宽与严的关系,切实做到宽严并用。[6]”认罪认罚从宽制度的推动和发展,是公正与效率、惩罚与教育、打击与保护的有力结合,深刻地体现了宽严相济刑事政策的核心价值。2016年11月“两高”“三部”出台的《关于在部分地区开展刑事案件认罪认罚从宽制度试点工作的办法》第8条规定:“在侦查的过程中,侦查机关应当告知犯罪嫌疑人享有的诉讼权利和认罪认罚可能导致的法律后果,听取犯罪嫌疑人及其辩护人或者值班律师的意见,犯罪嫌疑人自愿认罪认罚的,记录在案并附卷。…对拟移送审查起诉的案件,侦查机关应当在起诉意见书中写明犯罪嫌疑人自愿认罪认罚的情况”。因此,在侦查讯问阶段,侦查人员可以有充分的法律依据来对犯罪嫌疑人进行一定的说服教育和政策引导,促使犯罪嫌疑人主动交代犯罪事实,认罪认罚,从而争取从宽处罚的机会。
诉辩交易产生于美国,1975年美国《联邦刑事诉讼规则》第11条对诉辩交易的一般原则和程序作了明确的规定,诉辩交易从此正式成为美国的一项司法制度。“所谓诉辩交易,是指检察官和被告人或者辩护律师经过谈判和讨价还价来达成被告人认罪以换取较轻定罪或刑罚的协议。[7]”换句话说就是:如果被告人坦白认罪,就可以得到从轻处罚,如果被告人拒绝认罪,就可能会判处较重的刑罚。在当今各国,诉辩交易制度是广泛存在的。在刑事诉讼程序中引入诉辩交易制度,一方面可以使侦查人员多了一个在讯问中取得胜利的筹码,给了犯罪嫌疑人一定的利益驱动,从而提高了犯罪嫌疑人招供的可能性和积极性;另一方面在提高办案效率的同时也可以保护犯罪嫌疑人、被告人的诉讼权利。
侦查讯问中,分别讯问是制造信息不对称的重要方法。即使在被讯问之前犯罪嫌疑人之间曾有过协商或约定,只要分开讯问,他们不能获得另一方的信息,犯罪嫌疑人就会很难相信同案犯罪嫌疑人会继续有能力和意志与侦查人员进行对抗,反而会担心他人会先行交代,从而使他们之间的攻守同盟逐渐弱化,甚至消退。侦查人员可以在法律允许的范围内,限制犯罪嫌疑人互相交流信息,使犯罪嫌疑人对讯问人员的讯问意图、掌握证据的程度、讯问力量的配备、取得口供的信心以及对同案犯的供述情况等形成错觉,减弱犯罪嫌疑人的防御和抵抗。与此同时,侦查人员可以根据具体情况巧妙地设计出合理的方案或布局,制造出“囚徒的困境”,引导犯罪嫌疑人理性地进行利弊权衡,促使其做出通过揭发同伙或主动交代自己的罪行来争取从宽处理的决定。
犯罪嫌疑人一开始并不都会作出如实供述,而是会不失时机地避重就轻、不做如实供述,甚至编造谎言欺骗侦查人员。所以,对侦查人员来说,如何拆穿犯罪嫌疑人的谎言,打破其心理防线,就成为设计讯问策略的关键。拆穿谎言的方法主要包含以下几种:
一是进行重复讯问。心理学家指出,人说谎时会比不说谎时更认真,但是认真的状态很难一直持续下去。再者,编造的口供不是犯罪嫌疑人亲身体验过的,往往记忆不深刻,或是编造不具体、不全面。因此,在讯问中侦查人员如果对犯罪嫌疑人的回答有疑问或者怀疑其说谎,等过一段时间后再重复问同一个问题或类似问题,如果犯罪嫌疑人说谎,那么他将会在重复讯问中露出破绽。重复讯问并不是简单的重复讯问几遍,而是需要有一定的时间空白、叙事顺序,通常采取以下几种办法进行重复讯问:一是间歇重复讯问;对要核实的同一事实,在讯问后过一段时间再突然提出讯问。二是变向重复讯问;对要核实的同一事实,从不同的角度,用不同的问题重复讯问。三是分散重复讯问;对要核实的同一事实,拆散成若干具体问题,夹杂在其他事实中重复讯问。[8]
二是从口误中寻找突破口。尽管说谎者的“说谎水平”不一,但说谎时出现心理、生理异常通常是说谎者本身无法克服的。由于心理、生理状态的异常,在回答问题时说谎者难免会出现口误。因此,侦查人员要重视犯罪嫌疑人在供述中出现的口误,并对口误紧追不放,深追细问,寻根究底,从而打破犯罪嫌疑人的心理防线。
三是观察利用微表情。著名的心理学家西格蒙德·佛洛伊德曾说:“任何人都无法保守他内心的秘密。即使他的嘴巴保持沉默,但他的指尖可谓淋漓尽致地道出了身体语言在人与人的交流中所发挥出的不可小觑的力量。”这说明了微表情在解读人的内心情感方面发挥着不容忽视的作用。一个人在遇到外界刺激时的瞬间常常会出现一些细微的表情,这些反应是很难被掩饰和伪装的。当一个人说谎的时候会做出的一些下意识的动作,这是由于说谎人情绪上的波动而引起的。所以尽管每个人都是天生的表演家,但其身体语言仍在反映着撒谎时的信号。作为侦查讯问人员,要研究微表情、利用微表情,抓住犯罪嫌疑人不经意的瞬间流露,揭穿谎言。
四是应用心理检测技术。“心理检测技术是由主测人依据心理痕迹动态分析,用认知综合检测法编题,依序对被测人提问并唤起心理活动,使用Polygraph软硬件记录其心理生理反应,据此检验测评被测人与事件相关度、甄别心理事实的心理实验技术。[9]”相关研究成果表明,人的心理活动和生理活动是密切相关的,一个人在说谎时会产生一定的心理压力,而这些心理压力又会引起一系列生理反应,如心跳加速、血压增高、掌心出汗、呼吸速度异常等等,由于这些生理反应是受人体植物神经系统控制的,所以它们不受人的主观意志的制约,只要结合具体的问题,分析检测到这些生理参量,即可以对其心理进行分析,从而判明其是否说谎。
李双其教授认为:“讯问中的“纳什均衡”,从侦查方角度可以简单理解为侦查方与被讯问方在对抗审讯中,为了让被讯问方交代犯罪事实或其他问题,根据各个犯罪嫌疑人的特点与案情变化所提出的协议或策略。[10]”犯罪嫌疑人的心理会随着讯问的深入而不断变化,侦查人员要根据讯问情势以及犯罪嫌疑人心理的变化来制造“纳什均衡”,促使其进行利益权衡。犯罪嫌疑人因“犯罪嫌疑”被侦查方讯问,这是犯罪嫌疑人对自己可能“丧失利益”的基本认识,但是可能丧失多大的利益还是未知的。因此,侦查人员可以根据信息不对称的优势提出方案制造有效的“纳什均衡”点,帮助犯罪嫌疑人设置一个“小利益”和“大利益”,让犯罪嫌疑人自己选择,在权衡利弊之后,只要犯罪嫌疑人做出选择,其必然会做出“丢卒保车”的决定,从而供述罪行。
自讯问活动产生以来,侦查讯问的方法可分为两大类型:一类是生理强制的方法,另一类是心理矫治的方法。生理强制的方法,操作简便,收效快捷,科技含量低,任何不懂讯问技巧的人都能够操作。但是,随着社会文明的发展和法制的进步,生理强制的方法被人权保障的法律制度所禁止。心理矫治的方法所包含的范围较为广泛,笔者主要从法律和道德情感教育方面来进行论述。
首先,从法律层面而言,要帮助犯罪嫌疑人建立趋利避害的平台。心理矫治的方法是以犯罪嫌疑人人性趋利避害的行为特征和犯罪行为记忆的心理反应,来获取犯罪的证据信息,犯罪嫌疑人隐瞒犯罪的心理依据,是以利益、条件和心理支点为基础的。[11]基于此,讯问人员可以通过法律教育的方法,改变犯罪嫌疑人获取利益的方向,为其搭建趋利避害的平台,从心理上拆除犯罪嫌疑人的对抗条件,从而动摇或者消除其对抗的心理支点。如刑事诉讼法第118条第2款规定:“侦查人员在讯问犯罪嫌疑人的时候,应该告知犯罪嫌疑人如实供述自己的罪行可以从宽处理的法律规定。”促使犯罪嫌疑人产生“供述有利,能够获得从宽、从轻处罚的利益,对抗不利,对抗只能加重自己的心理负担”这样的供述动机。
其次,从道德情感方面而言,要帮助犯罪嫌疑人弄清是非界限,进而认罪悔罪。对犯罪嫌疑人供述驱力的研究表明,被试者“期望得到从宽处理”而选择供述的占92.7%、“想获得内心平静”而选择供述的占83.1%、“受良心谴责,后悔自己的所作所为”而选择供述的占74.9%。[12]所以,讯问过程中在对犯罪嫌疑人进行法律教育的同时,要抓住犯罪嫌疑人的内心需要,对其进行一定的道德、情感教育,做到以理服人,以情动人,情理交融,使犯罪嫌疑人认识到自己行为的社会危害性,唤醒其内心的良知和理性,从而转变其思想和态度,消除其抗审的心理,最终做出如实供述自己罪行的决定。
侦查讯问的一切策略和方法,都是围绕如何让犯罪嫌疑人自愿、如实地供述而展开的。犯罪嫌疑人之所以对抗讯问而隐瞒犯罪事实,首先是建立在一定的利益基础之上,侦查讯问中,由于犯罪行为的应受惩罚性,犯罪嫌疑人供述犯罪事实就意味着将会受到惩罚、利益受到损失,所以犯罪嫌疑人认识到这种后果时就会选择对抗。如果犯罪嫌疑人的供述能够给他带来利益,甚至这种利益要超过对抗的利益,那么犯罪嫌疑人就可能自愿供述。其次,犯罪嫌疑人的对抗是建立在一定的对抗条件之上的,如果堵住犯罪嫌疑人的退路,使其失去对抗的条件,那么犯罪嫌疑人继续对抗也就失去了意义,进而就会放弃对抗,选择供述。最后,犯罪嫌疑人对抗也是建立在一定的道德观念之上的,如果犯罪嫌疑人认识到自己的行为触犯了一定的道德、法律规范,并产生了悔过、悔罪的想法,他就可能会如实地供述犯罪事实,以此来求得心理安慰。[13]侦查讯问活动中对“囚徒的困境”的应用,正是从制造利益的选择、阻断犯罪嫌疑人对抗的条件、利用法律和道德来唤醒犯罪嫌疑人内心的良知来消除其对抗心理等方面来实现讯问的目的。侦查讯问活动具有博弈性,讯问策略的运用也有博弈论的根据,运用“囚徒的困境”进行的讯问策略构思具有一定合理性和实用性。
【参考文献】
[1]威廉姆·庞德斯.囚徒的困境:冯·诺依曼、博弈论和原子弹之谜[M].吴鹤龄,译.北京:北京理工大学出版社.2005:189.
[2]Daniel.J. Seidmann,Alex Stein .The Right to Silence Helps the Innocent:A Game-Theoretic Analysis of the Fifth Amendment Privilege[J].Harvard Law Review,2000(114):442-443.
[3]毕希茜.侦查讯问中博弈原理探析[J].铁道警官高等专科学校学报,2008(4):65-68.
[4]禹超,张竞旋.浅谈侦查讯问中“囚徒困境”的分析与运用[J].贵州警官职业学院学报,2011(5):62-66.
[5]魏鹏.侦查讯问[M].北京:中国政法大学出版社,2003:1-3.
[6]最高人民法院印发《关于贯彻宽严相济形势政策的若干意见》的通知[EB/OL].(2010-02-22).最高人民法院网,http://www.court.gov.cn/fabu-xiangqing-174.html.
[7]吕金胜.论坦白制度[D].兰州:兰州大学,2004:36-37.
[8]周军.侦查讯问理论与实践研究[M].北京:群众出版社,2008:223.
[9]武伯欣.心理检测技术概论[M].北京:中国人民公安大学出版社,2017:2-3.
[10]李双其.审讯中侦查人员与犯罪嫌疑人的合作:基于合作博弈的认识[J].山东警察学院学报,2016(3):97-104.
[11]吴克利.吴克利讲讯问[M].北京:中国监察出版社,2014:19-20.
[12]赵桂芬.供述心理与讯问对策解密[M].北京:中国人民公安大学出版社,2009:153-154.
[13]吴克利.自愿供述的侦查讯问攻略[J].中国检察官,2012(8):61-64.