钟明曦
(福建警察学院 法律系,福建 福州 350007)
当前移动互联网、大数据在各个领域的应用呈快速发展趋势,公安机关提出要向科技要警力,把大数据作为“公安工作创新发展的大引擎、培育战斗力生成的新增长点”的发展方向,“大力实施公安大数据战略,全面推动公安工作质量变革、效率变革、动力变革,努力实现公安机关战斗力的跨越式发展”①参见2018年1月24日公安部党委书记、部长赵克志在全国公安厅局长会议上的讲话。。刑侦实践表明,利用大数据技术开展侦查工作成为当前刑事侦查发展的趋势,如何运用大数据侦查中获得的证据材料,即大数据证据,逐渐成为一个显性的问题。
大数据侦查及大数据证据都是新兴事物,大数据证据是否能够成为诉讼证据必须纳入现行证据法理论中进行考量。所有证据都应当具备证据能力和证明力,大数据证据的证据能力要解决“取证主体合法、取证手段合法、证据形式合法”三大问题;对大数据证据证明力的分析要解决其“真实性”以及与案件事实之间的“相关性”问题。本文将围绕这两大问题对大数据证据效力展开探讨。
所谓大数据侦查是指侦查机关为了查明犯罪事实,运用大数据技术实施的相关侦查行为。大数据侦查行为是否合法是判断大数据证据之证据能力的一个重要方面。由于互联网及大数据技术的兴起,当前大数据侦查行为在实践中呈扩张趋势,需要在现行刑事程序法框架下,厘清大数据侦査行为的法律属性。
当前大数据在侦查中的应用主要有下列两种方法:(1)大数据搜索法。即利用大数据强大的搜索功能,通过公安机关内部数据或者社会面数据对犯罪案件中的行为人、被害人以及其他相关线索、证据材料进行搜索,从而查询、收集、提取与案件有关的证据材料。(2)大数据挖掘法。大数据挖掘是大数据的核心技术,是指在数据搜索、集合的基础上,利用计算机数据分析工具在海量数据中构建数据模型,发现数据间关系,从而探查和分析大量数据中隐藏的有意义、有价值的信息的过程[1]。
大数据挖掘技术有多样化的呈现,主要有:(1)大数据碰撞法。就是在两个或两上以上的数据库中,输入相关数据,运用计算机相关软件进行碰撞、比对,然后对重合数据、交叉数据进行分析,通过对这些重合、交叉数据的深度分析发现案件线索、证据材料,锁定嫌疑人。网上摸排、网上追逃、网上串并、网上控赃等侦查措施,以及以大数据为依托的DNA技术,都以“数据碰撞”方式进行侦查。(2)大数据画像法。在犯罪侦查中,数据画像是指通过大数据分析方法,将犯罪行为人或者相关人员的身份、行为特征、兴趣爱好、人际关系等情况以数据形式表现出来,刻画出分析对象的数据全貌,为犯罪侦查指引方向。在大数据画像技术下,犯罪嫌疑人会成为透明人,其身份信息、行为轨迹、消费习惯、经济状况,家庭关系、兴趣爱好、人际关系等特征一般会完整地展现出来。(3)犯罪网络关系分析。指通过大数据技术,利用犯罪分子的话单数据、即时通讯数据、社交网络数据等对犯罪活动中涉案成员的相互连接、分工合作关系进行分析。这些大数据分析技术对恐怖犯罪、黑社会性质的有组织犯罪案件的侦查具有重要的意义[2]。
经过对大数据侦查方法的分析,我们可以认为,大数据侦查不是一种单纯的侦查行为,而是一种侦查理念,不同性质的大数据侦查行为取得的证据效力不同。
侦查理论上认为,任意侦查指不用强制手段,不对有关人员的重要权益强制性地造成损害,而由侦查相对方同意并自愿配合的侦查行为[3];任意侦查不受法律保留原则的约束,也就是说对于任意侦查,即使法律没有明文规定其种类、程序等,原则上也可以采取适当的方式进行。一些大数据侦查行为由于不具有强制性以及对公民权益的损害程度较小,应当认为属于任意侦查行为,虽然法律没有授权性规定,侦查手段仍属合法,取得的证据材料可以作为诉讼证据。以大数据搜索为例,其是最基础的大数据侦查行为,按照数据来源的不同,大数据搜索可以分为数据库搜索、互联网数据搜索等。其中数据库搜索主要是依托公安机关已有的各种信息数据库进行的搜索行为,如全国基本人口信息数据库、全国被盗抢车辆数据库、前科人员数据库、全国失踪人员数据库等。公安机关自有数据库属于公民为配合社会管理自愿提供的数据,这种利用公安机关自有数据信息进行搜索的行为可以纳入任意侦查行为的范畴,由公安机关根据内部权限划分侦查人员在个案中可以搜索的范围和内容。互联网搜索是指将开放的海量互联网数据作为侦查资源进行搜索,如政府、企业平台的基础信息及开放的第三方网络平台发布的信息,发布平台的开放性使得使用人理应知悉其信息会被不特定第三方所知悉或收集,其发布或提交的行为应视为对相关信息的隐私权放弃,而推知其符合任意侦查“自愿”与“同意”的主观标准[4]。因此,对互联网数据的搜索可以认为是任意侦查行为,虽然法律没有明确规定为侦查措施,但仍然可以合法实施,取得的大数据证据合法有效。
与任意侦查行为相反,强制侦查是可能侵犯公民重要权益且具有强制力的侦查行为。强制侦查措施历来是法律规制的重点,其种类、程序必须由法律明确规定。具有强制性且深刻影响公民权益的大数据侦查行为应当纳入强制侦查的范畴。仍以大数据搜索为例,互联网搜索中对社会行业数据库中金融数据库、物流企业数据库、互联网企业数据库的搜索,例如侦查机关搜索阿里巴巴的用户购物数据,会影响到公民的隐私等权益,因为公民个人在这些社会行业数据库中的信息不是公开的,公民对此类信息享有合理的隐私期待。故此类搜索行为应被视为强制侦查行为,应纳入程序规制的范畴。侦查人员在依法办理调取证据的手续后,才能对相关数据进行搜索和分析,取得的大数据证据才合法有效。大数据技术在侦查中的其他深层次运用,如数据碰撞、犯罪网络关系分析,更有可能侵害他人的隐私权等合法权益,“作为看不见摸不着的计算机虚拟技术,大数据挖掘技术会成为事实上的强迫行为,即以现代高科技信息技术强行去获取被侦查人员及相关人员私密信息,并在打击犯罪的正当目的下,迫使相关人员私密信息被获取的结果合法化。”[5]这些大数据侦查行为应当纳入强制侦查的范畴,以法律限制其滥用。
根据大数据技术在侦查中运用的步骤、方式的不同,在现行刑事诉讼法的框架下,可以将大数据强制侦查行为定性为不同侦查措施。
1.调取证据。如前所述,侦查机关要收集、搜索、分析社会行业大数据,首先应当办理“调取证据”的相关法律手续。大型互联网公司往往掌握海量个人数据,典型代表如百度、腾讯、阿里巴巴等,他们持有的海量数据往往隐藏着大量涉案证据,刑事侦查中必须充分利用互联网公司的数据,发现犯罪电子痕迹,有效打击犯罪。
2.鉴定。近年来,公安机关信息化工程建设成效显著,已经建立了指掌纹数据库、DNA数据库、枪弹痕迹与种类数据库、在逃人员数据库等诸多不同的数据样本库,便于刑事技术人员对提取的痕迹进行自动查询比对,在刑事鉴定中发挥了重要作用。大数据挖掘技术在刑事鉴定中的运用主要表现为大数据碰撞技术,但由于技术上仍不够成熟,目前办案实践在将指纹或人像等样本入库碰撞比对后,仍然需要将样本与比对到的指纹、人像等数据进行传统的鉴定。但应当承认,这种大数据碰撞是鉴定的基础工作,属于鉴定工作的一部分。
事实上,大数据碰撞比对技术进行的刑事技术鉴定工作原理与传统鉴定工作原理是基本一致的。随着现代痕迹检验技术数据化程度的不断提高,将痕迹检验技术与计算机技术结合起来,积极探索新的检验办法,引进新的技术,以大数据碰撞技术实施的刑事鉴定有望独立成为诉讼证据,可以在碰撞比对完毕后,通过自动办公软件或者是专业系统软件直接快速准确地出具痕迹检验鉴定文书[6]。
3.技术侦查。大数据挖掘技术在侦查中的深度运用,如对通信基站数据进行分析获取嫌疑人的行动轨迹、对涉案车辆的定位和碰撞、大数据画像技术、犯罪网络关系分析等侦查措施因为法律属性不明确,虽然在侦查破案中发挥了重要作用,却无法在诉讼中发挥证明作用。有学者认为可以将其纳入技术侦查的范畴,“这类大数据挖掘技术对于个人数据之获取、挖掘、使用等诸多环节均具有浓厚的强制色彩,从技术含量与实施的隐秘程度看,与技术侦查措施都有共同特点。”[7]一旦纳入技术侦查的范畴,这类大数据侦查行为就要受刑事诉讼法所规定的技术侦查的程序制约,经过严格的审批程序才能适用,以平衡犯罪侦查与公民信息自主权之间的冲突和矛盾。
强制侦查法定主义是侦查理论的核心原则,只有明确大数据侦查行为的法律属性,依照法定的条件和程序开展大数据强制侦查行为,取得的大数据证据才具备证据能力。
根据对上述大数据技术在侦查中运用的分析,笔者认为,大数据证据是指为查明案件事实,在诉讼中运用大数据技术对海量数据进行分析后得到的能够证明案件事实的大数据分析结果。大数据证据应当包含三层含义:一是海量数据集合,包括公安机关自有的大数据和来自互联网的社会面大数据;二是大数据分析技术,如数据搜索技术、数据挖掘技术;三是大数据分析结果,如车辆轨迹碰撞结果、人像比对结果等等[8]。证据理论上一般要求,证据应当具备法定的证据形式,属于某一法定证据种类,才有资格成为诉讼证据。大数据证据也必须放到现行法定证据种类的框架下进行考量。
根据大数据分析结果的不同表现形式及其发挥证明作用的机理,大数据证据可以纳入以下法定证据种类。
1.电子数据。即大数据侦查取得的信息数据本身。犯罪行为人在实施犯罪时,可能在虚拟空间留下各种电磁信息痕迹。例如,通过搜索嫌疑人的手机,如某个APP应用,掌握其案发前后与犯罪行为相关的活动轨迹,监控视频中记录的嫌疑人的行踪,社交软件的聊天内容,电子邮件数据等,这种大数据搜索技术获得的数据仍然是“电子数据”这种证据形式。有学者将这种大数据证据称为“原生证据”,这些原生数据往往淹没在海量的日常数据中,侦查人员需要采取数据搜索、查询等方法去找到与案件相关的那一小部分原生数据,这一过程中,所获取的这部分数据仍然保持了其产生时的原始状态,大数据仅仅是一种技术、一种手段,并没有改变数据的原本形态[9]。
2.鉴定意见。如前所述,大数据碰撞技术应用于刑事鉴定产生的分析结果,应当属于鉴定意见的一部分。当然,由于技术上的原因,大数据碰撞比对的结果目前只能作为进行传统鉴定的辅助工作,例如,人像比对技术近一年多以来基于技术上的改进,比对的成功率才有所提高,实践中,比对后仍然需要进行人工筛选,在犯罪嫌疑人不认罪的情况下,往往需要把监控画面中的嫌疑男子与犯罪嫌疑人照片等交由有鉴定资质的机构做人像比对鉴定,以传统鉴定意见的形式出现在证据体系中。随着数字技术的进步,可以展望不久的将来大数据碰撞比对结果可以直接作为鉴定意见使用。
大数据画像技术、犯罪网络关系分析技术取得的分析结果目前只能作为侦查线索使用,这些大数据分析结果无法纳入某一法定证据种类,或者说立法尚未授予其法定的证据地位。可以肯定的是这种大数据分析结果不是“电子数据”本身,有学者称其为“衍生证据”,即它是对与案件或犯罪嫌疑人相关的原始数据进行二次挖掘分析后所得的数据,这类数据往往能够反映案件或犯罪嫌疑人的某些深层次特征,在这一过程中,大数据技术改变了数据的原始形态,获取的是建立在海量数据基础之上的新的数据,是不同于原始的“电子数据”的一种新的证据形式。
从法律发展史上看,每一次信息革命,都将带来证据制度的变革,立法总是滞后的,正如2012年刑事诉讼立法才确立“电子数据”的证据地位一样,事实上在2012年之前相当长的一段时间里,在司法实践中已经将电子数据视为合法的诉讼证据以发挥其证明价值。立法的滞后造成的负面影响在网络犯罪案件的侦查中尤为明显,如在福建沿海的电信诈骗案件中犯罪嫌疑人具有很强的反侦查意识,他们往往使用外置U盘或者储存卡实施诈骗,在抓捕前一刻很容易马上砸碎或者冲到马桶里,抹掉所有犯罪痕迹。如果对这些案件的前期侦查中获得的大数据证据不具有合法的证据资格,对此类犯罪的打击将十分困难。随着大数据技术的成熟以及大数据分析结果在侦查中发挥日益重要的作用,立法应当赋予其诉讼证据的地位。
上述对大数据侦查行为的合法性分析、大数据证据种类的分析解决的是大数据证据的证据能力问题。大数据证据的证明力问题则涉及大数据的真实性和相关性判断[10],即大数据证据应当真实可靠且与案件事实具有逻辑上的联系,能够证明案件事实的成立或者不成立。侦查实务中,大量大数据分析结果与案件事实之间不存在相关性或者相关性很弱,比如在毒品犯罪案件的侦查中,大数据碰撞表明犯罪嫌疑人手机号码漫游至涉毒重点区域,这是一个大数据分析结果,但该分析结果与贩毒案件事实之间的相关性比较弱,一般只能作为侦查线索。原则上,大数据证据证明力的大小一般应当交由司法裁判者自由裁量,证据法不作限制性的规定[11]。但是,在大数据证据证明力的分析中,需要特别注意以下三个问题:
大数据分析技术是对全样本复杂数据进行大规模分析后,对事件之间相关性做出量化评价的一种技术,它建立在算法模型的基础之上,这种分析并非逻辑意义上的论证、推理。舍恩伯格在《大数据时代》中有一个著名的论断:“知道‘是什么’就够了,没必要知道‘为什么’。”大数据时代人们更关注数据之间的相关性而非因果性,大数据颠覆了人类长久以来的因果关系思维,大数据能够快速告诉我们事物之间的相关关系是什么,却无法解释背后的原因。比如数据挖掘中的“关联性分析技术”可以发现不同数据项之间的关系,“能够将一些隐含的、甚至常理无法理解的关系找出来”[12]。
但在司法证明中,仅知道“是什么”而不知道“为什么”显然是不够的。司法证明过程是作为个体的认识主体认识把握客观事实的过程,必须充分尊重人的理性能力[13]。英国著名证据法学家威廉·特文宁曾指出,现代意义上的司法证明是一种理性主义的证明[14]。它要求证据与案件事实之间的关系能够为人类理性所认识。裁判者的“心证”是建立在理性基础之上,即裁判者必须能够认识到“证据”与“事实”之间的逻辑关系,这种逻辑判断建立在情理推断或者经验上。
由此可见,司法证明者在取得大数据分析结果后,应当进一步从逻辑意义上去解释其中的因果关系,这种解释应符合逻辑和人的经验,能够为人类理性所理解和接受,才能作为诉讼证据。“在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究因果关系,找出背后的‘为什么’。”[15]对于无法解释因果关系的大数据分析结果,由于无法被人类理性所认识,应当认为其不具备诉讼证据的真实性,不能作为诉讼证据。“大数据时代将颠覆诉讼证明原理”的观点值得商榷,法律领域如果都放弃对因果性的追求,人类理性还有存在的空间吗?
一般来说,证据的证明力要交给事实判断者自由判断,但是电子数据由于其高科技性,法官对电子数据的认识水平有限,所以立法规定“鉴定或检验”是审查判断电子数据的方式之一。《最高人民法院关于适用〈中华人民共和国刑事诉讼法〉的解释》第93条规定:“对电子邮件、电子数据交换、网上聊天记录、博客、微博客、手机短信、电子签名、域名等电子数据,应当着重审查以下内容:……对电子数据有疑问的,应当进行鉴定或检验。”最高人民法院、最高人民检察院、公安部《关于办理网络犯罪案件适用刑事诉讼程序若干问题的意见》第18条规定:“对电子数据涉及的专门性问题难以确定的,由司法鉴定机构出具鉴定意见,或者由公安部指定的机构出具检验报告。”
上述规定虽然是针对“电子数据”的审查判断出台的规定,但同样可以适用于大数据。基于大数据技术的专业性,大数据分析结果更需要专业人员的鉴定与检验,通过进一步说明“大数据技术是否成熟”“是否为业内公认的技术手段”“大数据挖掘过程是否符合行业规范”等,协助事实裁判者审查和判断大数据证据的证明力。
大数据画像是大数据挖掘技术在侦查中一项重要运用。大数据画像涉及犯罪嫌疑人的性格特征、行为偏好,人际关系等方向的信息,在证据法理论上,这些内容属于品格证据。理论上一般认为品格证据由于缺乏与案件事实的关联性而不具有证明力。我国现行与品格证据相关的立法主要是未成年人案件办理中关于社会调查报告的相关规定,根据《最高人民法院关于适用〈中华人民共和国刑事诉讼法〉的解释》第484条的规定,未成年被告人的“品格证据”仅仅可以作为“法庭教育和量刑的参考”,也就是说在未成年人案件的审理中,品格证据也不能作为诉讼证据。当前大数据画像分析结果也只能作为侦查线索。将来随着我国证据规则的不断丰富和完善,我们或许可以参照域外的品格证据规则来确定这类大数据证据的效力,即品格证据一般不能用作认定被告人有罪的证据,但例外情况下可以适用①关于品格证据的域外立法例比较典型的如美国《联邦证据法》第四章“相关性及其限制”中的规则404、405、607、608、609。。
有人类活动的地方必有纠纷,在当前网络交往的社会生活模式下,大数据证据必将登上诉讼证据的历史舞台,否认大数据证据的诉讼价值,违背社会发展规律。大数据证据在刑事诉讼中要发挥证明价值主要要解决三个方面的问题:一是大数据侦查行为的合法性问题,应当进一步研究大数据侦查行为的法律属性;二是大数据证据的证据种类问题,应当发展新的大数据证据形式;三是大数据证据的证明力问题。本文在现行刑事诉讼法的制度框架内,以刑事证据基本理论为出发点,梳理了上述问题。作为新生事物,大数据证据在刑事诉讼中的运用还面临许多未解的法律问题,对这个课题的研究涉及法学、计算机科学以及侦查学等学科。对大数据运用涉及的法律问题开展研究顺应了时代的呼唤,也与国家治理的科学化与法治化一脉相承,本文抛砖引玉,希望未来对该课题的研究能有突破性的进展。