高振悦
(天津大学 法学院,天津 300072)
1.大数据侦查的定义
大数据侦查一词并非我国《刑事诉讼法》中的既有概念,也不同于我国现有的侦查措施。大数据侦查是大数据时代纵深发展的产物,是侦查阶段出现的新型技术密集型的侦查措施——侦查机关可以通过一系列数据技术手段如数据搜索挖掘、数据对比分析以及数据共享等追溯已发生案件的犯罪嫌疑人,收集并固定犯罪证据或者预测可能发生的犯罪行为的侦查行为,是数据时代侦查措施革新的必然结果,其在提高刑事案件侦破效率和提高犯罪防控精准度方面功不可没。
2.大数据侦查的特征
(1)侦查范围扩大。与传统侦查措施相比,大数据侦查的犯罪行为空间由原来的线下实体空间转为线下实体空间与线上虚拟空间,侦查机关的排查范围也由原来的实体空间扩展到包括虚拟空间在内的侦查空间。大数据侦查是数据时代犯罪形态发展的必然产物,是适应侦查机关侦破虚拟空间犯罪的应然之举,也为原来实体空间犯罪侦查提供了新的侦查手段和破案思路。传统数据侦查的范围主要是侦查机关实地考察发现的线索或者向有关单位或个人调取的相关证据,而大数据侦查的数据分析来源更广,是与案件相关数据的全样本,这也意味着大数据侦查手段涵盖范围包括相关性证据和其他证据。
(2)侦查对象为数据。不同于《刑事诉讼法》中规定的搜查对象限于人的身体、物品、住所及其他有形物,大数据侦查的对象是通过数据技术手段处理的海量数据,数据是通过电子或者其他方式存储的信息,是信息存储介质。
(3)侦查手段技术性、隐蔽性。与大数据侦查最接近的概念是技术侦查措施,但也存在根本性不同。2012年《刑事诉讼法》新增的技术侦查措施一节及公安部《公安机关办理刑事案件程序规定》对技术侦查措施的内涵和外延都没有进行清晰界定,但根据对技术侦查措施的范围列举可以发现技术侦查措施的本质是监控,具有同步性和即时性,是对监控数据的初次利用和直接利用。而大数据侦查手段对存储的海量数据的记录与分析往往通过技术手段就可以完成,同样地上述监控的数据信息也包含在大数据侦查的数据源中,而且可以对既往监控数据进行二次利用,如分析整合或对犯罪数据进行对比分析进行未来犯罪行为的预测,具有更强的技术性且对于数据的利用更为隐蔽,不易发觉。
大数据侦查虽不同于传统侦查措施,属于侦查措施的新兴产物,但也应符合刑事程序正当化原则的要求,遵循侦查权正当运行的界限。大数据侦查对传统侦查措施的侦查合法性原则、侦查比例性原则和侦查秘密性原则适用带来了新的挑战,尤其是大数据侦查较强的技术性和隐蔽性特征使其天然符合侦查秘密性原则,但是也可能出现与侦查秘密性原则设立初衷背道而驰的情况。
具体而言,为防止犯罪嫌疑人知晓侦查情况采取阻碍证人作证、畏罪逃匿或制造舆论压力等方式阻碍诉讼顺利进行,侦查活动一般秘密进行,其内容原则上不对外公开,任何人均不得介入侦查活动,但另一方面为了适度保障当事人及相关人的知情权、被侦查人的有效辩护权和获得程序性救济的权利而进行适度公开,因此侦查秘密原则的“不公开”宜理解为相对不公开和暂时不公开。而大数据侦查手段的技术性和隐蔽性加剧了侦查的不公开,且发展为一种绝对性、全程性不公开。这也使得侦查行为不具有可预见性和可评估性,一方面不利于当事人诉讼权利保障,另一方面也可能出现无辜第三方个人数据被收集利用而全然不知的情况。
1.法条依据。大数据侦查的对象为数据,且包含所收集到的数据的全样本。根据《数据安全法》第三条对数据的定义,数据是信息的记录方式,是信息的载体。在此大多学者将数据直接等同于信息,数据主体享有的权利直接等同于个人信息权益,笔者不能完全赞同,认为将其划归为数据权利更为适宜。个人信息权益与数据权利和隐私权的消极、防御性不同,是一种积极、抵御性的权利。而个人信息权益主要关注的是公民个人等私主体,基本不涉及其他政府机关或者其他国家机关;数据权利主要关注以数据形式存储的信息,但是基于数据存储容量的指数级增长,这些信息背后关涉的数据主体不仅仅限于个人,有可能牵涉到国家利益。但个人信息权益涵盖的只是以数据形式存储的个人信息,不能延至国家。因而,数据权利主体可分为私主体的个人数据权利和国家数据权利,权利客体是数据,是以数字化形式收集、存储、利用的全样本化的信息集合。同样,对于私主体的个人数据处理可以参考对个人信息的处理方式。《个人信息保护法》第七条明确处理个人信息时应坚持公开处理原则,保障信息处理的明确公开性、准确性和安全保障性。并在35条进一步明确国家机关应履行告知义务。《网络安全法》第41条以及《民法典》第1035条第二款也明确要求个人信息公开处理的规则。数据作为信息的记录方式同时也应遵循公开处理原则,即意味着大数据侦查中侦查机关坚持公开处理原则,保障公民的知情权和数据权利,履行明确告知数据主体对其个人数据利用的目的、方式、范围和程度的义务。
2.法理依据。根据宪法相关权利和精神,数据公开处理原则是保障公民知情权的要求,是尊重和保障人权、维护个人尊严和自由的精神要旨。大数据时代纵深发展,大数据侦查手段秘密性和隐蔽性的特征使得公民个人数据的搜集方式更为多样,搜集范围更加广泛;数据的对比分析和整合归纳更加易于操作,使公民的数据信息完全暴露于“真空”状态,成为数据时代的透明人。现行法律中并没有对公民数据权利利用公开原则进行明确保护,对个人信息权益的保护也不能涵盖所有数据权利,我们应间接适用宪法,保障公民在数据侦查中对个人数据利用情况的知情权,保障公民在“知情被监查”情况下自由生活的权利和尊严。
数据时代纵深推进,公民的个人信息越来越多地通过数字化形式进行储存、使用,形成个性化的数据。对于个人数据的获取、存储、收集、利用的主体范围也不断扩大。侦查部门在大数据侦查行为中,也属于数据利用的主体。而大数据侦查措施在传统侦查措施秘密性的基础上将相对、有限度地秘密上升到了绝对的不公开程度,便利公安机关截获关键线索抓捕嫌疑人的同时也带来侦查权扩张给数据所涉主体知情权和数据权利利用的冲突和矛盾问题。
数据收集的数据源首先是公安部门内部系统的数据——自2016年以来,各省通过智慧政府及金盾工程等项目,建设了相对全面、完善、科学的数据资源平台并通过技术手段不断完善。以某省公安系统为例,统筹打造了全省一体化的公安数据云中心,其数据内容包含日常工作的业务数据、政府、企业共享的动态数据、互联网公开发布的数据。数据涵盖执法办案、旅馆住宿、交通管理、社保、卫生、医疗、教育及网络大众媒体的IP地址等,通过数据挖掘技术可以对公民的基本信息、行动轨迹、生产生活方式进行立体化、多维度的复原,与现实人和物进行对应和关联,形成公民在数据平台丰满的人物形象与“数据身份证”且实现系统内部的数据共享。
为搜寻案件线索,锁定犯罪嫌疑人,争取破案时间,公安机关运用大数据侦查措施具有目的正当性,但是大数据侦查的技术性和绝对秘密性使其无法明确告知处理目的。如利用大数据侦查手段锁定地铁扒窃人员,需要对地铁人员的行动轨迹进行挖掘分析,形成一定范围内的流动人员轨迹图,将固定规律长途的成员轨迹进行排除,找出轨迹形成不规律、上下车频繁的人员进行人脸识别和身份比对,进行人脸比对分析时可能会将嫌疑人的范围进一步扩大。这种大数据侦查措施锁定扒手的过程,进行轨迹分析确实能够提高破案效率,减少人力蹲守、轮岗的人工成本,但也把除扒手以外无辜人员牵扯进来,这些人员甚至并不清楚出于侦查破案,自己的行程轨迹、身份、人脸等信息已经被刑事化利用,这显然不符合公开处理原则下明确告知处理目的的要求。另一方面,基于预防犯罪的处理分析目的,大数据侦查措施通过全面分析犯罪人的信息能够预测未来犯罪行为的行为模式和行为对象。这也意味着大数据侦查措施要对犯罪者的全部犯罪行为和个人信息进行深度整合和分析,将现有犯罪人员进行分析可以理解,但收集处理的数据范围并不排除已经弃恶从良、改邪归正的犯罪人员,这是否在一定程度上将上述人员固定化界定为“坏人”,从根本上否定上述人员具有从良的可能性或者在一定程度上暗示着有可能变坏的人有了一定的轨迹和借鉴参考资料。基于上述处理目的,无论是对已经被确定为犯罪者的人还是潜在“犯罪者”出现都有一定的风险,正当性依据基础薄弱。
1.公安机关内部数据平台。公安机关收集公民生物信息一方面来自法律对公安机关的授权,另一方面通过向第三方平台进行调取证据。《刑事诉讼法》第 132 条对人身检查的规定,可以提取公民的指纹等生物信息,这是传统侦查措施中需要犯罪嫌疑人、被害人等当事人亲临现场才能够完成指纹等生物信息的收集和录入工作;《居民身份证法》第3条也对指纹信息的收集权限和目的进行了规定。《个人信息保护法》第 26 条也对公安机关收集人脸等生物信息进行了授权。上述收集指纹等生物信息一般而言是一种一次性的行为。
而数据化时代,公安机关基于如获取当事人生物状态或者身份证换领等正当化目的进行人身检查或生物信息录入工作时,一次收集上网便能够收录在公安办公网中,在第一次收集生物信息时的目的具有正当性,但是公安机关运用大数据侦查措施在数据平台对上述指纹信息进行数据挖掘和分析,所运用的信息不乏与案件侦破目标无关的公民信息,将平台已经收录的其他公民数据信息进行整合与定性指向,对上述信息在其他方面的处理和利用已经游荡于公开处理原则所能允许的最大边界上。此时,对于数据信息的处理已远超出最初收集时的范围,可是公民对此并不明确,而且技术性工作进行调取和比对工作轻而易举,更具快捷性和隐蔽性。那么,在这种效率化工作模式中又该如何兼顾公开处理原则,保障相关数据信息主体的权利是我们需要思考的重要问题。
2.第三方平台数据调取。另一方面,公安机关运用大数据侦查措施时可以调取第三方平台机构存储的数据信息。《数据安全法》第三十五条规定公安机关为侦查犯罪调取证据时履行严格手续后有关机关组织和个人应当配合。而根据《公安机关办理刑事案件程序规定》第57—59条以及《公安机关执法细则(第三版)》(以下简称《执法细则》)规定,侦查实践中,侦查机关调取行为的对象主要为实物证据,对于调取海量数据行为并没有明确的法律规定,只能参照适用。根据工信部要求第三方APP平台收集公民个人数据信息时,需要通过签署授权许可明确告知公民收集信息的范围及相应保密义务。公民对于数据平台授权的范围仅限于其与数据平台双方之间,虽有类似的“基于正当化目的或者公共利益使用公民个人信息,不构成侵权”,那么即使权利人通过软件信息收集清单可以知悉个人信息被收集情况,但并不能知悉其可能被用于刑事侦查的情况。且公安机关运用大数据侦查措施调取的海量数据是对数据的全样本进行全部调取,该样本量中必然包含大量无关的案件信息和数据权利人的信息,是否能够满足“与犯罪事实有关的证据”的调取数据的前提条件?大数据侦查绝对秘密性和强技术性背景下,侦查机关对于大数据侦查措施中对数据的利用事情和利用范围程度并不会向第三方平台报告,而更不会向权利人报告,在相当程度上公民并不知情更谈不上经过数据权利主体对大数据侦查获取、使用行为的质疑与反对。当然如果要求侦查机关对海量数据涉及的每一个数据权利人都进行告知说明,也显然有些强人所难,难以施行。这时,基于三方关系为侦破刑事案件对公民数据平台上的数据信息进行大数据侦查措施的分析处理、挖掘利用时如何履行告知程序和保障公开利用规则仍是需要探究的问题。
大数据侦查秘密性原则下如何保障大规模数据的存储完好、利用正当,与数据的保密性处理,防止数据泄露、盗取仍存在冲突。近年来,公安机关在不断完善大数据安全防护体系建设,强化安全管理平台设施和基础建设,对网络数据的调取传输等采用实时监测、自动报警系统进行规制,但仍存在不同程度的数据安全问题,以电子形式存储的个人信息即数据仍面临着泄露的风险,如“高速摸胸门”事件,上述事件反映的更多是数据时代背景下对于“监控”方式记录的数据的泄露,无疑该监控或者侦查行为已经渗透到公民的隐私权领域。作为消极防御性权利可以通过行政处罚、民事赔偿方式进行救济。而较于大数据侦查措施下公民对本该公开告知的数据毫不知情甚至出现数据泄露不知情、无法认领的局面,难以得到相应的救济与赔偿。对于秘密侦查下处理个人数据时的保密工作以及泄露时的责任承担与救济制度相应的保障也是侦查秘密性原则与公开处理原则冲突的表现之一。
对于政府大数据适用中面临的“权力与权利”的冲突,以美国和德国为代表基于各自国情提出了不同的规范方法——美国的“数据隐私权理论”和德国的“数据自决权理论”。
1.美国数据隐私权理论。美国的数据隐私权理论历经 1972 年 Whalen v. Roe 案中将政府对数据的收集、存储和利用划归为隐私权、1974 年《隐私法》对政府行政部门利用数据时保护个人隐私进行立法、1967 年 Katz v. United States 案中明确隐私保护的标准为“对隐私的合理期待”、 1976 UnitedStates v. Miller 案和 1979 年 Smith v.Maryland 案中最终确立了公开同意原则——如果数据信息是公民个人主动暴露的,且数据接受方同意与他人(包括政府)共享信息,此时暴露的数据将失去法律和宪法对其的隐私性保护,在没有特殊法律或者合同约定时数据二次使用不被限制。该学说主要聚焦于政府获取该数据行为是否合法,而不考虑数据二次利用的行为合法性。因此,美国的数据挖掘、分析处理等大数据侦查行为基本不受约束。
2.德国数据自决权理论。德国的数据自决权理论的演变主要从联邦宪法法院在 1983 年的“人口普查法案”中,提出“数据自决权”概念——并在《基本法》中进行定性,其属于宪法保护的一般人格权范畴,功能是对抗国家的不当干预。同时数据自决权在合法性、比例性的前提下受到“重大公共利益”的限制适用、《德国联邦数据保护法》从公权力和私权力两主体上对政府收集、适用数据进行规范和限制,且对公权力主体进行数据处理的要求比私主体更加严格。因此在德国数据自决权理论下政府大数据利用要遵循严格的基本权利干预的程序要求,更强调数据利用目的的正当性,更加注重对公民数据权利的保护。
3.我国“公共利益豁免”理论。借鉴上述两国代表性数据利用政策理论基础,我国结合数据时代大数据措施秘密性和要求保障知情权、数据权利确立了我国公共利益豁免理论。
我国对个人信息权益和数据安全保护等方面进行了一系列立法,如从2021年1月1日起施行的《民法典》、2021年6月10日通过的《数据安全法》到2021年8月20日通过的《个人信息保护法》,立法速度不断加快、法律对数据利用暴露的权力与权利问题不断回应与整治。《民法典》第 1036 条对处理个人信息的免责情形进行了规定,第一、二款主要是借鉴美国公民公开视为同意原则的规定,第三款主要结合德国重大利益对信息自决权理论的限制形成我国的“公共利益”免责条款。将“公共利益或合法利益豁免”作为数据知情权保障和数据权利保护的例外。并在《个人信息保护法》13条中细化公共利益豁免的具体情形,明确了知情同意规则和公开处理规则,保障公民知情权,契合大数据时代平衡侦查权和数据权利冲突的需要。在数据利用过程中,保障原数据主体初次收集时的知情权相对简单,数据公开处理原则也能够很好贯彻,但大数据侦查措施主要是对数据的二次利用,对数据的深度、复杂利用且随着技术手段的开发,数据利用深度也随之加强,若伴随着每一次大数据侦查中的数据挖掘、分析处理工作的明确告知,着实费事费力,而且考虑到数据样本的全面性,同意告知原则的适用必定举步维艰。利用公共利益豁免免责可以一定程度上缓解上述困境。大数据侦查运用的相关技术手段是出于维护社会秩序和利益的目的,履行法定职责或法定义务的要求,可以在未告知同意规则下处理个人数据,公民的知情权和数据权利也应受到侦查权的限制。因此,基于维护社会秩序目的进行大数据秘密侦查措施可以一定程度上限制公开处理规则的适用。
但另一方面,预测性的大数据侦查仍需让位于公开处理规则。2022年6月22日审议通过的《关于构建数据基础制度更好发挥数据要素作用的意见》中指出要构建数据产权制度,推进公共数据、企业数据、个人数据分类分级确权授权适用,健全数据要素权益保护制度。根据文件要旨,侦查机关或者企业等数据存储主体对于所收集的数据信息应当进行分类分级存储,一方面便于公安机关在数据调取时对全样本数据中私密级别更高的数据经授权同意后进行调取;即使在向第三方数据平台调取的过程中,也可以在数据属性理解偏差时,限制大数据侦查措施共享第三方数据的程度;另一方面规范第三方平台无限制收集归入个人隐私权界限的数据,减少公民对收集范围不明晰且难以举证侵权而无法获得救济赔偿的现象。但是对数据的分类分级认定也面临着标准认定的问题。一般而言,数据与数据之间的特质存在显著差异,如公民的指纹、人脸、身份证、通讯地址等很明显数据授权级别较高的数据;但是有些数据的分类并不容易界定,如网上浏览痕迹、视频监控等。
大数据侦查将秘密性发展到绝对的高度,越是这样的情况,我们越需要保障数据的真实性和准确性,克服数据自身的限制性和歧视性。美国的predpol是政府进行犯罪数据侦查的一款软件,利用大数据侦查技术进行犯罪数据的挖掘与分析,可以得出犯罪率高发的人群和地址,但是数据自身具有歧视性,会将这类人群更多地偏向黑人区,也会因数据偏差导致抓捕到并没有任何不良犯罪记录的公民。同样的,在美国银行借贷系统未打破将低收入人群排除在贷款人群之外的怪圈,之后FICO评分模型仅将借贷信用和个人资产作为评价的标准,一定程度上减少了其他类型的数字杀伤武器对征信系统的破坏。因此,无论是基于对犯罪预测软件还是银行评分系统模型的前车之鉴,我们首先就要确保大数据措施的应用前提的数据源的真实性和准确性。即在数据公开利用中,除明确告知处理的目的、方式和范围外,还应当赋予公民对个人数据的查询权和更正权,避免激发预测性大数据侦查的秘密性背后的破坏性和杀伤性潜力。
数据时代的步伐愈走愈快,大数据侦查是侦查措施发展的应然之物,理应勇于面对数据技术手段背后的法律困境。“权力与权利”的斗争与平衡是法律终身协调的事业。大数据侦查秘密性背后的侦查权扩张与数据公开利用的知情权与数据权保护的冲突,并非不可调和。数据立法、数据分类分级制度构建紧随其后,将收集、调取的数据源进行秘密级别、授权级别定性,基于处理目的在划定的数据范围内进行正当化、保密性利用。通过公共利益正当化原则进行隐私数据收集、调取和分析;在预测性大数据侦查中坚持数据处理公开原则至上,确保数据信息源的真实性和准确性。