董少平, 左喻文杰
(中南财经政法大学 刑事司法学院,武汉 430073)
目前侦查学界对大数据侦查的多数定义集中于技术维度,“大数据侦查”作为科技进步与侦查实践共同作用产生的新生事物,尚未形成权威统一的法律话语。概念界定视角的单一,会制约人们对某一概念的认知程度和原创性理解及综述性理解的水平。随着大数据侦查在实务中的广泛运用,加之法律规制必须首先明确其定义的需要,笔者认为,应当从多维度理解和界定大数据侦查。
大数据侦查由“大数据”与“侦查”两个名词组成。大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据与小数据不同的是,大数据是基于互联网及媒体平台的海量数据痕迹,利用数据管理及存储技术的革新,以普适计算模式为驱动,突破了传统数据利用的限制性,使数据收集的广度几乎达到样本即全体的数量级别。大数据具体包括不同数据来源的结构化数据、半结构化数据和非结构化数据。据此,可以将大数据侦查界定为借助现代数据技术进行采集、存储、利用,可以反复进行价值挖掘的结构化、半结构化数据以及混合结构的数字化数据而进行的侦查活动。
从价值维度界定大数据侦查的涵义应当将其置于国家治理与社会治理的视角下,置于公安管理与侦查职能的约束下,注重其对国家、社会以及公民产生的积极意义和对生产生活产生的颠覆性影响上。据此,大数据侦查可以定义为国家公权力机关及工作人员,特别是公安机关的侦查人员,针对已发生或尚未发生的犯罪行为,为了查明犯罪事实、打击犯罪所采取的一切以大数据技术为核心的相关侦查行为。
从系统的观念来看,大数据侦查主要是指包括大数据侦查思维、大数据侦查模式、大数据侦查方法、大数据侦查机制等内容的一个完整体系[1]。
大数据侦查思维主要是指公安机关在侦查工作中,能够灵活运用大数据收集与分析技术,合理使用大数据应用工具,从而通过挖掘数据价值为获取犯罪线索和侦查情报信息而提供帮助的一种新的侦查思维。大数据侦查思维是大数据侦查模式的先导,与大数据侦查方法相互作用,同时也是大数据侦查机制的重要基石。
大数据侦查模式是指在大数据侦查思维的指导下,在大数据技术支撑的基础上,建立在对长期以来的侦查实践过程中大数据对侦查行为内部各要素结构关系的作用和对大数据在打击犯罪中的具体实现路径的正确认识基础上而形成的较为科学、稳定、有序的以犯罪数据化与侦查数据化为主要内容的规律关系。
大数据侦查方法是指在大数据侦查思维的影响下,综合运用大数据、云计算等技术而采取的一切侦查破案、查明犯罪证据的手段与方式。其具体包括犯罪的数据挖掘方法、分类整理与关联整合的方法、规范储存与高效查询的方法、依法移送与报送及调度的方法、数据比对分析的方法,以及在大数据侦查实践过程中涉及的社会问题、伦理与法律问题的解决方法。
大数据侦查机制主要是指在侦查活动的各个环节中大数据发挥作用的传导路径,其既有事前进行的预侦查机制,也有具体的实施机制,还包括事后监督机制和基础的保障机制。就侦查实践来看,主要分为犯罪监控机制、犯罪侦破机制和犯罪预测机制等。
大数据在侦查活动中的运用逐渐广泛而普遍,把握好大数据对于侦查各方面的深刻影响,有针对性地分析大数据侦查亟待解决的问题,既是更好发挥其应有价值的必然要求,也是对其有效进行法律规制的必要前提。
维克托·迈尔-舍恩伯格①前瞻性地指出,大数据开启了重大的时代转型,其集中体现在三个部分,即思维变革、商业变革和管理变革[2]。其中,关于大数据引发思维变革的三个重要论断对当前的侦查理论极具启发意义。
1.不是随机样本,而是全体数据——样本即总体的全数据模式。
大数据是建立在尽可能多的数据积累基础之上的,在任何微观层面,都能用大数据去论证新的假设。这种全数据模式在侦查理论中映射为大数据侦查的整体性思维,即全景式侦查。
全景式侦查主要是采用海量的数据信息,对刑事犯罪的各个构成要素进行细致全面的搜索、排查、分析的一种情报信息主导型侦查模式,突破了传统侦查模式的部分局限性,主要体现在对侦查路径的再塑,对侦查思维的变革。全景式侦查强调从大量数据挖掘与积累出发,尽可能详尽地获取犯罪人和被害人等刑事案件相关人身份有关的数据信息;掌握与犯罪时间、地点、人数、工具、作案过程等相关的细节信息;通过电信、网络等数据资料收集犯罪前预谋过程的有关信息数据;通过广泛发动人民群众收集可疑迹象等相关数据信息等。传统侦查活动与统计学中的“用尽可能少的数据来证实尽可能重大的发现”这一目的类似,与其相比,全景式侦查的侦查思路根本上不同于以往的以有限信息做出相关推测再进行排查与核实的传统侦查路径,大数据侦查以“海量数据—相关信息—侦查情报/犯罪线索”的新路径对传统侦查进行再塑造,极大地突破了时空的限制,将侦查范围扩大到全景域,将侦查破案交给大数据。
2.不是因果关系,而是相关关系——侦查的相关性思维。
根据大数据观,在大数据时代要注重先发现相关关系,再研究因果关系,并且相关关系往往能够明确地指向因果关系。这种在相关关系的基础上找到因果关系的思维在侦查理论中映射为大数据侦查的相关性思维。
传统侦查是以逻辑推理与类比归纳为主要溯因原理的侦查,在数量极其有限,反映内容较为模糊的粗放型线索的基础上,侦查人员凭借各自的专业知识和破案经验,在不同的认知水平影响下,投入极大的精力和财力,通过思考、讨论、实验等手段推测案情[3],初步构建起“犯罪—线索—侦查”的因果关系链,在这种情况下,由于侦查人员的生理机能不同,认知水平与心理素质不同,生活经历和积累的经验不同,推测时心理状态的稳定性难以保证,推测方法的科学性也难以确定,推测必然存在误差且难以测量,最终导致侦查不可避免地带有主观性,破案的成功与否带有较强的运气成分。
而大数据侦查的核心是算法侦查,由于计算机不同于人的意识,不具备自觉选择性和主动创造性,因此人为设置因果关系条件加以限制,其产出的计算结果具有不可预见性和无法证实性,同时让计算机去分析因果关系是一种为难算法的行为,更是增加不必要的工作成本的行为,因此大数据侦查不以因果关系为出发点,而是尽可能获取与犯罪本身有着千丝万缕联系甚至难以察觉的数据信息。对大数据来讲,用数理关系揭示“是什么”比用因果关系揭示“为什么”更为可靠,这是侦查的相关性思维的合理性与可行性的本源因素。
3.建立在相关关系分析法基础上的预测是大数据的核心——预测型侦查。
艾伯特-拉斯洛·巴拉巴西认为,建立在相关关系分析法基础上的预测是大数据的核心。
人类社会发展的历史充分表明,我们所处的自然世界、人类社会以及我们每个人的意识领域,都受到一定的规律所制约,根据相关模型和原理,可以认为人类行为的93%都可以进行预测。在侦查实践中,犯罪规律的普遍性与客观性决定了绝大多数的犯罪活动能够被预测。
预测型侦查是公安机关的侦查人员使用数据分析技术对潜在犯罪活动进行统计预测,根据预测结果,对侦查资源进行合理配置并采取一定的响应措施的行为。预测型侦查不同于传统的回溯型侦查模式,在介入的时间和空间上,都具有较强的前瞻性,缩短了侦查活动的介入时间,精准定位侦查活动的空间范围,极大地提高了侦查效率。
4.大数据知道一切,数据决定一切——数据可以消除侦查员的偏见。
德国存在主义哲学家海德格尔指出,理解具有条件性,人对事物的理解受“理解的前结构”②的制约。可见,偏见是人类历史形态中必然存在的产物,因此要求侦查人员在工作中绝对地抛弃偏见去办案是做不到的。从传统型侦查实践来看,在许多情形中,侦查人员先入为主地将个人偏见带入侦查工作中,有时候有助于理清侦查思路、推动侦查进展,但也易造成冤错案件,影响司法公正。当前我国正推进以审判为中心的诉讼制度改革,实行办案质量终身负责制和错案责任倒查问责制,要降低侦查的错误率、提高司法公信力,需要大数据侦查作出应有贡献。如今,以现有的科学技术,我们虽不能期望大数据能够直接给予我们所有需要的信息,但通过数据关系的分析、运算和推断,大数据几乎能够在消除偏见的条件下揭示一切客观稳定的事实。因此在大数据观下,侦查人员应深化证据意识,树立大数据意识,锻炼大数据侦查的技能与本领,在未来的侦查活动中,侦查人员越来越需要具有公安知识技能与互联知识背景的复合型人才。
大数据侦查就其自身来说,其两个重要的构成要素之间的矛盾较为明显。
一是大数据的核心是预测,而侦查的重点是查明过去。上文阐述了大数据的核心作用即“预测”,但侦查机关立案侦查的条件要求必须具有犯罪事实,需要追究刑事责任,这表明了侦查活动的事后性,即侦查的功能是查明已经发生的犯罪和犯罪已经着手实施而留下的各种证据,因此从这个角度来讲,大数据与侦查的中心工作具有偏差。
二是大数据预测的是概率,而侦查对案件的信息要求必须精准。概率是一切预测模型的基础,数据科学家的主要工作是获取数据、分析数据及进行预测,特别是在分析数据过程中必然涉及概率,在进行预测活动时,任何人无法得出绝对性的结论,必然存在多种类型的可能性,因此预测过程也是一种处理概率的行为。而侦查活动以事实为依据,以法律为准绳,侦查人员立案工作的依据、侦破案件、证实犯罪的证据以及移送起诉的材料,均要求是准确充分的,因此在侦查实践中应当注意大数据预测的概率性与侦查这一刑事诉讼法定程序所要求的精准性之间可能存在的冲突。
三是大数据侧重静态数理关系,而侦查更多关注的是动态行为过程。大数据与侦查相比,仍然不可避免地具有滞后性,这是由大数据的作用机制即算法侧重于静态所导致的。大数据能够较好地预测大型体育赛事结果,因为大数据能够通过对过去十年乃至更长时间跨度的体育赛事中的参赛选手、比赛结果等海量数据信息进行分析,然后运用合适的模型去预测未来一段时间体育赛事的结果,但犯罪过程与其不同,犯罪是具有较强隐蔽性和动态性的活动,可供侦查使用的静态数据主要集中在身份信息数据、交通工具信息等,而对破案有重要作用的犯罪线索几乎都是动态行为,这一部分数据的提取与利用是一大难点。
四是大数据侦查的安全性问题。以大数据为依托的各种侦查技术是建立在大量的网络数据基础上的,这些数据本身就具有很强的共享性与传播性。这些数据是否为原始数据,秘密数据有无泄露,都是影响侦查活动的潜在因素。防止数据在网络病毒攻击下意外流失以及被不法分子所篡改和误导,成为大数据侦查需要解决的问题。
随着侦查实践的不断深入,大数据侦查逐渐暴露出与公民法益、法律秩序等方面的矛盾,对于这些问题需要予以辨析,加以关注。
1.大数据侦查与当前法律体系的矛盾问题。
(1)大数据侦查的预测性与“无罪推定”原则是否冲突[4]。一些侦查学者和实务界工作者认为,大数据侦查介入过早,属有罪推定的做法。笔者不认同该观点,我们更应当强调的是大数据侦查使用的谦抑性原则。大数据侦查的预测性主要包括预测事件(即预测犯罪可能发生的时间和地点)或人(即可能成为犯罪受害者或犯罪者的个人),这种对潜在高危罪犯的态势感知依据在于:首先从行为上其是侦查机关基于自身职能和对技术的利用所发生的;从结果上,也只有被预测对象确实实施了犯罪准备或具备了实施过程,才会启动刑事诉讼程序,而非根据大数据预测结果启动刑事诉讼程序;从目的上,针对具有犯罪可能的嫌疑人和犯罪可能发生的地点、时间、事件的一系列预测,根本上是保护绝大多数公民群体的合法权益,具有正当性;从理念竞合的角度来讲,大数据侦查强调数据思维、证据意识,与无罪推定的要求不谋而合,而且无罪推定原则能够保证大数据侦查使用界限的明晰化,使其更好地在法律允许的范围内发挥作用。
(2)现行法律规范是否能够调整大数据侦查。对这一问题,笔者认为大数据侦查的法律属性尚且较为模糊[5],传统法律体系无法适应大数据侦查的实践,现行法律规范也难以对其进行有效约束。这主要体现在以下几个方面:
第一,大数据侦查中的证据问题。首先,目前大数据侦查客观上不能突破传统侦查模式和传统法律规范的框架。大数据的组成多以电子信息为主,我国《刑事诉讼法》中虽然把电子数据认定为证据的种类之一,但明确规定了电子数据作为证据应有的价值属性即必须是能够证明案件事实的信息,这就使其根本不同于汉语意义上的数据。在大数据侦查过程中,由于受大数据技术水平所限,不同数据来源的结构化数据、半结构化数据以及非结构化数据无法达到能够自动揭示法律所规定和需要的足以反映虚拟数据与案件现实的介质或联系的极高的智能化程度,所以需要经过转化成为有效的相关数据,再处理成满足一定形式与实体要求的信息,才能够作为证据使用。由此可见,若严格遵照当前刑事诉讼法对证据的要求,大数据侦查只能被认定为一种简单的工具手段,而不能成为一种新的侦查措施,也就不能替代部分传统侦查措施而单独使用。其次,我国在刑事诉讼中坚持“疑罪从无”的原则,上述部分阐述的数据安全性问题以及大数据预测的概率性问题都表明,若不能有效判断大数据的真实性和准确性,则不能作为刑事诉讼的证据,也就不能作为判定犯罪嫌疑人是否有罪的依据。
第二,大数据侦查缺少法律依据。我国《刑事诉讼法》未对任意性侦查措施作出明确规定,而对于强制性侦查措施也只规定了五种强制措施(拘传、取保候审、监视居住、拘留、逮捕)以及一些强制性侦查措施(搜查、扣押、冻结、技术侦查等),都没有直接涉及大数据侦查。因此,大数据侦查既没有新的法律规范体系,也没有被很好地吸纳到传统的侦查模式和法律制度之中,其法律属性目前仍比较模糊。
第三,大数据侦查与现行法律制度调整对象的偏差。现行法律制度以实体空间的侦查活动为调整对象,调整对象不包括数据空间的侦查活动。
第四,现行管理制度难以保障大数据侦查的高效运行。目前大数据侦查呈现出由行政管理支配,淡化司法逻辑的管理特点。从行政职能角度去开展大数据侦查,容易忽视行政与司法界限,造成司法风险。
2.大数据侦查运行失范。
(1)大数据侦查的滥用。大数据侦查的滥用既包括一般情况的滥用侦查行为和大数据所特有的侦查滥用行为。前者主要指违反侦查程序等法律规定要求的侦查行为,在各种侦查措施中具有共性,在此不再赘述。大数据侦查滥用的特殊情形随着实践的发展而日益暴露,目前主要有以下情形:一是使用对象的滥用。目前我国大数据侦查实践中使用对象的不明确性是导致其滥用的主要原因之一,不同地区经济社会发展水平不同,对大数据技术的掌握与认知不同,也就对大数据侦查的使用对象范围产生不同的理解,有的主张适用于犯罪嫌疑人,有的认为应扩大到高犯罪风险人群,有的则认为要扩大到更广泛的公民群体,如一个社区,一个行业。二是预测结果的滥用。此种类型的滥用根源在于大数据本身的滥用。数据没有经过测试与检验,数据关系逻辑不当,最后盲目使用预测结果就是一种滥用行为。美国第一资本银行利用大数据分析,得知学生群体在更高学历水平上毕业后往往能获取更好的工作,因此认定学生群体是潜在的优质客户,于是在其制定的风控模型中,把是否申请了入学贷款作为一项重要的风控指标,结果在次贷危机下,大量名校毕业生也面临着失业问题,于是这个模型只能宣告无效。在侦查活动中也是如此,我们不能否认大数据本身的真实性,但我们也无法做到完全检验好与犯罪有关的一切大数据,所以,过分看重大数据预测的结果也可能带来侦查工作的麻烦。三是数据来源的滥用,即数据获取是否合法、有效。数据来源合法涉及到当前人们广泛关注的隐私权问题,这将在下面第6点重点讨论。数据的有效性强调的是数据的相关性,无限制无目标地开展大数据侦查,将不符合相关关系的内容引入到侦查工作中,极易造成大数据侦查的滥用。
(2)算法与数据错误引发错案的风险。维克托·迈尔-舍恩伯格曾指出,“数据量的大幅增加会造成结果的不准确,一些错误的数据会混进数据库”。大数据侦查具有双源头性:首先,大数据是一个重要源头,大数据侦查过程中的数据挖掘、数据查询、数据碰撞、数据画像及数据预测的质量和效益,根本上取决于数据自身的质量;同时,侦查也是一个重要源头,作为刑事司法工作的开端,侦查工作涉及到公民的生命健康权、财产权、人身自由权等多项重要权利,其容错率极其有限。因此,数据作为大数据侦查中的关键变量因素,算法和数据的瑕疵甚至错误,将严重影响侦查工作的正确方向,甚至带来不可逆的危害后果。
(3)刺激更大规模的数据收集——“监控型社会”。全景式侦查可能使得侦查情报信息无序扩张,公民个体特征被大规模识别并生成数据库,本质上强化了政府对公民的控制,容易产生更敏感更剧烈的“冷效应”,即被监控的持续性感觉可能会导致公民对社会和当局的不信任感,并导致其自我审查和行为变化,从而会疏远公众与公众、公众与警察、公众与社会的关系。因此,在利用大数据侦查时,如果陷入监控型社会的泥潭,将损害社会主义和谐社会的构建,对新时代我国社会治理造成不可承受的代价。
(4)架空犯罪嫌疑人程序性权利。算法要素、算法程序及算法背景的透明化程度低导致“算法黑箱”现象普遍存在,这会架空公民的知情权。而在侦查活动中,犯罪嫌疑人与侦查机关的对立性更加凸出,侦查人员所使用的大数据侦查手段实质上是一种隐蔽性、智能型和自动化程度较高的数据权力,此时犯罪嫌疑人不可避免地成为了弱势的一方,在其不知情的情况下,侦查活动悄然开展,在此过程中犯罪嫌疑人的诉讼权利可能受到潜在侵害,知情权、监督权、建议和批评权等保障犯罪嫌疑人的权利被架空,尤其体现在侦查程序上。
(5)侵犯公民隐私权或数据权。“政府对个人信息巨细靡遗的收集,将引发民众对‘隐私已死’的担忧,有可能滑入‘全方位监控型社会’”大数据侦查要从海量数据中寻找模式、信息,以满足犯罪预测或犯罪侦查的需要,前提就是拥有海量的数据,因此需要不区分对象、不成比例、不区分空间地收集数据,极易导致隐私边界的萎缩。
(6)预测型侦查机制下可能导致人群或区域歧视。公安机关分配警力资源对高风险个人、高风险地区进行干预,如加强检查或使用GPS跟踪设备等,将直接催生侦查机关歧视性执法,影响侦查结果,同时由于给个人或地区打上了“高风险”、“易犯罪”的标签,会造成社会阶层的新的不平等关系,阻碍一部分人群的社会化,不利于恢复性司法,如遇民族、宗教问题等特殊矛盾,还会加剧种族不平等,激化社会矛盾。
大数据侦查的法律规制是以保障大数据侦查依法打击犯罪的职能,保护公民各项合法权益为目的,在使其合法性、规范性、程序性进一步显性化的前提下,运用法律手段对其进行全方位的规范和约束。大数据侦查的法律规制,必须把握大数据与侦查的基本定位,理解其核心要义在于打击犯罪、保护人权,特别是要保护好公民的隐私权;其基本原则是比例原则和合法性原则,此外还要遵循特殊的数据原则。
一是侦查的事后性无需改变[6],这是大数据侦查法律规制的基本立足点,笔者认为,大数据侦查是针对已实施的犯罪在实体空间和数据空间进行的回溯性侦查。与传统侦查不同的是,大数据监测是启动大数据侦查措施的重要技术手段,数理算法和模型预测分析取代了传统侦查的因果关系推理分析,数据分析的结论是大数据侦查决策的主要依据,但都没有改变侦查与治安两分模式下侦查的事后性。预测警务等属于治安治理范围内的职能不是大数据侦查的法律规制所关注的范围,立法需要明确大数据侦查依旧需要在遵循传统侦查程序的条件下进行。
二是明确大数据的概率性不合侦查启动之条件。大数据预测不能降低立案侦查的门槛,不能无限扩张侦查权。大数据预测中存在的概率性数据,如断裂数据、弱相关证据等,必须排除在外,不能被认定为启动侦查的构成要件,侦查所需的证据必须确实、充分。
三是把握大数据是侦查技术这一定位。大数据的技术属性是第一属性,大数据侦查应属技术侦查范畴。首先,大数据侦查依赖大数据技术,包括大规模并行处理数据库技术、数据挖掘电网、分布式文件系统、分布式数据库、云计算技术、互联网技术等专业性极强的科学技术;其次,大数据侦查的价值性有赖于在人和技术的联系中实现,大数据侦查使传统侦查中的因果关系转化为相关关系,本质上是一种侦查权让渡给技术的行为,削弱了人的主体能动性,强调了算法数理关系在犯罪打击中的功能。同时,只有具有专门知识的侦查人员正确进行数据清洗、数据集成、数据归约、数据变换、数据挖掘、数据分析等工作,大数据侦查的效益才能体现出来;最后,目前学界对大数据侦查的定义虽然各不相同,但技术定义为主流,从技术角度理解大数据侦查也最容易得到较为稳定和被公众理解及认同的定义。
大数据侦查法律规制总体上要建立在继承传统规范框架的基础上,以保护公民权利为主线,注重传统侦查法律规范与新兴的数据保护相关规范的互相协同。
1.任意性与强制性之辩。
依据上文的阐述,大数据侦查应属技术侦查,但能否由《刑事诉讼法》所规定的技术侦查措施予以规制还需要深入讨论,因为大数据侦查的属性复杂,技术的意涵又较为丰富。
《刑事诉讼法》第54条和第128条对调取、勘验和检查作出了详细规定,这是最常见的任意性侦查措施。调取证据是指公安机关、检察机关和审判机关对存留于有关单位或公民手中的能够证明案件真实情况的物证、书证依法收取的行为。勘验和检查是指侦查人员对与犯罪有关的场所、物品、人身等亲临查看、了解、检验与检查,以发现和固定违法犯罪活动所遗留下来的各种痕迹和物品的一种侦查行为。显然,大数据侦查中数据收集与上述的任意性侦查措施吻合,因为在侦查活动中收集数据本身就是收集证据的一部分。但数据分析、数据预测、数据监控等关键环节无法通过上述任意性侦查措施予以调整。大数据侦查的对象是与犯罪有联系的一切数据,而我国现行法律规定对调取、勘验和检查对象的要求仅包括实物证据即物证、书证、视听资料。因此,数据收集也不能纳入任意性侦查措施的法律规制中。
笔者比较认同将大数据侦查措施先纳入到强制性侦查措施中,其理由为:第一,上面已经阐述过,大数据本质是一种技术,而刑事领域技术的使用必须保持谦抑性,强制性侦查措施在法律适用上具有更严格的限制,无论从程序还是实体上,大数据侦查都应当作为强制性侦查措施来审慎适用。第二,从《刑事诉讼法》的立法精神来看,第150-154条对技术侦查的程序作了较详细的规定,但对于“技术”所涵盖的种类、程度及适用对象都没有作出明确的规定,呈现出模糊立法的特点,但也表明技术侦查法律规制更具开放性和灵活性,这为技术侦查措施在吸纳大数据侦查作为调整对象时提供了广阔的空间,与其他侦查措施相比,技术侦查最具前沿性、创新性与包容性。第三,大数据侦查与我国《刑事诉讼法》中已经规定的强制性侦查措施联系最为直接,逻辑最为连贯。从法律逻辑来看,《刑事诉讼法》规定的技术侦查没有具体列明种类,而在《公安机关办理刑事案件程序规定》中,技术侦查措施被规定为记录监控、行踪监控、通信监控、场所监控等措施,因此可以看出,其核心内涵是监控,并且技术侦查措施正与当前警务改革的趋势相融合,预测也是其重要的外延。由此可知,大数据侦查的意涵与技术侦查是一致的。从实践逻辑上看,大数据技术在侦查中一般不是单一使用的,通常是与多种技术侦查措施结合使用,因此,大数据侦查与技术侦查有着自然的联系。
因此笔者认为,在我国刑事诉讼法第二编第二章的第八节中,将大数据侦查作为新添的一种侦查措施列入“技术侦查措施”的内容里加以规范是较为合适的。同时不能忽视大数据侦查自身的特殊性,应结合下面几条原则,在《刑事诉讼法》中增加关于大数据侦查的概念及范围进行清晰界定,详细规定大数据侦查的适用对象、程序等相关内容。
2.法律规制的原则。
应基于我国法律规制的历史经验与惯例,在坚持两个基本原则(比例原则及合法性原则)的基础上,对大数据侦查的启动条件、适用对象和法定程序等进行补充与完善。
(1)比例原则。
首先要坚持适当原则,这是为了保护无罪公民的要求。应考虑到大数据侦查对大规模无罪公民信息数据的挖掘、比对和分析这一行为的危害后果,坚持目的正义原则,即大数据侦查只能用于刑事侦查活动的各个环节,不可以用于其他个人、团体的任何特殊目的;大数据侦查的启动应当具有特殊的门槛条件,只有对侦查人员已经掌握部分犯罪证据的嫌疑人或已经知晓具有初步犯罪嫌疑的自然人或团体但缺乏相关证据,且通过其他途径无法获取证明其犯罪事实证据时,才可以进行大数据侦查;大数据侦查启动的程序需严格限制,如规范大数据侦查的申请与审批程序,加强人民检察院等监督力量对大数据侦查启动进行把关,切实贯彻重罪原则与最后手段原则。
其次要坚持适度原则,这主要是在适当的基础上为了保护犯罪嫌疑人的诉讼权利和无关人员的隐私权及数据权。要把大数据侦查措施严格限定于运用在预防重大潜在犯罪或侦查社会危害性严重的犯罪中,其中“严重”的程度应当参考《公安机关办理刑事案件程序规定》第208条中对重罪范围的相关规定③。同时要保证大数据侦查实施的程度应当与社会危害性程度保持一致,不过度侵害犯罪嫌疑人权利,更不得进行不必要的侵害,这有助于减少可能损害公民权利的大规模全民化的大数据侦查,也能够防止犯罪嫌疑人权利被架空。
(2)合法性原则。
大数据侦查必须具备程序合法和内容合法两方面条件。一方面要明确大数据侦查的审批主体、执行主体、监督主体、实施工具、实施过程、预处理机制及保障机制等,其中最核心的是明确大数据侦查权的行使,避免过度社会化、分散化,必须只有经过上级授权的公安机关侦查人员才能实施大数据侦查行为,检察机关有权介入大数据侦查活动并全程进行监督。另一方面,我国法律规定以权利和义务为核心内容,内容的合法性必须以“是否侵犯公民基本权利”为标准,以有效保障公民合法权利为基本价值取向,因此要在法律条文里明确大数据侦查过程中保护公民个人隐私权等相关权利的要求。如大数据侦查中不涉及秘密的,应事先询问案件有关人员的意愿,对其合理要求予以尊重和采纳。
(3)责任与救济原则。
大数据侦查隐私权侵害难以避免,因此必须设置对应的追责与救济程序。对于在大数据侦查中以非法手段获取和利用公民信息的,对大数据信息使用程度超出侦查职能权限范围的,意外泄露或出于非法牟利等目的泄露数据的,应该分别规定各情形侦查工作人员应当承担的责任;应当完善以个人数据保护为中心的数据立法,将一般侵权责任规定到专门的数据法里,区分个人侵权与职务侵权的情况,对于后者,应当依据大数据侦查确定责任人的履职情况、权限大小及侵权程度以给予行政处分,若造成严重后果或涉嫌刑事犯罪的,应按照《刑法》中侵犯公民个人信息罪的相关罪名追究其刑事责任。
要完善责任与救济制度。建立定期报告机制,由责任人对大数据侦查情况进行审查监督;建立常态化的激励机制,鼓励公民增强信息保护意识,帮助侦查人员更好地树立大数据思维,掌握大数据侦查的专业知识,增强侦查人员的责任感,逐步提高大数据侦查使用的规范性;要通过设立专门的信息保护机构为公民提供申请救济的渠道,如在公安机关内部设置相关部门集中统一受理公民数据权受到侵害而提起的申诉及救济申请。
(4)数据正义原则。
这是大数据侦查与其他侦查活动相比在法律规制上较为特殊的一类原则。2018年5月25日号称史上最严苛的数据保护规定——欧盟《统一数据保护条例》④(GDRR)正式生效。这部法律规定更加清晰地凸显保护数据主体、限制数据控制者的主题,向我们传递出“数据正义”的理念,我国大数据侦查中关于“数据”部分的内容可以借鉴这一理念进行法律规制,以建立适应大数据侦查实践发展的需要。笔者认为,数据正义原则应主要包括以下方面:
一是数据安全原则,着重解决大数据侦查的内在冲突。要明确数据安全目标,数据安全措施和数据安全管理主体责任。Gartner在2015年提出了数据安全治理的概念、原则与框架,其数据安全治理建设步骤中的安全状况摸底、数据使用管控、数据治理稽核对于解决大数据侦查的数据安全问题具有一定的启发意义。公安机关要加强数据的动态梳理(数据使用)、静态梳理(数据定位)和权限梳理(授权情况),做好数据的分级分类,在数据使用过程中做好收集、访问、传递、开发及存储等环节的管控,及时对大数据侦查中出现的权限变化,异常行为进行分析,建立起数据安全体系。
二是数据限制原则,着重解决大数据的滥用和侵犯公民隐私权的问题。要通过限制侦查机关和第三方的数据收集范围、数据存储时间、数据共享以及再利用来实现数据正义。
三是数据质量原则,着重解决大数据侦查的公平与效率问题。要注重数据的完整性、相关性、准确性、时效性,对可能影响数据质量继而影响侦查效益的因素一一作出明确规定,为确保数据质量提供法律保障。
大数据技术在侦查活动中的广泛运用是顺应新时代侦查工作规律的必然选择,也是顺应世界发展潮流和科技进步的必然选择。随着大数据侦查的法律规制日益完善,以及我国有着全球数量最庞大的互联网群体和最丰富的数据来源这一群众优势,大数据侦查一定能够进一步提升侦查工作质量,为我国刑事司法工作作出更大的贡献。
注释:
①维克托·迈尔-舍恩伯格系牛津大学网络学院互联网治理与监管专业教授,是最早洞见大数据时代发展趋势的数据科学家之一,也是最受人尊敬的权威发言人之一,被誉为“大数据之父”。
②海德格尔从哲学视角提出的概念,指出人们在解释和感受客观存在时常常会不自觉地受到“预先有的文化习惯”、“预先有的概念系统”和“预先有的假设”三方面非理性因素的影响。即“先行具有”、“先行见到”和“先行把握”。
③依据规定,重大犯罪主要指“可能判处无期徒刑、死刑的案件及其他重大犯罪案件”,具体而言是指应当适用的法定刑或者量刑档次包含无期徒刑、死刑的案件及其他致人重伤、死亡的严重危害公共安全犯罪、严重侵犯公民人身权利犯罪,以及黑社会性质组织犯罪、严重毒品犯罪等重大故意犯罪案件。
④参见Regulation(EU)2016/679 of the European Parliament and of the Council of 27 April 2016 on the Protection of Natural Persons with Regard to the Processing of Personal Data and on the Free Movement of Such Data,and Repealing Directive 95/46/EC(General Data Protection Regulation).