马 凯(铁道警察学院,河南 郑州 450000)
大数据、云计算、人工智能等科学技术的不断进步带来了数据化的时代浪潮,犯罪分子在此时代浪潮中借助科技手段实施新型非接触性犯罪,传统的侦查手段难以适应新型犯罪的侦查取证需要。在侦查机关积极开展数据化侦查手段探索的同时,理论研究界对数据化侦查的研究也进行得如火如荼。但是对于数据化侦查的基础概念、规范要求、模式机制等内容缺乏整体的归纳,使得理论研究对数据化侦查的实战支撑力度不足,各地公安机关的实践应用水平参差不齐。为了提升数据化侦查实战能力,强化跨地域的侦查协作,提高证据采信率以期更好地服务于审判活动,对数据化侦查理论系统的构建势在必行。数据化侦查是一个集合概念。数据化侦查的概念系统主要包含了组成数据化侦查的各个集合内容、数据化侦查背后的侦查学基本原理支撑及数据化背景下的新内涵。
就数据化侦查的概念系统而言,是众多小概念的集合,只有界定清楚其中主要包含的概念内容及演变由来,才能更好地厘清数据化侦查的概念系统。
根据《辞海》的定义,数据是指进行各种统计、计算、科学研究或技术设计所依据的数值。在计算机领域的视角下,数据是对已发生的客观事实进行记录的二进制信息单元,是还原和描绘信息的载体。数据不仅包括声音、图像这种连续值存储的模拟数据,还包括类似文字、符号这种离散存储的数字数据。在侦查学的视阈下,数据可以按照记录数据的媒介方式划分为普通数据与电子数据。
侦查学中的普通数据是指可以被侦查员借助其物理、化学特征而直观感知的附属于纸张、物品等实体物质上的与案件相关联的信息元素,其具有相对稳定性、可感知性、易提取性等特点,例如在犯罪现场遗留下来的汗腺指纹、灰尘足迹、工具痕迹等普通物证所反映出来的数据信息。侦查学中的电子数据是指在侦查活动过程中通过多种渠道获取的借助信息处理设备而形成的以图片、视频、声音、程序、文档等形式存在的信息及其转化出的衍生物,其不能直接被人的肉眼所阅读、耳朵所听到,需要依托于技术设备转化形式来呈现,具有形式复杂、稳定性差、依靠介质、易篡改破坏的特点。电子数据不同于电子物证,电子物证是指在案件侦查的过程中发现的可以作为法庭证据证明案件事实真相的电子数据、储存介质、电子设备等。电子数据是电子物证的重要构成。
大数据不仅仅是侦查领域的热词,更是当今时代各行各业的专家学者竞相追逐的前沿课题,从早期互联网商业应用到今天的政务管理、应急救灾、医疗健康等领域可谓是百花齐放。从1890 年美国统计学家霍尔瑞斯发明打孔制表机处理海量的人口普查数据开始,由电算代替人工计算改变了人们对于海量数据处理的传统认知,到1997 年美国航空航天局的两名研究人员在飞机模拟气流实验中生成了庞大的数据量,以当时的计算机设备及内存磁盘难以在短期做有效的可视化处理,从而将这种海量的数据量称之为大数据,这是人们对于大数据在早期的认知水平,特点就是单纯的数据量级庞大,难以有效处理。
随着科技水平的提高,人类的认知能力也相应进步。正如同“摩尔定律”所描绘的一样,在同等价格下,集成电路处理信息的性能在一定时间内会翻一番。移动硬盘、数据塔的出现使得海量数据可以便捷地存储传输。网络云盘存储技术的出现使得信息的存储能力呈指数级跃升,而数据存储技术的提升为大数据的应用扫清了基础性障碍。分布式计算技术的应用使得像图片、音视频这种高比例的非结构性数据可以有效处理。分类回归模型、集成学习、关联挖掘等数据分析技术的进步为大数据应用奠定了坚实的基础。人类认知能力的提高也使得大数据概念的内涵与外延更加丰富。从早期单纯的数据量大逐渐丰富为数据种类多,可以从数据背后挖掘出价值。综上所述,狭义的大数据是指将海量基础数据予以结构化处理,可挖掘出其背后价值的数据集合。广义的大数据除了包含基础数据集合外还包含数据分析处理技术、数据挖掘结果。
信息化侦查的概念2005 年首次在学术论坛中出现,而信息化侦查的学术探讨应结合当时“金盾工程”项目的建设背景和犯罪演变形势来理解。当时电脑和网络已经开始在公安机关普及应用,公安机关开始利用网络信息来缉捕逃犯,刑侦基础信息和相关业务基础数据已经可以实现由计算机管理。为更好地落实“科技强警”战略,于2003 年正式启动“金盾工程”项目建设,2006 年实现了一期工程的竣工验收。大部分公安基层科所队接入了公安内网,刑事在逃人员、违法前科人员、指纹信息等基础数据库初具规模,初步形成了“纵向贯通、横向集成、互联互通”的公安信息应用格局,为信息化侦查工作的开展奠定了坚实基础。而根据公安部的公开数据,2005 年刑事案件立案464.8万起,较上一年回落7 万起,是2002 年以来刑事立案数的首次回落,但仍旧是1978 年改革开放初期刑事立案数的9 倍左右,当时打击犯罪的压力非常大。①此处的数据来源于https://www.chinanews.com.cn/news/2006/2006-01-1918/680353.shtml。面对当时公安信息科技的高速发展与犯罪数量的攀升,信息化侦查方法的应运而生也是侦查活动发展过程中的必然。
信息化侦查可谓是中国侦查发展史上具有开创性意义的一次飞跃,其将侦查活动从单一的线下实体侦查丰富为线上虚拟侦查与线下实地走访相结合的形式。侦查活动从纸面上跃升到网上也使得侦查的基本观念发生相应的变革。但是信息化侦查更强调侦查过程的信息化,而就侦查过程的信息化支撑而言,其需要大规模的信息资源支撑才能满足网上作战的需求,这也给公安机关的科技化水平和侦查员的计算机操作能力提出了较大的挑战。
尽管由于公安内网系统中的侦查信息还不够丰富全面、各地公安机关之间存在信息共享壁垒、数据采集标准不同导致大量“数据废气”的存在使得信息化侦查无法开足马力,但可喜的是,我国网民数量于2005 年突破1 个亿并且呈井喷式上升趋势,互联网使用初期对于网络信息及网络言论缺乏有效的监管教育,网民在贴吧、QQ、游戏等网络冲浪的过程中肆无忌惮地发布信息,留下了大量可为信息化侦查服务的网络痕迹信息,为侦查机关查明涉案人员的真实身份、活动轨迹等提供了有利的帮助,成为信息化侦查的重要阵地。总的来讲,信息化侦查是指侦查主体在刑事法律规定的范围内借助网络信息资源开展的专门调查行为的总称。其将侦查行为的时间观念丰富为过去、现在、将来,将侦查的空间观念丰富为网络虚拟空间与实体现实空间。这两个维度、五个主体要素之间的不同排列组合极大地丰富了侦查活动的作战领域,可谓是侦查发展史上浓墨重彩的一笔,为大数据侦查、人工智能侦查的提出与发展起到了承前启后的作用。
就近些年侦查学的研究来看,无论是在各个级别的侦查学术研讨会上,还是侦查学专业的本科、硕士、博士生毕业论文的选题上,大数据侦查的字眼是绝对不会缺席的。甚至在一些学术研讨会、案情分析会上,很多专家学者一听到大数据侦查的相关报告都会觉得反感,一方面是因为大数据侦查这几年提及得过于泛滥,出现的频率太高,甚至还有一些凭空创造的大数据侦查词语。另一方面是因为很多大数据侦查的学术研究都是“假”的大数据侦查研究,无论是哪方面的侦查学研究都硬去蹭大数据的热点,将传统的侦查分析方法表述替换为大数据侦查方法的词语,以新瓶装旧酒的方式反而让人忘记了侦查学的基础理论要素。
大数据侦查是大数据技术在公安领域应用实践的典型成果。刑事诉讼法规定的侦查概念是我国具有侦查权的专门机关在法律规定的范围内依法进行的专门调查工作和有关强制性措施。相较于传统的侦查概念而言,大数据侦查只是侦查的一种形式,还是在法律规定的五种强制措施、八种专门调查行为的框架下对侦查手段的丰富和补充,而并非是对传统侦查的颠覆和革新。相较于传统侦查在发案后进行发案过程的还原和犯罪嫌疑人的查缉抓捕,大数据侦查可以实现对未来案件发生概率的预测、高危社会活动的同步管控,还可以可视化地还原已发案件的犯罪轨迹。大数据侦查不仅丰富了侦查的手段,还提高了对犯罪活动打击震慑的效能,有利于各地公安机关跨地域合作。因此,大数据侦查是指我国刑事法律规定的侦查主体借助数据挖掘、云计算等信息技术手段对已发刑事案件采取的专门调查行为和对未来可能发生的刑事案件进行的概率预测工作,其对基础数据的规范性、处理技术的高效性、侦查思维的活跃性及侦查指挥的即时性有着极高的要求。
人工智能侦查、智慧侦查这一概念在2018年首次出现在学术论坛的视野中,随后引发了相关领域专家学者的一阵热议,关于人工智能侦查的学术研究成果数量也是呈现稳步上升的趋势,内容逐渐丰富与完善,受到了更多一线侦查人员的认可。虽然说现阶段我国的人工智能技术还处于理论研究向实践应用过渡初期,贸然提出人工智能侦查似乎与公安侦查一线的实际条件存在脱节的可能,但由于犯罪形势的发展是瞬息万变的,只有侦查手段提前进行升级完善,才不致于始终处于被动打击的滞后地位,才能最大程度地降低犯罪活动给人民生命财产安全带来的负面影响。
人工智能侦查相较于大数据侦查而言更突出了其自我思维、主动预测的特点,降低甚至可以摆脱操作人员对侦查思维的依赖。[2]就人工智能侦查体系而言,其由大数据侦查体系的基础数据被动输入、依托于操作人员的侦查思维架构数据分析处理模型,变为基础数据根据人工智能侦查系统意志主动筛选提取有用数据、根据其系统训练出的机器学习思维意识进行主动分析进而输出情报产品的运行模式。人工智能侦查以机器学习的方式最大程度降低了因侦查人员认知偏差而导致的错误侦查方向,甚至是侦查错案的发生概率。以技术代替人工从事复杂枯燥的数据收集与分析工作,可以将更多的警力资源下沉到情报落地、抓捕预审的环节,将警务力量更有针对性地提前部署到案发高概率区域进行事前干预。[3]人工智能侦查也是数据化侦查体系未来的发展趋势,包括但不限于基础数据的智能采集、机器学习研判、证据链条固定完善、侦查过程可视化还原、智能情报传输落地。所以说,人工智能侦查是指侦查主体在法律规定的范围内运用人工智能技术多元化拓展数据获取渠道、减少侦查人员认知偏差、主动开展侦查活动的一种技术方式,具有庭审证明力强、人工依赖度低、侦查精准度高的特点。[4]
侦查学能够作为公安学下的二级学科分支,必然有着对于侦查学研究发展具有普遍性指导意义的科学道理,也就是支撑侦查活动的基础性原理。随着人类认知能力的提升以及新的侦查方式方法应用于侦查工作中,侦查学也将吸收借鉴其他学科体系的先进成果来丰富自己的基础理论体系,使更多的侦查学基本原理被发现与认可。
数据化侦查丰富了侦查活动的方法与手段,也给侦查学基本原理赋予了新的内涵。特别是侦查活动进入数据化时代以来,如雨后春笋一般涌现出很多不同的侦查学原理,但也存在着部分专家学者提出的原理过于超前,还没有深入系统的研究成果,因而没有获得大多数侦查领域的业务专家及特别是一线实战侦查人员的认可,甚至存在理论上争议的情况。因此笔者挑选出广为接受且普遍熟知的物质交换原理、同一认定原理、因果关系原理来进行数据化时代的理论探究。
物质交换原理也就是人们在生活经验中所认识到的触物留痕现象的演绎提升,其在20世纪初由法国的犯罪学专家埃德蒙·洛卡德(Edmond·Locard)在其著作《犯罪侦查学教程》中首次提出。洛卡德从犯罪侦查学的角度指出犯罪的过程是犯罪人与犯罪现场之间的物质交换的过程,犯罪活动的实施总会与犯罪现场的物质发生接触、碰撞等而存在物质交换的过程。就侦查学的视角而言,物质交换原理表现为不同的客体由于外力的介入发生挤压、接触,造成视觉、听觉的变化等情况,使得不同客体之间产生相互作用的物质能量变化。主要包括痕迹性的物质交换、物品性的物质交换、印象性的物质交换这三类。[5]比如在犯罪现场,犯罪分子进出现场时鞋底花纹会与地面上的灰尘挤压而使得部分灰尘转移到鞋底上形成灰尘足迹,犯罪分子移动现场物品时会与物体表面物质因触摸而使得物体表面留下汗腺指纹、手的接触面上留下物体元素,这都为侦查破案提供了科学依据。正是这种物质交换情况的客观存在,使得侦查活动的开展有迹可循,有理可依,可谓是侦查活动的最基本支撑理论。但是物质交换也需要有几个基本条件同时成立才能够实现:就客观条件而言需要有不同的受力客体与施力客体;就作用力而言,需要有行为力量作用于不同客体之间;就接触性条件而言,需要有不同实体物质之间的紧密接触;就物质性条件而言,需要不同客体表面的物质发生实际的增多或减少。
可是当我们进入数据化时代,却发现很多新型犯罪并没有传统意义上的犯罪现场,而我们依靠物质交换原理进行的勘查工作似乎也受到了一定程度的忽视,因而有些专家学者对于物质交换原理的普适性产生了怀疑。因为我们传统认知的物质交换是针对于物质性的客体而言的,即便是印象性物质交换,那也得有不同的人对犯罪过程中的人、物有过实际的照面或听见声音,产生视觉或听觉上的印象痕迹。随着人类认知水平的提升与科技发展进步,物质交换原理在数据化时代的局限性愈发的突出。印象性物质交换所囊括的是视觉、听觉的冲击,但是犯罪现场还会有行为人、受害人之间心理痕迹特征的变化转移。对于数据化时代借助网络媒介等实现的非接触性犯罪而言,没有实体的按压、触摸及外力作用,物体表面似乎也没有什么实质性的变化。所以有的学者认为是犯罪过程中发生了不同信息间的交换转移,也就是信息转移原理能够更恰当地解释数据化时代的“触物留痕”,其认为信息在转移的过程中不一定像物质交换一样始终保持着总量守恒、双向传递的情况,还存在与信息转移间的复制粘贴、单向传递的情况。然而,物质与信息之间并不能划等号。
数据化时代的物质交换原理也并不是更新为数据化时代的信息转移原理。对于行为人操作计算机利用网络空间输出数据而言,屏幕信息确实给行为人大脑突触以新的反馈形成了意识性信息。而对于现阶段方兴未艾的非接触性犯罪而言,作案人与受害人之间通过网络系统的媒介实现了信息的转移交换与数据接触,留下了网络空间的电子痕迹信息,数据化背景下还原出的行动轨迹、进出信息何尝不是一种数据空间的电子足迹、电子指纹呢?而这一切何尝不是“触物留痕”呢?只不过从现实空间变为了虚拟空间,这与物质交换原理并行不悖。所以说,信息转移原理不是对物质交换原理的否定与更新,而是随着认知水平的提高对于物质交换原理认知深度的进步,对物质交换原理内涵的进一步丰富,把这称之为数据化时代的物质信息转移原理更为贴切。[6]数据化时代的物质信息转移原理能更好地指导侦查人员在实战中注意对电子痕迹信息、心理印象性信息、反侦查信息等内容的收集,提高侦查认知的深度与广度,为数据化侦查工作创造更好的基础性条件。
同一认定理论属于舶来品,且具有百年的历史,最初由苏联犯罪学家波塔波夫在上世纪20 年代系统阐述,但是在生活经验中对于是否同一的认定则可以追溯得更早。“同一”这一词语最早来源于拉丁文的“ibem”,是视为同一的意思,而哲学意义上的“同一”是事物现象与自身相同、相等或一样的范畴。同一认定理论引入中国以来,其内涵与外延也是随着社会实际变化而不断丰富与拓展的。就同一认定的主体而言,具有专门知识和了解客体特征的人才符合主体要求。[7]具有专门知识的人通常是指刑事技术人员或刑事司法机关聘请的专业司法鉴定人员;了解客体特征的人主体范围非常广泛,包括被害人、见证人、知情人、行业专家等可以讲清楚某一物体的客观特征的人。就同一认定的客体而言,是指与案件相关的人员、物品等肉眼可见的或借助工具可转换识别的客观特征。较为常见的同一认定的客体是在犯罪现场中所提取到的指纹、足迹、血迹、工具痕迹等遗留在犯罪现场的客观物质。因此,同一认定原理的概念是指由了解客体特征的人或具有专门知识的人运用自身识别力及科学技术方法对于侦查客体先后出现的特征进行比较,确定是否为同一个,解决某一客体物质与案件之间是否存在特殊联系的原理。
对于同一认定原理在侦查学中的理论地位有着较大的争议。有的学者认为同一认定理论是侦查学最基础的理论,犯罪现场的每一个痕迹物证的检验鉴定是小的同一认定,整个侦查破案过程是一个大的同一认定,并且将其上升为刑事司法证明的层面。笔者对此理论在侦查实践中的应用情况是持有怀疑态度的,对于侦查阶段的认定只能作为侦查线索来开展,整个案件侦查过程包括但不限于DNA、笔迹特征、指纹等内容的同一认定,还包括了侦查思维的运用、犯罪事实真相的查明等诸多内容,这并不是一个大的同一认定所能够囊括的。但是同一认定理论对指导侦查工作仍具有重要意义。
在数据化时代,犯罪基本行为方式的二元裂变致使越来越多的非接触性犯罪活动出现在侦查人员的视野中。对于非接触性犯罪活动中出现的最为普遍的数据和信息以及留下的痕迹而言,是否同一反而会出现无法验证的情况。[8]例如某个犯罪分子利用计算机传输指令操控某个无人机实施故意伤害特定人员的犯罪活动,我们只能依靠科技认定出计算机传输的指令与无人机接受到的指令是相吻合的,至于是否能确定为某人所操作,还需要借助其口供以及其他视频资料相印证,最终达到认定某人与犯罪行为人同一的效果。数据吻合所依据的条件也是被认定客体的反映性、特定性与可识别性的条件,这与同一认定所需要的客观条件基本一致,但是对于某些数据需要转化识别,正如同在数据化的世界中人们的行动轨迹、输入内容其实也就是人们留下的电子脚印、电子签名等。因此,笔者认为在数据化时代,同一认定理论的外延应扩大,不单单是通过实体的物质性特征来进行同一认定,还有数据信息进行数据吻合性比对后应结合其他可印证信息来进行数据化时代下的同一认定。
在社会公众最朴素的价值观中,都普遍认同事出有因的理念。也就是引起某种现象发生的因素称之为原因,而这种现象所引发的后续影响称之为结果。原因与结果间的影响与被影响的关系及其内在联系也就是因果关系原理。在侦查活动中,侦查员面对刑事案件首先也会想这是属于哪种类型的犯罪,查清犯罪目的,做好案件的定性后再综合分析,明确下一步的侦查方向,这是对因果关系原理最基础的应用。因果关系原理作为侦查活动认识案情的基础,是推动刑事案件侦破的内驱动力,同样也是治理犯罪的关键要素。
侦查工作的基本路径之一就是围绕犯罪活动的异常状况从结果倒推出其原因,根据结果和原因之间的内在联系确定侦查方向,缩小排查对象的范围。犯罪动机是指在犯罪嫌疑人内心中萌生出的实施某种活动的趋使因素。犯罪目的是犯罪动机的显性体现,即犯罪嫌疑人想要通过实施行为活动达到的目标价值。犯罪嫌疑人在实施具体犯罪行为时,大多是出于某类犯罪动机的驱使,最终去达成某种犯罪目的。严格区分犯罪的动机要素与目的实现,找到具体犯罪活动之间的因果关系对于正确认定罪名、合理适用量刑情节意义重大。
在数据化时代,犯罪的时空观发生较大的变化,新型犯罪层出不穷,年轻人的思想意识受到网络文化的冲击而越发自由和活跃,部分犯罪要素以数据作为介质在传输指令,很多犯罪活动并没有什么明确的因果关系,这都给侦查活动的开展带来了一定程度的困难。[9]但是大数据技术在侦查活动中的应用似乎给解决这一困难带来了曙光。大数据技术通过对犯罪活动中收集到的数据进行深入碰撞、比对,对于不同数据间的关联性、相关性却是较为容易筛选出的,而借助不同数据间的相关性,对侦查线索的确定、嫌疑人特征的刻画等侦查活动的开展起到了极大的帮助作用。但是犯罪的相关性原理并不是对因果关系原理的更新,而是对因果关系原理在数据化时代下的补充与完善。因此,数据化时代的因果关系原理既包含了各个犯罪因素间因果关系的探究,又涵盖了对不同数据背后相关性的挖掘。
数据化侦查基础理论体系紧扣未来警务发展热点与当前的打击难点,紧扣全国公安工作会议上提出的“把大数据作为推动公安工作创新发展大引擎”的总要求。将数据化侦查的基础概念界定、侦查取证规范标准与数据化侦查实战的分析应用有机结合,能规范公安机关数据化侦查体系建设,增强公安机关打击非接触性犯罪的实效性,进而为提升公安机关数据化侦查打击能力提供理论依据、法律依据和操作指南,为针对性地破解打击非接触性犯罪活动能力不足提供有价值的认识视角。