赵 峰(江苏警官学院,江苏 南京 210031)
大数据侦查模式之下相关性关系的证明浅议
赵 峰(江苏警官学院,江苏 南京 210031)
大数据侦查模式是近年来我国侦查模式演进的最新表现,其所蕴含的侦查行动逻辑立基于海量数据的云计算技术,并以预测性功用为侦查人员所钟爱。数据的相关性关系是此种侦查模式的分析核心,其有别于传统侦查注重确定性因果关系的分析思路和行动指向。确定性因果关系分析存在自身局限,而相关性分析恰好可以补足此中缺憾。
大数据侦查模式;相关性;因果关系;融合
现代社会诸多新型技术和理念正给侦查学发展带来莫大的机缘和挑战,“大数据”在侦查领域的发展恰好可以诠释这一点。但在现阶段,“大数据”侦查模式所擅长的数理分析似乎与刑事诉讼证明的逻辑存在一定异位,笔者尝试解读其中的缘由,并试图阐述融合之道。
“大数据”概念之发端大约始于2008年[1],这一新技术给人类的生活、工作、思维带来了根本性的改变[2]。“大数据”对现代侦查行为产生了重要影响。
(一)反应型侦查模式之困境
在传统社会中,反应型侦查模式[3]占据绝对主导地位,但随着大数据时代的到来,西方国家转而着力建构大数据驱动的犯罪侦查和控制体系。反应型侦查的合理性虽未消失,但其所赖以存在的客观基础已发生改变。当今的犯罪从静止走向动态,从传统走向智能,从单兵走向组织,反应型侦查应付不了这种犯罪异化的趋势,侦查的成本支出(包括物质成本和权力成本)也即随之攀高,侦查效益相应走低。[4]反应型侦查模式的被动性在信息的搜集上也表现出一定的延迟。延迟不是表现在技术上而是出现在模式设计本身上。反应型侦查是由案件结果回溯原因的,逻辑上是因果关系,而在刑事案件侦查的因果关系逻辑框架下,原因到结果也好,结果到原因也罢,二者之间需要较为直接的联系。基于此种设计的反应型侦查模式就决定其在搜集情报的时候视野不大,对于情报(信息)的敏感度不高,胃口比较挑剔。处于信息时代,在情报主导警务已成趋势的背景下,这种情报搜集的迟延反映到侦查模式中是不妥当的。
(二)“大数据”对现代侦查模式之促变效应
1.侦查模式中理念的变革
侦查模式中的理念就是指贯穿在侦查模式中反映了侦查规律的并具有引导、支配、决定侦查活动的观点、看法、信念。在大数据时代,侦查主体需要确立在线开放的理念、数据主导侦查理念、相关性理念、线上破案与线下证明相结合的理念。[5]
2.侦查模式特点的转变
在具体的侦查运行中,“大数据驱动的侦查模式”还具有一体性、全景式、预测型、算法型侦查的特点,在侦查的具体过程和方式方法上区别于传统的侦查模式。[5]
3.侦查模式运行机制的转型
现代侦查机关应当对侦查运行机制进行转型升级,构建由犯罪监控机制、犯罪侦破机制、犯罪预测机制三者构成的关联体系。新的犯罪监控机制是一种集空间、时间、权力于一体的“全景敞式监视”[6],而要使得大数据监控成为可能,数据记录、存储以供分析、提取机制以及实时报警机制两者必不可少。新的犯罪侦破机制通过数据准备、明确问题和确定分析思路、数据挖掘、确定目标和验证等四个阶段来达到侦查破案的目的。新的犯罪预测机制的一般路径是通过对过去犯罪规律的描述建立模型并对模型优化,然后将现有数据输入模型,进而从其结果中预测未来。[7]
综上而言,“大数据侦查模式”主要是指侦查机关借助大数据和云计算技术,利用特定算法(包含藉由经验而得的直觉判断)对普遍存在且全面自动化收集的社会信息进行分析,形成对已发犯罪的侦查线索和未来犯罪发展趋势进行判断的一种犯罪侦查和控制模式。
大数据侦查模式极大地改变了传统侦查的运作方式,在行为方式、思维方式等方面均存在重大转变。侦查行为在相当程度上习惯性地被人以极具目的理性的方式来追问,因果关系便成为侦查行为与侦查目的之间最直接的思维联接。然而,通过大量侦查实践,笔者发现现代侦查于破案追求之际越来越着重相关性关系,而非因果解释方式。
大数据时代的思维及认知方式创新主要在于:一切皆有可能,数据自己发声,总体高于样本,庞杂优于精确,相关重于因果,协作胜于竞争,共享创造价值[8]。这种变革在侦查领域体现得愈发明显。
在现代侦查中存在这样的普遍性现象,即侦查人员在办案中基于时间有限性考虑而常常选择最能直接达到破案目标的行为方式。现代侦查中惯常使用的通讯技术、视频技术、行动技术等都能够为侦查人员快速锁定犯罪嫌疑人(或嫌疑对象),在利用“大数据”进行分析时,以侦查经验、生活常识、道德标准、权威力量、约定俗成等得来的相关性关系往往直接指向特定目标,而少有追问相关性关系背后的因果联系。故而,在侦查破案的行动过程中,侦查人员常借助“大数据”技术对海量数据进行分析,以迅速满足破案所需要的条件。
相关性这一概念首先应用于数理统计中,是研究社会经济现象数量依存关系的一种数理统计方法,即对两个对等的经济数列,用数学方法测定一个反映它们之间变动的联系程度和联系方向的抽象化数值,即以相关系数的方法反映出总体中确实具有标志性的联系,它是描述客观事物相互间关系的密切程度并用适当的统计指标表示出来的过程。相关性分析的功效表现在两个方面:首先,以相关性为标准可以避免数据收集、判断、利用过程中的漫无目的;其次,以不同于确定性因果关系认定方式显示事物之间的关联性。和确定性的因果关系不同,相关关系是一种不确定关系。两个变量之间如果一个发生变化,另一个随之发生唯一确定值变化,这是变量之间确定的函数关系。而一个变量发生变化,另一个可能与之发生正相变化或负相变化,也可能发生强变化或弱变化,这是相关关系。[5]
概括而言,大数据时代侦查行为主要存在以下几方面关涉“相关性关系”的内容:
(一)以法律程序设计而带来的相关性关系
这类相关性是基于我国程序性刑事法律规范而预先设定的侦查流程,在现行法律规定之下必然得以全面施行而形成的犯罪规律和侦查规律总结。简言之,其主要描述传统侦查行为中侦查主体的惯常思维联结方式。
(二)以社会信息构筑的数据关系
这类相关性不易被侦查人员所掌握,因其技术性语言需要人类自然语言来解释,更源于现实数据有欠真实可靠及遭遇可能的算法困境。
鉴于技术语言在侦查行动者群体中的普遍认同,侦查行为中的“相关性”往往容易获得理解,但这种“相关性”却在后续诉讼阶段中无法轻易获得认同。这不仅存在语言沟通上的障碍,更存在证明逻辑上的转换之累。
其实,相关性和因果性是大数据经验主义者[9]着重讨论的范畴,他们认为在大数据时代,因果性不存在了,由相关性来代替[2]83。近年来,我国侦查机关在绩效考核的实践工作激励机制驱动下,一方面在积极适用多种新型技术方法完成考核指标(例如破案数、抓获人头数等),另一方面,还在主动应对刑诉法修正后法律的诸多限权性设计。
(一)确定性因果关系分析的局限
有人认为确定性因果关系认定模式比相关性认定模式客观科学。其实并非如此,确定性因果关系认知模式产生的原因很有可能是人们思维惰性和一种无根据的想象甚至是迷信。这里所说的思维惰性按照舍恩伯格的话来说是一种“不费力的快速思维”,[2]103这种快速思维的结果是“使人们偏向用因果联系来看待周围的一切,即使这种关系并不存在”。[2]103当然,这种惰性的产生有其客观原因,在小数据时代,获取大量数据相对比较困难、成本较大,所以,人们倾向于从思维上进行节约。但是,当数据获取已经比较轻松时,仍然采用这种方法就未必不是一种惰性。其次,之所以认为确定性因果关系认定模式是一种想象和迷信的根据在于对人们思维特征的分析。一般来说,人们在观察分析外界事物时,要依据头脑中的一些思维预设和思维框架,比如说一些概念和逻辑思维规律,这是开展行之有效的思维活动必不可少的条件。但是,有一些并非真实存在和必需的附着物也会借此进入人们的思维过程。例如,概念是进行逻辑思维的起点,原本并非是表示物自体性质的存在,但是,当建立在概念基础上的逻辑推论越来越多并且越来越有效时,概念本身就会逐渐向人们显示其物自体存在的性质,以至于人们在以后因果关系认定时就发生了一个倒转,即回过头来转向对这个所谓物自体的认知,这就是一种彻底的本末倒置。正确的做法应该是抛弃既有的确定性因果关系认定模式,尽最大可能收集占有数据资料,在此基础上进行相关性分析。
现代侦查对日益复杂的犯罪行为所作出的回应之一便是不再将现实状态的功用性联结作为侦查主要思维导向,即不主要寻求实在而确定的因果关系,转而寻求在“大数据”的数据关系中探寻事物的相关性,并作出合适的预测性安排。大数据技术的核心就是预测。大数据不是要教机器像人一样思考,相反,它是要人像机器一样思考。“它是把数学算法运用到海量的数据上来预测事情发生的可能性。”大数据技术是一种基于独立的机器系统和算法系统之上的预测系统,“这些预测系统之所以能够成功,关键在于它们是建立在海量数据的基础之上的。此外,随着系统接收到的数据越来越多,它们可以聪明到自动搜索最好的信号和模式,并自己改善自己。在不久的将来,世界许多现在单纯依靠人类判断力的领域都会被计算机系统所改变甚至取代。”[2]52人最后将被还原为一个可计算的算法系统和自动机器,人被数据分析和算法完全量化了,变成了“数据人”。人完全无法驾驭数据,反倒是数据控制了人。更确切地说,是数据之间的“相关关系”系统控制了人。侦查员依靠技术获得线索和证据,并依循这种解释来完成侦查证明。
(二)相关性分析包含因果关系分析
因果与相关(causalityandcorrelation,在物理学中后者常译成关联),本来是哲学上的老问题,它们是同时存在又相互交叉、彼此又有区别的概念,一直缠绕着哲学家、数学家、统计学家和物理学家们。
例如一只纯色表盘的手表,除了时针和分针,没有其他装饰,这种情况下,指针的走动特点就可以领略到该款手表的个性。由于间隔一段时间才走动,所以这个指针的走动在整个过程中就非常明显了,如何将指针的走动过程设计得即简单化又可以受得起冲击呢?现在的城市生活节奏快速,生活空间也越来越狭小。工作、人际关系甚至连周围的物体都会给人带来多多少少的压力感,我们也希望手表可以帮我们承担起一部分释放压力的作用,就是希望它可以承受更大的冲击。
相关性是一种比因果性更广泛的概念。从数学上看,在集合论中,相关性不过是两个集合或多个集合组成元素之间的“有序对”,或通俗来说,是一些对应关系:多一对应、一多对应或一一对应的关系,它完全没有因果作用的含义。函数关系也是在这基础上进行定义的,“自变量”在数学上并没有原因的意思,“因变量”即函数也没有结果的意思。而因果关系或因果作用比一般的相关性进了一步,它要求揭示事物之间、个体元素之间、性质之间的机制作用和动力。所以,基本的解释进路是用因果解释相关,而不是用相关解释因果。
在大数据的研究中,作为物质、能量、信息传递的因果作用相对一般相关关系而言,有决定性的作用是毫不奇怪的。从逻辑上看,自从科学出现以来,因果与相关的关系既相互区别,又相互交叉。传统科学方法一般是从因果与相关的缠结中区分因果与非因果相关,即从一般相关中找出统计相关,再从统计相关中找出直接因果,大数据的实践依然符合这个进路;但大数据经验主义不区分因果与相关,主张只要一般相关,不要因果。它们之间的关系可用图1来表示:
图1 科学方法论和大数据经验主义在因果与相关关系上的分歧
在现代侦查办案过程中,笔者发现不少侦查人员已经相当熟悉利用“大数据”方式来获得便捷的侦查线索和有关证据,似乎在数据之间就能直接找寻到破案良方。然而,大数据主张对一切进行量化,进而运用统计学寻求数据之间的“相关关系”和“数理关系”。数据作为事物的“量”的规定,反映了事物一定的“质”。数据关联作为事物之间“量”的关系,当然也反映了事物之间的某种“质”的“联系”,揭示了事物和事物之间互动的某种规律。在此意义上,用大数据对事物进行统计学的把握,并对事物的发展趋势做出预测是有道理的。但是数据作为事物的量的规定,只是事物的一个方面。数据“相关关系”和“数理关系”只是事物之间的“量的关系”,它只是事物之间真实联系的“模拟”和“近似”,也即仅是一种“镜像性”的关联。它总是不完全的,它是对事物之间的联系的数量“抽象”,因此,大数据的量化的“相关关系”分析不能取代真实世界的“质”的“因果关系”分析,至多只是体现为一种对因果关系分析的“正面启发法”,有助于揭示事物之间真实的“质”的关联。“在大多数情况下,一旦我们完成了对大数据的相关关系分析,而又不再满足于仅仅知道‘是什么’时,我们就会继续向更深层次研究因果关系,找出背后的‘为什么’。”[2]58即便在侦查员群体内部也需要进行诸多“数据”到“知识”的解说,更不用说还存在令后续诉讼阶段诸多主体能够确信侦查所获并形成一致判断的重要任务。所以,笔者主张侦查人员需要具备两种思维,办案过程中以大数据思维来快速高效获取线索和证据来实现侦查终结,在审查过程中坚持确定性因果关系分析来完成诉讼证明。
证明,不仅需使证明主体自身产生确信,更应使得诉讼程序中其他程序主体获得普遍确信。在侦查办案过程中,侦查人员往往以侦查假说形式形成自身的内心确信。大数据侦查模式已实际改变侦查人员对现代犯罪行为的处理方式,侦查人员越来越倚重借助海量数据和特定算法形成的相关性关系来收集侦查线索和有关证据,逐步在侦查群体内形成共识。但是,审查(预审)阶段的主要任务却又要求遵循原有的因果关系来解释犯罪行为人的客观行为和主观动因之间的联系,这一方面需要考虑检察官、法官等法律职业共同体的知识结构和思维习惯,另一方面也要考虑普通大众对案件的理解能力及由此形成的对司法的普遍信任。这两方面的张力很显然可能撕裂侦查人员的思维模型,进而可能导致侦查人员虽能办案,但诉讼程序无法完成,犯罪预防无从谈起的败局。
以实践理性为视角,笔者主张在办案阶段以相关性分析提升破案效率,但在审查阶段及后续的审查起诉和审判阶段则仍需坚持因果关系分析来满足基本的法律解释。为实现这两种证明思维方式的融合,笔者建议从以下几个方面着手:
(一)机器语言与自然语言的融合
在科学方法中,对客观规律的总结已然形成一套独特的足以自我解释的语言系统,并在职业共同体内部形成一套通行无碍的证明语言。法律共同体的共享语言是一套有别于日常生活语汇的语言体系,在法律证明中扮演着基础素材和思想载体的角色。而大数据侦查模式所借助的大数据和云计算技术则是以机器语言为运转素材,其内在思维基础是以机器的自我辨识和自动化分析为主要形式的,这与人类所使用的自然语言存在一定差异。此种差异表现在现实侦查办案中往往是侦查人员通过自修或与技术人员合作形成了对案件的某种认识,这种认识是以自然语言形式呈现的,其中所蕴含的原理和规则是侦查人员对机器语言规则的理解和解读。但在刑事诉讼的审查起诉阶段和审判阶段,检察官与法官却并没有形成对大数据模式的内心认同,往往依循传统方式中对确定性因果关系的溯因追问来构建证明逻辑体系,这使得侦查阶段以大数据方式获得的相关性信息(线索或证据)往往无法得以理解,更惶论证明过程之完备。故而,在某些地方形成了政法委员会协调公、检、法有关机关共同会商,形成地方性文件的方式来促使检察官、法官接受某些形式的资料,完成刑事诉讼证明过程。其实,这种窘境可以通过两方面的解读来予以纾缓,一方面,侦查人员对社会信息的把握主要基于对社会现实的理解,其在犯罪信息的解读中主要是以自然语言的形式呈现的,那么,他们与技术人员的合作过程必然是从自然语言到机器语言的转化,浓重的目的论导向追求必然促使侦查人员不断追问并试图理解机器语言所呈现的可能障碍;另一方面,以机器语言驱动的算法使得侦查人员发现了数据自身的相关性,可这种相关性仍然需要侦查人员予以解读,并在后续诉讼证明过程中与其他刑事诉讼主体形成有效的交互性意见整合。所以,机器语言与自然语言的融合本就可能,并且可为。当然,法律共同体还需要进一步发展对大数据模式的理解,相应拓展对现代社会数据化生存的理解。
(二)相关性关系的证明可能
笔者认为,大数据侦查模式体现于侦查办案中的相关性证明应与刑事诉讼证明的整体内涵相契合,在现有刑事诉讼证明体系内探寻可能路径。现有刑事诉讼构造之下的侦查程序所担负的证据的收集、检验、鉴定等重任促使侦查人员更倾向于穷尽方法搜寻隐藏于数据迷雾之中的客观联结(即相关性),并力图将这种相关性关系合理解释为现有证据体系所要求的程度。因而,大数据侦查模式下的办案过程中的相关性证明如何与证据相关性证明有效联结,便成为转换与融合的关键。
大数据侦查模式下的相关性关系是基于特定算法得来的数据相关性,其数据基础来源于社会生活中不断积累的海量数据。社会生活中的各种信息痕迹被自动化记录,并为侦查机关所用,在侦查人员发现事实和认定事实之间相互关联方面发挥了重要作用。当然,这种关联必然是建立在全量数据的分析之上的,是超越人类已知的理性经验把握范畴的。
而刑事诉讼证明所依赖的证据本身不具有领域依赖性质,证据通过命题、断言在推理或者论证中展示对待证事实的支持关系。在传统证据法中,司法裁判由“发现”和“证成”两阶段构成,前者又涵盖对案件事实的发现(事实认定)和对法律适用的发现。按照大陆法系的传统,对事实的认定是事实认定者在自由心证过程中完成的,这个过程往往是复杂的心理权衡活动,在完成事实认定的基础之上,再对整个裁判论证进行合理性的建构。事实认定者的心证形成过程是一个心理过程,同时也是一个基于经验的论证判断过程,事实认定者基于证据的事实认定过程是一个理性心智判断过程,理想的事实认定是一个充分信息条件下的符合经验常识的理性认知决策。在信息呈指数性增长的互联网时代,社会生活的虚拟化纷繁复杂,事实认定者很难对各个领域全知全能,而大数据分析让我们看到了事实认定者经验与全量关联信息连接的可能性,试想我们如果能从某个维度对全量数据进行完整收集、分析、归纳,在知识的意义上就为事实认定者的决策提供了完备信息准备,事实认定者只需充分运用自身的理性、良知、经验即可从完整的信息图景中作出最优判断。大数据背景下的侦查信息恰恰提供了这种全景性考察,使侦查主体即使未能通过逻辑推理来把握数据之间的关联缘由,也能在海量非结构化数据中提炼出结构化的数据集合供侦查主体发现规律,对现实犯罪活动做出恰当预测。而依据英美证据法对相关性的理解,大数据分析只要能够对理解证据提供实质性帮助,就可以作为证据予以承认,只不过这种实质性关系建立在对全量数据的观察之上,而非传统的法律人理性经验。笔者认为,英美证据法对证据相关性做二分解释,从逻辑分析的角度看,某个现象(事实)的成因或许非常复杂,但是我们从实证的角度可以观察到现象之间的先后关系,传统证据相关性理论强调个人经验对先后现象的观察,而对于全量数据的统计观察或许是另一条探寻现象之间实质性关系的重要途径,只不过人的理性在此方面不擅长而已。
大数据分析基于全量数据的研究手段,能够帮助事实认定者扩展认知能力,特别是在理解证据对待证事实的支持关系上,实践中大数据分析跳出了以往侦查活动对经验的高度依赖,能够以数据可视化的方式处理证据与待证事实间的相关性。证据推理过程不仅仅是逻辑思维过程,同时也是主观经验判断过程,大数据分析是针对互联网海量数据间相关关系的实证性观察,是一种经验性研究。大数据中的相关性可以为刑事证据的证成提供有力帮助。
笔者认为,大数据相关性强调数据间的关联,基于全量数据分析,规模化数据处理能力是人的经验和理性无法胜任的任务,而证据相关性则强调法律人的经验和逻辑理性。本文提出,大数据分析预测尽管在目前阶段尚不能独立成为证据方法,但能对案件事实认定过程提供背景知识。侦查办案过程中愈发受重视的大数据方法,为侦查人员提供了超越理性的“数据经验”,这种经验可以作为事实认定的有力工具,并为后续的证据相关性提供有力支撑。很显然,我国的证据法规则需要在大数据背景下做出恰当的完善。
[1] Manyika J, Chui M, Brown B., Big data: The next frontier for innovation, competition and productivity[R/ OL]. Las Vegas: The McKinesey.com/institute.[2015-10-13]. http://www.mckinscy.com/insights/business techology/ big data the next frontier for innovation.
[2]维克托·迈尔-舍恩伯格,肯尼斯·库克耶.大数据时代——生活、工作与思维的大变革[M] .盛杨燕,等,译.杭州:浙江人民出版社,2013:1.
[3]王国民,李双其.侦查学[M].北京:中国人民公安大学出版社,2013:38.
[4]查尔斯·R·史旺生,列尔纳德·特里托·警察行政管理——结构过程与行为[M].匡萃冶,等,译.北京:中国人民公安大学出版社,2013:114.
[5]何军.大数据与侦查模式变革研究[J].中国人民公安大学学报(社会科学版),2015(1).
[6]米歇尔·福柯.规训与惩罚[M].刘北成,等,译.北京:生活·读书·新知三联书店,1999:219—255.
[7]陈振明.政府治理变革的技术基础——大数据与智能化时代的政府改革述评[J].行政论坛,2015(6).
[8]张浩.大数据与法律思维的转变——基于相关性分析的视角[J].北方法学,2015(5).
[9]齐磊磊.大数据经验主义——如何看待理论、因果与规律[J].哲学动态,2015(7).
责任编辑:刘洪波
Proof of Relativity Relations under Big Data Detection Mode
ZHAO Feng
(Jiangsu Police Institute, Nanjing 210021, Jiangsu Province, China)
The big data investigation mode is the latest performance of evoltution of investigation mode in China, whose investigation is based on massive data cloud computing technology and predictive function is favored by investigators. Relativity relations of data is the analyzing focus of this investigation mode, that is different from the traditional investigation which emphasize the thinking way and action guidance of deterministic causality. Deterministic causality has its limitation and relativity analysis just can make up it. This article suggests that taking combination of machine language and natural language as a start to change thinking way and combine relativity connections in cases with proving process of criminal litigation.
big data investigation mode; relativity; causality; combination
D90-051
A
1671-5195(2016)06-0030-07]
10.13310/j.cnki.gzjy.2016.06.005
2016-03-01
江苏警官学院院级科研项目:《江苏省网络犯罪侦查行为风险干预模式研究——以“信息自决权”为视角》(13Q15),江苏省优势学科项目,江苏高校品牌专业侦查学建设工程资助项目,江苏警官学院侦查系科研创新团队项目资助研究成果。
赵 峰(1980-),男,江苏南京人,江苏警官学院侦查系讲师,法学硕士。