大数据时代犯罪防控困境及出路探讨

2018-01-28 01:01
铁道警察学院学报 2018年1期
关键词:犯罪预测防控

张 威

(北京师范大学 刑事法律科学研究院,北京 100875)

引言

大数据时代的到来,影响着社会生活的方方面面,犯罪防控领域也不例外。犯罪防控作为社会治理以及公共安全体系的重要组成部分,也越来越重视对大数据技术的应用。西方许多国家已经率先将大数据应用于反恐、国家安全、犯罪预测、犯罪侦查等领域,并收到了积极的效果。我国在2015年9月召开的全国社会治安防控体系建设工作会议上,首次明确提出要充分依托大数据、云计算中心,善于从多源的、分散的、碎片化的大数据中找到规律,为维护公共安全提供创造性服务[1]。同时,各级公安机关也在不断尝试利用大数据技术,建立大数据警务平台用于犯罪防控,并且已经取得了一定的成效。但科技永远都是一把双刃剑。在大多数人都对技术充满了崇拜和迷恋的背景下,如何正确理解并理性对待大数据,如何能在应用大数据进行犯罪防控的同时科学应对大数据带来的困境,未雨绸缪地合理规避大数据带来的风险,是非常值得研究的一个重要课题。

一、大数据的概念与特征

(一)大数据的定义

关于大数据,目前还没有较为统一的定义,但是普遍认为大数据具有四个主要特征:第一,数据规模庞大,要远远大于传统数据的规模;第二,数据流转迅速,不仅数据产生得快,而且数据处理也快;第三,数据类型具有多样性,不仅包含传统的结构化数据,还包含了大量的半结构化和非结构化数据;第四,数据价值密度低。大数据的价值密度相对较低,但是有巨大的潜在价值。

大数据并不单指数据,本质上是数据和大数据技术的综合体。大数据技术包含四个方面的内容,即:大数据采集,大数据存储和管理,大数据的分析和挖掘,大数据应用。其中,大数据的分析与挖掘是较为关键的一步,目前的数据分析和挖掘方法主要有分类、估计、预测、关联分析、聚类、描述和可视化等,每种分析方法又可以通过多种不同的算法来实现。

(二)大数据思维的典型特征

1.重全样而非抽样

大数据时代,处理的数据从样本数据变成全部数据。以前,因为人们无法获得大量的总体数据,所以只能采用抽样的方法获取数据。在大数据时代,数据的收集、存储和分析技术都有了很大进步,人们对全部数据的收集与分析变为可能。通过对全数据的分析,能够更准确、更深刻地发现之前的小样本研究无法得出的信息,进而使我们对事物整体的认识更加全面、系统。

2.重效率而非精确

大数据时代,大部分数据都是非标准化的数据,混杂性强,同时由于对效率的追求,人们的思维方式从小数据时代的精确思维转向容错思维,对精确度的痴迷将减弱[2]。也就是说,当拥有海量且多样化的数据时,绝对精准就不再是追求的主要目标,而是可以容许一定程度的错误与混杂。而且,大数据时代更多关注的是效率、相关性及概率性。因此,在大数据时代,可以适当忽略微观层面上的精确度,追求宏观层面上更为深刻的洞察。

3.重相关而非因果

大数据时代,人们不再像传统的因果思维时代那样注重挖掘事物或现象背后的因果关系,而是试图通过大数据发现事物之间隐蔽的、普遍的相关关系,然后通过这种相关关系来进行预测。这不仅是大数据一个最为突出的特点,这种建立在相关关系分析法基础上的预测也正是大数据的核心。与因果思维相比,相关思维更关注的是事物或现象间的关联或联系,而不必非得深究背后的深层次原因。舍恩伯格指出,知道“是什么”就够了,没必要知道“为什么”。大数据时代,我们不必非得知道现象背后的原因,而是要让数据自己“发声”。

4.重数据主导

大数据时代,数据成为核心和主导,海量数据的潜在价值不断增大,让数据发声成为常态,也就是主要靠对数据的分析发现其中的巨大价值。对于一个企业或者一个部门来说,拥有了数据就拥有了更大的主动权和更多的资源,可以通过大数据分析发现关联因素,并据此做出预测。在这种趋势下,通过大数据来进行决策将会成为常态,人们会越来越依赖大数据。

二、大数据对犯罪防控的影响

随着大数据的发展,大数据技术已经逐渐被应用于犯罪防控领域,对犯罪防控的理念和模式产生了深刻的影响。

(一)基于大数据的犯罪侦查

犯罪侦查离不开对各种信息和数据的收集与分析。大数据时代的到来,对犯罪侦查的理念、策略以及工作模式都产生了极大的影响,使之发生了深刻的变革。

1.犯罪侦查理念的变革

(1)数据主导型侦查

大数据时代,侦查理念上最大的变化就是形成了以数据为主导的侦查理念。由大数据驱动的侦查理念,以大数据库作为侦查的基础资源平台,让数据处于核心地位,支配侦查工作的全过程[3]。传统的侦查,主要是通过对犯罪嫌疑人的讯问来获取口供,然后通过口供来寻找犯罪证据,并最终查清犯罪事实,侦破案件。在大数据模式下,可以依靠大数据掌握大量的犯罪证据和信息,只需要在讯问阶段进行核实就可以。也就是说,大数据技术的应用将打破传统的“重口供,轻证据”的证据收集规则,从而形成以客观证据为主,犯罪嫌疑人口供为辅的证据规则[4]。

(2)主动型侦查

大数据背景下,犯罪侦查的模式由反应型侦查模式向主动型侦查模式过渡。按照侦查模式采取的措施和行动是否具有超前意识的标准,侦查模式可以分为反应型侦查模式和主动型侦查模式[5]。反应型侦查是一种“由案到人”的侦查,即是在犯罪行为发生后,根据案情来确定犯罪嫌疑人,这是传统侦查方式的主要特征。大数据技术的出现,使侦查人员能够获得足够的情报和关联信息,从而能够更为主动地追踪犯罪嫌疑人,实现快速破案,这就发生了“由案到人”到“由人到案”的侦查理念的转变。

(3)预测型侦查

如上所述,传统的侦查模式实质上是一种回溯型侦查。侦查人员根据案件情况进行调查,通过不断的侦查来重建过去。而大数据时代的预测型侦查能够将介入的时间提前,可以与犯罪行为发生的时间同步,甚至还可以再提前进行。借助大数据既可以预测某一区域乃至全国的某类犯罪的趋势,还可以预测某一个体的犯罪概率。根据预测,我们可以提前制订应急预案,优化警力配置,及时采取行动。这样,对于犯罪侦查来说,过去的“犯罪发生—再反应”模式或将改变为“预测—行动”模式[6]。因此,在大数据时代,预测型侦查将成为常态。

2.大数据在犯罪侦查中的应用

大数据在犯罪侦查中的应用大致可以分为两个方面。首先,大数据可以实现多种数据的快速查询及比对,如可以进行文字、图像、指纹、人脸识别等多种数据的搜寻比对。任何时间,都可以根据侦查需要,在办公室、车上或任何一个有行动装置的地点进行查询。其次,大数据可以分析犯罪模式,帮助办案人员快速破案。一方面可以运用数据分析、探勘、分群、分类、建立关联、特征识别等技术来分析罪犯的行为模式,并可将汇整的数据显示至地图或制作各种表格,协助警察侦查犯罪[7];另一方面,可以对犯罪人进行犯罪画像、预测嫌疑人逃亡去向、将案件进行关联对比,有助于解决悬案和连环犯罪案件[8]。

(二)基于大数据的犯罪预测

1.大数据对犯罪预测的影响

大数据的核心在于预测,大数据的发展提升了犯罪预测的可能性和精确性。基于大数据的犯罪预测,能够帮助公安机关高效地利用已知的犯罪数据,对未来可能发生的犯罪行为进行预测,并以此预测结果进行行动部署,使有限的警力和资源发挥最大的功效。

基于大数据的预测体系标志着个体化的分析转变为基于事件的分析。在个体化分析情况下,监控数据被用来为已经存在嫌疑的人提供证据。基于事件的分析侧重于通过将数据与负面事件的关联来识别犯罪模式,然后寻求将这种相关性反过来用于进行个体或群体预测。在这样的系统中,就有可能将Facebook上某篇帖子的某些言语与可能的校园枪击联系起来,允许警察审查或逮捕一些符合危险模式的人[9]。

2.大数据在犯罪预测中的应用

大数据在犯罪预测中的应用主要包括以下三个方面。第一,可以进行犯罪高发区域的预测。在大数据时代,可以通过对以往犯罪数据的挖掘和分析,以可视化的方式生成犯罪热点图,进而就可以直观地看到各个地区的犯罪率情况、热点犯罪类型以及犯罪的季节性或短期趋势。通过这些热点图,公安机关可以合理部署巡逻力量或相应的预防措施,有效地避免或减少犯罪案件发生。第二,可以识别犯罪模式,预测个体或群体犯罪。基于大数据技术,可以找出某些个体特征与具体犯罪类型或犯罪特征之间的关联,从而确定某些高风险个体或群体,然后就可以针对这些个人和群体,进行排查、监控和适当的干预。第三,可以进行科学的再犯罪预测。在大数据时代,可以利用大数据分析处理技术提取罪犯危险性特征,建立服刑人员危险性识别与动态预测模型。利用机器学习等技术,根据后期测试结果不断完善模型,提高预测精度,使其成为一个循环反馈环路,从而建立一套服刑人员危险性识别与动态预测体系。通过这一体系可以实现对服刑人员危险性的个性化、精准化预警,为大数据时代监狱的监管安全提供可靠保障[10]。

三、大数据下的犯罪防控困境

(一)伦理困境

1.数据获取和所有权困境

数据获取阶段存在的伦理问题主要包括两个方面。第一是数据的获得是否合规,是否是在个人知情并同意的情况下进行的。大数据环境下,有些数据的获得是经过用户同意和许可的,但是有些数据并未得到授权和许可。在目前开放性的互联网环境下,授权行为实际执行比例太低[11]。这就导致很多人在并未授权和不知情的情况下就被收集了个人信息数据。而用作犯罪防控的大数据的收集,很多时候更是完全忽视了个人的知情权。

第二,数据所有权问题。数据的所有权属于“收集者”还是“创造者”?即便是所有数据的获得都得到了个人的授权和许可,这些数据的所有权仍然是存在争议的。从某种意义上来说,个人的信息数据就相当于个人的私有财产,尤其在大数据时代,数据的价值越来越凸显。在这种情况下,个人的信息数据是否仅仅经过简单的授权就可以被拿去进行存储、分析、处理,甚至用来共享?即便是将大数据用作犯罪防控也是如此,是否仅以社会稳定或国家利益的名义,就能够直接收集、使用公民的个人信息数据?

2.个人隐私权侵犯困境

个人隐私权的侵犯是一个重要的伦理问题。从本质上讲,大数据并不能做到完全匿名化。虽然单个数据或者单一数据库中的数据是匿名的或者经过模糊处理,但是大数据处理技术的一个基本前提是,众多独立的小数据在数据库中组合在一起,才可以产生一个足够充分的个人画像,才足以预测他或她的行为。也就是说零星的或者部分搜集数据的行为,可能是单独无害的、被使用者授权的,但是这些数据结合在一起,在量上的积累就有可能造成对隐私权的侵犯。无论是用于商业用途还是用于犯罪防控,通过大数据技术,能够完全掌握一个人的各种隐私信息,如通信隐私、社交隐私、身体隐私等。

3.偏见和歧视困境

以数据为主导的思维方式和大数据的预测性特征,会不可避免地导致对个人、群体以及地域的偏见和歧视。大数据的核心在于预测,大数据技术使人们相信可以通过数据的分析和挖掘来预测人的行为,即便是在缺少因果关系及理论基础的情况下,也会依据分析的结果来进行主动防控。这会使人们产生先入为主的观念,从而逐渐产生偏见和歧视。如对犯罪热点区域或高发区域的偏见,对那些被大数据技术筛选出来的符合某些特征的人或群体的歧视。人们原本寄希望于机器或者自动化来减少乃至消除人类的偏见,但是大数据不仅不会避免群体歧视,还有可能加重这一趋势。

4.“被遗忘权”之困境

“被遗忘权”也是大数据时代必须要面对的一个难题。所谓“被遗忘权”就是指个人有权删除或禁止别人使用涉及自身的不良或隐私信息。被遗忘权本身就是在大数据背景下产生的。大数据时代,一旦数据被收集、存储,将会长时间保存,这些涉及隐私甚至是包含某些个体不良记录的数据信息能否定期删除或者被大众遗忘,是一个非常重要的问题。每个人都有犯错误的可能,如果一些之前生活中的非常小的错误被永久记录,那么就有可能在以后的某个时候对其产生重要影响,特别是一些较为负面的、令人尴尬的信息都有可能导致被放大、滥用,最终使当事人成为大数据的受害者。

(二)技术困境

1.数据质量困境

(1)大数据仍非全数据

大数据看似全面,但实际上往往存在系统偏差,难以做到全数据。首先,大数据难以涵盖所有的“黑天鹅事件”①“黑天鹅事件”通常是指难以预测的但影响甚大的事件,一旦发生,便会引起整个局面连锁负面反应甚至颠覆。。影响人的行为或事件产生的因素很多,有些影响因素可以通过对历史数据或者其他关联数据的分析获得,但是还存在一些类似“黑天鹅事件”的因素难以获取,这势必会影响数据的全面性。其次,数据在生成或采集的过程中并不都是平等的,大数据采集存在“信号问题”——即某些个体和群体会被忽略或未得到充分代表。最后,当前的大数据采集缺乏顶层设计,大多仍处在各自为战的层次,共享水平较低。

(2)数据正确性难以保证

数据的正确性是影响大数据结果的最明显因素。由于数据来源的复杂和类型的多样,数据很容易在细节方面出现错误。例如,可能会知道一个人的名字,但是可能会完全弄错他的年龄、种族或者购物习惯。在搜集的是非结构数据的情况下,这种错误可能更大。将这些数据用于犯罪预测系统将会放大数据错误以及有缺陷的解读带来的伤害。

2.预测错误率困境

大数据预测系统的一个先天的局限是存在固有错误率。所有的预测系统都会存在基准谬误,在犯罪预测中,如果系统出现错误否定,也称假阴性,就有可能错误地漏掉一个有罪个体;而假阳性是指一个无辜的个体被怀疑有罪,会导致需要去审查大量的正常个人的档案,这不仅会不必要地侵犯人们的隐私和自由权,还会增加工作量。这一基本的统计局限表明,即使一个非常精确的预测模型,也有可能造成难以接受的错误率。在犯罪防控领域,这种局限带来的成本是巨大的。例如,如果一个用来识别恐怖阴谋的系统存在0.1%的误报率和0.1%的漏报率,那么在检查了万亿条信息的情况下,系统就会产生10亿的误报。

3.存在“预测即干涉”悖论

大数据分析中还存在“预测即干涉”的问题。“预测即干涉”悖论类似于量子物理中的“测不准原理”②量子物理创始人之一维尔纳·海森堡(Werner Heisenberg)曾在1927年的一篇论文中指出,在量子世界中,测量粒子位置必然会影响粒子的速度,即存在“测不准原理”。。也就是说,一旦进行预测,就会对实际情况产生干涉。比如,如果因为当年的大白菜卖价不错而预计明年的卖价也不错,于是众多菜农在这个预测的指导下,第二年都去种大白菜,结果反而是菜多价贱伤农。在犯罪预测的情况中也会出现这种情况,比如,当向某些预测的犯罪高发区增加警力的时候,虽然确实有些人会停止犯罪,但是有些人可能会选择其他地点实施犯罪行为。

4.过于注重相关关系

对相关关系的分析是大数据技术的核心任务。如前所述,大数据技术的主要分析方法就是利用相关关系的分析来进行预测,而不再去关注更为深层次的因果关系。很多时候,大数据追求的是实验性,也就是很偶然地发现非预期但很有价值的信息,这与统计分析中对确定性的追求是不同的。这明显是存在问题的。相关性普遍存在于很多事物或因素之间,所以即使存在相关关系也不能说明什么。在大数据中,看起来毫不相关的两件事同时或相继出现的现象比比皆是,相关性本身并没有多大价值,关键是找到了“相关性”背后的理由,才是新知识或新发现。

5.存在自我强化和自动化偏差

基于大数据的犯罪防控会形成自我强化偏差。人们对模型的评估是按照发现犯罪的成功率来判断的,而不是按照降低犯罪或社会监控成本的成功率进行判断的。这就是说,如果经常在系统模型所标识出来的地区寻找犯罪,每找到一次就会更加认为系统是有效的。同时这也会导致盲区的存在,就是对目标群体之外的群体缺乏监管。实质上,对目标群体的监控并不会降低所针对犯罪的发生率,甚至会增加。另外,在自我强化的基础上大数据还会产生自动化偏差,进而会导致人们对基于计算机的操作特别是机器的计算过于相信,缺少理性思考。在审校机器的结果时,常常缺少信心和经验去否决机器的错误或者对机器的结果做事后批评。

(三)法律困境

1.信息安全困境

大数据时代,信息安全问题是需要面对的首要法律问题。在大数据背景下,数据收集、分析、流转等任何环节都有可能出现数据滥用、泄露等问题。而且,从实际情况来看,信息安全事件也层出不穷。但是,我国的互联网法制化道路还很遥远,在大数据的背景下,还有很多法律困境需要我们去正视和应对。而在大数据警务时代,用于犯罪防控的大数据更是需要注重安全性。这是因为用于犯罪防控的大数据,涉及太多个人的隐私信息数据,一旦泄露将会对个人造成难以估计的影响。我国并没有赋予个人对自身信息数据像财产权保护一样的权利,国家部门在收集使用数据的时候也并没有明确的法规限制,没有建立这些数据使用和管理的规则条例或法律。这就会造成数据的滥用,给个人的信息安全带来极大的威胁。

2.侦查权的过度扩张困境

大数据背景下的犯罪防控,是一种主动型、预测型的防控,会导致公权力特别是侦查权的过度扩张。基于大数据的犯罪防控,首先要通过大数据技术的分析,确定某些高危个人或群体,然后有针对性地进行排查和监控,甚至是审查逮捕,这极易造成侦查权的扩张。侦查权的扩张不利于尊重和保障人权,不利于公民基本权利与国家侦查权力之间的平衡。人权保障之得失取决于侦查权制约之成败。公民的基本权利和自由是否能获得保障,关键取决于侦查权制约之成败[12]。如果仅凭大数据系统的预测就直接实施审查和抓捕,启动侦查权,是对数据和机器的盲目信任,同时也是对当事人人权的极大伤害。

四、大数据下的犯罪防控困境之应对

(一)确立科学的大数据使用观

大数据作为一种方兴未艾的新技术,必然存在优势和缺陷。我们既不能盲目相信,让大数据主宰一切,也不能故步自封,盲目排斥。在运用大数据进行犯罪防控的时候,应当正确认识到大数据技术存在的问题,并加以修正,避免出现自动化的偏见。

1.注重将大数据与小数据相结合

在进行犯罪防控的时候,要注重将大数据与小数据研究相结合,这样才有利于得出客观公正的结论。如上所述,大数据具有数据量大的优点,但是却容易存在数据质量问题,而且其更加注重的是混杂性而不是精确性。而传统的小数据预测,注重科学抽样,保证抽象的随机性,在此基础上得出的结果更值得信赖。所以,大数据在结果的正确性上并不必然优于小数据。因此,在当前大数据并非全数据,而且多为不均匀的大量数据的情况下,将大数据分析和小数据研究相结合,不失为一个最优的选择。也只有以这样的态度利用大数据进行犯罪防控,才是一种负责和审慎的态度。

2.数据分析与人工分析相结合

基于大数据的犯罪防控,要注重将数据分析与人工分析相结合。大数据终究是一种技术,本质上仍然是一种人类发明的工具。人类最伟大之处恰恰是算法和硅芯片不能够揭示的。我们要在正确认识大数据弊端的基础上,合理运用大数据分析技术,尽可能提升我们对事物的分析处理能力。但是,我们不可完全受其主导,将大数据的分析结果奉为真理。若对其过分依赖,自动化的偏见就会超过人类的偏见。因此,在获取大数据分析结果的基础上,还要根据以往的经验和理论进行一定的人工分析,对其结果进行甄别、筛选,最终获得科学的分析结果。只有这样,才能达到理想的犯罪防控效果。

(二)建立正确的大数据伦理准则

为了促进大数据健康发展,我们必须尽快采取措施,确立正确的伦理观念和伦理准则。具体来说,就是要尽快确定道德底线和行业规范,明确何种行为是正确、何种行为是错误的道德判断,构建起是与非的判断准则。同时,还要注重进行大数据的道德伦理教育,并使之内化为道德标准,最终建立基于数据伦理道德的新公序良俗。

为此,需要确立以下三个方面的原则。首先,确立无害原则。无害原则是最低的伦理道德标准,要求尽可能地避免给他人造成不必要的伤害[13]。不能因为进行犯罪防控,就可以肆无忌惮地伤害公民的权利和自由。其次,确立保密原则。大数据下的犯罪防控,涉及众多的个人隐私信息。同时,基于大数据的犯罪预测和犯罪预防,又很容易产生偏见和歧视。这就要求对数据的内容以及数据处理的结果严格执行保密纪律。最后,确立人本主义原则。在使用大数据进行犯罪防控过程中,要以人为本,尊重每个人、关怀每个人。明确赋予个人知情权、被遗忘权以及其他与个人信息数据相关的权利,真正确立技术的发展是为人的全面发展服务的技术伦理观。

(三)完善大数据相关法律

法律是社会公平正义的最后保障,因此要尽量通过法律途径严格大数据程序,明确大数据适用范围。当前,我国在大数据方面的立法基本处于空白状态,地方性条例法规也是凤毛麟角。而传统的法律在个人数据保护等方面难以操作。另外,还存在边界模糊、责任不清的问题。这不利于大数据的健康发展以及在犯罪防控中的应用。

相关法律的完善可以从以下方面着手。第一,明确个人信息数据的获取程序。是否需要个人的授权和许可,以何种方式获得个人的许可,这都需要在法律中加以明确规定。第二,明确个人信息数据的所有权、处分权归属,明确使用权的界限。第三,明确个人隐私权的内涵和边界,确立保护个人信息安全的内容和策略。第四,在主动性侦查、预测性侦查背景下,需要明确执法机构的权限和侦查程序,防止公权力的过度扩张和侦查权的无限放大,防止个人的正常生活受到妨碍、正当权益受到侵害。

参考文献:

[1]孙春英.主动适应新形势 增强风险意识 坚持创新驱动切实提高维护公共安全能力水平[N].法制日报,2015-09-24(001).

[2]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革[M].杭州:浙江人民出版社,2013:18,67,75.

[3]印大双.侦查模式从现场驱动到数据驱动的逻辑演进[J].贵州警官职业学院学报,2016(6):3-10.

[4]徐良峰.大数据背景下侦查模式变革研究[D].上海:华东政法大学,2016:24-26.

[5]王晓楠.大数据时代下的主动型侦查模式研究[J].辽宁警专学报,2015(3):18-21.

[6]何军.大数据与侦查模式变革研究[J].中国人民公安大学学报(社会科学版),2015(1):72-80.

[7]章光明,黄文志.大数据在犯罪侦查中的应用[J].上海公安高等专科学校学报,2016(1):84-89.

[8]李熙,黄力.大数据背景下的犯罪预测与预防——基于犯罪预测分析模型的应用及构建[J].山西科技,2015(3):133-135.

[9]Miller K.Total Surveillance,Big Data,and Predictive Crime Technology:Privacy's Perfect Storm,Journal of Technology Law&Policy,2014(19):106-145.

[10]马国富,王子贤,马胜利.基于大数据的服刑人员危险性预测[J].河北大学学报(自然科学版),2016(6):657-666.

[11]臧一博.大数据时代下信息伦理问题探究[D].锦州:渤海大学,2016:17.

[12]孙煜华.侦查权的宪法控制[M].北京:法律出版社,2014:3.

[13]理查德·A斯皮内洛.刘钢译.世纪道德:信息技术的伦理方面[M].北京:中央编译出版社,1999:53.

猜你喜欢
犯罪预测防控
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
公园里的犯罪
选修2—2期中考试预测卷(A卷)
配合防控 人人有责
猪常见腹泻病症状及防控
守牢防控一线 静待春暖花开
夏季羊中暑的防控
Televisions