张涛
〔摘要〕 在推进国家治理体系和治理能力现代化的背景下,大数据技术在警察执法中广泛使用。基于此,文章运用规范分析、案例分析、比较分析的研究方法,研究了大数据警务的技术逻辑、实践运用、社会风险及法律控制。研究表明,在大数据警务实践中,“脏数据”往往导致公民平等权保护受到威胁;警察机关大量归集、处理和使用个人数据,对公民个人信息隐私造成侵犯;算法系统缺乏透明度和问责机制,导致公民权利得不到有效救济。为了防范大数据警务系统的异化,我国应当制定警务数据采集规范,确保个人数据的合理使用;建立警务系统评估机制,定期检测系统存在的风险;赋予公众算法解释权,强化事后的监督问责。
〔关键词〕 大数据警务;算法;人工智能;法律规制
〔中图分类号〕TP31113;D6311〔文献标识码〕A〔文章编号〕1008-2689(2020)03-0069-09
引 言
数据是信息、知识和智慧的基础和前提。①20世纪90年代以来,信息技术日新月异,信息产业持续发展,信息化、数字化已成为当今时代的重要特征,“凡事皆可量化”②“万物皆数”已经成为现实。随着物联网、云计算、机器学习、人工智能等技术的发展,我们已经进入了一个以海量信息和数据挖掘为特征的大数据时代,人们的生活、工作与思维都发生了大变革[1](1)。在第四次工业革命背景下,人类的行为决策和公共治理方式向着智慧化方向发展,大数据技术成为数字时代的“望远镜”或“显微镜”,使我们可以看到并计量之前我们一无所知的新事物[2](8)。警察执法模式也开始向“智慧警务”或“大数据警务”发展。2017年7月,国务院发布《新一代人工智能发展规划》,提出“促进人工智能在公共安全领域的深度应用,推动构建公共安全智能化预警与控制体系”。大数据警务逐渐成为法学、公共管理学、社会学、数据科学等学科共同关注的重要课题。
自美国“9·11”事件以后,世界各国的警务部门都在积极探索警务模式之变革,而大数据技术为警务模式创新提供了重要契机。根据美国警察行政研究论坛于2014年出版的《警务的未来趋势》(Future Trends in Policing),受调查的200家美国警察机构中,有70%的警察机构表示将在2到5年内实施或加强对大数据警务的使用[3](3)。我国各级公安机关也在积极探索大数据警务实践,四川省泸州市公安局于2018年1月成立了“大数据警察支队”,专门负责大数据警务资源的开发与应用,实现对各类风险隐患的敏锐感知、精确预警[4];上海市公安局于2019年7月成立了“数据处”,成为全国省级公安机关中首家独立的“数据警察”部门[5]。
大数据警务对警务部门而言,既是机遇,亦是挑战。大数据的核心就是预测,是把数学算法运用到海量的数据上来预测事情发生的可能性,许多单纯依靠人类判断力的领域都将会被大数据技术所改变甚至取代[1](16)。大数据技术在警察执法中的应用,不但可以降低警察执法成本,提高执法的准确性,而且还能提高执法效率,及时应对突发情况,在一定程度上还能限制执法者的自由裁量权[6]。美国圣克鲁斯警察局在第一年使用大数据警务技术Pred Pol后,盗窃案件下降11%,抢劫案件下降27%[7];四川泸州市自实施大数据警务以来,2017年、2018年刑事发案率分别下降2098%、147%[8]。然而,大数据警务实践也存在诸多亟待解决的风险议题,如因“脏数据”而导致的社会公平问题、因海量数据采集(挖掘)而导致的个人隐私问题、因大量数据存储而导致的数据安全问题等等[9]。这些风险议题在很大程度上尚未得到法律界的认真讨论与审查,若不妥善应对,将严重影响“智慧公安”的建设进程,出现警察权力行使与公民个人权利保护失衡的局面[10]。
在全面推进国家治理体系和治理能力现代化的背景下,大数据警务虽然能够提升警察执法的效能,但却存在侵犯公民权益的风险。基于此,本文重点分析了大数据警务的技术逻辑和运行现状,阐释大数据警务实践中存在的主要风险,从行政法的角度提出规制大数据警务的建议。
一、 大数据警务的技术逻辑
大数据警务作为一个综合性概念,目前尚未有明确而统一的定义。为了理解大数据警务的基本内涵,我们可以从大数据本身入手。一般认为,“大数据”是收集和分析大量数据集的简称,目的是揭示隐藏的模式或规律[11]。以此为基础,大数据警务则是以物联网、云计算、数据挖掘等信息技术为支撑,以警务信息化为核心,实现警务数据的“强度整合、高度共享、深度应用”之目标的警务发展新理念和新模式。从本质上看,大数据警务作为有别于“小数据警务”的一种新型的警务发展形态,其背后的技术支撑主要体现在两个方面:一是数据,二是算法。
(一) 数据是大数据警务的基础
“数据”这个词在拉丁文里是“已知”的意思,也可以理解为“事实”,计量和记录一起促成了数据的诞生[1](104)。大数据是现代通信技术、计算机技术和人工智能技术快速发展的产物,之所以产生如此巨大的数据量,概括起来主要有以下几个方面的原因: 1.由于各种传感设备的使用,使人们能够快速感知并获取到更多事物;2.由于海量存储技术的出现,这些事物的部分甚至全部数据就可以存储;3.现代通信工具的使用,改变了数据传输的方式,大规模海量实时数据能够及时收集和存储;4.由于各种智能分析和数据挖掘工具的出现,使大数据的加工处理成为可能[12](21)。在大数据时代,文字、图片、位置、沟通等均可以转化为数据,因此大数据时代亦可称为“一切事物的数据化”时代,这就为大数据警务的兴起提供了重要的时代背景。正如迈尔-舍恩伯格和肯尼思·库克耶所指出的“数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而绝大部分则隐藏在表面之下。” [1](134)
警务部门作为与个人、企业及其他组织联系最为紧密的部门,一直在“默默地”收集、存储及处理各种类型的数据,这就为大数据警务的出现奠定了坚实的基础。《人民警察法》第2条第1款对警察的职责进行了明确规定《中华人民共和国人民警察法》第2条第1款规定:“人民警察的任务是维护国家安全,维护社会治安秩序,保护公民的人身安全、人身自由和合法财产,保护公共财产,预防、制止和惩治违法犯罪活动。”,概括起来大致可以分为“保护个人生命、身体及财产安全”和“维护公共安全与秩序”两大部分。在履行警察职责的活动中,既有限制公民的权利和自由的活动,也有非限制公民的权利和自由的活动,无论是哪种活动,收集处理各种数据均是必不可少的環节。从公安信息化基础设施建设角度看,我国先后开启了“金盾工程”“平安城市”“雪亮工程”等公安信息化工程。通过摄像头、射频识别、智能终端、传感器等泛在网技术,实现了对公安管理要素与治安控制对象的物质属性、环境状况、行为态势等静、动态信息进行大规模、分布式的信息采集与状态辨识[13]。如今,治安监控系统、道路监控系统、居民身份系统、现场图像采集系统等系统中的有效数据奠定了大数据警务发展的基础。
(二) 算法是大数据警务的灵魂
大数据问题的核心就是大数据技术,即从各种各样的巨量数据中,快速获得有价值信息的技术,而大数据分析则主要是借助于数据分析工具以及数据挖掘算法,从海量的数据中挖掘出有价值的信息。数据挖掘算法是大数据分析的理论核心,各种数据挖掘的算法基于不同的数据类型和格式才能更加科学的呈现数据本身具备的特点。何为算法呢?如今普遍认可的算法定义是:算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作。[14](12)数据挖掘算法在实践中主要的目标是模式识别和行为预测。模式识别是指通过对数据集中的数据域进行数据分析,识别出可由人类解释的数据模式,获得对问题的深入理解,从而实现分类、个性化、精细化管理;行为预测主要是通过使用数据集中的目标对象的一些属性来预测我们所关心的变量的未知或未来的值,辅助决策支持。[15](213)
各类算法工具为大数据警务创造了无限可能性,其核心就是将“因果关系”转变为“相关关系”,将“合理怀疑”转变为“大数据怀疑”。在传统的警察执法中,警务部门主要是根据收集的各类数据按照因果关系进行分析;而在大数据警务中,警务部门通过找到一个现象的关联物,相关关系就可以帮助我们捕捉现在和预测未来。如果A和B经常在一起,我们只需要注意到B发生了,就可以预测A也发生了。这有助于我们预测A可能会发生什么,即使我们不可能直接测量或观察到A[1](70)。此外,在警察执法中,警察盘查权是一种重要的权力,它是警务部门对可疑人员和可疑场所进行临时阻拦、盘问、检视、检查。[16]警察行使盘查权的一个重要条件是“合理怀疑”或“有违法犯罪嫌疑”,其标准一般是建立在警察的经验判断之上,而“经验”常常被随意扩大。在大数据警务中,大数据的相关关系分析法更准确、更快,而且不易受偏见的影响。如果正确使用大数据怀疑(big data suspicion)[17],不仅可以提高准确性和效率,而且还能对犯罪活动模式产生意想不到的洞察。
二、 大数据警务在我国的实践应用
大数据警务成为警务工作创新的重要内容,在实践中,我国各级警务部门结合自身的工作实践,开发出不同的大数据警务模式,从方法和功能上来划分,主要可以分为两大类。
(一) 以时空为导向的大数据警务
在犯罪环境学理论中,有一种被称为“犯罪地理学”(criminal geography)的理论,其旨在研究犯罪的空间和时间分布,它的发展可以追溯到比利时统计学家阿道夫·凯特勒(Adolphe Quetelet)和法国统计学家安德烈·米歇尔·格雷(André Michel Guerry)的研究,以及美国犯罪学者克利福德·R·肖(Clifford R. Shaw)和亨利·D·麦凯(Henry D. McKay)在芝加哥的研究。[18]如今,“日常活动理论”(routine activities theory)“犯罪制图”(crime mapping)“社会解组理论”(social disorganization theory)等理论已经成为犯罪环境学中的重要理论,也为以时空为导向的大数据警务奠定了理论基础。
警务部门在以往的执法过程中积累了大量的违法犯罪案件数据,已经发生的每个案件都可能包含如下特征信息:某一特定区域的重点人口数量、整个地区的重点人口、某一特定区域的年犯案数、整个地区的年犯案数、某一特定地区的流动人口数量等[19](140),借助这些数据,前述犯罪学理论可以得到进一步研究和检验。目前在国际大数据警务实践中,已经开发出一些相对比较独立,且以时空为导向的大数据警务系统(软件),比较有代表性的主要有以下三类:1.PredPol系统,该系统可以提供多项预测服务,但是最重要的是对入室盗窃、汽车盗窃、汽车扒窃这三类案件的犯罪地点进行预测;2.Risk Terrain Modeling系统,该系统能够对某一地区的地理风险因素进行评估和预测,然后向执法部门提出建议,从而避免该地区再次发生犯罪;3.HunchLab系统,该系统综合了前述两种系统的特点,既能预测犯罪风险区域,也能针对这些风险提出有针对性的警务策略。[20](494-496)
在我国大数据警务实践中,也有许多以时空为导向的大数据警务系统,并且在警察执法中发挥了非常重要的辅助作用,极大地提升了执法效率。北京市公安局怀柔分局于2013年4月正式上线运行“犯罪数据分析和趋势预测系统”,该系统收录了怀柔区近9年来16万余件犯罪案件数据。2014年5月,该系统预测提示:近期泉河派出所辖区北斜街发生盗窃案的可能性较高。泉河派出所加大对该区域的巡逻,并于5月7日抓获一名盗窃汽车内财物嫌疑人[21]。苏州市公安局于2014年3月正式上线运行“犯罪预测系统”,该系统汇集了以往案发数据、人口信息、地理信息、气象信息等多种数据,利用大数据技术进行智能建模,预测辖区案件的高发区域及法案概率,把重点防控区域用图形界面直观展现出来[22]。
(二) 以个人为导向的大数据警务
在警务部门履行职责的过程中,提前发现和识别“有违法犯罪嫌疑的人员”一直是重点,警务部门许多权力的行使均与此有关,如《人民警察法》第9条规定的“警察盘查权”。在犯罪学理论中,“集中威慑”(focused deterrence)与以个人为导向的大数据警务密切相关。“集中威慑”源于20世纪90年代美国波士顿一个有名的减少团伙暴力犯罪项目,波士顿警察局将威慑技术聚焦于那些警局已经掌握的涉及街头团伙和暴力犯罪人身上,让一些问题地方的某些人意识到执法部门在关注他们,如果他们违法犯罪,执法部门可能会竭力让他们入狱,进而受到严厉惩罚。最终证据表明,与一般威慑相比,集中威慑能够有效减少街头犯罪和团伙暴力犯罪。[23](54-55)
以个人为导向的大数据警务主要是利用大数据来识别和调查潜在的犯罪嫌疑人、过去的犯罪嫌疑人以及潜在的受害人。就识别未来有高犯罪风险的人之方法而言,大部分方法与评估个人风险有关。传统的方法将风险因素的数量相加,从而创建一個整体风险评分;大数据警务则采用回归和分类模型,将风险因素的存在与一个人犯罪的概率联系起来。就识别过去犯罪的嫌疑人之方法而言,主要是利用犯罪现场提供的信息将嫌疑人与犯罪联系起来,既可以直接进行识别,也可以通过排除来识别。就识别潜在的受害人之方法而言,基于时空或犯罪嫌疑人的大数据警务技术均可适用,因为要想识别潜在的受害者,往往要先识别有犯罪风险的个人或群体[24](9-11)。
在我国的大数据警务实践中,也有许多以个人为导向的大数据警务系统,对于识别潜在的犯罪嫌疑人或受害者、以及过去的犯罪嫌疑人发挥了重要作用。贵阳市公安局自2017年以来开始建设“人像大数据系统”,依托“块数据指挥中心”“天网工程”等信息基础设施,运用人脸识别技术,实现对潜在犯罪嫌疑人或受害者以及过去的犯罪嫌疑人的识别。2017年,“人像大数据系统”协助抓获各类犯罪嫌疑人375人,其中全国在逃人员39名,破获各类案件400余起。[25]天津市公安局反诈骗中心通过大数据警务系统甄别潜在受害人,2018年及时劝阻受害人62万人次,避免损失115亿元。[26]
三、 大数据警务实践中的风险议题
数据驱动的决策系统正在融入社会生活的方方面面,无论是个人还是组织机构,对于自动化决策的热情似乎前所未有的高涨。警务部门越来越多地使用各种大数据技术来预测、预防和调查犯罪,所有的大数据技术均有可能存在各种不利影响,大数据警务系统也不例外。
(一) 因“脏数据”而引发的不公平对待
如前所述,数据是大数据警务系统的基础,因此任何数据驱动的系统均有被“脏数据”(bad data)破坏的风险。从数据科学的角度看,脏数据的类型很多并且每种脏数据出现的原因也不尽相同,大致可以分为单源数据和多源数据的“脏数据”,前者是指不完整数据、不正确数据、不可理解数据、过时数据、数据重复等;后者主要是指重复数据、数据冲突等。[27](96)大数据警务系统通常综合了多种基础数据库,因此脏数据的种类及来源更为复杂,一旦这些数据在性别、职业、民族、学历等方面存在偏见,就可能导致歧视性结果,造成不公平对待,正所谓“偏见进,偏见出”。美国马里兰大学教授弗兰克·帕斯奎尔(Frank Pasquale)在《黑箱社會》(The Black Box Society)一书中指出,算法并不能杜绝基本的歧视问题,而只是会使那些没有事实根据的负面假设汇集成偏见。算法的编写是由人完成的,而人又会将其价值观嵌入算法,编写算法过程中使用的数据也会不可避免地带有人的偏见。[28](55)
美国学者索伦·巴洛卡斯(Solon Barocas)和安德鲁·塞尔布斯特(Andrew Selbst)专门对大数据的“差别影响”(disparate impact)进行了研究[29]。他们认为,所有的算法决策均存在四个根本性问题:1. 定义偏见,目标变量及其关联的类标签的定义将决定数据挖掘的内容;2. 训练数据偏见,训练数据若包含偏见因素将导致歧视性的数据挖掘结果;3. 特征选择偏见,在决定哪些属性纳入分析的过程中若存在偏见将导致严重结果;4. 代理偏见,决策者在对大数据分析结果进行解释和适用时可能存在偏见。在此基础上,安德鲁·塞尔布斯特进一步对大数据警务中的“差别影响”进行了研究[30]。他认为,大数据警务系统因“脏数据”而导致不公平对待已经是不争的事实,如果这种情况继续不受法律规制,那么大数据警务系统将强化和扩大刑事司法系统中的歧视。除非社会认识到这种紧迫性,并迅速采取行动,否则我们将对大数据警务系统的歧视性差别影响习以为常。
在我国警察执法实践中,歧视问题也时常发生,尤其是社会阶层歧视,这导致选择性执法现象严重[31]。警务部门在火车站、地铁站、机场等公共场所实施盘查措施时,往往明显地将盘查对象的个人因素作为启动盘查措施的考虑基础。研究表明,社会大众以及新闻媒体对于“农民工”存在不少“污名化”的现象,认为农民工群体是问题群体(如违法犯罪率高、不文明、不礼貌、不诚信等)[32]。这种刻板印象也被带入警察执法过程中,“农民工”及其居住场所常常成为警务部门检查的重点,并形成一系列“执法数据”纳入大数据警务系统中。这些表面“客观”的数据可能实际上正在使原有的偏见得到加深和强化。假设警务部门过去一段时间中更加关注“农民工”集中的城中村,那么该地区的违法犯罪数量肯定会在总体违法犯罪数据中占据很高的比例,而这仅仅是因为警务部门恰巧重点检查了该地区,而不是因为这些地区的犯罪率的确比其他地区高。一旦这些“客观”数据将该地区认定为“犯罪高发”地区,那么对这些地区的巡查将会更为严密,那么被发现的违法犯罪现象可能就会越多,而背后的原因可能是真正的犯罪问题,也可能是应付上级的逮捕配额(如“扫黑除恶”),歧视性执法问题便会依然存在并且难以解决。[28](60)
(二) 大量数据归集、共享与处理造成隐私侵犯
数据归集、共享和处理是大数据分析中的重要环节。目前所采集的大部分数据中都包含个人信息,而且存在着各种各样的诱因,让数据控制者或处理者想尽办法去采集更多、存储更久、利用更彻底,甚至有的数据表面上并不是个人数据,但是经由大数据处理之后就可以追溯到个人[1](196)。关于大数据对个人隐私造成的影响,国内外许多学者都展开了专门的研究。美国学者迈克尔·弗罗恩金(Michael Froonmkin)提出“隐私已死”。他认为,政府和企业快速部署“隐私破坏技术”(privacydestroying technologies),导致个人信息隐私岌岌可危。这些技术包括交易数据的日常收集、公共场所越来越多的自动化监控、人脸识别技术和其他生物识别技术的使用、手机追踪、车辆跟踪、卫星监控、工作场所监控等。[33]
面对大数据大量、多样及快速的特征,笼统地讨论大数据中的隐私保护问题并不能够准确找出大数据对隐私产生的影响。因此,本文认为,应当从数据生命周期的角度出发,对数据利用行为的不同阶段所隐含的隐私问题进行精准分析。美国隐私法权威丹尼尔·沙勒夫(Daniel Solove)以数据利用为基础的分类方式将隐私分为四个阶段,分别是信息归集、信息处理、信息散布和侵害。[34]其中信息归集包含数据的产生和归集;信息处理涵盖后续存储至分析的步骤;信息散布则是数据控制者散布数据给第三人;侵害则是讨论侵入和干扰决定等行为,可以进一步分为16个类型,即信息归集阶段分为监控、讯问两个部分,信息处理包含加总、身份辨识、不安全、目的外使用等问题,信息散布涉及违反保密、揭露、暴露、增加近用、欺诈、盗用、失真。
大数据警务系统通常融合了多种不同来源的数据,即使每种数据的归集都是合法、适当且必要的,但是一旦加上大数据的大量、多样的特征,再加上算法的分析处理,除了可以产生意想不到的预测结果外,也容易造成个人身份的重新识别、增加个人档案的信息内容和建立个人活动的追踪。如果再结合类比数据一同使用,如人脸识别系统、车辆追踪系统等,个人隐私暴露的风险也随之增加。在大数据警务实践中,警务部门利用大数据警务系统对个人行动轨迹进行“画像”的事例大量存在。例如,江苏公安机关从2017年便开始智慧警务系统建设,该系统汇聚融合了1200多类近8000亿条各种资源数据,不仅能够绘制个人的活动轨迹,而且还能预测未来活动去向。“来能报警、动知轨迹、走明去向、全程掌控”已经成为江苏智慧警务的建设目标[35]。攀枝花市米易县公安局在2020年“新型冠狀病毒”防控期间,利用大数据平台,对外来人员、返乡人员进行排查,结合各卡点车辆信息、人员信息以及人脸识别,最快只需10分钟就能锁定排查对象在米易县的活动轨迹。[36]这些事例一方面反映出大数据警务对于提升执法效率、准确性的积极作用;但另一方面也隐含着对个人隐私的威胁,其合法性也有待进一步讨论,个人信息的无限制归集、共享使用可能违反“目的限制原则”,而个人活动轨迹的公布则将对个人隐私造成直接侵犯。
(三) 自动化算法系统缺乏透明度与问责机制
算法透明和算法问责一直是算法规制研究中的重点议题。一般认为,算法透明作为一种重要的算法规制原则,其侧重点主要在于事前对自动化决策系统进行规制,其功能主要在于增加算法控制者的可问责性,并且满足算法规制对象的知情权[37]。算法问责,在计算机科学家看来可能是在设计算法之前应当遵循的详细规范,从更广泛意义上来看,算法问责应当是计算机科学家、社会公众、法院及其他审查人员通过技术措施、法律机制(诉讼)实施的事后监督[38]。算法透明与算法问责之间是一种相互促进的关系,要破除“算法黑箱”,既要遵循透明度原则,也应当具备相应的问责机制。
按照目前各级警务部门实施大数据警务系统的情况来看,几乎所有类型的大数据警务系统都缺乏透明度和问责机制。大数据警务系统和其他自动化算法系统遇到了同样的难题,即技术复杂性使得局外人几乎不可能判断程序的准确性、有效性和公平性。对于警务人员而言,他们可以察觉到大数据警务系统是否在运行,但是他们无法探知大数据警务系统是如何运行的;对于社会大众、新闻媒体、法院而言,他们可能知道大数据警务系统存在问题,但却无法拿出合理的证据予以证明。这种透明度与问责机制的缺乏不仅是新技术快速发展使然,也是知识产权专有的结果。如果警察、法院或公民不能理解大数据警务系统,如果律师、记者和学者不能质疑这些技术,那么大数据警务系统都将面临合法性与合理性的危机。
四、 对大数据警务的法律控制
随着国家治理体系和治理能力现代化的不断推进,大数据警务已经势在必行。我们在追求大数据警务带来的技术红利同时,不能忽略隐含其中的风险议题。为了在技术创新与权利保护之间保持平衡,需要建构大数据警务的法律控制机制。
(一) 制定警务数据采集规范,确保个人数据的合理使用
从个人数据保护的角度看,个人数据处理与利用是个人数据归集的必然结果;从政府信息公开和政府数据开放的角度看,政府数据应当有完整的归集和处理,才能有充分正确的信息对人民公开。因此,数据的归集、处理和利用均应当有完善健全的法制规范,才能在考量行政效率的同时兼顾个人数据的保护。大数据警务系统对个人数据的汇集与使用主要体现在两个方面:一方面是警务部门直接从个人、组织归集个人数据;另一方面是警务部门整理、利用他人或其他机关共享的各种数据。为了能够规范个人数据的归集、处理与使用,确保个人信息隐私不受侵犯,应当从以下两个方面完善相关规范。
其一,制定明确的警务部门个人数据采集规范。目前关于个人数据的采集,我国尚未制定专门的法律规范,一些基本的原则或规则主要散见于其他法律中,不过大部分主要针对私营部门的数据采集行为。例如,全国人民代表大会常务委员会于2012年12月颁布实施的《关于加强网络信息保护的决定》第2条便规定:“网络服务提供者和其他企业事业单位在业务活动中收集、使用公民个人电子信息,应当遵循合法、正当、必要的原则,明示收集、使用信息的目的、方式和范围,并经被收集者同意,不得违反法律、法规的规定和双方的约定收集、使用信息。”前述规定已经基本上涵盖了目前国际上有关个人信息保护的通用基本原则,因此也应当适用于警务部门的个人数据采集行为。目前日本专门制定了《行政机关个人信息保护法》,其他国家也纷纷在个人信息保护法中对行政机关个人信息采集行为予以规范,我国应当以此为借鉴,结合我国的实践经验,制定专门的警务部门个人数据采集规范,建立统一的数据集采集、录入标准和审核标准,并且确立数据质量的责任主体。
其二,严格规范警务部门(人员)处理、使用个人数据的行为。个人数据的处理、使用是大数据警务系统中的重要环节,尽管最终的处理过程是由算法完成,但是从数据的前期处理,到算法的技术设计,均是由人在进行。因此,应当加强对大数据警务系统设计人员、管理人员的法律与伦理要求,加强对他们的培训,避免他们将自己的个人偏见带入数据处理和系统设计中;同时还要强化个人责任体系,对于那些借助“职务之便”,利用大数据警务系统从事违法犯罪的警务人员或技术公司,造成损失的应当承担赔偿责任,涉嫌刑事犯罪的,应当依法追究刑事责任。
(二) 建立警务系统评估机制,定期检测系统存在的风险
大数据警务系统的设计、使用并非一劳永逸,换言之,此时无风险并不意味着彼时无风险。美国学者安德鲁·弗格森(Andrew Ferguson)认为,无论是输入数据和输出结果的问题,还是系统的错误、偏见等问题,均指向一个解决方案,那便是检测,用于警务的大数据技术必须不断检测和重新检测。[39]他进一步指出,警务部门在部署大数据警务系统时必须明确回答以下几个问题:1. 拟使用的大数据技术所要解决的风险是什么?2. 能否确保系统输入的适当性(如数据的正确性、方法的可靠性等)?3. 能否确保系统输出的适当性(如对警务实践、社会的影响)?4. 能否对系统进行测评以确保透明度和问责机制?5. 使用大数据警务系统是否尊重了公民的自主权?此外,在欧盟的个人数据保护法制中,“个人数据保护影响评估”“自动化决策影响评估”等已经成为数据控制者或处理者的法定义务。[40]结合国外的理论与实践经验,本文认为,应当从以下两方面完善大数据警务系统评估机制。
其一,从评估的阶段来看,应当完善大数据警务系统的事前、事中和事后评估。从目前我国大数据警务实践来看,各级警务部门大部分遵循了“个别试点运行+全面上线运行”的模式,即先在某一个区域对大数据警务系统进行小范围试点,然后再推广应用到整个警务系统。这种模式可以视为是大数据警务系统的事前评估机制,对大数据警务系统的效果进行测评,视情况进行修正完善后交付正式运行。然而,在大数据警务系统正式上线运行以后,相应的评估机制往往付之阙如。因此,本文认为,应当完善大数据警务系统的事前、事中和事后评估机制。在实施的全过程,对大数据警务系统可能给警务实践和公民权利带来的影响、存在的法律风险和技术风险进行全面评估,并通过互联网、新媒体等载体向社会公众公布评估报告,接受社会公众的监督。
其二,从评估的主体来看,应当完善大数据警务系统的自我评估和第三方评估。警务部门作为大数据警务系统的设计者、管理者,由警务部门开展内部自我评估,可以有效利用其自身的实践经验优势,这对于提升大数据警务系统运行的稳定性意义重大。但是从行政法理论看,个人不应当做自己案子的法官,所以应该由高等院校、科研机构、科技公司等第三方机构来对大数据警务系统进行评估。这样做一方面可以充分发挥第三方机构的专业优势,将最新的技术发展应用到大数据警务中;另一方面也可以利用第三方机构的中立地位,提升公众对大数据警务系统的信任。
(三) 赋予公众算法解释权,强化公众的事后监督问责
大数据警务系统以各种数据资源为基础,借助算法技术,直接对行政相对人的行为进行预判,并辅助警务部门的决策(如启动盘问、专项执法等),已经具备了传统警察权的效果,成为一种新的技术权力,有学者将其称为“算法权力”[41]。为了防止算法权力异化,必须对其进行有效规制,其中最为重要的是要赋权行政相对人。
其一,赋予公众算法解释权。算法解释权是公众对自动化算法决策提出异议的权利,以保护个人自主与尊严[42]。面对“算法黑箱”,我们不能听之任之。尽管大数据警务系统作出的决策是由机器或算法作出,但只要融入到警察机关的行政行为中,并且最终对行政相对人的合法权益造成影响,那么就应当允许行政相对人提出反对意见。从理论上看,公众享有算法解释权与行政机关“说明理由”义务是相对应的,警察机关对其作出的决定或裁决应当进行正当性说明[43]。从域外法制经验来看,欧盟《通用数据保护条例》第15条第1款(h)项规定,参见https://gdprinfo.eu/art15gdpr/。当数据处理已经开始,且若存在算法决策,算法控制者应当向算法决策相对人披露这一信息,尤其是决策系统适用的逻辑以及此类自动化处理对于算法决策相对人的意义及可能后果等“有意义的信息”。
其二,赋予公众事后救济的权利。“有权利必有救济”,行政相对人对于大数据警务系统除了享有算法解释权以外,还应当具有异议权、修复权、反对权。具体而言,首先应当允許行政相对人对大数据警务系统的决策向主管机关提出异议。其次,如果发现大数据警务系统的不利决策是由数据错误、缺漏、过时造成,应当允许个人向主管机关要求修复数据的权利。最后,若行政相对人始终无法接受大数据警务系统作出的决策,应当允许行政相对人推出算法决策,并为其提供人为决策。欧盟《通用数据保护条例》第22条第1款便规定,参见https://gdprinfo.eu/art22gdpr/。个人有权不受完全依据自动化处理作出的且对其产生法律或类似重大影响的决策的约束,这就是所谓的“反对权”,尽管上述权利的行使还存在诸多限制条件,但也不失为一种有益尝试。
结 语
新兴的大数据警务系统打破了警察机关与行政相对人之间的权力结构平衡,存在诸多风险议题,亟待进行法律规制。面对大数据警务系统的广泛运用,一方面,我们需要不断进行技术创新,发挥大数据警务系统在优化警察执法、推进社会治理智慧化方面的优势;另一方面,我们也应当恪守法治精神,将大数据警务系统纳入法治轨道,避免不当使用对公民的知情权、隐私权、平等权等合法权益造成侵害。与所有人工智能法律规制议题一样,大数据警务系统的法律控制是一个系统工程,并非一项制度、一部法律就能解决,因此需要不同的学科、不同的治理主体共同参与,形成社会共治的局面。此外,无论是大数据警务系统的设计,还是大数据警务系统的运行,我们均应当坚持“以人为本”的精神,正如迈尔-舍恩伯格和肯尼思·库克耶在《大数据时代》一书中所指出的:“大数据并不是一个充斥着运算法则和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助只是暂时的,而更好的方法和答案还在不就的未来。” [1](233)
〔参考文献〕
[1]
[英]维克托·迈尔-舍恩伯格,肯尼思·库克耶.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛 译.杭州:浙江人民出版社,2013.
[2] [美]史蒂夫·洛尔.大数据主义[M].胡小锐,朱胜超 译.北京:中信出版社,2015.
[3] Police Executive Research Forum. Future Trends in Policing[M]. Washington, D.C.: Office of Community Oriented Policing Services, 2014.
[4] 岳东. 泸州市公安局成立全省首支大数据警察支队[EB/OL].(2018-01-31)[2020-02-05].四川新闻网http://scnews.newssc.org/system/20180131/000852634.html.
[5] 郑莹莹,李姝徵.“数据警察”亮相上海[EB/OL]. (2019-07-25) [2020-02-05].中国新闻网https://baijiahao.baidu.com/s?id=1640038782151978140&wfr=spider&for=pc.
[6] 谭俊.大数据技术在警察执法中的应用及挑战[J].行政法学研究,2018,(6):128-135.
[7]Huet, E. Server and protect: predictive policing firm PredPol promises to map crime before it happens[EB/OL].(2015-02-11)[2020-02-05].https://www.forbes.com/sites/ellenhuet/2015/02/11/predpolpredictivepolicing/#4763ab24f9bf.
[8]刘嫚.四川首个大数据警察支队带来警务变革: 刑事案发率明显下降[EB/OL].(2019-07-18)[2020-02-05].搜狐新闻http://m.sohu.com/a/327775435_161795.
[9]高文英.警务数据的应用与执法方式改革探究——以贵州、四川泸州警务数据的应用为例[J].警学研究,2019,(1):5-13.
[10]夏菲.警务科技化进程中的公民权利保障[J].华东政法大学学报,2019,22(5):84-95.
[11]Cohen, J. E. What privacy is for[J].Harvard Law Review, 2013, 126(7):1904-1933.
[12]翟云.智慧治理:“互联网+”时代的政府治理创新[M].北京:国家行政学院出版社,2016.
[13] 张兆端. 智慧公安:大数据时代的警务模式[M]. 北京:中国人民公安大学出版社, 2015.
[14]周延森. 数据结构[M]. 北京:北京邮电大学出版社, 2019.
[15]马国富. 基于云计算的监狱数据安全与大数据挖掘[M]. 保定:河北大学出版社, 2016.
[16]万毅.论盘查[J].法学研究,2006,(2):126-137.
[17]Ferguson, A. G. Big data and predictive reasonable suspicion[J]. University of Pennsylvania Law Review, 2015, 163(2): 327-410.
[18]谭远宏.从动机到机会——犯罪地理学的兴起[J].山东警察学院学报,2016,28(6):19-29.
[19]陶卫东. 模糊信息理论与警务智能决策[M]. 北京:科学技术文献出版社, 2016.
[20] Lave, T. R. & Eric Miller, J.(eds.) The Cambridge Handbook of Policing in the United States[M]. Cambridge: Cambridge University Press, 2019.
[21] 李濤. 北京怀柔建“犯罪预测系统”收录9年案件数据[EB/OL].(2014-06-17)[2020-02-06].中国新闻网http://www.chinanews.com/fz/2014/06-17/6287303.shtml.
[22]丁国锋.苏州公安犯罪预测系统上线6个月,大数据助推警务改革[EB/OL]. (2014-10-9) [2020-02-06].法制网http://legal.china.com.cn/2014-10/09/content_33711795.htm.
[23][加]欧文·沃勒. 智慧的犯罪控制:共建安全未来的指南[M]. 吕岩 译.北京:中国法制出版社, 2018.
[24]Perry,W. L., McInnis, B., Price, C. C., Smith, S. C. & Hollywood, J. S. Predictive Policing: The Role of Crime Forecasting in Law Enforcement Operations[M]. RAND Corporation, 2013.
[25] 张鹏.贵阳创建“人像大数据”系统[N].贵阳晚报,2018-3-8(A05).
[26]周斌,张驰. 政法机关大数据战略守护平安[N]. 法制日报,2019-1-17(3).
[27]蔡莉,朱扬勇. 大数据质量[M]. 上海:上海科学技术出版社, 2017.
[28][美]弗兰克·帕斯奎尔.黑箱社会:控制金钱和信息的数据法则[M].赵亚男,译.北京:中信出版社,2015.
[29]Barocas, S. & Selbst, A. D. Big datas disparate impact[J].California Law Review, 2016, 104(3): 671-732.
[30]Selbst, A. D. Disparate impact in big data policing[J]. Georgia Law Review, 2017, 52(1): 109-196.
[31] 戴治勇.选择性执法[J].法学研究,2008,30(4):28-35.
[32]李建新,丁立军.“污名化”的流动人口问题[J].社会科学,2009,(9):56-64,189.
[33]Froomkin, A. M. The death of privacy[J]. Stanford Law Review, 2000, 52(5): 1461-1544.
[34]Solove, D J. A taxonomy of privacy[J]. University of Pennsylvania Law Review, 2006, 154(3): 477-564.
[35] 趙家新.江苏深挖大数据打造智慧警务[N].人民公安报,2018-3-27(1).
[36]彭莉.最快10分钟锁定活动轨迹!米易县大数据助力疫情防控[EB/OL]. (2020-2-5) [2020-02-7].川报观察https://cbgc.scol.com.cn/news/228914?from=groupmessage.
[37]沈伟伟.算法透明原则的迷思——算法规制理论的批判[J].环球法律评论,2019,41(6):20-39.
[38]约叔华·A.克鲁尔,乔安娜·休伊,索伦·巴洛卡斯,爱德华·W.菲尔顿,乔尔·R.瑞登伯格,大卫·G.罗宾逊,哈兰·余,沈伟伟,薛迪.可问责的算法[J].地方立法研究,2019,4(4):102-150.
[39] Ferguson, A. G. Policing predictive policing[J]. Washington University Law Review, 2017, 94(5): 1109-1190.
[40] 肖冬梅,谭礼格.欧盟数据保护影响评估制度及其启示[J].中国图书馆学报,2018,44(5):76-86.
[41] 张凌寒.算法权力的兴起、异化及法律规制[J].法商研究,2019,36(4):63-75.
[42]解正山.算法决策规制——以算法“解释权”为中心[J].现代法学,2020,42(1):179-193.
[43]王立勇.论正当程序中的说明理由制度[J].行政法学研究,2008,(02):60-66,84.
(责任编辑:夏 雪)
On Big Data Policing and Its Legal Control
ZHANG Tao
(School of Law, China University of Political Science and Law, Beijing 100088, China)
Abstract: In the background of advancing the modernization of the national governance capabilities and system, big data technology is widely used in police law enforcement. Based on this, the article uses the research methods of normative, case and comparative analysis to study the technical logic, practical application, social risks and legal control of big data policing. In the practice of big data policing, “dirty data” often leads to threats to citizens equal rights protection. The massive collection, processing and use of personal data by police agencies infringes on personal information privacy. The algorithm systems have no transparency and accountability mechanism, which leads to the lack of effective relief for personal rights. In order to prevent the alienation of big data policing, China should formulate police data collection laws to ensure the reasonable use of personal data, establish risk assessment system to regularly detect the risks of the big data policing, give the public the right of algorithm interpretation and strengthen the public accountability.
Key words: big data policing; algorithm; artificial intelligence; legal regulation