刘 莉
智慧警务是大数据环境下公安信息化模式的深度探索,也是当前警务改革的新形态。智慧警务的发展离不开大数据、云计算、人工智能等技术支持。《促进大数据发展行动纲要》明确提出要加大大数据关键技术研发、产业发展和人才培养力度;完善法规制度和标准体系,科学规范利用大数据,切实保障数据安全。随着信息技术的快速发展,国家也加快了信息数据相关的立法进程,加大了对网络安全、数据安全的保护力度,由于警务工作的特殊性,警务数据信息庞大而复杂。警务数据安全管理风险、法律风险、技术与伦理风险等都严重制约了智慧警务建设和可持续发展。
智慧警务系统核心技术是利用数据的整合,形成新的信息资源,数据表现为警务工作的重要“生产资料”。在智慧警务系统中,警务数据是警务信息的核心要素,但目前对警务数据的界定只停留在理论探讨阶段,缺乏官方规范性文件的认定。
高文英教授认为,警务大数据既是一种理念,也是一种手段,警务数据则是指“公安机关在履行职责过程中采集获取的,或者其他单位和个人依法向公安机关提供的,与维护公共安全相关的各种数据”①。这个概念基本涵盖了警务数据的内涵与外延,但不是特别周延。其一方面将主体限定在公安机关,主体范围过小;另一方面数据获取的行为模式界定过窄。宏观界定警务数据或许更为符合目前警务信息发展的需要,即可以将警务数据概括为和警务工作业务相关的数据,以关联度作为数据性质的评判标准,更有利于对警务数据进行分级分类管理。
相较于传统警务数据,警务大数据颠覆了传统数据的推演路径而具有前置性和复杂性;相较于通用大数据,警务大数据基于专业领域特征而具有专业限定性。
1.数据前置性。传统模式下,警务模式、警务系统均以完成工作任务为核心,运行方式是一种由规律—决策—数据验证的演进路径。在智慧警务的大数据模式下,则是围绕“数据挖掘—规律发现—作出决策”的思维路径展开,数据目标是“预测”,在广泛收集数据基础上,通过算法,获得预期数据价值,从而为警务工作提供技术支持。“大数据与人工智能技术的实质是建立了一种基于海量数据挖掘的认知范式”①高文英:《警务数据采集与运用中的法律问题探究》,《中国人民公安大学学报(社会科学版)》2019年第1 期。王禄生:《司法大数据与人工智能技术应用的风险及伦理规制》,《法商研究》2019年第2 期。,这种认知范式颠覆了传统的数据思维模式,智慧警务数据就是突破了传统数据的证明功能,集中于辅助决策的推演、预测,从而具有绝对的前置性。
2.高复杂性。警务数据来源于人口、刑侦、交管、监管、涉外、治安等多系统、多接口,信息庞杂,数据格式不统一。同时,由于采集端口和采集标准不同也会导致数据不同。虽然智慧警务打破了原来系统分割,以跨业务、跨警种、跨区域的“条块模式”重构了数据组合方式,但这也恰恰是导致数据高复杂性的原因。不仅如此,数据类型也非常复杂,静态数据与动态数据、结构化与半结构化以及非结构化数据、高关联度与中关联度以及低关联度数据等互相交织。
3.专业限定性。警务场景的特殊性对数据提出了特殊的技术需求,不是普通的大数据和人工智能技术平移进警务场域就可以实现,如违法、犯罪、从轻情节、从重情节等复杂的法律概念都彰显了警务场景的专业性、多维度特征,在软件研发、信息采集、系统使用过程中需在警务活动的专业场景中进行,离不开专业的程序性设置和规范的警务内容表达。
警务数据资源非常庞杂,与社会交互的信息量大,端口多,公安信息种类有三百多种,纷繁复杂,相互交叉,数据资源涵盖了公安基础工作信息、应用工作信息、研判工作信息等领域。未来,随着智慧警务的广泛推进,数据类型和数量也会急剧增加,如果不能在宏观架构阶段提前研判风险,其后果将会是巨大的经济成本和安全成本。
张兆端教授提出我国大数据资源管理的思维尚未建立,如何利用大数据进行精细分析仍处于摸索阶段,如何管理大数据,我国各部门包括公安机关还缺乏统一标准,各部门的数据来源、数据架构、数据体系各自为政。②张兆端:《智慧公安大数据时代的警务模式》,中国人民公安大学出版社,2015年版,第75 页。数据安全管理问题众多,但对于公安机关来说,威胁数据安全最主要的问题依然是数据泄露和数据污染。
1.数据泄露。在数据日益“资源化”“利益化”“财富化”的大数据时代,数据不可避免地成为不法分子攻击窃取的重要对象。目前的数据泄露防护技术(DLP)主要是通过“关键字、正则表达式和数据指纹”等在数据存储、传输和使用过程中借助内容匹配发现违规数据泄露,从而达到数据泄露防护的目的。①陈锦、王禹:《从数据全生命周期看数据泄露防护问题》,《中国信息安全 》2018年第3 期。但是,该技术主要用于内部防护,即员工无意泄密,对于黑客和内部员工故意泄密和盗窃行为则难以防范。由于工作的特殊性,公安机关掌握更多、更重要的个人信息,涉及公民身份信息、生物信息、隐私信息等,一旦数据泄露或者数据错误则会造成严重后果。
根据裁判文书网上“出售、非法提供公民个人信息罪”判决书的统计,发现泄露个人信息的源头多来自公安机关、代理公司、金融机构。其中来自公安机关的比例最高②公安机关比例达62.5%,主要集中在交警、户籍警、110 指挥中心,辅警的比例达40%,以公民个人信息和车辆有关的信息为主。中国裁判文书网,http://wenshu.court.gov.cn/访问时间2019年9月6日。,这也是因为公安机关接触公民个人信息最广泛和最全面。“公安及交警人员能够进入全国人口信息查询系统等官方系统,可以较为轻易地获取身份证、住址、出入境、驾驶记录等公民信息”。③《你的个人隐私,就是这样被“内鬼”卖掉的!》,网易财经网,https://www.yicai.com/news/5096894.html,刊载时间2016年9月9日。由于信息背后巨大的利益诱惑和侥幸心理,以及信息安全管理规范体系的不完善,来自内部人员的信息泄露至今屡禁不止。
另外,是来自外部黑客攻击导致的信息泄露。外部黑客可以在数据存储阶段、数据处理交换阶段“利用基础设施层、网络层和应用层等在技术上存在的安全漏洞进行远程入侵”。在移动化、智能化、多中心化的智慧警务模式下,每一位民警都是一个数据中心,数据是警察的另一种“武器”,不久的将来,犯罪分子袭击或者抢夺的也许不是“枪、警棍”等警械装备,而是民警手中的移动警务智能使用终端。有学者预测数据泄露将会成为最大的网络攻击问题,这也是智慧警务系统架构首要面临的问题。
2.数据污染。智慧警务核心技术是建立在大数据和人工智能技术基础上,根据国家标准《信息安全技术大数据安全能力成熟度模型》可知,“大数据的数据生命周期包括数据采集、传输、存储、处理、交换和销毁等六个阶段”。在销毁之前的任何一个阶段都可能出现数据污染问题,依据被污染的数据不仅无法正确分析和合理判断,甚至产生错误的决策。
警务工作关系人民群众的生命、财产、健康、安全等权利,对于数据质量依赖度非常高,一旦基于污染数据而形成判断,后果更加严重,将会产生重大风险。基于信息人理论,人们网络世界中的身份边界会尽可能模糊处理,如注册时就出现身份错位,或者注册没有问题但是实际使用人不是本人,或者由于身份共享产生数据污染。基于网络聊天平台的数据垃圾产生的数据污染问题等,“微信、微博、博客等社交平台每时每刻都在制造、积聚数据垃圾。这些数据垃圾毫无疑问将会导致数据污染。”④刁生富、冯桂锋:《论大数据的社会问题与社会治理》,《山东科技大学学报》2018年第4 期。另外,由于不同的智慧警务系统数据采集要求不同,除了原来的警务数据信息资源库,大部分都是仰仗基层一线民警,数据质量对民警的责任心、职业素养要求很高,旧的警务信息资源系统中的信息也存在老化、过期等现象,这些都会导致警务数据被污染。
另一个不容忽视的问题是数据污染的隐蔽性。调查发现,数据污染问题很多是由不合理的数据采集方法造成的,智慧警务突出了系统的智能化和一体化,但是,传统公安工作流程、工作方法、工作思路严重桎梏了大数据采集的理念、思维和方法。一线民警采集信息还常常受制于设备功能单一、数量有限等原因,需要肉眼识别、手工录入,对于带有二维码、磁条、芯片等物证,难以识别属性、来源、真伪,导致工作效率低、准确性低,这些都严重影响数据的准确性,加深了数据污染。“正如经济学的马太效应一样,数据污染问题也是一个污染逐步加深的过程。”⑤方国斌:《数据污染的特征与影响分析》,《统计与咨询》 2007年第5 期。在数据处理过程中,如果原始数据或早期数据受到污染,后续的分析会加重这种污染的程度。
1.数据权力扩张与数据权利冲突的法律风险。目前,我国还没有出台专门的数据安全管理方面的法律,在警务数据采集方面还没有厘定数据采集的具体权力边界,主要依据《网络安全法》的相关规定,以及其他散见于部委规章、内部管理等规范文件。基于公权而产生的数据权力与基于私权而产生的数据权利在数据膨胀的大数据时代必然面临冲突,哪些数据可以采集,哪些不可以采集,哪些采集方式可以用,哪些采集方式不可以用,数据采集的深度如何控制等,法律边界的模糊性也必然带来两种权利冲突的风险。
公安机关通过大数据开展的犯罪侦查、犯罪预判、各种数据库建设、大数据监控等,出于国家安全公共管理需要,个人信息安全权利要让渡给国家相关公权力机关。但是,这种让渡有无界限,基于行政职能、司法职能的豁免权是否足以对抗个人隐私安全的权利,答案显然是否定的。况且司法机关的最终职能是保护公民的权利,不仅二者的平衡至关重要,尽快厘定公安机关数据采集的权力边界更加重要。随着智慧警务建设的成熟,数据采集规模会更加庞大,将来数据权力仍将处于不断膨胀的阶段,公安机关既是行使数据权力、也是保障数据私权的重要机构,其理应为平衡数据权力与数据私权做出努力,在行使数据权力的过程中保持审慎。①蒋涛:《数据民主化在警务活动中的实践》,《江苏警官学院学报》 2018年第3 期。这也是未来警务数据采集的立法趋势。②美国旧金山市是第一个禁止面部识别监控的城市,禁止警察和其他政府机关使用面部识别技术。目前美国、欧盟在利用大数据进行生物信息提取方面采取了非常审慎的态度。
2.程序正当的冲突风险。为了提高打击犯罪的效能,智慧警务系统利用大数据开展犯罪研判,进行犯罪预测,通过采集犯罪风险因素,借助模型分析技术,预测潜在的犯罪行为,对某些重要人物开展监视,对潜在的犯罪被害人行为轨迹进行捕捉。随着人工智能的发展,智慧警务系统可以通过数据的收集和自主分析得到相应的推理结果,但这又和我国刑事诉讼法“未经人民法院依法判决,对任何人都不得确定有罪”的法律理念相冲突。更有甚者,大数据侦查中的“黑箱效应”一旦蔓延,对当事人或者是利害关系人将会产生不可估量的后果。因为在智慧警务系统中借助人工智能的自主学习和持续进化,不仅外部用户无法了解黑箱的算法逻辑,甚至开发者自身也越来越难以全面解释算法的决策危机。不仅如此,当某个人被大数据算法列为潜在的犯罪分子或者潜在的犯罪被害人,其相关的权利保护、监控约束的尺度都遭遇了法律挑战。司法程序上犯罪预测技术的介入,也让司法证据面临新的问题,最终触发人们对“犯罪预判和跟踪”与法律程序的正当性思考。
1.伦理风险。智慧警务系统的研发一般都是和第三方技术公司合作,程序设计尽管有一定的科学标准,但是每一个设计员都有自己的价值倾向,在系统研发程序中会带有价值痕迹。如果算法模型存在技术性缺陷或者算法设计者自身存在的价值偏见,导致算法设计无法实现设计者既定的向善目标,就会产生与预期不符以及危害性后果。目前,人工智能技术在司法领域发展和应用还是初步阶段,警务活动中的智能技术也只是弱人工智能。随着技术发展,“技治主义”的路径依赖也会引发消解警务人员自身主体地位的伦理风险。
2.技术风险。智慧警务是以现代信息技术为基础而建设的新型警务模式,涉及警务信息的采集、传输、处理、共享、存储等多个环节。尽管智慧警务建设是在公安信息化建设的基础上深化推进和展开的,但是智慧警务建设更强调信息共享和智能研判与分析。如果说信息化建设强调的是内部信息系统的现代化、科技化,智慧警务建设则更强调信息的动态性和数据驱动力,共享、交流、智能的特点更加突出,外界接口扩大,数据专业性要求高,对法律和公安业务专业性要求需准确规范,对软件防护要求越来越高,智慧警务建设刚刚起步,数据加密和隐私保护等信息安全技术还远不够成熟。
由于智慧警务的专业性,很容易产生技术上的业务经验壁垒而导致系统建设的技术风险。智慧警务系统的研发一般外包给专业的公司,尽管有早期信息警务技术托底,但原有业务应用软件的功能提升已无法满足需求,况且,智慧警务对跨警种、跨地区、跨管理层的业务关联和协同运作提出了更高的要求。由于公安业务的特殊性和专业性,不仅需要先进的软件研发技术,还需要了解公安工作的业务环境和工作机制,甚至需要深入了解相关警务技能。软件技术和公安专业技术的双重标准对智慧警务系统建设提出了更高的技术要求。
首先,系统研发和使用都由具体的人完成。智慧警务系统的建设不仅要求软件研发人员具有专业领域的高端技术水准,还要求对公安行业的运行机制有足够的了解,人才素质的高要求和高端软件人才市场资源的有限性形成人才的矛盾困境。另外,公安机关数据涉密严格,价值倾向鲜明,软件人才的价值导向机制和人才评估机制缺乏使软件系统研发也潜藏风险。
其次,公安民警的数据素养亟待提升。尽管近年来随着公安大数据建设及应用推广,民警数据素养在逐年提升,但在数据的采集获取、甄别筛选、整理评估、分析研判、传递应用等环节依然非常欠缺。①张兆端:《智慧公安大数据时代的警务模式》,中国人民公安大学出版社,2015年版,第169 页。在系统应用中,部分警务人员纪律性不强,受利益驱使,泄露数据信息。
智慧警务是以大数据为基础,以智能化为核心,以标准化、规范化、流程化为引领的警务系统,制度规范的空白和不足削弱了行为预见的结果,增加了流程运转的风险。
首先,在系统构建方面,在智慧系统构建过程中尤其重要的是标准的统一。长期以来,各类公安信息分属于不同的业务部门,从目前公安部已经制定的信息化标准体系看,各种标准差别比较大,存在许多相互矛盾和不一致的地方,对内部信息共享和利用以及外部信息交换都造成了障碍。
其次,在数据使用方面,尽管公安机关内部加强了纪律约束,但是也出现各地区要求不同、各部门要求不同等情况,在理解和执行上松紧不一。
最后,在对外规范方面包括软件采购②我国软件采购提出了 “统一标准、备案准入、适度竞争”的管理原则,但软件研发标准并不统一,软件采购也只是以原则为指导。、警用数据的采集和抓取③民众拒绝配合非必需的个人信息采集,民众起诉公安机关在不知情状态采集个人生物信息等问题都处于空白状态,亟需法律的回应与规范。、与数据公司的合作④苹果公司、微软公司拒绝了美国联邦调查局要求查阅恐怖分子手机数据的请求;微信也曾经拒绝了法院调取微信点对点数据的请求。参见何渊等:《大数据战争》,北京大学出版社 2019年版 第91 页。、境外数据流通与合作⑤2018年欧盟《通用数据保护条例》(简称GDPR)规定,任何机构如果违规收集、传输、保留或处理涉及欧盟任何人的个人信息,都将面临高达2000 万欧元的责罚。国家和国家之间数据流动、数据合作等缺乏相应规范指引。等方面亟需法律规范的回应与确认。
在智慧警务信息体系中,安全体系是核心体系。围绕安全体系布局应用体系、技术体系、管理体系,科学构建智慧警务信息的生态系统。数据作为该生态系统的核心因子关系到系统的稳定和发展,需以法律规范为引领,以现代科技为保障,以伦理规范为补充构建智慧警务生态安全防范系统。
在数据素养中,数据意识是基础性要素,但也是一个主观性要素。数据意识是公安队伍将数据思维应用于公安工作的内在主动性,具体应包含数据敏感意识、数据搜集与存储意识、数据分析与共享意识、数据管理与保密等。而数据能力具有一定的客观性,一般理解为数据应用能力,需结合专业特征加以评判。
数据意识、数据能力的培养,首先必须从顶层驱动,并向下逐级贯穿到组织的每个层次。如果领导层致力于将决策和指挥建立在数据基础之上,那其下属自然就会遵循其原则。有学者称之为“数据洞见”,即如果你要鼓励组织中的其他人按这些洞见采取行动,你自己就必须这么做。①[英]伯纳德·马尔:《数据战略——如何从大数据、数据分析和万物互联中获利》,鲍栋译,机械工业出版社2019年版,第202 页。如果你只是纸上谈兵,就别指望整个单位的变化。
其次,要培养一批技术优良的“榜样”人员或者团队,在文化理论中称为“榜样文化”。如苏州市公安局要求全体警员应普遍具有数据思维,而且在晋升培训、专业岗位培训中都加入了大数据课程。要播种一种强大的数据文化,最有效的一种方法就是让关键人员参与数据战略,让这些关键人员成为数据的倡导者,通过他们的部门创造出涓滴效应,辐射全警。
最后,将数据意识、数据能力作为警察胜任力要素纳入警察培训课程以及警务考评体系,以促进数据能力的成长,从而增强数据安全意识、数据风险的防范能力。
智慧警务打破了传统警务流程,以大数据为指引的警务流程再造重构了警务行为模式和警务关系,数据前置的特性解构了传统的警务工作认知。每个警务人员都成了数据中心,每一个警务行为都会留下“痕迹”而“被数据化”,警务关系由于数据和网络的推动也更加多元和复杂。但恰恰是这一个个“中心”凸显了每个警察个体的主体地位,一条条“痕迹”量化了工作业绩,也更有利于规范化、标准化和法治化。
首先,在智慧警务系统研发推进之前就提前架构,将法律标准、制度规范嵌入警务流程中,保证每一步流程都严格依法依据设计,每一步勤务都有详细的操作规范和质量标准,从而实现警务流程的数据法治化,再将标准流程固化嵌入智慧警务平台,实现程序与法治的深度融合以及信息流和业务流、管理流的统一管理。
其次,为了将数据控制在安全的区域、在合规的轨道运行、实现数据法治化,还应健全公安信息安全法律法规体系,加强公安信息化立法和执法工作,强化公安信息网安全管理,规范公安网运行管理部门和联网单位的信息安全管理职责。要按照法律和相应的标准规范,按照国家颁布的《信息系统等级保护》相关法律法规的规定,对每个公安信息系统进行定级,全面实行公安机关信息安全等级保护制度,完善数字认证、信息安全等级测评、安全惩戒制度等工作机制。
为了进一步推进警务信息工作法治化、执法规范化,国家也在逐步完善和修订相关法律规范。自《网络安全法》生效以来,网络安全与数据保护方面的执法活动逐渐走向常态,执法依据越来越完善。如2017年颁布的《网络安全等级保护定级指南》2019年升级为网络安全等级保护制度2.0 标准,又如近期颁布的《互联网个人信息安全保护指南》等。而网络安全等级定级系列国家标准的颁布预示着“等保”2.0 时代的正式开启;国务院在2019年立法计划公布了将由公安部组织起草《公共安全视频图像信息系统管理条例》,网信办、工业和信息化部、公安部联合起草《关键信息基础设施安全保护条例》等信息数据保护的有关法规,《关键信息基础设施安全保护条例》《网络安全审查办法》《数据安全管理办法》都处在征求意见稿阶段,这也传递了国家对数据信息安全的重视程度。这些规范既是未来执法的依据,也是公安民警利用大数据开展警务活动的约束规范,对于警务数据安全防范起了很好的规范作用。
技术是数据保护的关键屏障,也是预防数据安全风险的有力武器,加强预防、预警的保护意识,采用数据分级和双身份认证制度以及关键数据保护制度,对于防范数据安全风险具有重要价值。智慧警务具有多端口、多系统融合的特点,每一个公安民警个体都是数据的中心,在数据权限上如果不能分级,将增加数据泄露的可能性。因此,加强权限分级和数据加密更有利于提高网络安全防护水平。对于警务内部信息采用双身份认证制度,对于重要系统的访问,采用双身份认证和口令密码的登录方式,依据数据系统的重要程度,逐级对访问者的身份进行严格控制,对其权限严格进行分级分类。关键数据特别保护,设置特别程序和口令。对于警务外部信息,加强日志管理功能,通过智能监测实现阻隔信息泄露的风险,让数据在安全可控范围内使用。同时,加强监测预警技术,提升紧急处置速度和能力,提高网站数据运行交换、分析处理、集中存放过程的安全性,为智慧公安建设保驾护航。
任何技术创新都会给我们带来巨大的机遇,同时也会带来巨大的挑战。①美国学者KordDvais 与DougPatetsron 在其《大数据伦理学》中提出,大数据是一种新的技术创新,技术伦理风险伴随技术的创新和发展而需要引起高度重视。因此,我们必须在创新与风险之间找到合适的平衡,并对大数据技术进行必要的伦理规制。②黄欣荣:《大数据技术的伦理反思》,《新疆师范大学学报》2015年第5 期。后期随着智慧警务的发展,部分智能系统的研发不仅要置于规范控制之下,更应当同时用伦理规范加强引导,避免“科林格里奇困境”③所谓“科林格里奇困境”指当一项技术的社会后果不能在技术生命周期被预料到,但不希望的结果发生时,技术却往往已经成为整个经济和社会结构的一个部分。鼓励开发具有高可解释性的智能系统促进人工智能算法逻辑与人类社会价值规范的持续校准。
有学者提出,为了应对人工智能算法安全,应建立算法安全的评估机制和数据监督机制。笔者认为,在评估机制和监督机制中应主动添加伦理指标,尤其应融入法治的价值维度指引智慧警务技术架构的法治化发展。
智慧警务的发展与软件产业的发展是密切相关的。随着物联网技术、云计算技术和智能分析技术等新技术的发展,智慧警务系统会更加成熟,相关的信息化行业市场规模一定也会不断扩大。但由于缺乏统一的行业标准,很难实现顶层设计和区域信息共享,现有的公安部《公安信息化数据质量管理规范》对数据信息规范化具有一定指引作用,但是,该规范主要是对公安机关数据质量管理提供规范标准,对于第三方行业规范标准不能起到实质作用。
由于数据潜在的价值以及相关制度规范的缺位,在智慧警务运行中,数据安全环境并不乐观,风险也无处不在。原来警务信息化建设的基础并不能承载智慧警务庞大的数据系统和运行规模,再加上公安工作的复杂性,各警种的工作模式、警务机制、部门利益冲突与协调、标准规范的差异等使智慧警务数据安全风险治理并不能一帆风顺,亟需顶层设计的统一和规范。