袁康 刘汉广
摘要:大数据时代,政府在提供公共管理与社会服务过程中积累了海量的公共数据,给传统政务模式带来了新的挑战与机遇。挑战主要有出现了公共数据的具体意涵模糊、政府大数据收集正当性基础薄弱、公益目的数据收集信息公开与个人数据自决权利的博弈、政府公共數据使用的约束机制欠缺等一系列问题。在我国,对个人赋权、对企业苛以义务为重,忽略政府规制的大语境下,应正视信息多头收集的现状以及政府巨型数据库建设效能低下的弊端,厘清政府信息使用的正当性基础,并在此基础上对政府信息使用进行合理约束,同时借鉴具有本土资源认同基础的相关域外经验,平衡私权与公利的关系。
关键词:公共数据治理;政府角色;行为边界;个人信息保护
中图分类号:D912.1 文献标识码:A 文章编号:1003-854X(2020)05-0120-08
党的十九届四中全会就推动国家治理体系和治理能力现代化作出重要决定,提出要推进数字政府建设,加强数据有序共享,依法保护个人信息。随着互联网、大数据、人工智能等技术手段在政府行政管理中的加速运用,政府为提供公共管理和社会服务而搜集、存储了海量的公共数据。从功能层面而言,公共数据是数字政府的行政资源,因此需要扩大公共数据的规模和效率;从权利层面而言,公共数据既包括个人信息的集合,又凝结着政府对海量信息的集合与处理,因此需要在准确界分数据权属的基础上平衡公共权利和私人权利。从这个意义上来看,加强公共数据治理是我国推进数字政府建设,推动国家治理体系和治理能力现代化的题中应有之义。为此,本文将视角聚焦于公共数据的有效使用与个人信息保护的协调,系统研究公共数据治理中的政府角色与行为边界,尝试在界定公共数据内涵和属性的基础上分析当前政府公共数据治理的困境及成因,通过厘清公共数据的生成机理和权属构成,辩证处理好政府在公共数据治理中面临的利用与保护之间的二元价值的冲突与协调,并结合我国实践和域外经验,探讨公共数据治理的制度优化方案。
一、公共数据的内涵与属性
公共数据是公权力机关履职过程中收集和保存的个人信息,在收集完毕前和公共数据受侵害且可识别具体受害群体时分散为个人信息。表征私属性;在公共数据形成且未受侵害时主要用于公共治理,体现公属性;作为公共资源池塘物品供公民全体使用时,体现财产属性。
(一)公共数据的内涵界定
信息时代政府在进行社会管理和提供公共服务时常常需要搜集大量公民数据信息,政府收集的信息从姓名性别、身份证号码、教育背景、职业状况、收入存款、汽车房产、犯罪记录到面部识别特征、指纹血型、交通住宿、财务交易、医疗档案,等等,包罗万象。随着政府公共管理的精细化,这种数据搜集日益深化和拓展到与公民日常生活相关的各个领域和类型,由此产生了涉及面广、数据海量大的公共数据。我国现行立法已关注到“公共数据”这一数据类型,例如《中华人民共和国电子商务法》和《中华人民共和国网络安全法》已经提及公共数据,然而对其内涵并无统一界定。在一些电子政务发展较为领先的省市,对公共数据予以明确定义的地方立法已经出现。例如《上海市公共数据和一网通办管理办法》第3条将公共数据定义为各级行政机关以及履行公共管理和服务职能的事业单位在依法履职过程中,采集和产生的各类数据资源。《北京市公共数据管理办法》(征求意见稿)第2条第2款将公共数据定义为行政机关和公共服务企业在履行职责和提供服务过程中获取和制作的,以电子化形式记录和保存的数据。《成都市公共数据管理应用规定》第2条将公共数据定义为政务部门在依法履职过程中产生和管理的,以一定形式记录、保存的文字、数据、图像、音频、视频等各类信息资源。这些地方立法一般均认为公共数据是公权力机关依法履职过程中产生,由该机关采集并以一定形式进行记录保存的各类数据资源,系公权力机关履职过程中收集与保管的个人信息之集合。
(二)公共数据的法律属性
从公共数据的来源和构成来看,其法律属性具有显著的复合性特征:一是公共数据来源于个人数据的集合,具有一定的私权属性;二是公共数据的形成和利用反映着政府为了公共利益而行使公共权力,具有一定的公权属性;三是公共数据不论是从政府信息公开的角度,抑或是从数据资源公共用途的角度,都应当是可以为社会分享的公共产品。
第一,公共数据是来源于个人信息的集合。公共数据从海量个人信息中产生,是个人信息和数据搜集、集中和处理的产物。公共数据与个人数据的联系是紧密的,公共数据是政府依法履职过程中采集与保管的个人信息,是将零散的个人信息聚合的结果。当然,公共数据与个人信息也存在着区别:一方面,政府履职过程中收集的个人信息才成为公共数据,个人信息总集合中还包含诸多与履行公务无关、不具备收集必要性和正当性的信息,故公共数据包涵的对象范围比个人信息总集合的范围要狭窄;另一方面,公共数据在使用时通常具有去个人化的特点,一般表现为无法识别具体个人的宏观抽象数据,只有在政府有特定具体行政行为需求时公共数据才会分解为具体的个人信息。第二,公共数据是社会治理的基础。公民允许政府收集个人数据是公民让渡自身私权签订的社会契约在大数据时代的表现形式。我国政府收集的公安系统数据、人口普查数据、经济统计数据等,为政府有效开展公共安全管理、经济管理和民政管理等提供了数据支持,为确保行政管理和公共服务的科学性和实效性提供了有力保障。第三,公共数据属于社会共享的公共产品。由于公共数据可以广泛地应用于政务和商务,具有一定的使用价值和交换价值,故而具有显著的财产性利益。① 从《中华人民共和国民法总则》第127条关于数据保护之规定,到市场数据交易的实践,都体现了数据的财产属性。而公共数据相比于一般意义的数据而言,又因其搜集主体和权力来源的公权力特征,以及数据构成和数据用途的公益性,而具有典型的公共属性。作为一种信息资源,公共数据是公民群体让渡个人信息产生的数据集合,其获益对象也是公民全体,公共数据具备非竞争性和非排他性的基本特质②,效用上也有不可分割性。这种特质主要是因为信息资源的确有在政府引导下大规模互惠分享的可能性。为了充分发挥公共数据的公共产品属性,就需要在不损害公民个人信息的前提下推动公共数据可以公开获取,同时提高公共数据在公共部门的充分有效共享,尽可能节约社会成本。
二、公共数据治理的困境及成因
公共数据是政府开展社会治理和提高治理能力的重要基础性资源,也是数字政府建设的核心要素。由于法律属性和关涉利益的多元性,公共数据在数据采集、数据处理和数据利用的过程中需要充分协调公权与私益,既要充分保障政府公共管理的现实需求,又要避免对个人信息空间的过度侵占,还要有效提高公共数据的利用效率。在实践中,尽管大数据和电子政务已经得到广泛应用,然而对于公共数据的法律治理却并不尽如人意。
首先,公共数据的采集缺乏有效约束。尽管我国电子政务和数字政府建设已经取得了显著的成绩,建立了体量惊人的政府巨型数据库,然而政府采集和处理数据的行为并未得到有效的法律约束和规范。由于缺乏统一的信息收集标准,各政府部门依据不同法律法规进行信息收集并建立了类型繁多的数据库,但其依据的法律法规多有重复之处,各法律法规规定信息收集范围的具体用语较为宽泛,留给各部门的解释空间较大。主要会导致两个方面的问题:一是多头收集情况严重,即同一信息被不同部门重复收集多次,这种情形与信息利用时各部门间不愿分享信息的现状关联度高,从已获得信息的部门请求信息分享的难度和成本均高于部门自行采集。这既导致了政府在搜集信息过程中的资源浪费,又增加了作为行政相对人的公民和企业的负担;二是滥采滥用情况严重,即政府在信息采集过程中违反比例原则,超出其必要性限度收集信息,加之政府数据利用缺乏约束,导致了政府公共数据被不恰当地利用,容易造成私权空间被过度侵犯的问题。
其次,公共数据管理存在漏洞。技术层面上,互联网的开放性使得信息窃取变得难以追查,政务系统中的大量个人信息有可能被黑客直接获取,如2015年美国联邦人事管理局联邦雇员个人信息大量泄漏事件;抑或通过爬虫技术,将加工后的数据叠加计算推导出原始信息。内部管理层面上,政府部门的人为疏忽也可导致公民个人信息泄露,在我国这一疏忽往往表现为基层政府官网“主动泄密”,政府信息公开的审查把关义务未落实,审查机制漏洞较多。如2017年媒体曝出的安徽、江西多地的基层政府官方网站主动公开公民个人隐私信息的情况。政府管理疏漏中可问责性更高的情况是如“尹海龙侵犯公民个人信息罪案”中政府工作人员贩卖公民个人信息,或是更甚的如“罗彩霞案”中政府工作人员篡改公民个人信息等。由于法律制度的不完备,导致了政府在公共数据管理中缺乏有效约束,容易给公共数据的滥用以及政府数据行为中的个人信息泄露提供空间。
再次,公共数据治理机构空缺。对政府数据处理的监督在我国几乎处于空白,有监督能力的机构与被监督单位多隶属于政府体系、依附于政府拨款或者受到政府的监管,难以作出中立客观评价。在目前公共数据权力的格局下,各行政机关根据其法定职权广泛地搜集各类信息以形成公共数据,造成了数据采集主体的高度分散。然而针对各行政机关的数据行为的管理机构并未有效设立,既无专门机构负责对政府数据收集、存储和使用等行为进行监管和规范,又无专门机构负责协调各行政机关的数据行为、提高公共数据的使用效率。近年来,北京、重庆、广东、浙江等省市纷纷成立的大数据局在制定大数据政策法规、大数据资源管理、大数据市场监管等领域做到了一定程度上的资源整合,但其弊端也同样明显。各地设立的大数据局,并未真正有效地将各行政机关各自分散的公共数据资源进行有效地整合利用,也无法对其同级别的政府组成部门的数据行为进行有效监管和规范。
最后,公共数据利用效率低下。公共数据利用效率的欠缺包括对内和对外两个层面:对内的效率不足主要体现为部门之间的信息壁垒,在信息交换环节职能部门之间的交流错综复杂,导致行政资源浪费;对外的效率不足则主要体现为既有数据的整合不足,公民对于高质量的公共数据获取的需求无法得到满足,公共数据信息的颗粒度过大、可使用度低下。从公共数据的公共产品属性来看,公共数据既要满足政府行政的需要,也应该作为一项公共服务向社会合理提供。然而在实践中,各部门间数据库的壁垒既限制了公共数据的流通和整合,又在很大程度上增加了整体数据搜集和处理的成本。另外,公共数据并未在合理程度内以便捷的形式实现有效公开,限制了社会充分利用公共数据的机会。公民和企业往往会为获取相关数据或信息而付出巨大成本,导致在整体上社会资源的浪费。
总之,个体层面工作人员的过失或故意可以通过监管教育等手段纠正,制度层面机构设置的缺陷可以通过新设机构弥补,但信息共享中的阻碍无法通过上述手段消除,因为信息壁垒是由主客观原因综合造就的。客观原因主要是技术原因,我国政府在公共数据治理领域的信息化水平低下,各部门由于信息收集、存储、传输标准不尽相同,相对应的信息处理系统也互不兼容,因而当信息共享需求出现时往往寻求有关部门合作,但各部门中尚无电子签章系统,部门间合作依靠纸质办公,信息延迟成为必然。这种技术水平低下客观上有更新设备的费用过高和本地储存安全性高的考量,但建设高质量的政府数据库从长远来看显然更为经济。除了技术原因之外,公共数据的共享利用障碍也可以在一定程度上归因于制度的鸿沟。目前,现行法律对于公共数据信息共享的权责分配不明。对于宏观层面上的政府间信息交流库建设构想有所提及的文件很多,如《2006—2020年国家信息化发展战略》《国家电子政务总体框架》《国家电子政务“十二五”规划》等,对于信息资源目录共享规范化改革、信息资源协同化整合等工作都作出了原則性的安排,但是缺乏详尽的实施细则;对于信息资源进行的系统性安排多出现于地方性行政规章之中,相对细致地对此类问题进行指导的国家级法律规章或者行政指导中则仅仅牵涉征信、金融基础建设等极少数领域,这些文件都偏重对特定领域的标准制定,而且制定部门也不一致,实施起来仍有不少障碍。
三、公共数据治理的政府角色定位
公共数据治理是一项系统工程,而作为公共数据的收集者、处理者和最主要的使用者,政府在公共数据治理体系中扮演多重角色。就政府角色定位而言,既需要解决政府在公共数据搜集和处理的正当性基础问题,又需要提升政府对公共数据利用的效率问题,更需要规范政府的公共数据治理行为。
(一)数据治理的正当性基础
数据治理的正当性以数据属性为前提,因而分为三个方面:
第一,数据治理是私权维护的保障。数据的私属性一般在公共数据尚未完全形成阶段或遭侵害时表现出来,数据治理行为以政府权力背书,起到类似公证的效力。厘清个人信息权属,可以从根本上避免信息盗用后辨别真假困难的问题,成为公民后续求偿等行为的法律依据。
第二,数据治理是公共治理的前提。公共治理包括两个层面,即管理与服务。管理层面上,国家政权和政府行政管理很大程度上依赖数据治理,数据治理是统计、基础设施建设、打击犯罪、联合治理等社会治理的各个部门获得信息的正当性基础,也是减少内部信息壁垒的必要机制,同时其可以提升政府部门及其委托的科研单位进行政府管理机制的相关研究的精确度和质量,利用公共数据提出公共问题的解决方案、评估政府政策或项目的效果,提升行政效能和管理水平;服务层面上,高效数据治理可以避免公民因个人数据重复收集遭受的侵扰,确保公民享受与自身状况相适应的社会福利和保障,获取与自身相关的公共信息,进一步将除个人隐私外,仅供政府内部使用的封闭数据开放给有正当需求的公民使用。
第三,数据治理是信息利用的基础。公共数据作为具有财产属性的信息集合,本质上是公共产品,其披露作为一种可期待的社会福利,是公民向政府让渡私权利后可以获得的回报的有机组成部分和一种信息基础设施,是一般民众作出后续投资、迁徙等信息利用选择的基础。同时,数据行为也可以构架起公私之间的桥梁。通过数据开放创造公共价值,公共价值可以反向推动政府转型,将新的参与方和利益关联方引入政府决策过程,鼓励公民更多地参与政治生活或服务于公共利益目标的私主体获得政府数据参与公共产品制作,转变旧有政府利益中心主义的做法,并关注政府层面和用户层面以及二者之间的互动,以数据共享作为数据公开的精神内核,发挥数据资源提供帮助之效③,鼓励合作治理,运用信任机制反哺绩效机制④。
(二)公共数据权属
数据权属的不明确性业已导致一系列后续问题,如政府数据实践领域存在的“反公地悲剧”现象。“反公地悲剧”现象是指公共资源的产权主体越多,这些主体之间的互斥性和独占性就越强,导致资源闲置和交易成本提高,当交易成本超过其所带来的利益时,资源反而处于闲置状态。在数据治理过程中,公民群体委任政府方面获取公共数据集合,在我国信息建设以部门为单位开展的前提下,公共数据作为一种具有极强的经济和政治意义但产权尚不明晰的资源容易导致部门争利,产生政府数据行为的外部不经济。因此,解决“反公地悲剧”最好的方法就是明晰产权,把严重碎片化的产权重新整合起来,而由于排他行为所导致的数据资源的使用效率低下及浪费所产生的成本由整合后的数据支配者来承担”⑤。
公共数据在不同阶段表征出不同属性,因而与一般财产的管理受益模式存在差异,其所有人和公益性反射效果的受益受众均为公民全体,但承担公共数据治理职能的却是政府,符合公益信托的特征:数据治理中委托人为对数据有所有权的国民全体,但公共数据形成后数据的支配权归于作为受托人的政府,以实现风险区隔之效。政府应尽其善良管理人的注意义务,所有行为服务于公共利益这一信托目的,通过制度设计力图使数据治理协调化整体化⑥,规避信息部门之间的信息壁垒。作为受托人的政府侵害作为委托人的国民全体之公共数据权益时,政府应承担相应责任,公民的数据所有权一定程度上由于政府对于公共数据的支配权而遭到克减,但是这种克减是公民获得公共数据服务所必须付出的代价,这种服务作为公益信托“公益性”反射效果的呈现,客观上可供全体公民无负担使用。
(三)公共数据使用范围
政府作为受托人支配公共数据必须遵循作为委托人的公民的全体意志,故公共数据收集处理使用全过程都应体现社会福利公益目的。能体现公益目的的数据治理行为一般可以归入行政管理、公共产品两个类别,其中行政管理类别主要致力于便利公民个体内部的数据使用系统构建,如构建个人社保档案、征信档案;而公共产品类别则致力于构建公民个体之间的联结,个体通过让渡自身部分个人数据权限以期获得公共数据集合,让公民群体在政府有序引导的前提下形成互惠分享的信息社群,帮助公民群体获得大数据红利。
目前公共数据利用较为发达的领域仍为行政管理,公民的社会契约中必然包含了对于政府行政管理中收集可识别个人信息的默示同意以及对于提供不可识别信息用于建设全民共用的数据池的默示同意。数据收集不应超出这一授权范围进行数据使用,同时政府有妥善保管公共数据的义务,泄露公民数据将被追责;行政管理之外的数据利用则会受到更多约束。尤其是公共产品的提供必然会牵涉具有专门技术能力和科研需求的第三方机构,应允许适度的数据共享,其中依申请或者政府主动公开的数据甚至可以在符合条件的情况下用作商用,但高度隐私的数据共享则应通过目的评估机制和签订含有分享目的、风险控制、责任承担等必要事项的数据共享协议才能进行。
(四)政府数据行为监管
《中华人民共和国信托法》第64、65条规定公益信托必须设置信托监察人,当侵害行为发生时以法律行为约束受托人按照信托目的行事。政府数据治理作为深入公民生活隐私层面的行政管理和公共服务行为理应受到严格监管,但目前尚无常规化机构承担信托监察人角色,只有性质严重的公共数据侵害行为才会触发外部机关的临时性介入。由《最高人民法院、最高人民检察院关于办理非法利用信息网络、帮助信息网络犯罪活动等刑事案件适用法律若干问题的解释》第4条规定可知,在处理公民群体的信息泄露时,纵使涉及通信记录、健康生理信息、交易信息等高度敏感信息都要達到五千条以上、对于单个公民的信息泄露更是只有在招致死亡、重伤、精神失常或者被绑架等严重后果或重大经济损失才会触发刑事程序,结合《中华人民共和国基本医疗卫生与健康促进法》(2020年6月1日生效)第101条、《证券投资基金销售结算资金管理暂行规定》第27条等单行法相关规定可知,未达到刑事处罚高标准时,信息治理中其他违规行为一般仅招致责令改正等程度较轻的行政处罚,且惩治权都归于进行信息处理和收集的政府部门,显然这种自律机制的效率值得商榷。目前网信机关的职能设计相对克制,不包含深入政府部门日常信息收集处理的一般流程进行抽查监控和风险控制,针对潜在风险的事前规制和事后第三方监督也都不存在,这种制度设计上的缺位亟需弥补。
四、公共数据悖论:利用与保护
通过公益信托厘清政府在数据治理中的角色后,政府在数据治理中仍面临利用与保护相互冲突的两难境地。这种两难是由公共数据私权属性、社会治理资源属性和公共产品属性的内在矛盾导致的,需明确数据收集和公开的一般范围,个案中数据治理非重大法益不得突破公民授权进行,避免政府越权治理。
(一)静态规制:限定公共数据范围
公共数据的有效治理前提是限定公共数据的具体范围,范围的限定主要包括收集层面和公开层面。从直接收集层面而言,法律规定中有关信息收集的规定边界弹性很大,基本上任何公民信息都可以通过灵活解释被纳入信息收集范围,作为信息收集权源的法律法规与政府信息收集范围相关的表述多体现为概括外观。我国的统计法、警察法、保密法中关于信息收集的具体范围并未明确,仅提供信息收集目标限制,具体的信息收集范围一般散见于各省部级、厅局级单位的通知中,以调查表格形式呈现,缺乏标准化约束,较之于域外一般实践缺乏原则性兜底规定,解释行政化的做法也屡见不鲜,不同地方不同部门的具体实践都有出入,难以形成稳定的共同认知。从间接收集层面而言,在间接收集信息时政府常常处于告知义务与知情同意一般规则之外的地位,针对政府这一特殊主体而言,目前立法未明确平台的告知义务与用户知情同意对于信息收集正当性的基础性意义,这种明确仅见于部分地方法规和行业条例,并没有得到全面貫彻。此外,在国外权威立法例已有明确规定⑦的前提下,我国立法普遍回避了政府主体作为第三方接受平台信息供给后是否属于被遗忘权的义务主体问题,公民信息在信息主体提出删除要求后是否从政府巨型数据库中被删除不得而知。目前我国公共数据的范围较为宽泛是符合我国国情的,未来应逐渐收紧对于信息收集和处理的限制,落实政府公共数据行为中的告知义务,实现公民的删除权和在部分信息收集领域的知情同意权。
探讨公共数据的公开范围在我国信息收集要求相对宽松的现状下具有较强的现实意义。我国尚不具备美国《透明和开放政府备忘录》、英国《数据开放白皮书》等较为详细的数据公开标准,缺乏明确的负面清单,“采取的是增量开放模式”⑧,即由政府各部门确定本部门开放的信息和数据资源内容,但要求各部门数据开放的内容项按一定数量逐年增加。由于实践中各部门的初始开放范围参差不齐,导致不同部门的数据开放水平差异较大,因此应建立统一的政府数据开放目录,提高公共数据开放水平和效率。
(二)动态规制:规范政府数据行为
政府应在遵守公共数据范围限定的前提下进行信息收集和处理,同时也应在个案判断中秉持克制谦抑的精神。诚然,为国防安全、公共安全、公共健康、行政管理目的必须进行的信息收集无疑属于公民为获得政府的服务、保护以及管理上的便利在社会契约中所让渡的部分私权,但任何政府都不可能在所有决定中遵循公民群体的所有意愿。突破公民授权需要的事由应牵涉重大公共利益,规避权力脱离权利的母体获得独立性后失控、异化,政府的自我克制应将其权力限于补充与纠正市民社会内部难以调和的私利冲突⑨,以休谟的“无赖理论”作为制度构建的前提,严格规制数据行为。
数据处理过程必然牵涉信息自决权、公众知情权、公共管理权等同样积极的价值角力。应正视与承认法律实践和行政过程中的缺陷,正视信息处理实践中的价值冲突,并且严格限制国家对于公民基本权利的控制权。保障公民面对强大国家机器保有的防御权,遵循适当原则、必要原则、狭义比例原则,只有保护重大法益才能算作是突破公民知情同意与告知义务一般原则的正当化事由,且这种突破必须同时包含对于公民整体效率优先的考量,突破的进程中应坚持方法论上的平衡论。对于所侵犯的私权应给予补偿、赔偿,非必须使用强制力的领域使用行政指导等手段,应尽可能达到行政权与公民权的衡平,从而实现最终的公共利益保护目的。纯粹为管理便利而进行的信息收集与不恰当的信息交换是滥权的表现⑩。我们需要对公益与私益相关的信息资源进行恰当厘定,明晰不同类别与保密等级的信息的处理面向。
五、制度构建与机制创新
目前我国的数据治理结构符合公益信托的基本样态,但信托监察人缺位,宜借鉴域外设计建设信息专员制度。信息专员应协助建设在规范性文件缺位、用语不明时的个案判断机制:一般通过量化隐私工具即可辨识信息中的隐私和公益成分从而确定是否公开,当涉及量化隐私工具中未包含的信息类别时,则应诉诸事前确立的免责行为模式——安全港模式。确定可以公开的信息则应进一步提升数据质量,通过高水平数据库建设便利公民数据生活。
(一)构建政府数据治理的监督制度和公共数据管理机制
英国于1984年颁布的《数据保护法》中设立了数据保护登记官,后更名为信息专员。信息专员办公室(Information Commissioners Office,简称ICO)作为独立机构将政府强制力从政府提供服务的领域中排除,使之受到独立部门的约束{11}。信息专员制度的职能特殊性在于兼备信息保护与信息公开监督职能,由女王颁发专利特许证,但并不属于皇家雇员或代理;由国家设立,但完全独立于政府之外,其属于为行政目的而成立的从属于内阁的非政府部门的公共机构。其既有政府和女王授权带来的权威性与法律地位,又有机构属性上的完全独立性,不受行政力量干扰,从经费划拨、人员任免、组织架构上单独布局,保障公民知情权的同时也保护公民个人信息不受政府的“越界”侵犯。
在政治治理层面上,我国数据治理机构应独立于同级政府及其部门,不应与直接进行信息处理的公权力机关有事务性的从属关系。在经费、人员任免上仅对同级人大报告与负责,具体事宜的处理也可获同级人大协助,采取垂直管理机制,既获得国家权力支持又获得最大程度的自主权。同时,其应与网信办、工信部等相关部门保持密切合作关系,赋予其借调相关部门的智力、信息库等资源的权力,避免重复收集带来的行政成本以及与外部单位分享信息时常见的信息壁垒问题。
在机构职能设计层面上,应结合我国数据治理的特点,注重实务越轨现象监管,尤其是政府部门对于法律保留事项的侵犯。基于我国的信息治理呈现“九龙治水”的现实,信息专员办公室应起到统筹调配的作用,有效整合各部门职能,在统一的信息共享法规和信息共享平台建设完毕前,对部门之间的信息共享进行调度,最大程度地避免信息壁垒导致的资源浪费。
为避免信息专员机构的风险防范不周延,还应对信息专员机构的相关工作进行二次审核,引入具备专门资质的专家组成专门第三方审查机构,具体选任和责任承担模式可参考“脸书案”的判决;第三方审查机构的基本选任标准应由国家信息专员机构设定,各级处理公共数据的政府一旦选定专家组成员不得任意开除,须由同级信息专员机构批准才可开除,构成一定制约。第三方机构和信息专员组织在信息监督领域均负有具体到个人的刑事和民事责任,并分别按季度向各级人大提交公共数据处理情况报告。
(二)政府数据治理行为约束机制
量化隐私工具可以有效地约束政府数据行为。在个案判断某一数据集被政府公开时进行的衡平是否合理时,应先分析信息内部成分,再决定是出于信息自决考虑保护还是出于公共管理需要而作为信息资源向社会一般公众公开。而具体判断时则需要一套标准技术性流程,即信息分级制度,将信息中的隐私与公益成分进行量化,确认实务部门使用数据时是否具备明确的法律依据,从而将隐私风险降到可接受水平,通过统一明确信息等级的流程,便利实务部门在具体个案中作出是否可以公開的具体决定。此种隐私工具设计主体宜归于信息专员等内部监督机构,设计过程中应吸纳外部监督机构的意见,其分级标准应以书面形式向社会公众公开,便利公民追责。当政府行为可能招致对公民个人信息的风险时就应进行相关风险评估,此处的政府行为主要是指法律法规明示授权外、以个案为单位判断的信息决策过程。主要设置目的在于指导政府内部机构展开隐私影响评估,判断其所提供的服务对于公民个人信息的搜集、使用、披露是否遵守相关的法律、政策,同时指导各部门撰写具体个案中的公民个人信息影响评价报告。{12} 要公开进行民意调查、公共参与等形式对于量化隐私工具进行纠偏工作,形成执行效果报告制度,便利未来发生类似情形时的处理与判断,降低成本。
安全港模式可以提升公共数据效率。政府工作人员在信息处理过程中时常陷入由于规定模糊性导致的“难以作为”的困境,为克服这种困境造成的效率低下问题,域外信息收集领域一般通过制定自律性免责规章的形式构建安全港,让政府工作人员在信息公开与隐私权保护冲突出现时有效规避职务风险,从而提升行政效率,通过有限授权达到实际限权的效果。“安全港”在信息收集领域的运用始于美国与欧盟建立的《安全港协议》,壮大于美国《儿童网上隐私保护条例》等法律,之后逐渐成为英美行政机关在信息收集储存使用公开方面的通用模式。相关机构制定符合“安全港”原则的自律政策,该政策经立法机关或者行政部门背书后加入公共目录成为安全港,以后相关信息收集与保有主体只要遵守该规则即可免责。一般做法是:政府部门在收集、使用个人信息时原则上遵循知情同意规则,告知数据主体处理的目的与用途,提供联系方式以便数据主体了解部门在限制第三方使用与公开该信息方面所采取的措施,并允许数据主体使用信息、修改不真实信息;建立强制性的、由第三方独立进行的信息收集评价与抽查制度。
由于我国尚未出台统一法律协调各单行法信息收集公开的相关规定的冲突之处,亦无量化隐私工具确定公共数据的保护面向,安全港制度宜作为上述漏洞的有效补充广泛运用。在信息公开领域,安全港模式相对成熟,一般不可公开的包括个人生理信息以及种族、民族、政治观点、宗教信仰等敏感数据,且这种有限保护中还存在脱敏数据可公开{13},以及国家安全、国防安全、公共安全、公共卫生、重大公共利益或与犯罪侦查、起诉、审判和判决执行相关信息可以无条件公开的例外情形。
有别于国外通行的“一般性不允许收集或公开+列明允许收集或公开领域”的严格规定,我国在信息收集领域的安全港模式可以通过“一般性允许收集+特殊排除性规定”对个人信息进行有限保护。在直接收集领域:地方层面知情同意规则仅在《贵州省大数据安全保障条例》第16条等少数地方性行政条例中部分提及,国家层面知情同意规则仅在《国家互联网信息办公室关于〈个人信息出境安全评估办法(征求意见稿)〉公开征求意见的通知》第3、15、17、20条处存在责任程度较低的国家信息主管部门核实安全评估义务;在间接收集领域:政府可以通过作为“信息中间人”的信息保有主体转移获得所需信息,此时遵循知情同意规制的主体是“信息中间人”而非政府{14},但这种知情同意也存在可超过原本告知的收集范围进行收集以及向关联方转移相关信息的四种例外情形,且目前针对信息收集实际用途是否归入上述例外并无实质审核程序。我国与安全港模式有关的法律较为零散模糊,违反安全港模式的惩罚也相应地较为温和,例如《上海市公共数据开放管理办法(草案)》第46条中对于未履职人员的行政处罚通常停留在责令改正层面,相关规范难以产生足以阻却个人信息收集领域一般违规行为的威慑。
本土化安全港模式有诸多改进途径:从安全港牵涉的信息范围看,《天津市互联网信息办公室关于〈天津市数据安全管理办法(暂行)〉(征求意见稿)公开征求意见的公告》第11条值得肯定,针对除对于行政管理、国防安全等牵涉重大公共利益的信息外的其他信息采用备案管理而非具体收集,在信息备案过程中可以仅提供信息收集目的、方式、范围、类型等内容,不提供数据本身;从立法与法解释角度看,应统一对于个人信息保护相关概念的理解、信息收集具体范围和兜底原则的解释,并适当提高门槛;从程序性要求层面看,间接收集信息时应进行实质性审核,平台进行审核后政府应进行双重审核,避免出现“间接同意”招致的乘数效应式的风险,脱敏的具体技术标准应从严制定,对于数据脱敏的标准、程度、免责程序作出详尽说明。从源头上避免爬虫技术对于未经过精细脱敏处理的个人信息的抓取与侵蚀,且应经过同级人民代表大会的审核固定化并向社会公开;从责任认定角度看,仅责令改正明显畸轻,信息的不当采集与分享公开应受到处罚,应充分考虑牵涉的有信息主体人数、造成的经济损失等因素;从风险防控角度看,各地区应根据风险级别制定相应的紧急预案,并且定期组织演练以防微杜渐。
(三)完善公共数据的使用机制
首先,可以探讨巨型数据库建设与集约化使用。公共数据的使用主要应依托巨型数据库建设,包括政府内部数据库和数据公开平台建设。政府内部数据库的建设目的是终结“手工行政”的低效率,对公共数据分类整合,优先构建有效的公共危机应对模式{15},再针对公共服务和内部政务便利进行细化设计。政府内部数据库的建设难点主要在于从既存的大量含有重复信息的异构政府部门数据库中抽取数据,建立公共数据中心、修改既有的信息系统以及一般化的公共数据平台建设难以满足局部的、个别的职能部门之间特殊的资源共享需求{16}。公共数据公开平台建设的最大难题在于技术瓶颈,较之政府内部数据库,信息公开类网站访问量大、增长速度快、预测难,且设计指标普遍远低于实际访问量。应引入实时扩容机制,减少阻碍公民获得信息的技术性故障,注重网络维护,避免因外部攻击导致的信息泄露或者平台故障。
其次,可以探索公共数据产品的合理开放。政府信息处理的低效能直接催化了“企查查”、“水滴信用”等的火爆,从侧面为政府信息处理改革提供了产品设计层面值得借鉴的灵感:通过信息整合、爬虫技术抓取整合关联信息,厘清各类信息的基本脉络关系,分析、加工成公民需要的终端产品,将不同层级的政府以及不同部门的信息整合成完整的信息链条,简化处理应达到足以消解数据的复杂性与非技术类公民对数据理解之间的冲突的程度{17}。公共数据产品高效能公开后,可将信息作为战略资源,与科研机构合作,构建面向全社会的教育平台与市场监管体系等{18},具体方向为通过定期调研向技术部门呈交优先级提案。较之于一般网络公司仅有国家工商总局网络作为信息数据来源,政府数据库总库具备更完整的数据基础,收集信息过程中因网络系统兼容性与软件之间技术壁垒导致的运营维护费用作为最低边际成本由复制、阅览、下载的公民付费;记录数据的动态变化过程并尽可能提升新数据储存格式的兼容性,随技术发展不断增加新格式,减少公民信息检索壁垒。
注释:
① 参见田威:《大数据背景下个人数据权的民法保护》,贵州大学2017年硕士学位论文。
② P. A. Samuelson, The Pure Theory of Public Exp-enditure, The Review of Economics and Statistics, 1954, (36), pp.387-389.
③ Allen Kent, The Goals of Resource Sharing in Libararies, See: Allen Kent, Thomas J. Galvin, Library Resource Sharing: Proceeding of the 1976 Conference on Resource Sharing in Libraries, Pittburgh, Pennsylvania, New York: Marcel Dekker, Inc., 1977, pp.17-18.
④ 參见高娟:《新时代中国政府绩效评价研究》,《中国软科学》2019年第12期。
⑤⑧ 参见迪莉娅:《“反公地悲剧”视角下的政府数据开放研究》,《实践研究》2016年第7期。
⑥ 参见曾凡军、定明捷:《迈向整体性治理的我国公共服务型财政研究》,《经济研究参考》2010年第65期。
⑦ 详见欧盟《通用数据保护条例》第17条。
⑨ 参见张翔:《基本权利的规范建构》,高等教育出版社2008年版,第129页。
⑩ 参见张千帆:《“公共利益”的构成——对行政法的目标以及“平衡”的意义之探讨》,《比较法研究》2005年第5期。
{11} 参见黄如花、刘龙:《英国政府数据开放中的个人隐私保护研究》,《图书馆建设》2016年第12期。
{12} 参见邹东升:《政府开放数据和个人隐私保护:加拿大的例证》,《中国行政管理》2018年第6期。
{13} 详见《互联网个人信息安全保护指南》。
{14} 详见《互联网企业个人信息保护测评标准》。
{15} 参见康红霄、王爱冬:《基于大数据技术的公共危机预测研究》,《科技管理研究》2015第6期。
{16} 参见李卫东:《政府信息资源共享的原理和方法》,《中国行政管理》2008年第1期。
{17} A. F. Karr, Citizen Access to Government Statistical Information, Springer, 2008, (17), pp.503-529.
{18} 参见赵光辉、田芳、田仪顺:《大数据交通市场监管:研究进展与技术创新》,《中国软科学》2019年第5期。
作者简介:袁康,武汉大学法学院副教授,湖北武汉,430072;刘汉广,武汉大学法学院,湖北武汉,430072。
(责任编辑 李 涛)