曹雨佳,黄伟群(深圳市委党校图书馆)
政府数据开放生态系统构建:以数据安全为视角
曹雨佳,黄伟群
(深圳市委党校图书馆)
为构建安全和谐、可持续的政府数据开放生态系统,提出了政府数据开放的基本指导原则:数据安全依托于所有利益相关方的良性互动。并且,政府在保障数据安全的同时开放更多数量、更高质量的政府数据;数据开发者在创新利用的同时承担数据安全利用的责任;公众在积极分享数据开放创新成果的同时保持对个人数据的绝对掌控权。最后,提出了建立数据管理专门机构,负责数据开放安全审查;对政府数据进行分层分级分类管理;制定个人数据保护法;加强政府、数据利用者与公众之间的互动与反馈等建议。
政府数据;数据开放;数据开放生态系统;数据安全;数据开放原则
政府数据开放是政府信息公开的进一步发展,要求政府相关信息和数据的公开、透明,但政府数据开放将开放对象进一步提升到了原始数据的粒度,并且政府信息公开强调的是公民的知情权,公众有权了解政府的各项活动及决策信息。而政府数据开放强调的是数据的再利用,公众可以分享数据利用创造的经济和社会价值,并且可以根据对数据的分析判断政府的决策是否合理。目前,世界已有63个国家和地区以及国际组织推行了政府数据开放政策。政府数据开放所带来的政治、经济、社会价值日益被人们所认可和期待。但值得注意的是,政府数据中包含大量涉及国家安全、商业秘密、个人隐私以及其他涉密内容,一旦被泄露或滥用会造成难以估量的数据危机,威胁国家安全、社会稳定和个人隐私。安全是数据开放的生命线,只有更好地保护和利用,才会有更好的开放。如何在开放中确保数据安全,构建安全和谐、可持续发展的政府数据开放生态系统是各级政府部门面对的挑战和亟待解决的难题。
2.1政府数据开放生态系统主体构成
在数据开放的同时确保数据安全,这是一项系统工程,不是依靠任何一方或者个体就能实现的,它有赖于政府数据开放生态系统中的各主体,即政府、数据利用者以及作为数据消费者的公众。各主体各司其职,同时又分享数据,互利依存,共同实现数据价值的最大化效益,维持生态系统的和谐及可持续发展。
2.1.1政府
政府在生态系统中起着重要作用。首先,政府是政府数据的源头和生产者,政府拥有海量数据资源,并且掌握着数据是否对外开放以及如何开放的决定权。从数据安全角度说,政府需要在开放和保密中寻求平衡,保护数据的利用创新和安全。国外政府在这方面做出了很好的示范,主要有以下四种做法。
(1)规定豁免开放数据范围,保护国家安全、商业秘密以及个人隐私。在政府数据开放中,缺乏可依据的开放或保密的范围容易导致政府工作人员在数据开放工作中无从判断某一类型数据是否公开,处于免责的考虑而不予开放。因此,推行政府数据开放的国家主要采取三种方式来确定豁免数据范围。
第一种是划分豁免开放数据类型,即确定特定数据是否可以被认定为豁免开放的框架,大多数与其信息自由法规定豁免公开的信息类型相同,如表1所示。
表1 三国豁免开放数据范围[1]
第二种是制定开放数据清单。如,韩国就是由主管部门确定具有共性的开放范围,再通过公众需求调查的方式进行补充,去掉有争议的数据范围,最后选出36个领域,按计划进行开放。[2]
第三种类型则是制定豁免开放数据清单。如,印度就制定了一个豁免开放的数据清单,规定涉及国家安全、商业秘密和个人信息方面的数据不予开放。
这三种方式各有优劣,划分豁免开放数据类型的方式已经在大多数国家的信息自由法实践过程中使用过,积累了一定的实践经验,政府数据的类型太多太杂,无法通过一一列举的方式确定所有开放的内容,但缺点是赋予了政府部门较大的自由裁量权,工作人员主要根据自身理解来作出数据应该划分到某一豁免开放类型中去的判断,容易引起争议和纠纷。制定开放数据清单的方式在数据开放的初期比较适用,它有针对性地选出了适宜开放且满足公众需求的数据类型,有利于减小内部阻力,培养政府部门开放数据的主动意识,同时也可以通过“试点开放”的方式总结经验和教训。但此种方式的局限是数据类型有限,从长期看限制了政府数据的全面开放。制定豁免数据开放清单的方式是通过具体列举不能开放的数据资源的方式实现对数据安全的保护,它的优势是清晰明了,对政府数据开放工作有相当明确的指引作用,但制定过程相当繁杂,且难以应对日新月异的大数据时代的社会变迁。
目前,我国虽颁布了全国性的政府数据开放行动纲要,但暂无全国性政府数据开放实践。地方层面自2012年起就开始了探索政府数据开放的活动,并取得了一定成果。上海市是我国最早开始试行政府数据开放的城市,其采取的就是制定开放数据清单方式,重点开放11个领域总计190项政府数据内容。
(2)设立数据管理员,专门负责数据的安全审查和开放。政府数据开放工作一般依照法律规定、审查标准和以往案例对数据开放或保密作出审查,这在很大程度上依赖于工作人员的专业知识和经验。因此,指派掌握审查知识和技能的专业人员,确保其对政府数据开放与否的属性准确判定就显得非常重要。美国在各部门内部指定了数据管理员,他们负责对政府数据的质量和数量进行监控,对数据进行安全和隐私审查,再予以开放。英国则要求政府机构内部各部门配备隐私保护专家,确保在政府数据开放过程中依照隐私保护相关规定执行。
欧洲国家一向注重个人的权利和自由,对个人数据均设有特别的保护手段。即设立专门的个人数据管理机构,任命专门的数据保护专员,直接负责关于个人数据处理的通报及预先审查。也就是说在处理个人数据之前,先要向本国的数据管理机构通报收集及处理的数据类型及数据处理目的。特别是可能给数据主体的权利和自由带来特殊危险的数据处理行为,数据管理机构应该进行预先审查,在得到批准之后数据控制者才能进行后续的处理工作。这种由数据保护机构实施的审查和批准制度对限制个人数据的非法和不正当公开和使用非常严格及有效。如瑞典、匈牙利、芬兰等国就任命了数据保护监察专员,主要监察数据控制者对个人数据的使用情况,如果存在违反数据保护法的行为,它可以以要求修正或者赔偿的方式为个人提供数据保护方面的救济。另外,法国、波兰和西班牙等国则采取了数据保护管制模式,也就是可以通过强制性手段来确保法律的遵守。
(3)建立政府数据开放门户网站,分领域、分阶段开放数据。美国、新西兰、英国等国家均建立了政府数据开放的“一站式”开放平台,对开放数据进行管理和发布,如表2所示。
表2 国外政府数据开放网站一览表(数据截止2015年9月25日)
各国的政府数据开放平台对各政府部门上传的数据进行安全检查和质量监控。如,美国Data.gov网站规定所有提交到网站的数据均不能违反当前隐私法的规定,内容性质均不能涉及国家安全或其他保密规定,各政府部门应对各自提交的数据作隐私影响评估;[3]在Data.gov网站中,可以鉴别出个人信息而对个人隐私有损害或与国家安全议题相关的或非属于联邦政府管辖的数据都不在开放的范畴。并且规定在向data.gov网站提交数据集之前,各部门机构应使用《国家/国土安全和隐私保密检查表和指南》[4]对数据进行安全审查,检查表应当与申请公开的数据集一同提交。英国Data.gov.uk网站隐私政策条例中规定,其收集和使用数据均要遵循1998年的数据保护法。澳大利亚政府规定,政府要开放某一数据时,必须进行隐私匿名化处理,以避免所开放数据对个人隐私权产生冲击。同时,还需要考虑开放的数据是否会对国家安全造成危害。如果涉及隐私或会影响国家安全等,则不予公开。[5]
我国虽尚无全国范围的统一平台,但上海、北京等地已经建立了政府数据开放网站,其中大多数是政府部门自己决定公开的一批开放难度较小的数据集,但相较于国外网站数据集来说数量和种类都较少。随着政府数据开放工作进一步推动,数据集的范围将进一步扩大,数据安全的压力也随之加大,网站需对政府部门上传数据的安全情况进行审查,并对开放对象安全使用数据作出明确规定,并根据开放对象以及利用数据方式的不同,分领域、分阶段进行开放(见表3)。
(4)鼓励数据利用,促进数据安全开发。从表2可以看出,国外政府数据网站均提供了API应用的接口,鼓励用户通过利用政府数据,创造出受公众喜爱的应用工具。自2009年起,纽约市政府便资助了“NYC Big Apps”的应用开放竞赛,鼓励用户利用政府数据来开发网页或者设计移动应用程序。[6]北京市政务数据资源网也举办了主题为“政府数据开放,大数据应用创新”的创意大赛活动,旨在通过竞赛活动宣传和推广政府数据资源,引导和鼓励更多公共机构、企业参与政务数据资源开发利用。[7]
表3 国内政府数据开放网站一览表(数据截止2015年9月25日)
另外,影响政府数据开放和利用的因素很多,包括保守本部门工作秘密的固有价值观、狭隘的部门利益主义,不愿意共享部门相关数据、担心所开放的数据被误用而可能导致责任归属问题。同时,若无相关法令或规范的授权,政府开放数据的意愿也会降低。[8]也就是说,政府开放政府数据的意愿会受到自身以及生态系统中其他生态主体行为及外部环境的影响。
2.1.2数据利用者
政府数据开放不是简单地收集和分发数据,促进数据开发,提高数据的利用率才是核心。数据利用者在资金、技术或者精力上相较于政府部门来说更有优势,他们通过分析、处理、挖掘和整合政府数据,开发出各种创新应用,给人们生活提供各种便利和个性化服务。在一个良好的政府数据开放生态系统中,数据利用者需做到以下三个方面。
(1)明确数据利用者的数据安全义务,为数据利用承担责任。尽管政府已进行了数据安全审查,但是,由于信息技术的加速发展,关联数据所带来的风险增加,因此需要通过相关的法律法规,明确数据利用者的义务。在过去,数据利用者在收集和处理个人数据时,均采取“告知和许可”的方式,一般来说,都是通过繁杂的法律条款方式告知数据所有者收集、使用数据的目的、方式和范围,并得到数据所有者的认可。但是,在大数据时代,这种“告知和许可”原则面临巨大挑战,政府在收集数据时无法预料数据将如何被使用,也就无法告知数据所有者,数据所有者也无法想象被收集数据的粒度会在何种程度影响其生活,也就无法明确地许可,而未通过这一原则的规定,在一定程度上阻碍了数据开放和创新利用。因此,在大数据时代,传统的“告知和许可”原则应该被修改,数据利用者应提升数据安全意识,为数据利用的后果负责,承担数据安全利用的责任。另外,对于可能给国家安全、商业秘密和个人隐私带来威胁的数据处理行为,数据利用者应当主动向相关数据管理机构汇报,得到安全审查批准之后再进行进一步的处理。
(2)根据用户需求,积极开发创意性数据产品。数据利用者在生态系统中的重要角色便是利用政府开放数据,创造出受公众欢迎的创意性数据产品。如根据美国气象局、美国地质调查局以及美国航空航天局数据开发的应用程序“Climate”,可以及时提供气候信息、田野作业信息以及农作物生长阶段信息,帮助农民作出最优决策,提高劳作效率并增加利润。[9]只有通过数据利用者的开发和利用,政府数据才能实现潜在的政治、经济和社会价值。
(3)接受数据安全测评和风险评估,维持相应的防护能力。对于处理一些敏感数据的数据利用者,还应接受第三方机构的数据安全保护能力测评和风险评估。第三方机构应当按照一定的标准对数据利用者的能力和资质进行审核,对其开发数据产品的安全性能进行测试和评估,对于数据产品存在的安全隐患及时排查和通报,降低数据泄密或滥用的风险。
2.1.3公众
政府数据开放利用需要较强的数据处理和挖掘能力,这将许多普通公众排除在数据利用者的身份之外,在很多情况下,他们是以数据消费者的形式参与到政府数据开放生态系统中,只有通过公众的广泛参与和使用,政府数据开放才能得到应有的关注,才能实现政府数据资源再利用的政治、经济和社会价值。为了加强与公众的互动,提升公众在政府数据开放中的参与度,政府部门一般在政府数据网站上通过博客、栏目以及实时在线交流等方式与公众进行良性互动。政府应该通过在网站开设虚拟社区等方式及时获取公众的反馈意见,营造一个良性循环的开放政府数据体系和生态系统。
公众在享受政府数据开放利用成果的同时,也应注意保护涉及个人隐私方面数据的安全。在大数据时代,为保护创新的自由发展,数据利用很难做到完全对公众一一告知,但公众必须保有对个人数据绝对的控制权。也就是说,当发现个人数据遭滥用或错误利用时,个人有权纠正其行为并选择回收个人数据。美国《消费者隐私权利法案》就对数字化环境下个人的权利作出了如下规定:个人控制,即个人可以控制企业收集和处理个人数据;透明度,即个人有权以简单明了的方式了解隐私以及安全保障的信息;安全,即个人数据必须得到安全和负责任的处理;可修改和准确性,即个人数据有误时,在与数据敏感性以及与数据错误可能对消费者带来不利影响的风险性相适应的情况下,个人有权纠正个人资料的准确情况;问责,即拥有个人数据的公司有义务遵守《消费者隐私权利法案》的规定等。[10]
2.2政府数据开放生态系统外部环境
良好的外部环境对政府数据开放生态系统的构建也非常重要,只有将数据产生者、数据利用者、数据消费者与数据政策、数据技术等进行良性互动,才能构建安全的生态系统。首先,数据安全有赖于科学、完善的数据政策。美国一方面对原有政策进行了修改以适应开放政府的需求,如《开放政府指令》提出要在120天内通过审查现有的美国政府预算办公室政策,如《削减文书方案》和《隐私指导方案》等,识别其中阻碍开放政府和新技术使用的问题并予以修正;另一方面发布了13526号总统令、13556号总统令等一系列相关政策,在促进政府数据开放透明的同时,对政府数据开放的范围作出相关限制,对数据安全管理问题作了相关规定(见表4)。
表4 美国政府数据开放相关政策内容[11]
同时,数据技术能力也须齐头并进,包括在技术上去除敏感的手段,如人工合成数据技术,其通过随机抽样和填补等一系列统计方法产生多个版本的模拟数据,用来完全代替真实数据。人工合成技术既保留了原始数据的关联特性和统计特性,又能保证个体样本的隐私性,在美国人口普查中有所利用,是保护隐私安全方面的一个重大数据技术创新。
2.3政府数据开放生态系统能量流动
在政府数据开放过程中,外部环境,即完善的数据政策、先进的数据技术水平和其他的一些政治、经济、社会因素以及政府本身的开放意愿和管理水平决定着政府数据能否安全、完整地开放。而政府数据开放之后,数据利用者的责任意识和开发水平则决定着政府数据能否被安全地处理和利用,生产出受人欢迎的数据产品。而公众对数据产品的积极消费,对数据产品中存在的安全问题积极监督和纠正,就能保证政府数据的开放利用既能产生巨大的公共价值,又能有效地避免国家安全、商业秘密以及个人隐私受到威胁。这样会进一步消除政府的顾虑,加强开放动力,开放出更多数量、更高质量的数据,从而有利于数据利用者的开发利用,形成一个良性循环。也就是说,要构建一个安全和谐、共享、绿色、可持续的政府数据开放生态系统,需要所有生态主体的良性互动。政府在保障数据安全的同时开放更多数量、更高质量的政府数据;数据开发者在创新利用的同时承担数据安全利用的责任;公众在积极享受数据开放创新成果的同时保持对个人数据绝对的掌控权。
3.1建立政府数据管理专门机构,全权负责数据开放和安全审查
政府数据开放工作涉及多个政府部门以及众多的数据开发利用者,需要建立一个专门的数据管理机构,统筹协调开展数据开放工作。①数据管理机构应当协助各级政府部门确定开放的数据范围,确保开放数据不会威胁国家安全、商业秘密以及个人隐私等法定保密事宜;②制定详尽的数据安全审查工作指南,统一全国保密审查标准,规定具体的保密审查流程,包括根据指南评估机密,对涉及保密信息的数据进行相应的脱敏处理等,便于工作人员根据工作指南和保密审查流程开展工作;③对各部门上传数据标准作出规定,确保数据高质量、高互联;④对开放数据进行安全审查,通过有效的数据技术手段,对开放数据的质量、安全作出评估;⑤数据管理机构应当对数据利用者的数据开发利用情况进行监管,当涉及不当利用或危害安全隐私的行为时及时进行处理。
3.2依照相关法律法规,对政府数据进行分层分级分类管理
政府数据开放工作不可一蹴而就,应根据实际情况和实际对象,分层次、分级别、分大类进行管理和开放。即根据我国的行政体系,协调好中央政府与地方各级政府开放渠道的关系,建立一条层次纵贯中央-省-市-县的政府数据链,并对这条政府数据链中的数据进行安全审查,划分保密级别。如将一些具有重大经济、社会价值,能够促进生产、便捷生活、推动社会创新的数据划分为完全开放级别,优先对所有公众和数据开发利用者开放;将有可能威胁到国家安全、违反商业秘密和侵犯个人隐私等的数据划分为豁免开放级别,纳入完全保密处理;将暂时不宜完全对外开放的数据划分为依申请开放类型,需经公众或开发者申请,经过对敏感数据的处理或者有效分割处理再予以开放。再者,应为各部门上传的政府数据创建元数据,并根据元数据的类别划分数据群,将其覆盖到社会生活中各个主题,以方便公众和开发利用者查看和利用。
3.3制定个人数据保护法,规定数据利用者的责任和义务
在大数据时代,个人数据被肆意收集和滥用的风险与日俱增,个人的一言一行都处于被监控和暴露的威胁中,个人对保护隐私的意愿也越来越强烈。因此,要尽快推出我国个人数据保护法,协调政府机构和开发利用者在收集、处理和利用个人数据方面产生的种种问题。值得指出的是,个人数据保护法的立法原则需顺应大数据时代以及数据开放利用的新特点,强化数据开发利用者的责任和义务。相关法规应明确规定数据开发利用者使用个人数据的类型,以及个人数据被何种方式利用,同时对敏感数据的处理和通报以及违反安全利用规则的严格惩罚,使其承担数据安全利用的责任。
3.4加强政府、数据利用者与公众之间的互动与反馈
政府数据生态系统中的各主体相互依赖又相互促进,加强政府、数据利用者与公众之间的互动和反馈,可以促进生态系统中能量流动和价值创造。政府只有通过沟通了解数据利用者和公众的需求,才能开放更多有利用价值的数据;数据利用者只有更多地了解公众的喜好和个性需求,才能开发更多受人欢迎的数据产品,政府数据开放才创造了应有的价值。因此,政府一方面要通过各种应用竞赛或者招标购买、补贴奖励的方式鼓励和吸引公众参与政府数据的创新性开发利用,提供更多有助于提高公共服务水平,促进生产活跃发展的数据应用,另一方面要通过网上论坛、在线交流以及数据应用下载频次管理的方式了解公众对数据类型、质量、使用方面的偏好和需求,调整开放数据的重点和鼓励开发应用的方向。
[1]Rininta Putri Nugroho,et al.A comparison of nationalopendatapolicies:lessonslearned[J].Transforming Government:People,Process and Policy,2015,9(3):286-308.
[2]姜涵.“互联网+”时代如何确定公共数据开放范围?[EB/OL].[2015-09-20].http://www.cnii. com.cn/informatization/2015-07/13/content_1597371.htm.
[3]侯人华,徐少同.美国政府开放数据的管理和利用分析——以www.data.gov为例[J].图书情报工作,2011(4):121-124,144.
[4]National/Homeland Security and Privacy/Confidentiality Checklist and Guidance[EB/OL].[2015-09-20].http://www.data.gov/sites/default/files/attachments/ Privacy%20and%20Security%20Checklist.pdf.
[5]杨东谋,等.国际政府数据开放实施现况初探[J].电子政务,2013(6):16-25.
[6]张毅菁.从信息公开到数据开放的全球实践[J].情报杂志,2014,33(10):175-183.
[7]北京市政务数据资源网.“2014年北京市政务数据资源网应用创意大赛颁奖仪式暨应用推介会”在京举行[EB/OL].[2015-09-20].http://www. bjeit.gov.cn/zwgk/ztzl/zhbjjs/zhcy/djxm/80627.htm
[8]杨东谋,等.政府开放数据与信息增值:台湾的经验与启示[J].图书情报工作,2013(10):67-73.
[9]Data.gov[EB/OL].[2015-09-28].http://www. data.gov/applications.
[10]“大数据时代”的美国隐私权保护制度[EB/OL].[2015-09-25].http://www.36dsj.com/archives/18240.
[11]陈美.美国开放政府数据的保障机制研究[J].情报杂志,2013,32(7):148-153.
Construction of Government Data Open Ecosystem:a Perspective of Data Security
Cao Yu-jia,Huang Wei-qun
In order to build a safe,harmonious and sustainable government data open ecosystem,this article presents some basic guidelines:Since data security relies on the positive interaction of all stakeholders,government should open more and higher quality of government data while keeping it security;data developer should take responsibility for data security while making creative use of data;the public should maintain their personal data under absolute control while enjoying the innovative data usage.Specific recommendations are made as follows:establishing a specialized agency responsible for data management;managing the data through layer,hierarchy and classification channels;developing Data Protection Act;strengthening the interaction and feedback among the government,developers and the public.
Government Data;Open Government Data;Open Data Ecosystem;Data Security;Open Data Principle
G254.97;G203
A
1005-8214(2016)10-0020-05
本文系全国行政学院科研合作基金课题“政府数据开放安全审查制度研究”(项目编号:15HZKT113),教育部人文社科研究青年基金项目“我国政府数据开放保密审查体系构建及保障机制研究”(项目编号:15YJCZH237)阶段性研究成果之一。
曹雨佳(1988-),女,硕士,深圳市委党校图书馆助理馆员,研究方向:政府数据开放,政府信息资源管理等;黄伟群(1966-),研究生,研究馆员,研究方向:政府信息公开、政府数据开放。
2016-02-04[责任编辑]菊秋芳