陈晓勤
(中共福建省委党校法学教研部,福建福州350001)
政府数据开放是整合公共数据资源向社会开放,促进数据增值利用和创新应用的重大措施。政府作为各类政务数据的收集者、加工者和传播者,所掌握的数据占我国信息数据资源的80%左右。与社会数据相比较,政务数据在权威性和时效性上存在天然的优势,具有巨大的开发潜力和利用价值。[1]随着数据技术发展和数字经济的深化,政府数据开放逐渐受到世界各国的重视。据统计,截至2014年1月12日,开放数据运动已覆盖44个国家和地区。[2]英国开放知识基金会(Open Knowledge Foundation)通过调查发现,英国和美国的政府数据开放情况在70余个国家和地区中分别位居第一和第二,而后依次是丹麦、挪威和新西兰。[3]在政府数据开放浪潮的影响下,我国进行了相关尝试,但仍处于探索阶段。2015年8月31日,国务院印发的《促进大数据发展行动纲要》指出,“在依法加强安全保障和隐私保护的前提下,稳步推动公共数据资源开放”“逐步实现信用、交通、医疗、卫生、就业、社保……企业登记监管等民生保障服务相关领域的政府数据集向社会开放。”[4]2016年3月,国务院出台《中华人民共和国国民经济和社会发展第十三个五年规划纲要》,要求“制定政府数据共享开放目录,依法推进数据资源向社会开放。”[5]2019年党的十九届四中全会通过的《中共中央关于坚持和完善中国特色社会主义制度推进国家治理体系和治理能力现代化若干重大问题的决定》也提出“推进数字政府建设,加强数据有序共享”。
政府数据开放是政府信息公开的延伸与深化,但两者存在着较大差异。首先,制度目的不同。政府信息公开侧重强调公众的知情权,重心在于“知”;而政府数据开放的重心则放在“应用”,强调数据开放后的可利用性。[6]14其次,对象不同。数据的范围比信息更加广泛。数据可以是原始的、一手的、未经处理的个体数据或数据集;信息则是经过加工处理甚至解读过的,具有特定含义的数据。[6]13再次,范围和程度存在差异。什么是符合政府数据开放要求的“开放”?开放知识基金会指出,开放的条件包括方便获取、允许再散布和再利用、无技术限制、简要署名标识、原件完整、无差别待遇、不限目的、明示许可方式等。[7]美国的“开放政府数据”研讨会提出,开放应当具有八项原则,即全面开放、数据完整、即时发布、便民使用、机器处理、不作限制、公开格式、不需另外申请授权。[8]尽管不同研究机构对数据开放的定义存在差别,但从整体上看,政府对于数据开放的要求要比信息公开更高。最后,参与主体不同。政府数据开放的利益结构比政府信息公开更为复杂。政府信息公开主要涉及行政机关和申请公开主体;而政府数据开放除了行政机关、申请开放主体之外,还涉及数据利用主体和数据权属主体。
既往研究曾经将政府数据开放与政府信息公开混为一谈,但随着社会、科学技术的发展和研究的深入,二者逐渐区分开来。目前,我国对政府数据开放的研究主要集中在以下几方面:(1)政府数据开放概念的梳理。学者们基本达成共识,即政府数据开放与信息公开相比,侧重于数据资源价值挖掘和利用。[6]14,[9](2)政府数据质量和整合研究。政府数据质量是增值利用的关键,应建立一个整体的数据资源收集、整合、管理、费用预算体系。[10](3)政府数据权属研究。政府数据存在公共属性和私人属性双重特征,应当厘清产权归属。[11](4)政府数据开放管理研究。学者们从参与主体、影响因素、体制机制与能力建设等方面对政府数据开放进行了分析。[6]14-15,[12](5)政府数据开放中的安全和隐私研究。学界普遍认为,政府数据在开放和增值利用中存在滥用个人信息的风险,应当予以规范。[13](6)政府数据开放立法研究。政府数据开放立法应规定数据采集、汇聚、共享、开放的范围,明确开放的原则、范围、程序、标准等。[14-15]现有成果从不同层面将政府数据开放纳入理论视野,但仍有进一步深化研究的空间,表现在对政府数据开放的目的关注不足、对制度如何回应实践分析较少等,这也正是本文试图讨论的问题。
国家层面并没有对政府数据开放进行专门立法,对其进行调整的依据只是《政府信息公开条例》(以下简称《条例》)。2019年4月3日修订的《条例》第八条规定:“各级人民政府应当加强政府信息资源的规范化、标准化、信息化管理,加强互联网政府信息公开平台建设,推进政府信息公开平台与政务服务平台融合,提高政府信息公开在线办理水平。”该规定内容较为宏观与原则。
地方在政府数据开放立法方面进行了一定探索,但存在两大问题:一是政府数据开放的制度供给不足。目前,贵州、天津、海南、上海等制定了相关法规规章,但这些法规规章或仅规定了政府数据资源的管理办法,或只是制定了数据发展或智慧城市的建设规划,并未对政府数据开放进行详细规定。[16]95而在已经施行的政府数据开放地方立法中,除《上海市公共数据开放暂行办法》规定得较为详细全面外,大部分立法还是将重点放在数据共享上,较少涉及数据开放。二是政府数据开放的重要目的——“应用”,存在被忽略的现象。当前政府并未完全理清政府数据开放与政府信息公开的区别,在法律文本中未加以区别,仍然将数据开放像信息公开一样管理和限制,没有体现数据开放可及便利性、利用增值促进性的特点。[16]99在相关立法规定中,数据管理被赋予更多的权重,而对数据开发利用机制及其促进规定则缺少关注。这导致实践中政府数据的开发应用缺少法律依据。尤其是数据使用授权机制的缺失,已经成为社会和企业开发利用政府数据的阻碍,极大地减损数据的应用可能和开发价值。由于立法的空白,有些企业担忧触碰法律红线,既不清楚如何获取政府数据,也不知道如何使用政府数据,抑制了开发和创新的动力。
在实践上,政府数据开放尚处于起步阶段,存在着数据采集汇聚质量不高、数据开放范围不明、数据开放程序不清、数据应用无影响力和数据安全保护不足等问题。
第一,数据采集汇聚质量不高。数据采集质量不高主要表现在两方面:一是数据缺失统一标准,数据生产单位采集准确度欠佳、录入不规范的问题依然较为常见,数据字段缺失问题时有发生。二是部门多头采集导致描述同一问题的数据存在差异。如民政部门、公安部门和法院都会对婚姻数据进行采集,但是却常出现数据不一致的现象,导致大量数据难以发挥有效价值。而在数据汇聚方面,从横向上看,数据资源管理条块分割,“数据孤岛”“信息烟囱”现象依然存在。一些政府和社会需求强烈的民生数据,如公积金、医保、水、电等还未实现“应汇尽汇”。从纵向上看,政府各层级之间的数据共享环节仍不顺畅,平台和业务系统的对接存在目录不一致、需要二次录入等问题,已经汇集的数据也回流不足。虽然省级层面汇集了不少数据,但地市却缺少可用数据,且向上级部门申请数据的程序繁琐、耗时较长。
第二,数据开放范围不明。目前有些数据权属、类型规定不清,加上考虑到数据安全和个人隐私等问题,一些政府部门对数据开放范围仍然持相对保守的态度。在此背景下,政府数据开放范围的划定并不明晰,主要体现在两方面:一是相关立法和规范性文件对“政务数据”“政务信息资源”的规定范围大小不一。最大的范围除了政府部门还包括事业单位、社会组织、公共企业的数据,而最为狭窄的范围仅包括政府部门和事业单位的数据。规定范围不同影响政府数据开放范围在不同地区出现巨大差别。二是立法中大多将政府开放的数据进行分级分类,常见分类为“无条件开放的数据”“有条件开放的数据”,但这两种分类之间的界限并不分明。在政府部门保守态度的影响下,实际操作中容易出现大部分有价值的数据被划入“有条件开放的数据”的情况,削弱数据获取和开发的便捷性。
第四,数据应用无影响力。政府数据开放的主要目的在于开发数据价值,使其被社会和市场充分利用。在对地方政府数据开放平台浏览、下载、开发应用情况的调查中发现,政府数据的应用并未形成数量上的优势,社会和市场对政府数据开发和利用的积极性没有被激发。据调研,不少大数据相关企业的代表提出,大量有价值的数据没有开放,而开放的数据质量不高。截至2016年1月,青岛和武汉的数据集平均下载量仅为9次和1次,北京、上海、青岛、武汉政府数据的应用仅为59个。[16]99造成这一情况的原因,一方面是相关立法不完善。由于缺少数据开放的规则,政府担忧开放数据可能导致国家秘密和个人隐私泄露,容易触碰法律底线、引发社会问题。一些政府工作人员认为开放数据是吃力不讨好的事情。另一方面是因为政府对开放数据应用的宣传和促进力度不足。社会公众对政府数据开放了解不多,尚未发现政府数据这一“富矿”挖掘的巨大潜力。
第五,数据安全保护不足。尽管在大数据相关立法中,数据安全领域的规范内容最多,但仍然不足以满足实践需求。政府负责组织实施数据汇聚共享平台的建设和运维,但承建、开发主体为企业。数据安全从某种程度上来说系于承建、开发者之手,然而相关监管制度对个人隐私、商业秘密等保护规定不明,对承建、开发者缺少监管,提高了数据泄露和滥用的风险。数据化后的社会和个人信息经济价值巨大,且极易被复制、传输和查找,一旦发生泄露和滥用,则影响和损失巨大。
政府数据开放法律框架的构建应围绕实践需求。其中,数据采集汇聚是政府数据开放的前提,要提供全面优质的数据;数据开放开发制度是政府数据开放的核心,应当对数据开放的范围和程序、数据使用授权、数据应用促进加以规定,以保障社会和市场对政府数据的充分开发应用;政府数据开放不可避免地涉及国家秘密、商业秘密和个人隐私,需要完善数据安全保护制度(见图1)。
采集汇聚是政府数据开放的“上游”。该制度旨在规范政府数据采集,打破“信息壁垒”“数据孤岛”现象,加快政府各部门、公共数据库之间的互通共享,整合公共数据,形成全面、优质的数据集合,提高开放数据的质量。因此,需要完善两类制度:一要细化政府数据采集、制作、管理制度,包括规范政府数据采集的渠道、格式、标准、边界;规范政府数据分类、处理、清洗、加工;监管规范政府数据的存储、调取等。这类规则应当在国家层面进行,若由地方立法进行规定,会造成不同部门、地区采集数据维度各异,获取的数据很难开发应用等问题。二要明确政府数据汇聚共享制度。这一制度既涉及数据共享的范围边界、使用方式和相应权利义务等,也涉及政府数据平台和社会数据平台的对接和共享机制。一方面需要规定数据由上至下的回流机制,简化数据共享申请的程序,保障地市层级的数据使用;另一方面应当要求政务部门的业务数据及时向数据共享平台汇聚,尤其是与民生有紧密关联、社会需求迫切的数据。
图1 政府数据开放法律框架
1.划定政府数据开放范围。数据开放范围是政府数据开放法律制度的核心内容,涉及以下几方面:开放数据的形式、主体、内容要素;依据性质、用途、权益等因素建立的数据分类分级体系;政府数据开放的范围、条件;政府数据开放的负面清单;政府数据目录的编制与更新制度等。时建中认为,数据跨区域的开放、互通和分享是大数据的特性;地方立法不免具有局限性,与大数据特性不一致,有可能阻碍产业发展,还有可能成为地方保护的手段。[17]因此,“政务数据”“政府信息资源”等对政府数据开放范围影响巨大的根本性定义和分类,需要从国家层面进行统一规定,才能避免由于地域规定不同导致数据开放范围存在差异的问题,才能打破地方立法局限对于大数据产业发展的阻碍。
2.明确政府数据开放法律程序。为规范政府数据开放过程,需要通过法律程序明确数据开放的步骤、途径等内容。首先,应当建立数据安全审查程序,以避免造成违背保密要求、威胁国家安全的后果。可以规定网信部门会同大数据管理部门、网安部门在政府数据开放前进行分级分类安全测评、风险评估,完善安全防护、应急处置等措施,保障数据开放环节安全可靠。其次,需要规定数据开放、更新程序,明确政府数据主动开放与及时更新的责任、时限和内容。如依据数据开放的不同类型设定开放程序,无条件开放的数据依托数据开发平台直接获取,有条件开放的数据应由公民、法人或其他组织通过数据开发平台向数据生产应用单位索取。数据提供和开放部门应及时更新数据,保障数据的完整性、准确性、时效性和可用性。再次,应当细化数据开放申请程序,尤其应当规定对数据开放申请的响应时限。如《吉林省促进大数据发展应用条例》征求意见稿规定,行政机关以及公共管理和服务机构应在接到申请10个工作日内对数据开放的申请予以答复。最后,应规定数据不予开放的告知程序和数据开放监督程序,赋予公众参与和反馈权利,为其提供救济渠道。此外,还可以在行政体系中引入数据开放的评估和问责机制,如将影响政府数据开放的几个重要指标进行量化,在政府的绩效考评中纳入数据质量、数据开放、数据应用情况等内容,定期考核评分。
4.强化政府数据应用促进法律制度。政府数据开放的重要目的在于公共数据得到有效应用,为社会和经济发展带来巨大价值。仅注重开放数据,忽略开发、应用,容易落入“为开放而开放”的陷阱。强化政府数据应用促进法律制度应做好以下几点:首先要建立数据开发、应用的政府购买法律制度。如《吉林省促进大数据发展应用条例》征求意见稿第四十一条规定:“省、市(州)人民政府及其有关部门应当落实政府购买服务政策,加大对大数据应用产品和服务的采购力度。”其次要制定促进数据资源开发、应用的行政指导制度,可以采取示范项目、信息通报会、社会培训、数据利用指导等多元形式进行。如美国白宫科技政策办公室、商务部与纽约大学在2014年联合举办开放数据圆桌会议。会议中有20多个利用政府数据的公司和机构,就开放政府数据的需求、可操作性等要求开展结构性对话沟通。[21]研究显示,不少大数据相关的中小企业代表也反映希望政府面向企业开展大数据应用的培训,特别是针对政府开放数据应用案例的学习培训。最后要明确政府数据开发、应用的收益分配制度。一则政府数据开发和利用的积极性和效率必将涉及数据开放的费用问题。政府机构收集、制作、复制、发布数据要付出成本,可以收取一定费用,对其进行适当补偿,但对这种费用的额度应当进行限制,仅限于边际成本。二则政府与企业共同开发数据,也需要依据开发利用价值贡献度,合理分配开发利益。如《福建省政务数据管理办法》规定,在共同开发数据情况下,政府可以获得收益,所得收益作为国有资产经营收益,缴入同级财政金库。
数据安全保护制度是政府数据开放的有力支撑,需要明确对数据汇聚、开放平台和流程的安全标准,细化数据全生命周期的安全保障措施。如对数据汇聚平台的安全等级和建设运维机构进行规定,在保障数据安全前提下采用沙箱技术、堡垒机、审核流程等方式进行开放,实现数据所有权和使用权分离,让数据“可用不可见”。[22]此外,还应加强个人信息保护制度的建设。大数据技术的迅猛发展改变了政府数据获取、处理、共享、开放的渠道和方式。为避免数据不当开放和泄露带来的隐私、歧视等问题,保护个人信息的紧迫性日益上升。在政府数据开放中,需要通过数据隐私网络服务协议、再识别规制条款等技术对政府数据进行脱敏处理,并赋予公民由多个权利组成的“权利束”,对个人信息进行保护。“权利束”包括个人的隐私权以及与之相关的知情权、同意权、控制权、拒绝自动画像权、删除权、由于违法或不当数据开放行为蒙受损害时的异议救济权利等。