黄贤达,高绍林
(北京大学 法学院,北京 100080)
针对公共数据开放的意义与重要性,当前学界已然探讨许多,但就立法层面如何展开制度建构却无法达成统一意见。纵观当前国内相关研究,大多着眼于某一在先的理论设想或制度逻辑,在国家统一立法的框架下论述公共数据开放制度的建构路径。展开而言,公法学者普遍关注政府信息公开与公共数据开放的联系与区别,试图通过界定二者的制度边界,进而描绘出适合后者的制度框架。如有观点根据社会公共知情权与信息自由流通理论,将公共数据开放限定为一种政府主动公开信息的特殊表现形式[1];亦有观点虽将公共数据开放与政府信息公开的基本关系定位为“继承但不取代”,但强调二者在制度基础、立法进路以及政府与公众关系上均存在差异[2]。私法领域则往往聚焦于公共数据的权属性质,并以此为基点重新论证开放公共数据的制度正当性以及相应的权益分配机制。如有观点试图通过卡-梅框架重新审视财产规则与责任规则两种模式对公共数据池制度建构的利弊[3],参考数据信托理论重构数据主体权利保护机制[4],进而将有别于传统国有自然资源开发利用的公共信托法律关系运用于公共数据开放领域,并以此构筑公共数据使用权[5]。
吊诡的是,尽管上述观点均阐述了某种制度建构路径的可能性,可2019年修订的《政府信息公开条例》以及2021年公布的《数据安全法》与《个人信息保护法》均未触及有关公共数据开放的实质性内容,只是对已达成共识的制度实践进行了确认。相比中央立法的“相对冷清”,各地方公共数据开放立法的试点实践却正如火如荼地进行,为公共数据开放奠定了规则基础。可对于地方公共数据开放的丰富立法实践究竟是以何种逻辑展开的、其与当前主流理论如何结合,学界却鲜有系统全面的梳理与研究。换言之,当前理论界与实务界就公共数据开放的建构立场并不完全一致,国内公共数据开放的制度实践并没有依照之前学界的设计路径展开,学用脱节。
本文无意探讨诸如区分信息与数据等只具有相对意义的概念纷争,亦不试图在规范意义上重新建构一套公共数据开放的理论逻辑,而是希望通过对既有的开放路径进行还原,厘清其在中国语境下究竟是以何种逻辑展开的,在此基础上探讨我国公共数据开放制度建构在理论与现实之间的联系与沟壑,并希冀勾勒出规范化的制度建构路径。
与域外不同,中国的政府信息公开和公共数据开放自始就非简单的延伸和递进关系,而更像是并驾齐驱的两个进程。在我国特有的“央地”二元制度构造模式下,藉由开放政府的政治意涵与数据产业的经济动力这两种迥然相异却又可并轨转换的驱动逻辑,使得我国公共数据开放的制度构造呈现出顶层设计“政策先行”与“立法滞后”并存、基层试点实践“全能化”且“多元化”的制度建构特征。
公共数据开放,是伴随着政府信息公开而出现的新现象。政府信息公开兴起于20世纪60年代的信息自由化立法浪潮[6](p37),其制度目的在于保障社会公众对政府行为和公共事务的知情权,通过确保公共信息得以无障碍流通和使用,给予社会主体以稳定的预期和监督能力[7](p10),体现了以公民知情权制约政府公权力的制度理性。公共数据开放则依托于既有的政府信息公开制度,是其自然延伸与递进发展。在通过开放公共数据寻求其社会化利用的过程中,亦极大地推进了政府信息公开的广度与深度。
但政府信息公开与公共数据开放也并非简单的升级替代关系,而是发展出了新的独立于政府信息公开的制度内涵,形成了自身的演进逻辑。一方面,开放公共数据能促进政府的高效、透明、廉洁和创新,已经逐渐成为国际共识[8](p25-30)。另一方面,作为天然具有公共属性的抽象物,数据已逐渐取代土地和能源成为人类社会数字化转型的第一生产要素,被视为信息时代最重要的经济资源。然而,数据只有经过流通、整合、分析才能发挥其使用价值[9]的社会化属性,与数据控制者基于利益考量不愿开放自身占有的数据从而形成的孤岛效应之间的矛盾[10],让公共数据愈发受到重视。政府作为拥有数据最多的数据控制者,在开放公共数据的过程中,不仅能对数字经济的标准体系起到试点与表率作用,亦能降低社会治理成本、节省政府开支,进而释放出巨大的经济效益。
值得注意的是,数据规则的建构逻辑往往与本国语境深度契合。以数据跨境流动为例,欧盟将自己的数据保护模式奉为圭臬,并以其他国家向其看齐作为数据流动的前提条件;美国则从政治经济利益出发,通过推行低水平保护模式实现数据向美国汇聚,在巩固和强化美国公司对全球数据掌控的同时,压缩各国数据规制的自主空间[11]。公共数据领域亦不例外,在域外,从政府信息公开到公共数据开放前后历经了四十余年的制度演进,期间储备了丰富的制度理论与实践经验,最终形成了界定清晰的制度构造目标。相比之下,我国直到2008年前后,才正式制定并实施《政府信息公开条例》(以下简称《公开条例》),并在2019年进行了重大修改。但相较于政府信息公开制度建设的起步较晚,我国公共数据开放的制度起点却并不落后。截至2020年10月,我国已有142个省级、副省级和地级政府上线了公共数据开放平台,涵盖66%的省级行政区(不含港澳台)、73%的副省级和35%的地级行政区,数据开放平台日渐成为地方数字政府建设和公共数据治理的标准配置(1)复旦大学数字与移动治理实验室:《中国地方政府数据开放报告2020(下半年)》,参见:http://www.dmg.fudan.edu.cn/?cat=7&tag=all,最后访问日期,2021年8月18日。。
显然,我国公共数据开放的制度建构并没有完全同西方一样沿着已经成熟的政府信息公开的制度演进依次展开,而是在二者并行建设的本土化移植与再构造过程中,融入了中国特色语境下的制度建构逻辑。但是,就不同制度建构主体而言,中央与地方之间,地方与地方之间,对于公共数据开放的理解往往各不相同,使得这项制度自诞生之日起就呈现出多重制度目的,这具体表现为:
首先,基于政府信息公开的制度惯性,将公共数据开放视为保障公众知情权、参与权、表达权和监督权,促进政务公开的新方式。如《2015年政府信息公开工作要点》提出“积极稳妥推进政府数据公开,鼓励和推动企业、第三方机构、个人等对公共数据进行深入分析和应用”,将公共数据开放纳入政府信息主动公开的范畴。其次,根植于开放政府的政治意涵,将公共数据开放作为加快建设法治政府、创新政府、廉洁政府和服务型政府,实现政府治理能力现代化的新途径。与域外不同,我国新旧《公开条例》均包含了“充分发挥政府信息对人民群众生产、生活和经济社会活动的服务作用”之立法目的。换言之,除了保障知情权与监督权的法定义务外,我国政府信息公开还天然地具有促进生产、生活和经济社会活动的公共服务属性。与之相对应,我国的公共数据开放自始亦包括了提升政府治理能力、推动经济转型发展、重塑国家竞争优势等多重制度目标。如《国务院办公厅关于运用大数据加强对市场主体服务和监管的若干意见》(2015年)就明确将“加大政府信息公开与公共数据开放的力度”作为提高政府服务水平的一种方式。最后,聚焦于数字经济的驱动逻辑,将数据与土地、劳动力、资本、技术等传统要素并列作为市场化配置改革的五大基础生产要素,以公共数据开放为着力点建构数据确权规则和利益分配机制。在我国,仅凭自上而下的信息公开运动并不足以充分说服所有政府部门积极推动数据开放,以地方政府为例,在大数据的时代背景下,各地往往将发展大数据产业视为寻求本地经济变革的一次契机,而恰逢其时的公共数据开放也步入了同样的思考范式[12]。实践中,地方先行的公共数据开放试点实践往往是与经济发展相挂钩的。
简而言之,由知情权和大数据两种逻辑演化而来的开放政府的政治意涵,在中国制度建构中屡见不鲜的顶层设计与基层试点并行的二元模式下展开后,又融入了地方政府特有的经济驱动逻辑。伴随着十八届五中全会将大数据提升到国家战略地位,要求政府起到表率推动作用,“开放政府”与“发展经济”的二元驱动逻辑最终在2015年形成合力。那么,公共数据开放的制度建构在我国究竟是如何具体展开的呢?
中国的横向制度构造往往呈现出“政策先行、法律迭进”[13]的发展进路。新制度凭借中央发布的新政策得以建立和快速发展,进而通过后续一系列配套政策文件对其结构框架和运行规则进行探索和调整,最后以法律的形式予以确认和完善。公共数据开放的制度构造亦步入了同样的建构框架,但就制度现状而言,公共数据开放政策文件的“积极先行”与相应法律法规的“滞后缺位”形成了鲜明对比。
以2015年两会期间(2)“政府掌握的数据要公开,除依法涉密的之外,数据要尽最大可能地公开。”参见《李克强对政府数据表态:尽最大可能公开》,《新京报》2015年3月7日,第A04版。政府第一次公开表态支持公共数据开放为标志,我国公共数据开放的政策推进速度陡然加快,反映出国家和政府对大数据发展和公共数据开放的高度关注。包括我国首份关于大数据发展的国家级、系统性、纲领性的顶层设计政策文件《促进大数据发展行动纲要》在内,一系列政策性文件的陆续出台,标志着国家层面的公共数据开放的政策体系已经初步形成。然而,与公共数据开放的国家政策如火如荼地先行推进相比,国家层面的立法却明显相对滞后。
首先,国家迟迟未制定统一的数据类立法。目前仅有《网络安全法》和《民法典》对个人信息的边界以及个人信息向可流通数据转换的规则作了初步规定。2021年8月颁布的《个人信息保护法》对个人信息的处理规则、个人在信息处理活动中的权利以及处理者义务又作了进一步健全与完善。但如果按照数据的采集生产、整理加工、开放共享、管理使用这四个数字经济基本环节进行分析,目前我国的数据类国家立法还停滞在第一环节。其次,既有的政府信息公开制度并未给公共数据开放预留充分的制度空间。在政府信息公开与公共数据开放并行建设四年后,2019年新修订的《公开条例》并没有新增有关数据开放的任何内容。这也意味着,原本试图凭借《公开条例》的修改契机为公共数据开放实践提供合法性支撑的方案设计,短期内不会再有落实的可能性。而为了落实《促进大数据发展行动纲要》而制定的行政法规《政务信息资源共享管理暂行办法》,本质上只是为了规范部门间政务信息资源的共享与合作,并不涉及数据对社会公众开放的范畴。最后,虽然2021年6月颁布的《数据安全法》专章规定了公共数据的安全与开放等内容,但究其性质而言只是对实践中已达成共识的开放原则进行了确认,并没有深入涉及何谓公共数据开放以及如何开放公共数据等具体的规则建构。
在中央政府明确的政策导向下,地方政府也着手探索构建包括公共数据开放在内的大数据发展地方制度架构。但作为“央地”二元制度构造模式中承担具体实践任务的一方,地方政府往往会面临中央政策“激励号召”、国家立法“滞后缺位”、地方试点实践又迫切需要明确法律规则的现实困境。此时,在中央某种程度的“默许”下,地方政府往往主动地承担起数据立法工作,且往往涉及数据规则的各个方面,而非仅仅局限于数据产业一隅。但由于对“开放政府”与“发展经济”的二元驱动逻辑理解各有不同,各地在数据地方立法全能化的实践过程中往往呈现出多元化的地方立法设计。
一方面,与中央层面的数据立法暂时“失语”相比,地方层面的数据立法则显得如火如荼。就本文统计的71份涉及公共数据开放的地方立法中,绝大多数地方立法都涉及了数据开放的主客体、数据的采集与整合、数据的共享与开放、数据的开发与应用、大数据平台建设等诸多方面,部分地方甚至对数据的权属与法律性质进行了详细规定(3)如2020年7月发布的《深圳经济特区数据条例(征求意见稿)》率先创设了“数据权”的概念,并将其定义为兼具财产权、人格权和国家主权属性的新型权利,虽然在2021年6月该条例的最终稿中已用“数据权益”的新表述取代相关概念。。由此可知,当前我国地方数据类立法总体涵盖了数据规则的各个方面,具有明显的全面化乃至全能化的立法倾向。另一方面,在国家层面迟迟未有统一的公共数据开放立法一锤定音的情况下,地方层面的全能化立法倾向又推动了多元化的立法趋势。但由于制度设计的逻辑起点不完全一致,各地对公共数据开放规则往往存在不同规定,从而引发了多元化立法带来的制度张力。
一个切入视角是公共数据的概念界定。作为中央政策中公共数据开放的纲领性文件,《促进大数据发展行动纲要》对于涉及开放的政府类数据同时存在“公共数据”“政务数据”和“政府数据”(4)在《促进大数据发展行动纲要》全文中,“政府数据”共出现24次,“公共数据”共出现6次,“政务数据”共出现6次。三种不同的概念表述方式。而国家层面直到2021年才在《数据安全法》中以“政务数据”的概念统称政府类数据,这就引发了各地在之前数据立法过程中的概念表述混乱,进而导致了各地对政府类数据外延的不一致规定。总体来说,与开放相关的政府类数据主要涉及以下三个层次的涵义:首先,行政机关在履行有明确授权的公共职能过程中产生、收集和使用的数据;其次,具有公共管理服务职能的组织在履行有明确授权的公共职能过程中产生、收集和使用的日常数据;最后,本身不具有行政职能或公共管理服务职能的特定第三方主体,在行政机关授权委托下,行使公共职责过程中收集的数据。除了以上三个层次的涵义外,亦有观点认为,在具有公共属性的领域或空间中,并非通过政府授权产生但涉及公共利益的数据(5)胡凌.论地方立法中公共数据开放的法律性质[J].地方立法研究,2019(03):1-18.也应当属于政府类数据的范畴。就本文而言,采用字面涵义最广的“公共数据”对这些政府类数据进行统一表述,其概念范围主要包括前三个层次的涵义。
值得注意的是,由于各地对公共数据概念外延的不一致规定,进而导致了开放义务主体的不一致。具体来说,行政机关是公共数据开放的当然义务主体,但使用了财政性资金的公共事业单位也掌握了大量数据,其开放程度亦影响着公共数据开放的广度和深度,许多地方为此进一步扩张了有开放数据义务的主体的范围(6)如无锡市和南京市规定了行政机关和其他具有公共管理职能的组织均具有数据开放义务;天津市则将数据开放的义务主体限定为政府部门和行政执法机构,公共服务企业和公共事业单位则只是被“鼓励”向数据平台共享和开放数据;海南省也只是“鼓励”大数据生产经营单位、社会服务机构和公共服务机构共享、开放数据,但并没有强调这些组织如同政务部门一样具有公共数据开放义务;中山市规定公共服务企业的数据开放“参照”政府部门执行,贵阳市在此情况下却只规定“可以参照”执行。。换言之,开放义务主体不应局限于狭义上的行政机关,也包括其他使用了财政性资金的公共机构(7)肖卫兵.论政府数据开放环节立法[J].财经法学,2019(06):3-12.。《开放数据宪章》甚至倡议,除了国家和政府机构,还要把国际组织视为“政府”一样的地位,使之承担开放数据的义务。
有学者将我国公共数据开放的现状概括为“实践先行,立法滞后,文件治理,政策推动”[14]。但纳入到我国“央地”二元制度构造模式下审视,藉由开放政府的政治意涵与数据产业的经济动力这两种迥然相异却又可并轨转换的驱动逻辑,又可以将我国公共数据开放的制度构造特征进一步细化为顶层设计“政策先行”与“立法滞后”并存,基层试点实践“全能化”且“多元化”。
由前文可知,基于中国特有的制度构造语境,地方在公共数据开放的规则建构过程中承担着探索实践的任务。但因为公共数据开放的不同驱动逻辑,导致各地在全能化立法的过程中,呈现出不同进路的开放路径,进而产生了多元化立法及其制度张力。
1.作为法定义务的公共数据开放
沿着政府信息公开的制度惯性,公共数据开放的首要目标即是保障公众的知情权和监督政府的能力。从公开政府信息向开放公共数据过渡的历程中,经历了从静态的文件信息向动态的实时数据的转变,以及从以被动(依申请)公开为主向主动开放的递进。但公开与开放的关系究竟如何界定,二者的制度边界究竟如何划分,学界尚未有清晰统一的共识。而在立法实践中,政府往往出于路径依赖或者审慎考量,将公共数据开放恪守为政府主动公开信息的一种特殊方式,而非独立于主动公开之外的新形式。如许多地方在立法实践中规定,公共数据开放要遵守《公开条例》的相关规定(8)山东省、浙江省、合肥市、佛山市、中山市、贵港市、南京市、济南市、台州市、湖州市的公共数据开放立法中均有此类规定。;部分地方甚至强调,公共数据开放就是政府信息公开的一种方式(9)山东省、济南市、中山市的公共数据开放立法中均有此类规定。;一些地方还延续了防止滥用政府信息公开申请权的思路,规定如申请开放公共数据的数量、频次明显超过合理范围且理由不合理的,告知申请人不予处理(10)《贵州省政府数据共享开放条例》第26条。。
根据信息流通理论,信息在政府与公众之间以主动公开、被动公开(依申请公开)、内部公开(共享)和外部公开等途径流通,而作为主动公开在大数据时代升级版的动态开放,一方面促进了不同主体间更大程度的信息流通,另一方面也降低了因频繁申请公开而产生的社会成本。在从依申请公开向主动公开再到开放的递进过程中,信息被转化为数据,以机器可读、电子形式、免费和无需授权许可为特征的方式流通,使政府的透明程度依次递增,体现了一种典型的工具主义制度立场。在此语境下,政府信息公开与公共数据开放具有相同的制度目的,都属于行政机关对社会公众负责的单向法定义务,以保障公民的知情权和对政府的监督权。
2.作为公共服务的公共数据开放
值得注意的是,除了知情权理论之外,开放政府理念又赋予了公共数据开放以公共服务属性作为新的制度正当性。在国外,从传统的政府信息公开迈向公共数据开放的最大差别在于前者以知情权为逻辑起点建构制度,后者却不以个人权利保障为其制度设计的唯一核心基础。基于信息技术发展而兴起的公共数据开放没有完全沿着从保障公民知情权的进路展开制度建构,而是从权利保障机制这一传统行政法治建构轨道逐渐转向寻求更优数字治理效果的另一种功能主义建构思路(11)王万华.论政府数据开放与政府信息公开的关系[J].财经法学,2020(01):13-24.。从社会现实出发,仅仅以“知情权”这一从形而上的抽象概念出发去一味地限制和削弱行政权,并不能真正发挥其保护公民自由与权利的目的价值,行政机关在执行过程中还需要从满足功能需求的角度积极追求公共利益与行政效率[15]。而与数字化相结合的开放不仅更有效率地拓宽了政府信息公开的广度与深度、增强了政府的治理能力,亦在公共数据商用化的过程中间接实现和创造了社会经济价值。据此,公共数据开放是行政机关功能主义需求在大数据时代语境下发展的必然结果,也是伴随着新政府运动全球趋势下一种面向社会的公共服务,而非只强调对政府信息公开和个人知情权保护的法定义务(12)有观点就认为,“政府数据开放强调赋予社会利用政府数据的权利,更侧重于其经济与社会价值,开放数据本质上是政府提供的一项公共服务”。参见:郑磊.开放不等于公开、共享和交易:政府数据开放与相近概念的界定与辨析[J].南京社会科学,2018(09):83-91.。
为此,一个具体的切入视角是公共数据开放的无偿服务属性。就域外经验而言,是允许政府在公开政府信息时收取适当费用以弥补边际成本的。虽然《美国版权法》第105条规定了联邦政府的任何作品,都不适用版权保护,因此政府发布的数据信息无法以版权作为法理依据进行收费,但《联邦政府信息资源管理政策》(OMB Circular A-130)允许联邦政府在公开信息时可以收取不超过传播信息环节所产生的成本费用,只是不涵盖数据收集和数据处理等其他环节。与之相比,作为公共服务的公共数据开放则更多强调其免费和无条件开放属性。如《G8开放数据宪章》和美国《开放政府数据法案》均将“对公众免费”和“对复制、出版、分发、传播、引用或改编没有限制”作为开放的实质内容。
反观国内,尽管在2008年版《公开条例》中,行政机关仅能就依申请的信息公开收取包括检索、复制、邮寄在内的成本费用,但2019年版《公开条例》则规定,依申请的信息公开不得收取任何费用,只是若当事人存在恶意申请行为可以收取信息处理费。鉴于我国新旧《公开条例》均在立法目的中明确了其公共服务属性,因此作为政府信息公开递进延伸的公共数据开放,其作为公共服务的费用无偿原则亦在一些地方得到了传承。如天津市(13)《天津市促进大数据发展应用条例》第20条。和贵州省(14)《贵州省大数据发展应用促进条例》第24条。就在规定公共数据开放公共服务性质的同时,进一步强调了开放过程中的“无偿服务原则”。从这些广义的制度实践中可以看到,部分地方公共数据开放的立法进路带有很强的功能主义色彩,目的在于促进公共数据使用价值的最大程度发挥。通过将公共数据开放给市场和社会,从而提高政府治理能力,推动经济转型升级,促进科学技术进步。然而,在政府信息公开到公共数据开放的转换过程中,伴随着法定义务向公共服务的演变趋势,政府的职责从以依申请公开为主转向以主动开放为主,不仅要保证被开放数据的实时动态更新,还要承担数据开放之后可能带来的诸如马赛克效应等政治、法律和社会风险。这些困难本可以在开放政府的政治意涵驱动下通过自上而下顶层立法的推广方式予以克服,但是在我国地方先行先试自下而上的立法实践过程中,伴随着无偿的公共服务与增加的责任风险,却使得各地缺乏内在动力和激励主动推进公共数据开放。
总而言之,当前我国公共数据开放建构缺乏稳定的理论基础与实践动力。在先的政府信息公开无法证明公共数据开放的制度正当性,而地方又无法依靠在顶层设计上定位不够清晰的国家政策性文件进行立法,使得各地在试点实践过程中往往出于自身考量去设计规则,而地方设计逻辑起点的不一致又进一步导致了各地因立法全能化与多元化立法而产生的制度张力。
1.国有财产视角下的公共数据开放
在公共数据开放建构无法完全依赖开放政府理论和公共知情权的前提下,部分地方政府转而试图以功利主义的立场重构这一开放过程,即为了最大多数人的最大幸福,从社会福利最大化的角度出发对公共数据进行充分利用,通过将数据资源视为有价值的国有资产,由政府进行统一规划管理、有序开放利用,公共数据资源向社会开放可以直接增加社会的整体福利。与保障公民知情权、提升政府治理能力、间接促进社会进步的功能主义路径相比,功利主义采用“公共利益”的概念将“社会福利”予以具体量化,通过直接引入数字化的客观标准来衡量“公共利益”,而由于衡量标准更加具体化,“增加公共利益”也相比“保障公共知情权、增强政府治理能力”更加易于实践操作,从而更受青睐[16]。在此语境下,开放本质上是对公共数据这一有限资源的有效配置,目的是为了实现其社会价值的最大化利用,而在对公共数据资产进行统一规划管理中所获得的直接经济利益,也是地方政府所乐见的。
在以功利主义的立法路径展开公共数据开放的制度建构过程中,一个明显的制度切入点是开放方式中的依申请开放(或称有条件开放、受限开放、授权开放)。在政府信息公开制度中,依申请公开与主动公开并列,是政府信息公开的主要方式。虽然2008年版《公开条例》设置了“根据自身生产、生活、科研等特殊需要”的限制,但2019年修订时删去了“特殊需要”这一前置条件。换言之,依申请公开的主体不再有范围限制,而是扩张为不特定的公民、法人和其他组织。申请公开者收到政府公开的信息后,便有自由使用与进一步向社会公开的权力,这与主动公开一致。此时依申请公开与主动公开在概念上近似于美国信息公开制度中的Disclosure和Distribution,前者是政府和某一社会主体之间的点对点关系,后者是政府和社会之间的点对面关系,两者在信息公开的法律后果上是等价的。然而,相比静态的政府信息,动态的公共数据突出了风险性、时效性和技术需求高等敏感特征,也被赋予了更高的价值属性。因此,地方政府在公共数据开放的实践过程中,往往出于实用主义立场对某些类型的公共数据开放予以限制,将符合特定条件的公共数据归为有条件开放,具体来说:
首先,对数据开放机构技术负担较重的公共数据,其开放程度往往受到一定限制。如,虽然山东省明确了对于政务数据开放按照政府信息公开的相关规定予以办理,但对于医疗大数据的开放则被赋予了新的限制:“对数据安全和处理能力要求较高、时效性较强或者需要持续获得的健康医疗数据,列为有条件开放数据。”(15)《山东省健康医疗大数据管理办法》第10条第2项。其次,针对开放风险高、经济价值高的公共数据,其开放程度也受到一定限制。如,浙江省规定了受限开放的公共数据及其判断标准。除“开放将严重挤占公共数据基础设施资源,影响公共数据处理运行效率”这种负担较重的公共数据之外,对“涉及商业秘密、个人信息的”;“开放后预计带来特别显著的经济社会效益,但现阶段安全风险难以评估的”(16)《浙江省公共数据开放与安全管理暂行办法》第15条。的公共数据也要限制开放,客观上认可了这类公共数据的特殊性。在依申请的政府信息公开中,申请主体的范围和被公开信息的使用方式均不受限制。但在依申请的公共数据开放中,政府往往规定了申请主体的授权条件(17)《南京市政务数据管理暂行办法》第24条和27条。,通过签订协议明确数据定向开放的使用范围、保密责任和安全措施等内容(18)《山东省健康医疗大数据管理办法》第11条第2项。,并以数据下载、接口访问、数据沙箱等技术手段保证限制,客观上限制了公共数据的开放范围。
由此,伴随着开放过程中部分公共数据高风险、高负担和高价值的现实特性,变相赋予了政府对其开放进行一定限制的正当性。在实践中,地方政府往往出于制度惯性与路径依赖,将该类公共数据的开放与具有相似特性的国有自然资源开发联系起来,在经济利益的动力驱使下,按照传统自然资源授权使用的模式对依申请开放的公共数据进行排他性授权利用。通过利润最大化模式,政府凭借自己垄断的公共数据优势,向数据需求方收取市场化的价格,地方公共数据开放的功利主义路径得以显现。而公共数据开放功利主义路径的一个具体表现形式,则是将公共数据资源视为国有财产,并据此明确公共数据的财产法律属性。如福建省不仅明确公共数据资源属于国家所有,纳入国有资产管理框架,还要求数据管理机构应当根据数据开发利用价值贡献度分配开发收入,授权收入则作为国有资产经营收益(19)《福建省政务数据管理办法》第3条。。山西省也明确政务数据属于国家资产(20)《山西省政务数据资产管理试行办法》第7条、第11条和第13条。;政务信息管理部门代表政府行使政务数据资产所有权人职责,并建立政务数据资产交易评估机制促进政务数据资产交易。
将公共数据资源按照成熟的国有资产进行管理开发,既保留了地方政府实现公共数据价值的主导作用,又激发了地方政府推进标准化采集、整合公共数据的动力,确实能从某种程度上防止数据资源的滥用或闲置。但在实践过程中,沿用传统自然资源排他授权模式,往往使开放公共数据被转化为公共资源使用权拍卖问题,使得该项服务逐渐失去了公共属性,而完全偏向营利性,这与在功能主义语境下的社会服务属性背道而驰。换言之,国有自然资源排他性授权模式不利于公共数据的进一步开放和社会化利用,反而产生了将无条件公开的数据转为有条件开放的逆向动力。另一方面,由于数据的特殊属性,数据无法成为某个主体完全支配的“物”,无法设立一般意义上的所有权。数据的独占、独享意味着无法实现数据的社会化利用,且数据一旦流动便很难保持独占,故无法通过特定、独立的财产规则来界分数据权利的边界。山西省试图通过建立数据资产登记制度(21)《山西省政务数据资产管理试行办法》第7条第2款。亦有业界研究者对这一制度进行了讨论。参见余志兰,彭歆北.建立政府数据资产登记制度 促进政府数据资源交易流通[J].通信企业管理,2017(05):66-69.来解决政府数据资源转变为国有资产时附带的数据流通悖论,但登记制度是否可行尚待实践验证。可关键在于,在地方有限的立法权限下,对公共数据进行国有财产的定性,显然是对地方立法权的突破。
2.新的进路:数据信托语境中的公共数据开放
既然在先的政府信息公开无法为公共数据开放提供充分的驱动激励,而传统的国有自然资源排他授权开发途径又无法与数据的流通属性相兼容,如何调和两种模式在实践中各自的优势与不足,进而发展出与公共数据社会化利用完全匹配的指导理论,并以此为基础构建规范化的公共数据依申请开放路径,是中国语境下公共数据开放必须回应的现实问题。在传统路径无法提供有力制度支撑的情况下,部分学者试图通过分析数据的自身特性,为公共数据开放寻找新的理论基础。
首先必须承认,单条信息即使有价值也极为有限,采集、整合后的数据只有通过数据平台集合形成数据池(datapool)后,才能进一步流通以实现其社会价值。由此,对数据集合的确权和其他相关权益的平衡,成了数据立法中的核心问题。实践中,数据生产者通过约定格式合同的方式,合法地获得了数据主体的数据使用权以提供数据分析的服务。学界与法院也在一系列判例中均认可,数据控制者在收集、整合、汇总、分析数据的过程中投入了大量劳动与资源,因此有权获得基于数据而产生的财产性权益。但是,基于洛克的劳动财产理论虽然赋予数据生产者排他的财产性权益,保护了数据平台的利益,促进了数据的社会化生产,却排斥了其他主体对数据的进一步开发利用,形成的数据孤岛效应在事实上限制了数据的社会化流通。
为了摆脱传统制度惯性对公共数据开放的桎梏,部分学者试图在卡-梅框架(Calabresi-Melamed Framework)[17]的视域下重新审视个人信息与流通数据的边界及其转换规则。一般而言,法益在主体间的转移须以法益所有者同意为前提,这种财产规则(Property Rules)是建立在主体双方地位平等且自愿交易的基础上[18],但这种数据赋权模式仅适用于主体双方地位基本平等且行使没有阻碍的情形,可实际上,数据在流通过程中往往面临主体地位不平等、交易成本过高等障碍,数据权利边界和效力的不确定性凸显了财产规则的局限性。例如,数据平台的用户在享用数据服务的同时,自身往往也是提供数据资源的劳动者,可用户与平台之间的不平等地位使得用户的权益在财产规则架构下无法得到充分保护;又如,受制于合同的相对性与决策信息不足的双重掣肘,用户无法对自身数据的每个流通环节均作出有效的知情同意处分,亦限制了用户对后续第三方数据利用行为主张权利;再如,在公共数据从政府向市场流通的过程中,政府垄断的优势地位与排他的数据授权使用方式,往往容留了非市场化的寻租空间,导致数据流通成本大幅增加。显然,简单套用传统自然资源开发的立法进路无法平衡数据采集与数据利用之间的张力,财产规则的立法设计亦无法在促进数据社会化利用的同时保障数据主体的合法权益。于是,如果主体间无法达成交易合意或者谈判成本极高,此时为了公共利益,法益的转移可以不再以同意为要件,而是在转移的既定法律事实发生后,由法益获得者向法益原所有者进行补偿,这种以法益的强制转移和客观补偿为构成要素的规则模式即是责任规则(Liability Rules)[19]。民法领域中的紧急避险、无因管理以及专利强制许可等制度均属于这种规则模式,《个人信息保护法》第13条将“应对突发公共卫生事件或紧急情况”与“为公共利益实施新闻报道、舆论监督等行为”两种情况作为个人信息处理同意原则的例外亦沿用了这一思路。
在将责任规则模式应用于数据主体保护领域后,以信托机制平衡数据控制者(采集者)与数据主体之间权利义务不均衡配置的数据信托理论应运而生。一方面,数据主体应当允许数据控制者(采集者)使用其个人数据,且使用不以“知情-同意”原则为必要条件;另一方,数据控制者(采集者)应当给予数据主体必要的补偿,并课以更为严苛的信义义务以保障数据主体的利益[20]。数据主体“赋权-维权”式的高成本低效率的权利保护进路得以避免,取而代之的是以数据控制者(采集者)义务规范为核心的数据信托进路。
在此基础上,由信托机制继受而来的公共信托理论亦可涵射于公共数据开放领域,将蕴涵着公共利益的公共数据纳入公共信托财产的范畴以厘清开放过程中的多重法律关系。全体公民作为公共数据的“真正所有人”即信托人享有使用和获得信托财产增值利益的权利,政府仅为公共数据的“形式所有人”即受托人,为了公共利益而负有控制、管理和保护作为公共信托资源的公共数据的职责和义务[21]。此时,基于公共利益,政府在责任规则模式下不必取得个人同意即可获得公众所有的公共数据,而公众作为信托财产的共有人亦有权凭借责任规则自由使用公共数据。政府不得像处置自然资源等一般国有资产那样设立排他性授权许可,但可以在不妨碍公共数据传播、再利用的情况下收取合理的非盈利成本费用。基于信托关系,公共数据管理机构被授予高权限的处分权力,可以将收集整合的公共数据统一存储在数据平台以进行开放,但开放不能以营利为目的,且要承担严苛程度远高于一般合同机制的义务与责任以保护公民的权利,如数据脱敏、脱密,举证责任倒置,对流通数据的利用进行可溯源式的追踪等。
不同于传统物权对于一般物的使用权排他性桎梏,这种由公共信托引申而来的非专有利用方式能够完美适配数据可供多个主体同时使用的特性,最大程度地发挥公共数据的社会化属性。而囊括了劳动价值在内的成本收费亦可一定程度上弥补政府在开放公共数据过程中对激励的需求。类似的公共数据开放路径在域外已有先例,2019年重新修订的《欧盟开放数据和公共部门信息再利用指令》(EU Directive 2019/1024 on open data and the re-use of public sector information,以下简称PSI)(22)参见:https://eur-lex.europa.eu/legal-content/EN/TXT/?uri=CELEX%3A32019L1024&qid=1628770717445 最后访问日期2021年8月18日。虽规定公共数据的开放与重复利用在原则上应当免费,但允许在数据复制、传播、提供以及个人数据匿名化和保护商业秘密的过程中收取相应费用以弥补边际成本。除此之外,PSI还容许公共事业单位、图书馆以及部分公共部门额外收取占总费用一定比例的“合理投资回报(Reasonable return on investment)”。但对于这些公共数据的开放应当是可重复利用的(Re-use),并向所有潜在市场主体平等与非歧视地(Non-discrimination)开放,即便有市场主体已经基于特定公共数据开发出了增值产品亦不得给予其排他性授权。倘若因为重大公共利益需要给予排他性授权的,也需要给出正当理由并经过严格审查,且整个授权流程应当透明公开。
大数据的规则建构从其诞生伊始,就打破了通过法律法规和行政手段进行规范和控制的传统单一化范式。包括法律法规、社会规范、市场规则和技术架构等都在事实上承担了规制的功能[22](p123),这一点数字经济领域亦不例外。
从目前国内大数据产业的发展状况来看,无论是数据市场规则的制定还是数据技术架构建成抑或是数据社会规范的形成,均处于刚刚起步的阶段,无法为当前的数据经济发展提供充分的规则支撑。例如,由于数据集中存储的技术特征,数据往往以数据池的形式被极少数的数据控制者所垄断,从而形成了数据的孤岛效应,这使得仅凭自由竞争的市场机制无法及时将数据的使用价值进行社会化利用;而数据的价值又诱使数据控制者只聚焦于数据产生的经济效益,从而忽视数据道德、数据伦理等相应的数据社会规范的建构,甚至危及国家安全、侵犯公民隐私,带来数据的“负外部效应”;但如若贸然动用传统的法律法规予以应对,又会对已有的数据行业造成不可测知的风险,丧失数据的“正外部效应”优势。因此,当大数据这一新兴产业进入中国后,不可避免地由政府这一天然拥有最多数据资源的数据控制者主导数据规则的建构进程,而政府对其控制的公共数据进行开发利用的驱动逻辑,也自然成了我国数据规则建构的逻辑基础。然而,我们又必须看到的是,本应是递进发展关系的政府信息公开与公共数据开放制度,在中国语境下却成了并驾齐驱共同发展的关系,伴随着特有的“中央顶层设计”、“地方试点实践”的二元制度建构模式,使得我国公共数据在开放过程中呈现出中央政策积极先行、国家立法滞后缺位、地方立法全能化与多元化的规则建构特征,最终导致立法实践中因为功能主义与功利主义的双重路径而产生的多元化立法及其制度张力。
必须指出的是,功能主义与功利主义本属不同层次的立法观,二者各自分立却不对立。在立法实践中,政府往往出于实用主义立场而将两种观念并列为公共数据开放立法的驱动逻辑,从而导致我国公共数据开放制度自诞生伊始就明显地具有双重属性。如许多地方既在定义条款中明确了开放的公共服务属性(23)《浙江省公共数据开放与安全管理暂行办法》第2条第3款。,又将经济效益显著的公共数据列入受限开放类(24)《浙江省公共数据开放与安全管理暂行办法》第15条。,而在中央政策文件中公共数据开放也总是同时与推动经济发展、完善社会治理、提升政府服务和监管能力等多重制度目的相挂钩。但由于国家层面的政策性指令无法提供清晰稳定的理论和制度基础,在统一的国家数据法律出台之前,各地公共数据开放的地方性实践却有可能因为基于自身的制度立场与现实基础而产生目的与结果的偏差,甚至将两种立法路径延伸至背反的极端境地。以上文提及的收费模式为例,如果沿着政府信息公开的制度惯性和公共服务的费用无偿趋势对公共数据开放予以彻底免费,势必影响政府开放公共数据的动力与质量;如果回归自然资源排他性授权开发的传统路径,又无法契合公共数据的开放使命,亦无法说明公共数据池区别于私人数据池的正当性何在,反而容易将公共数据的国有财产化导向地方利益化。如果采取折中模式,即以低偿或成本价格收取开放费用,或将费用标准依照个人使用与商用、价值高低进行区分,又容易在市场垄断的背景下容留寻租空间,因此迫切需要一种全新理论对公共数据平台的逐利冲动进行成本化规制。
而将公共信托理论引入公共数据开放领域,确实能在学理上充分融合上述两种立法路径的正当性,不仅能为未来混合了财产规则与责任规则的公共数据开放法律模式容留理论支撑的空间,亦能平衡数据主体与数据控制者(处理者)因数据池的现实特性而呈现出的二元权利结构张力,以实现数据财产权益分配的均衡。至此,功能主义与功利主义两种立法路径藉由公共信托法律关系而在公共数据开放领域中具有了耦合性。但值得注意的是,信托制度在我国主要运用于公司法领域,在数据法领域仅仅停留在理论研究层面而尚未落实为具体可操作的制度设计,且现有的学术观点也只是试图以信托机制来解释不同角度的现实问题,而尚未形成统一共识的数据信托理论框架。换言之,在选取公共信托理论作为指导理论之后,针对公共数据开放制度建构的进一步落脚点应当在于,如何对这一开放的制度建构过程进行规范,从而防止产生不必要的改革风险。
在短时间内统一的公共数据开放进路无法达成共识的情况下,以地方试点实践的方式对不同路径进行探索、比较与竞争,最后由中央以统一立法的形式对最优方案进行确认与规范,这在我国特有的央地二元制度构造模式下是公共数据开放制度建构的必经之路。在此过程中,不仅能观察何种模式可以推动公共数据的有效流通和充分利用,也能为接下来的国家层面立法提前掌握公共利益与私人利益之间的平衡点,从而为进一步完善数据权益分配机制打好基础。
但正如上文所分析的,政府主导公共数据规则建构并不意味着立法就是规制公共数据开放的唯一途径。数字经济如同其所属的互联网领域一样,存在多种形态的规则,法律规则只是其中的一种。尤其在应对新兴互联网经济业态方面,法律由于其天然的保守性而显得缓不济急,而数据经济所塑造的全新社会经济关系,必然要求传统法律部门之间内部融通,从而重塑一种适应新兴经济社会形态的规则体系[23]。但我们显然无法期待如此复杂的法律发展过程,能够及时满足数据规则建构的迫切需要。所以,尽管相对于数字经济的发展,法律规则的迭进速度天然地存在一定的滞后性,却并不妨碍其他形态规则的补位。在数据市场规则、数据技术架构以及数据社会规范等因素的规制力度尚待加强的情况下,政府应当发挥其价值导向性的优势,通过政策激励和环境优化等方式孕育法律以外的数据规则的成熟。
值得注意的是,在当前数据规则不同意见尚待中央一锤定音的情况下,许多地方全能化的制度设计倾向却将上述数据规则建构导向了反向极端,即试图以预设立场的方式由地方政府主观能动地自行设计一整套公共数据开放制度。在这种规则建构逻辑下,直接以“公共服务”或者“国有资产”的方式定性公共数据开放的法律属性,并在此预设的制度立场中自行设计公共数据的开放方式,似乎违背了“中央顶层设计、地方试点实践”的初衷,甚至带有包揽了“设计”与“实践”的越俎代庖之嫌。这种倾向不仅有可能突破现行宪法、法律确立的权属秩序,也可能阻碍数据规则经由技术、市场、社会途径而产生自生自发秩序的可能性。
基于以上论述,笔者认为未来我国公共数据开放的制度设计仍应基于“中央顶层设计”与“地方试点实践”并行的二元制度构造模式下进行。但当务之急是尽快厘清中央与地方就公共数据开放的立法职责,在总结当前多元化立法经验的基础上,规范立法秩序,防止无序立法,使得中央与地方各司其职,有所侧重,充分发挥各自的制度设计优势。一方面,地方政府应该在立法观念上调整全面、全能立法的思维惯性,将有限的立法资源投入到优化数据经济发展环境上来,进而采取一种“助推型(25)刘晗.分享经济平台的社会公平问题与规制重构[J].行政法学研究,2020(01):55-65.”的治理理念。换言之,地方立法在促进数据经济发展的过程中,基于公共数据开放对数据市场与数据社会生态进行培育与引导,有助于数据规则与秩序的自生自发。同时,通过立法规范数据平台的建设,监督数据各个流通环节的安全状况,可以为数据经济设置一道“安全阀”,有效控制数据控制者因“理性缺失”从而带来数据的负外部效应。而且,由于立法没有直接介入数字经济市场内部,数据的正外部效应能够得到最小程度的干涉,避免新兴经济“一管就死、一放就乱”的困境。另一方面,在中央层面,应当在一种开放且规范的制度建构框架下探索公共数据开放的最优路径。如《数据安全法》第42条专门规定国家通过“制定政务数据开放目录”和构建“统一规范、互联互通、安全可控的政务数据开放平台”,来推动公共数据开放利用。实践中,各地依托开放平台对公共数据的开放目录与申请程序等事项已逐渐达成共识。
就公共数据开放目录而言,绝大部分地方在立法中规定了应当按照国家有关规定编制公共数据开放目录并以清单形式向社会公开,且编制过程中应当征求提供公共数据的机构与社会公众的意见,并根据需要动态更新目录;开放目录应当列明公共数据的开放属性、标准格式、开放方式、使用条件、更新周期以及技术与安全要求等基本信息,被列为不予开放或限制开放的公共数据还要说明依据;部分地方还规定了与民生紧密相关、社会迫切需要、行业增值潜力显著、产业战略意义重大(26)《宁波市公共数据管理办法》第22条。和被公众申请频次高(27)《温州市公共数据共享开放管理暂行办法》第31条。的公共数据应当优先纳入开放目录,以及处于开放目录以外的公共数据可依照规定的程序申请列入开放目录(28)《龙岩市政务数据管理办法(试行)》第19条。。
就申请流程而言,则主要分为数据申请、数据审核、数据开放三个部分。首先,行政相对人在申请开放公共数据时,除了要登记身份信息外,还需要明确公共数据的名称、类型、内容等便于数据提供部门查询的特征性描述,并说明获取数据后的使用范围、应用场景、安全管理等措施。其次,数据开放主体或数据管理部门应当在期限内对上述申请进行审核,审核不通过的,说明理由;审核通过的,应当视情况签订数据使用协议(数据开放利用承诺书),约定数据的开放方式与使用范围,明确不得擅自转让,不得利用公共数据从事违法犯罪活动(29)《贵州省政府数据共享开放条例》第32条。等内容。最后,在获取数据后,行政相对人还要对数据质量进行校核,接受数据主管部门的监管并定期报告数据的利用情况,以保证数据的安全使用。
在这些规范化的制度框架内,公共数据的开放属性与开放方式得以事先明确,从而有效提高开放效率,最大程度地减少行政机关因主观判断而产生的权力寻租的空间。而当前各省着手制定的公共数据分类分级指南亦是公共数据开放规范化的开端。然而,对于如何利用经申请开放的公共数据,各地仍留有较大自主空间。由于并非所有地方公共数据开放都配备了标准化的授权许可协议,缺乏用以规制各利益相关方权利义务分配的可操作法律文本,使得公共数据的使用价值与风险管理之间的冲突难以调和,进而影响了开放的效果。反观域外经验,欧美均通过成熟运作的标准化开放许可机制规范公共数据的开放再利用。就欧盟来说,PSI通过遵循在线可查的标准公共许可证(Standard publiclicence)模式,以数据开放许可(Openlicence)的形式保障公共数据的开放与再利用。通过事先以标准且格式化的形式约定开放后的权利与义务,任何人均可以出于任何目的地自由访问、使用、修改以及传播公共数据。即便在某些情况下,基于公共利益而要设定收费等特定条件,也要基于标准许可证的基础之上,以保证开放的条件是客观、相称和非歧视而不具有排他属性的。就美国来说,虽然其版权法明确了联邦政府的作品不适用版权保护,但对于州政府以及其他地方政府则没有类似的明确规定。因此,为了避免版权制度的模糊性与复杂性妨碍公共数据的开放性,尽管公共数据能以“免许可”的形式不受限制地重复再利用,但依然需要采用明示的方式以表明该数据符合“免许可”原则的标准。为此,实践中则往往采用CC0协议(Creativecommonzero)或者PDDL许可(Open Data Commons Public Domain Dedication and License)的形式明示放弃或开放相关的数据权利,并据此规范相应的权利与义务。
有鉴于此,当务之急应尽快制定一套适应我国国情的普适性政府数据开放许可协议,以规范各地公共数据开放的试点实践,合理配置各利益相关方的权责,实现公共数据价值释放与风险管理的平衡[24],最终推动并规范我国的公共数据开放运动。
在央地二元制度构造模式下,公共数据的开放路径因为多重制度建构逻辑而存在争议。在统一的整体化解决方案尚待达成共识的情况下,应当通过开放且规范的制度建构方式探索公共数据开放的最优路径。为此,应当依托制度化的公共数据平台、开放目录以及开放流程,为接下来的开放路径探索提供规范化的建构框架,尽力确保数据经济带来的“负外部效应”得以缓解或解决,从而保证数据经济的“正外部效应”得以长远平稳发挥。