文/常江(华东政法大学经济法学院,上海200042)
公共数据具有巨大的社会价值和经济价值。特别是随着大数据时代的来临、数字经济的蓬勃发展,数据逐渐成为一种重要的生产要素。政府逐渐意识到,开放这些数据,有利于提高政府自身的治理能力。为此,上海市、贵州省率先开展了公共数据开放的实践。早在2012 年,上海市就建立了全国省级政府第一个公共数据开放平台。截至2021 年10 月,我国已有193 个省级和市级的地方政府上线了数据开放平台。与2020 年下半年相比,新增51 个地方平台。①复旦大学数字与移动治理实验室:《中国地方政府数据开放报告——省域(2021 年度)》,http://www.dmg.fudan.edu.cn/wp-content/uploads/2021ycity.pdf,访问日期:2022 年3 月18 日。与平台建设相对应,各地快速推进立法。2019 年,上海市率先出台了《上海市公共数据开放暂行办法》(上海市人民政府令第21 号),这是国内首部专门规范公共数据开放的省级政府规章。随后,广东①《广东省公共数据管理办法》(广东省人民政府令第290 号)。、江苏②《江苏省公共数据管理办法》(江苏省人民政府令第148 号)。、山东③《山东省公共数据开放办法》(山东省人民政府令第344 号)。等省也陆续出台了有关公共数据开放的地方立法。
公共数据开放所释放的数据价值、经济效益似乎并未达到预想的效果。一是数据集覆盖面不够,数据呈现碎片化趋势。本应作为一个数据集的大类数据,被按照行业、地域拆为多个数据集,大大降低了数据价值,很难被开发。二是数据格式单一,有的并未采用可机读格式。例如,某省级政府公共数据平台资源使用排名第一的数据,是该省会城市的政区图,开放格式为jpg 图片压缩格式。这样的“数据”,实际上仅是扫描的纸质地图,不能被加工成数据产品。三是数据的时效性不够。大部分数据都是静态的一次性数据,即使有一部分动态数据,如交易数据、环境监测数据、市场监管数据等,也更新不及时。四是数据的价值与时效性密切相关。市场主体期待获取高频实时更新的数据,以满足商业模式创新和数字产品开发的需要。各地数据开放平台还普遍存在公共数据和政府信息混杂的情况,将本应属于政府信息公开的内容,如机构职责、领导人信息、统计公报等混杂在公共数据当中,进一步稀释了数据价值。④公共数据与政府信息存在显著不同,政府统计报告、政府数据可视化、政府数据应用等,都不应列入公共数据开放的范围。郑磊:《开放不等于公开、共享和交易——政府数据开放与相近概念的界定与辨析》,《南京社会科学》2018 年第9 期。事实上,国外的公共数据开放平台,也存在类似问题。如美国的政府数据平台,同样存在缺乏元数据、数据质量参差不齐、数据群未能覆盖全部数据等问题。⑤陆建英、郑磊、Sharon S. Dawes:《美国的政府数据开放:历史、进展与启示》,《电子政务》2013 年第6 期。即使在发达国家,政府数据开放度仍不高,低于各国的预期。⑥才世杰、夏义堃:《发达国家开放政府数据战略的比较分析》,《电子政务》2015 年第7 期。政府数据开放运动在全球范围内陷入发展瓶颈。⑦胡业飞、田时雨:《政府数据开放的有偿模式辨析:合法性根基与执行路径选择》,《中国行政管理》2019 年第1 期。
本文试图从制度建设层面分析现行立法原则,尝试寻找公共数据开放陷入瓶颈的制度原因,并就如何构建公共数据开放路径提出建议。需要说明的是,本文所称的公共数据,是指公共机构在履行公共管理和服务职能过程中所收集和产生的数据。一些论文使用了政府数据的概念。和公共数据相比,政府数据是将数据的收集和产生主体限定在行政机关,在数据的管理要求、开放原则等方面没有实质性差异。⑧郑春燕、唐俊麒:《论公共数据的规范含义》,《法治研究》2021 年第6 期。故下文在讨论时我们会同时使用公共数据和政府数据这两个概念。
2007 年12 月,30 位开放政府倡导者在美国加利福尼亚州举行会议,提出了政府数据开放的八项原则,为评估政府数据开放制度提供了参考。①Open Government Data Principles,https://public.resource.org/8_principles.html,访问日期:2022 年3 月6 日。此后,有关政府间协议、非政府组织等在此基础上完善了开放原则。②2013 年7 月,八国集团领导人签署的《开放数据宪章》提出了数据开放的五项核心原则(默认数据开放原则、数据质量和数量原则、人人可用原则、为改善治理发布数据原则、为激励创新发布数据原则);2015 年,《国际开放数据宪章》提出了数据开放的六项原则(默认开放原则、及时全面原则、可访问和可用性原则、可比较和可互操作原则、改善治理和公众参与原则、促进包容性发展与创新原则)。这些公共数据开放原则,提出的角度各不相同:有的反映了数据开放应当遵循的目标,如《开放数据宪章》认为数据开放应当遵循改善治理和公众参与原则③Building Global Open Data Principles,https://opendatacharter.net/our-history,访问日期:2022 年3 月17 日。;有的反映了实践层面的技术要求,如英国开放知识基金会(Open Knowledge Foundation)认为开放数据应当遵循原始性、机器可读性、非专有格式等原则④Open Definition:Defining Open in Open Data,Open Content and Open Knowledge,https://opendefinition.org/od/2.1/en,访问日期:2022 年3 月17 日。;还有的原则是从公共数据提供者与使用者关系角度出发,涉及不同主体之间权利义务的分配,属于构建公共数据开放制度的指导性原则。默认开放、免费开放、无差别开放等三项基本的立法原则得到了比较广泛的认可,分别涉及数据开放范围、成本负担和开放方式。
默认开放原则是指全部公共数据默认处于“可开放”的状态。除了特定原因,如国家秘密、商业机密、个人隐私、版权保护等可以不开放外,其他公共数据一律无条件开放。《国际开放数据宪章》认为,政府需要证明保持封闭的数据是合理的,例如出于安全或数据保护等方面考虑,否则就应当对数据进行开放。⑤International Open Data Charter,https://opendatacharter.net/principles,访问日期:2022 年3 月17 日。
免费开放原则是指政府应免费提供数据开放,不得因提供数据收取任何费用。开放数据工作组认为费用是公众获取政府数据的最大障碍。⑥Ten Principles for Opening up Government Information,https://sunlightfoundation.com/policy/documents/ten-open-dataprinciples,访问日期:2022 年3 月17 日。美国访问量最大的免费国会数据下载网站创始人Joshua Tauberer 在《政府数据开放》一书中归纳了数据开放的十项原则,其中首条原则就是免费。他认为,如果政府数据不能在互联网上免费获得,那么这样的数据开放没有意义。⑦Joshua Tauberer,Open Government Data,Second Edition(2014),https://opengovdata.io/2014/online-free-primarytimely-accessible,访问日期:2022 年3 月17 日。免费开放原则至少传达出三层含义:数据开放行为本身不得收取费用;数据格式采用开放性的文件格式,不需要使用专用收费软件即可实现数据利用;赋予的数据许可条款是全面的、充分的。
无差别开放原则是指数据一旦开放,即对所有社会公众开放,任何人都可以无条件获取该数据。根据英国开放知识基金会的定义,无差别性是开放(openness)应当具备的基本元素,必须确保使用者获得访问、获取、使用、增值、演绎、拷贝、传播数据的权利。①Open Definition:Defining Open in Open Data,Open Content and Open Knowledge,https://opendefinition.org/od/2.1/en,访问日期:2022 年3 月17 日。该原则侧重保护公众的数据获取权利,强调获取数据无须申请和注册,可以进行完全匿名的访问。②Joshua Tauberer,Open Government Data,Second Edition (2014),https://opengovdata.io/2014/no-discriminationlicense-free,访问日期:2022 年3 月17 日。
受公共数据开放运动的影响,有关国家公共数据开放法律和政策在设计时也体现了这些原则。例如,2020 年,美国国会通过了《开放政府数据法案》,对开放政府数据资产,采纳默认开放原则和免费开放原则,即在法律未另行禁止的情况下,联邦政府维护的公共数据资产和非公开数据资产应以开放格式提供,同时不向公众收取费用。③Open,Public,Electronic,and Necessary Government Data Act (OPEN Government Data Act),https://www.congress.gov/bill/115th-congress/house-bill/1770/text,访问日期:2022 年3 月17 日。加拿大政府在《开放数据宪章——加拿大行动计划》中明确提出,要保证发布的开放数据能够免费使用。④才世杰、夏义堃:《发达国家开放政府数据战略的比较分析》,《电子政务》2015 年第7 期。2012 年,英国政府发布的《开放数据白皮书——释放数据潜能》对开放数据提出三项标准,其中之一是不限制用户身份和意图,都可以获得政府数据。⑤王万华:《论政府数据开放与政府信息公开的关系》,《财经法学》2020 年第1 期。2013年,韩国出台《公共数据提供和使用法》,对公共数据开放的范围,采取负面清单的方式,除保密信息和未获得法律合法许可的信息外,公共机关负责人应当向公众提供由有关公共机构持有和管理的公共数据。⑥《公共数据提供和使用法》,http://www.odsc.go.kr/user/nd82389.do,访问日期:2022 年3 月10 日。许多国家在不同时期的法律中,将默认开放、免费开放和无差别开放等原则作为制度设计的基本指导思想。当然,也有部分国家在立法中对上述原则做了一定程度的调整。⑦英国明确公共数据开放可以采取边际成本收费;法国的《再利用法案》规定,为了限制部分数据集的使用,可以实行定价收费。才世杰、夏义堃:《发达国家开放政府数据战略的比较分析》,《电子政务》2015 年第7 期。
2015 年,《国务院关于积极推进“互联网+”行动的指导意见》(国发〔2015〕40 号)明确了开展公共数据开放改革试点,推进政府和公共信息资源开放共享,支持公众和小微企业充分挖掘信息资源的商业价值,促进互联网应用创新。在该文件的指引下,各地从2017 年开始,在地方性法规和政府规章层面,开展了大量的立法探索。
国内立法对默认开放原则的表述有三种表达方式:一是完全的默认开放。贵州省是我国大数据产业发展领先的省份之一,2017 年《贵阳市政府数据共享开放条例》(市人大字〔2017〕4 号)明确规定,除涉及国家秘密、商业秘密、个人隐私和法律法规规定不得开放的政府数据外,应当向社会开放政府数据。2022 年,《山东省公共数据开放办法》(山东省人民政府令第344 号)更是将“公共数据以开放为原则,不开放为例外”确立为立法的基本原则。二是限缩式的默认开放。2022 年,《黑龙江省促进大数据发展应用条例》将开放范围表述为“确定为有条件开放和不予开放数据的,应当以法律、法规或者国家有关规定作为依据”。虽然这种表述对范围有所限缩,但是仍然是一种非常宽泛的负面清单式的立法表述。原因是,公共数据开放是近年来出现的新生事物,现行法律法规和国家规定在起草颁布时,没有考虑数据开放的情形,极少有法律会对公共数据的开放作出明确的肯定或否定的表述,即使事实上这类公共数据应列为不予开放的范围。三是附条件的默认开放。此类以广东省、浙江省的立法为代表。2021 年,《广东省公共数据管理办法》(广东省人民政府令第290 号)规定,法律、法规、规章以及国家规定要求开放或者可以开放的公共数据,应当开放;未明确能否开放的,应当在确保安全的前提下开放。这实际上将法律未明确开放的数据也列入了开放范围。所谓“确保安全”,是开放的一个前提条件,并非对开放范围的约束。此外,也有部分地区未采用默认开放原则,而是采用了以正面清单为主的开放原则。
在公共数据开放是否收费的问题上,目前国内立法基本上秉持了免费开放的原则,但是在表述上有所差别。有的地区明确规定了免费开放原则。2020 年,《山西省政务数据管理与应用办法》规定,政务服务实施机构按照政务数据开放目录,向社会免费开放经过脱敏和标准化处理、可机器读取的数据。2020 年,《浙江省公共数据开放与安全管理暂行办法》(浙江省人民政府令第381 号)规定,除法律另有规定外,公共数据开放主体应当免费开放无条件开放的数据、获取本人或本单位的受限开放类数据、第三人经授权的受限类开放数据等。虽然有的地区对公共数据开放是否收费未作直接规定,但是概括性规定把相关工作经费纳入财政预算。2021 年,《上海市数据条例》规定,公共管理和服务机构开展公共数据收集、归集、治理、共享、开放及其质量和安全管理等工作涉及的经费,纳入市、区财政预算。2021 年,《江苏省公共数据管理办法》(江苏省人民政府令第148 号)规定,公共数据管理工作所需经费纳入本级财政预算。实际上,从目前各地实践情况来看,基本上实行了免费开放的原则。
国内立法也涉及无差别开放原则。例如,《贵阳市政府数据共享开放条例》(市人大字〔2017〕4 号)规定,政府数据应当以可机读标准格式开放,公民、法人和其他组织可以在线访问、获取。其并未对获取数据的主体予以特定限制,任何人都可以无条件获取数据。《成都市公共数据管理应用规定》(成都市人民政府令第197 号)也有类似规定。但是不少地方意识到难以运用无差别开放原则,对该原则做了一定程度的修正,将公共数据的开放情形设计为无条件开放、有条件开放和不予开放等三类,允许对某些领域的公共数据设定获取条件。
默认开放原则能够获得较为广泛的认可,有其特定的背景。该原则是国际公共数据开放运动初期就提出来的一项基本原则,此时公共数据开放仍处于起步阶段,来自政府外部的声音要求政府推进公共数据的开放,各国政府尚未达成一致的行动共识。绝大部分公共数据仍然尘封在政府信息系统当中。因此,为了快速推动政府数据开放运动的发展,借鉴了政府信息公开的原则,一些国家提出了默认开放原则。随着公共数据开放的深入推进,如果完全采纳默认开放原则,可能会面临一系列问题:一是必要性不足。政府数据涉及面极为广泛,包括农业、气象、能源、海事、环境、医疗、卫生、国防、人口、经济等方面。公共数据开放有别于政府信息公开的一个显著特点是,信息公开的价值目标是保障公众的知情权,而公共数据开放的主要价值目标是实现数据的经济社会价值。在目标层面,政府信息公开目标侧重“知”,而公共数据开放侧重“用”。①王锡锌、黄智杰:《公平利用权:公共数据开放制度建构的权利基础》,《华东政法大学学报》2022 年第2 期。因此,与确保知情权实现不同,数据开放首先应考虑数据价值维度。在开放序位上,并非所有数据都有立即开放的价值和必要,而应当根据社会需求,优先开放与经济社会发展密切相关的数据。二是风险性难以把握。公共数据涉及国家秘密、商业秘密和个人敏感信息,即使经过脱敏脱密处理,也很难保证在算法、算力进一步升级后可能存在新的风险。特别是一旦开放全领域的数据,融合、比对、交叉使用不同数据集,可能会产生不可预知的风险,即公开数据与其他数据混合分析会产生“马赛克效应”。三是数据开放的成本问题。默认开放很难实行的一个重要原因是,几乎所有的公共数据开放的倡导者都忽略了数据开放的成本问题。目前公共部门控制的公共数据,是不同机构在不同时期积累形成的,层级不同,格式不同,元数据单元不同。如果要形成具有社会利用价值、可以对外开放的数据集,必须对数据进行清洗、变换、规约、集成、脱敏、脱密等,每一步都意味着成本投入。同时,数据的储存、安全保护也需要大量资金支持。更何况,面对公众不同的数据开放需求,还需要有相应技术能力的工作人员进行研发、管理。即使公共部门形成了数据,由于数据制作与开放之间存在漫长链条,事实上无法实现所有数据都达到可以开放的状态。四是默认开放原则可能带来滥诉问题。默认开放原则作为政府信息公开的基本原则有其合理性,因为政府信息公开作为政府的法定义务,根植于政府合法性理论;公共数据开放是政府提供的服务,根植于政府有效性理论。②Beth Simone Noveck,“Is Open Data the Death of FOIA?”Yale Law Journal Forum 126(2016—2017),pp.273-286.默认开放原则使公共数据开放变为公共部门的一项法定义务。在这种原则的约束下,公众可以随时要求公共部门开放数据。但是公共部门由于技术能力、时间、成本所限,如果无法提供相应的数据,就意味着处于不作为的违法行为状态,可能导致公共部门承受不必要的诉讼负担。默认开放原则导致政府负有开放义务的数据范围过大,还要应对潜在的不作为挑战,在资源有限的条件下,政府无法集中优势力量聚焦高价值数据的治理、开放,不能释放公共数据真正具有的价值。
免费开放原则同样存在问题。如上所述,公共数据从采集到能够对外开放的状态,有很长的数据处理链条。更何况,很多数据需求方,特别是商业化的利用需求,往往要求接口开放、持续供给、实时更新,同时对数据内容和数据质量有很多特定需求。满足这些商业化需求需要投入更高的成本,如果也由财政资金来支付,那么显然有失财政负担的公平性。也就是说,不应当通过财政支出来满足商业企业数据利用的个性化需求。①罗培新:《数据立法的基本范畴:数据权属及数据处理的头部、中部及尾部规则》,中国法律评论公众号,2021 年4 月29 日。实行公共数据免费开放模式,就相当于向全体公民征收“数据税”,但是纳税人并没有从这些数据开放行为中获益。②胡业飞、田时雨:《政府数据开放的有偿模式辨析:合法性根基与执行路径选择》,《中国行政管理》2019 年第1 期。对公共部门来说,其原有的预算、人力、技术能力并不足以支撑市场所期待的数据开放需求。一个合乎逻辑的现实情况就是,在公共数据免费开放的情况下,公共部门自然选择开放那些数据治理成本低、开放难度小的数据,而不去提供高质量但同时需要负担高额开放成本的数据,即使这类数据才是公众最需要的数据。之所以会出现数据碎片化、数据时效性差、数据与信息混杂等问题,是因为免费开放原则导致政府投入不足,没有足够能力和动力提升数据质量。
无差别开放原则的本意是在公共数据开放中,对数据利用主体不应当设定差异化条件,所有数据均应一视同仁地对外开放。在实践中推行该原则同样困难重重。主要原因是,在公共数据中,确实有些数据是可以对不特定的公众开放的,任何人均有权获取。这些数据往往是基础性、非敏感的数据,如开放某地基本气象数据、企业注册的基础数据等。对于某些行业的高价值数据,如公共交通数据、地铁人流数据、企业纳税数据、居民用水用电数据等,属于高敏感的数据集,对数据利用主体的技术水平、管理能力都有相应要求。如果向公众实行无差别的开放,在不了解数据利用主体自身能力、应用场景的情况下,就会存在较大的数据失控风险。因此,在无差别原则的约束下,政府部门实行公共数据开放时,只能基于社会公众的一般数据管理能力水平来确定开放内容,同样导致数据质量无法达到社会预期的问题。
默认开放原则、免费开放原则、无差别开放原则当然具有积极意义,对公共数据开放运动在全球迅速兴起发挥了很大推动作用,在一定范围内也取得了共识。但是这些原则导向与政府的实际能力和现实基础之间存在偏差,当以这些原则来指导立法,并借助立法的力量将公共数据开放运动向更大范围、更深层次推进时,就不可避免地出现了上文所提及的问题。因此,只能说这些原则是具有理想色彩的宏大目标,更适合作为推动公共数据开放运动的理念,而不宜作为立法的原则。为了将公共数据开放工作向更深入的方向推进,同时为国家层面开展公共数据开放立法提供参考,立法者有必要对公共数据开放的立法原则予以修正。
正面清单开放原则与默认开放原则秉持不同的理念。默认开放是推定式的开放,也就是说,只要没有被纳入禁止开放的清单,一律要对外开放。正面清单开放是指建立可开放的数据资产清单目录,凡是被列入清单的,属于可以开放的范围;未被列入的,即属于不可开放的范围。正面清单开放的好处是,公共部门可以将有限的资源投到经济社会最需要的数据当中,优先将数据价值高、社会需求大的数据,纳入数据开放的范围。同时,通过正面清单,还可以标注数据的开放形式、条件等信息。正面清单开放的弊端可能是开放的数据范围较小。为了弥补这一问题,可以引入公众参与机制,允许公众对数据清单的开放范围提出评议意见,公共部门根据社会需求及时扩大清单范围。同时,也应当允许公众在开放数据清单之外提出数据需求,采取一事一议的方式,确定开放的范围。如此一来,既可以通过正面清单聚焦社会的需求重点,将有限资源聚焦于最有价值的数据,也可以通过公众参与和例外申请来不断扩大开放范围,从而更务实地划定开放范围,提升数据开放的质量。实际上,已经有部分省份对正面清单开放原则进行了探索。例如,《上海市公共数据开放暂行办法》(上海市人民政府令第21 号)规定,数据开放主体应当在公共数据资源目录范围内,制定公共数据开放清单,列明可以向社会开放的公共数据。其后续的制度设计,均围绕该清单展开。虽然并未明确清单外的数据是否可以公开,但是按照行政职权法定的原则推断,行政机关不得在清单之外向社会开放数据,故可以认为采取的就是正面清单的开放思路。在立法的推动下,上海市在数据开放质量、开放利用度等方面,在省级政府中都取得了较高的得分。①复旦大学数字与移动治理实验室:《中国地方政府数据开放报告——省域(2021 年度》,http://www.dmg.fudan.edu.cn/wp-content/uploads/2021ycity.pdf,访问日期:2022 年3 月18 日。
如上所述,免费开放原则作为一种倡导的理想,是有其价值的,但是必须与收费开放原则相结合。两者并非矛盾的,而是可以并存的,各自有着不同的适用场景。免费开放的数据主要聚焦于基础性、通用性,与普通社会公众生产、生活、学习研究有较强关联性的数据。这些基础性、通用性的数据,大多是公共部门在推进智慧政府、一网通办建设等过程中所积累的监管数据和服务数据。公共部门对这些系统的建设已经投入了大量财政经费,数据只是这些系统运行的“副产品”,实行免费开放属于题中应有之义。而对于收费开放的数据,我们应当从两个方面把握。一方面,这些数据属于机构用户的专业性需求,特别是具有商业目的的数据使用需求,其数据用途本身就具有营利性。另一方面,商业目的使用的数据往往是跨领域、跨部门的大型数据集,具有复杂的数据结构和数据层级,面临艰巨的数据治理任务,脱敏脱密的难度也较大,数据从积淀在有关政府部门的初始状态到实现可开放状态,必须支付高昂的处理成本以避免“巴别塔困境”(Tower of Babel)。②高价值数据集的形成犹如建设巴别塔,只有整合不同数据集,才能形成真正具有价值的大型数据集。Open Knowledge Foundation:Open Data Handbook,http://opendatahandbook.org/guide/en/what-is-open-data,访问日期:2022 年3 月17 日。实际上,实践中企业大多数表示愿意通过适度付费的方式来获取公共数据。①罗培新:《数据立法的基本范畴:数据权属及数据处理的头部、中部及尾部规则》,中国法律评论公众号,2021 年4 月29 日。政府数据开放的有偿模式有利于实现政府的数据收益权、降低行政成本、提升政府部门开放数据的动力、保障政府开放数据的质量。②张会平、顾勤、徐忠波:《政府数据授权运营的实现机制与内在机理研究——以成都市为例》,《电子政务》2021 年第5 期。为此,在公共数据开放立法中确立免费和收费相结合的立法原则,既是必要的,也是可行的。具体的收费标准和收费方式,需要考虑数据类型、数据需求和数据开放路径等方面。对专业性、个性化以及治理成本高的数据应当实行收费。对于商业性需求,可以实行覆盖成本的全额收费方式。对于公益性需求,可以实行政府补贴的收费方式。不同的数据开放路径所对应的成本补偿机制有所不同,故收费方式也存在差异。对此,本文将在公共数据开放的路径构建部分展开进一步讨论。
公众对公共数据的使用需求千差万别。公众可能会出于个人获取信息、监督政府的目的存在数据需求。科研机构在科学研究中有获取批量化的环境、医疗、交通等数据需求。商业机构有创新商业模式、研究市场、开发新的数据产品的需求。不同场景对数据范围、颗粒度、时效性的要求也不一样。对公众用户而言,可能只要通过开放平台下载数据包即可满足,而商业机构可能需要以接口方式持续获取数据。对于一些敏感度较高的数据,还要采取数据沙箱、隐私计算等数据可用不可见的方式来开放数据。同时,对这些复杂的数据需求,政府还需要承担后续监管义务。因此,面对不同的社会主体和不同的数据需求,我们很难按照某一类型或某一场景设定统一的无差别数据供给模式和路径,必须基于不同的应用场景,在分类开放的原则下,设计具体的开放路径。
公共数据开放路径以是否可以直接从行政机关获取数据来划分,分为直接开放和间接开放两大类。
完全授权型开放,是指公共部门将适合向不特定公众普遍开放的数据,免于审批赋予数据利用主体全部数据权利的开放方式。这种方式属于公共数据直接开放的方式之一,主要满足公众基础性、普遍性的数据需求。公众可以通过开放平台直接获取数据。该模式具备以下四个方面特征:第一,开放范围限于基础性数据,目的是满足公众对公共数据的基本需求。例如,基础的企业主体数据、环境监测数据、地理信息数据等,该范围与其开放对象和授权内容相匹配。第二,向不特定主体免费提供。正因为这类数据是面向公众普遍开放的,任何人都有权获取和使用这些数据,故采用财政资金负担数据开放的成本,不存在公平性问题。第三,免于审批。即不需要申请、审批即可直接获得数据的完全授权,这是这种开放模式的核心特征。允许公众无条件地获取、使用、传播数据,同时对使用目的、场景没有限制。数据利用主体既可以用于个人目的,也可以用于商业目的,同时鼓励市场机构对这些数据加工、提升价值后开发数据产品继而出售。为了避免法律风险,便于数据利用主体后续数据开发形成衍生数据及数据产品的权利保护,可以借鉴国外开放许可的做法,由公共部门通过开放平台发布权利声明,赋予数据使用主体完全的数据权利。①国外数据开放领域,有多个可以普遍适用的法律授权文本,例如开放政府许可协议(OGL)、开放数据共享公共领域奉献和许可(PDDL)、开放数据共享署名许可(ODC-By)、知识共享组织(Creative Commons)的公共领域贡献声明(CC0 1.0)等。第四,匿名化。因为这类数据不存在使用条件,也不需要数据利用主体披露个人信息和用途,所以平台应采取免于注册、免于实名认证的方式,便于数据的获取和传播。从国内政府数据开放平台来看,绝大多数平台都是需要注册的,有的平台还需要进行实名制的身份认证。之所以出现这种情况,是因为目前平台上开放的数据,混杂了可以普遍开放的数据和不宜向所有公众开放的数据,不得不统一设定了身份认证要求。这从一个侧面证明了应当区分不同类型数据的开放路径,从而提高数据获取效率。
有限授权型开放用在非基础性的公共数据,主要是特定行业的专业性数据集。因为这些数据的数据量和敏感性不同于普遍开放数据,且对数据利用主体自身数据安全管理水平、技术能力有着较高要求,所以不宜采取完全授权型的方式对外开放,而应明确数据利用主体的使用条件,并赋予其有限的数据使用权限,也就是“有限授权型开放”。
有限授权型开放面向特定主体。特定主体,是指对该主体有专业资质、数据处理能力、安全管理能力、数据使用场景等某些约束性条件限制。考察这些条件,主要目的是解决开放行为的安全合规和隐私保护等问题。这些要求很难通过普遍适用的行政性规定来统一明确。比较可行的做法是将数据使用条件通过协议方式予以明确。一个有争议的问题是,该协议究竟是民事协议,还是行政协议?其本质问题是这种开放行为究竟是民事行为,还是行政行为。笔者认为,界定该协议为行政协议比较妥当。一是从协议主体来看,该协议的一方主体是行政机关。尽管公共数据中部分数据的控制主体是事业单位、公用企业等,并非行政机关,但是这些单位基于政府授权具有合法采集和管理公共数据的职权,这些主体签署的协议,应被认为符合行政协议的主体标准。②邢鸿飞:《政府特许经营协议的行政性》,《中国法学》2004 年第6 期。二是从协议目的来看,行政机关签署数据开放协议,是为了履行公共管理和服务职能,与满足其自身作为私主体的需要有显著差异。三是从合同标的角度来看,行政机关将其管理的公共数据交由社会主体开发利用,将特定数据权利赋予对方,运用的是一项公权力,而非民事权利。公共部门不是数据“批发商”,开放数据也不是交易行为。
开放的数据是特定领域的专业数据集,且仅授予数据利用主体部分权利。例如,上海市在推进普惠金融试点应用中,对接了四家试点银行,支持银行开发了四个普惠金融信贷产品,共向试点银行开放了八个委办局386 项累计3.8 亿条公共数据。①《上海深化公共数据利用开展普惠金融试点》,载国家发展和改革委委员会网站,https://www.ndrc.gov.cn/xwdt/ztzl/szhzxhbxd/zxal/202007/t20200713_1233616_ext.html,访问日期:2022 年4 月4 日。这些数据包括市场监管局法人库企业处罚、税务评级、法人变更信息、市税务局企业资产负债情况、销售盈利情况以及成本等数据。这些数据包含大量个人信息和企业信息,具有高敏感性特点,不宜将数据的所有权利都授予利用主体,而应匹配数据利用主体的需求予以有限授权,对数据的传播方式、利用领域、开发目的以及是否可以对数据进行修改、再授权都有相应的约束。
有限授权型开放面向所有符合条件的主体非排他地开放数据。虽然有限授权型开放对数据利用主体存在条件限定,但是这种条件应当是公开的,遵循非歧视和非排他原则。凡是符合条件的主体,均有权获得数据,不会因为主体规模、机构性质的差别而受到不同对待。同时,对数据利用主体也不存在数量上的限制。虽然数据是一种有价值的资源,但是其并不属于有限的排他性资源。数据具备开放条件后,其复制的成本极低。某一个主体使用,并不妨碍其他主体同时使用。数据在使用中会不断产生新的数据,价值可能会随着使用愈发增加。因此,一旦某个数据集已经处于可开放状态,最有利于发现价值的路径就是允许符合条件的所有主体都使用该数据。
有限授权型开放采用有偿使用原则。特定领域的数据开放有必要采用有偿使用模式。从对支出成本补偿的角度而言,有偿使用可以采取三种方式,即市场定价、行政收费和税收。根据经济学理论,市场定价适合私人产品的成本补偿。公共数据具有公共产品或准公共产品属性,不适合采取市场定价方式。行政收费适用于受益直接且明显、受益范围特定、可以排除未缴费者受益且排除成本较低的事项。税收则适用于受益范围不特定、受益不直接、不能排除未缴费者受益或排除成本很高、征收的费用比较稳定的事项。②江利红:《论行政收费范围的界定》,《法学》2012 年第7 期。在有限授权型开放的模式下,公共数据的利用主体直接从数据中获益。由于税收是向全社会征收的,并没有具体到利用数据所获益的企业,如果采用税收方式,反而将这个负担加到其他企业和公民身上。为此,采取行政收费的方式较为妥当。至于收费的标准,毕竟公共数据具有公共产品属性,故应以保本微利为基本原则。在计算成本时,数据提供方应当仅仅计算数据开放而发生的直接成本,不应把数据采集、系统建设的成本统计在内。因为这些成本在公共部门履行公共服务职能时,可以由财政预算予以保障,数据的积累是履职行为的自然结果。在收费对象上,数据提供方也要考虑具体的主体性质和目的。比如,收费对象主要限于商业化的利用开发主体。对于非商业化的利用,如开展科学研究等,可以视单位性质和具体用途,考虑低于成本或者免费提供。
公共部门和数据利用主体均承担“开放后”义务。在完全授权型开放中,数据利用主体获取数据后,开放行为即终止,公共部门和数据利用主体均不承担后续的其他义务。在有限授权型开放中,由于对数据使用存在条件限制,数据利用主体只拥有数据的部分权限,公共部门需要考虑如何避免数据利用主体超权限使用的问题。因此,数据利用主体在获取数据后仍承担相应义务,如需要对使用情况进行报告、在限定范围内传播和修改数据、不允许重新识别数据主体身份。公共部门为了满足数据利用主体的要求,不仅承担持续性的数据供给义务,而且对数据利用主体的开发利用行为也有监管职责。
上述两种路径属于公共数据的直接开放方式,即从公共数据的控制主体直接获取数据。直接开放方式的好处是开放链条短,数据利用主体能够从公共部门获取原始数据,但缺点是公共机构考虑到技术力量、成本、数据本身特性等,能够提供数据的范围和种类是有限的,无法完全满足社会多层次的数据利用需求。因此,各地已经开始实践探索公共数据的授权运营、资产运营等不同形式,如成都市①张会平、顾勤、徐忠波:《政府数据授权运营的实现机制与内在机理研究——以成都市为例》,《电子政务》2021 年第5 期。、贵阳市②曹谦、范佳佳:《从理论视角看政府数据资产运营的得与失——基于贵阳实践的思考》,《上海商学院学报》2020 年第5 期。等。国家相关文件也有诸如公共数据授权运营③《中华人民共和国国民经济和社会发展第十四个五年规划和2035 年远景目标纲要》正式提出“开展政府数据授权运营试点,鼓励第三方深化对公共数据的挖掘利用”。、特许开发④2022 年1 月,国务院印发《“十四五”数字经济发展规划》,提出“对具有经济和社会价值、允许加工利用的政务数据和公共数据,通过数据开放、特许开发、授权应用等方式,鼓励更多社会力量进行增值开发利用”。等表述,从而在更大范围内推进公共数据开放。但是究竟何为授权运营、何为特许开发尚无统一的界定,与公共数据开放究竟是何种关系也未达成一致意见。笔者认为,这些概念的一个核心特征是采用公私合作(Public-Private Partnership,PPP)的方式来开展公共数据开放。公私合作分为政府撤资(divestment)、政府委托(delegation)、政府淡出(displacement)等三种类型。⑤Emanuel S. Savas,Privatization,New York:Routledge,1997,p.822.政府委托的具体方式包括合同外包(contracting out)、特许经营(franchise)、提供补助(grant)、抵用券(voucher)、强制(mandate)等五种。笔者认为这种新型的数据开放方式,从理论上说具备政府特许经营的特征,故以特许经营型开放这一名称来归纳并进行分析。
特许经营型开放,是指政府将数据资源的开发利用权授予特许经营者,由其帮助政府共同进行数据治理、开发数据产品,从而实现公共数据的开放。在整个开放链条中,与前两种开放路径相比,这种路径增加了特许经营者这一主体,数据利用主体不是从政府直接获取数据,而是从特许经营者那里获取数据或者数据产品。笔者将其界定为公共数据的间接开放方式,以区别于上述两种政府直接提供数据的开放模式。这种模式由于有专业机构介入,既可以发挥其数据治理的专业能力,又起到了防火墙隔离风险的作用,因此可以开放的数据范围更广,更有利于提高公共数据的生产要素价值。
特许经营型开放本质上是以契约型公私合作提供公共数据开放的一种形式。根据资金来源不同,契约型公私合作可进一步分为委托模式和特许模式。①李霞:《论特许经营合同的法律性质——以公私合作为背景》,《行政法学研究》2015 年第1 期。在委托模式中,社会主体接受政府委托,以政府名义提供公共服务,社会主体从政府获取资金,即通常所称的“政府购买服务”。在特许模式中,社会主体从政府处取得经营权,以自己名义提供公共服务,并可以向服务接受者收取费用以弥补经营成本。委托模式实质上仍然是以税收来支付公共数据的开发成本,上文已论述了税收方式的弊端。公共数据作为有价值的生产要素,天然具备使用者付费的条件,故采用为特许模式是恰当的。政府部门和社会主体通过签订公共数据特许经营协议,将数据运营权授予社会主体。政府提供公共数据的原始资源,社会主体提供资金和技术力量,对公共数据进行治理和开发利用,并进一步向社会提供可以开放的公共数据和数据产品,替政府履行了部分公共服务职能。
特许经营型开放的数据范围是非特定数据,并不指向具体的应用场景和特定的数据集。与有限授权开放根据使用人需求开放特定类型数据不同,特许经营型开放指向的数据范围,不是根据已经确定的数据用途,而是根据特许经营者的数据处理能力来确定的。例如,将某省级区域公共交通出行的所有数据,或者将某个行政区域内所有的公共数据,统一授权给某个社会主体运营,由社会主体基于自身的技术能力对这些数据进行处理、挖掘,从而形成公共数据供给的一级市场和二级市场。
特许经营者的选择是竞争性的,而非行政指定的,也不应是排他或者独家所有的。特许经营者处理的是非特定化的公共数据,需要承担与政府同等的数据安全管理责任。为了充分挖掘公共数据蕴含的价值,政府部门还需要掌握相应的专业技术。为了选出合适的合作对象,最佳解决方式就是借助市场力量,通过竞争性手段选择特许经营者。目前,采用招标、竞争性谈判等方式选择特许经营者是通行做法。应当遵循公开公平公正的原则择优选择公共数据的特许经营者。根据数据资源的特点,将公共数据特许某个主体运营后,并不影响其他具有能力的主体进行运营,故特许对象不应是排他的。当然,为了防范风险,有必要对特许经营者的股东背景、信用等级、安全管理能力、运营水平等设定必要的条件。
运营成本主要靠向用户收费来弥补。为了保护特许经营者的利益,同时形成完整的利益链条,应当允许特许经营者向数据最终使用方收取费用。由于公共数据的“公共属性”,即使采取特许经营的方式,公共数据开放属于公共服务的属性仍未发生变化,特许经营者对用户的收费也应当接受政府管制,实行政府定价或者政府指导价格。对收费无法弥补成本的,政府部门可以考虑予以补贴,以保证特许经营者能够维持良性运作。由于特许经营者是拥有专业技术的机构,且拥有原始的公共数据资源,除了向社会开放公共数据外,还可以基于已开放的数据开发相应的数据产品,类似于在基础服务之外,提供增值服务。对这部分服务,特许经营者可以采用市场定价的原则获得收入。
政府部门对特许经营者的经营过程实施全程监管。特许经营合同作为行政协议的一种,政府部门拥有行政优益权。政府部门既要监管特许经营者的数据开发行为,又要监管特许经营者的数据开放行为。政府部门不仅要监督、评价特许经营的效果,也要对违反协议约定的行为行使行政优益权,采取约谈、信用惩戒等手段,严重的可以实行处罚、解约等措施,保障公共数据开放服务的质量和效率。
特许经营型开放与有限授权型开放都是采用行政协议的收费开放模式,有相似之处,也存在实质性不同:一是法律关系不同。有限授权型开放的数据利用主体与行政机关直接建立数据供给法律关系;特许经营型开放的特许经营者和行政机关建立特许经营的法律关系,数据利用主体再与特许经营者建立数据供给法律关系。二是数据范围不同。有限授权型开放是根据数据利用主体的需求,点对点供给特定数据;特许经营型开放是将某个区域或行业的数据批量开放给特许经营者,由其进行治理后再进行二次开放。三是收费性质不同。有限授权型开放的收费属于行政事业性收费,特许经营型开放的收费属于经营服务性收费。四是授权内容不同。有限授权型开放仅授予数据利用主体部分数据权利;特许经营型开放既可以完全授权,也可以有限授权,由特许经营者视具体场景而定。综上所述,特许经营型开放作为公共数据的间接开放方式,引入了专业的社会第三方实施数据的治理和开放,赋予了该主体更大的数据权限,弥补了有关政府部门专业能力的不足,通过市场机制满足社会主体更加多样化的数据需求,有助于推动公共数据开放向更深层次发展。
总体而言,公共数据开放属于法学和公共管理领域的新兴话题。本文认为,公共数据开放是一个广义的概念。凡是公共部门向社会提供公共数据的行为,均可以被纳入公共数据开放的范畴,其本质是将公共数据这一生产要素向社会分配的过程。公共数据开放目前面临的问题,与现行立法和实践所奉行的原则有一定的关系。过于宏大的目标作为长远的理念有其合理性,但是制度设计更应关注可行性,有必要对立法原则予以适当修正,以减小制度实施的难度,增强有关主体的内生动力。基于修正后的立法原则,公共数据开放的路径设计应区分不同的数据利用主体,匹配与数据需求相适应的利用权限,既能释放公共数据的价值红利,又能保护好商业秘密和个人信息,构建高效、安全、合规的公共数据开放制度。