政府数据开放许可协议研究:现状调查与机制构建

2020-09-23 02:49范丽莉张薷予
渭南师范学院学报 2020年9期
关键词:许可权利数据库

范丽莉,张薷予

(长安大学 公共管理与法学院,西安 710064)

政府数据开放是近期国家信息政策的重要内容之一。开放数据不是开源,也不是开放获取,而是需要开放许可。“尽管越来越多的数据以互通和开放形式提供,但是目前数据很少以一种直接明确第三方如何使用的形式提供,当数据交换与互通达到网状规模,传统的社会规范已经无法保证数据的合理使用,需要许可机制来明确数据利用的条件与要求。”[1]作为政府数据开放过程中的重要元素,许可协议不但可以确保开放数据自由免费地被利用、传播,也有益于进一步发展出基于数据许可协议的商业模式。[2]“政府数据开放许可协议是从法律层面约束政府与用户行为的重要政策,其本质是用具有法律效力的协议落实政府与用户的权责,调和或缓解数据价值释放与风险管理之间的冲突。”[3]我国目前未能形成统一、国家层面的政府数据开放许可协议,成为制约政府数据开放的主要因素。因此,为了完善我国的政府数据开放许可机制,需要借鉴国际上通用的开放许可协议和其他国家专门的政府数据开放许可协议,思考我国政府数据开放许可协议设计的基本思路与相应的配套制度。本研究基于对国内外政府数据开放许可现状的调查,分析目前政府数据开放中的许可协议的类型、特点、适用性,从而有效把握“开放许可”的本质,为完善我国政府数据开放许可机制提供思路。

一、相关研究述评

总体而言,目前关于政府数据开放许可的相关研究较少,主要围绕两个方面展开:第一,明确了开放许可(open license)是开放数据的重要特质之一。英国的开放知识基金(Open Knowledge Foundation)[4]、美国的开放政府工作组[5]都将开放许可(open license)或免于许可(license-free)列为政府数据开放的特征之一。我国学者郑磊对政府数据开放相关概念进行了辨析,指出“开放”的政府数据无需授权即可利用。[6]第二,分析了目前政府数据开放许可的具体协议。迪莉娅[7]、黄如花与李楠[8]、Mashael khayyat[9]等都基于对现有政府数据开放许可协议的比较分析,提出相应的政府数据开放许可的建议。多个研究都建议选择CC协议作为我国政府数据开放的许可协议。[8,10]少数人提出构建中国的政府数据开放许可协议(CLOD)。[3]但基于对我国政府数据开放许可的现状分析,我国不仅仅存在许可协议空缺的问题,还存在开放理念不足、缺少与许可协议相配套的制度体系等问题,因此需要从理念—协议—制度三个方面构建起政府数据开放的许可机制。

二、国内外政府数据开放许可的现状调查

(一)国内政府数据开放许可现状

中国政府数据开放起步较晚,尚未建有国家层面统一的政府数据开放门户。因此,本研究以国内现有省级政府数据开放门户及开放许可做得较好的城市为样本,主要涉及上海、北京、浙江、山东、广东、贵州、江西、宁夏、贵阳、广州等,将从是否允许用户自由、免费、不限目的使用等方面考察上述地方政府数据开放门户的数据许可的现状,访问时间截至2019年12月31日。通过逐一访问上述政府数据开放门户,阅读网站有关数据许可的声明和每个数据集的元数据信息,研究发现:

1.数据许可采取网站整体授权模式

除了宁夏,其余政府数据开放门户都以网站“免责声明”“服务条款”等方式列出了数据利用的规定与声明。但是这些声明与规定采取的是网站整体授权模式,使用条款或协议仅仅列在网站顶部或底端,并未体现在每一个数据集的元数据信息页面。宁夏采用的是本省政务服务网的“网站声明”,并未针对开放的数据形成专门声明。

2.数据许可条款或声明不符合“开放许可”标准

第一,调研的10个门户网站均符合不受歧视、自由免费访问的特征,但有7个需要注册才能下载数据,不符合自由、无限制获取的标准。

第二,除去贵州、贵阳明确数据可以免费访问、获取与利用之外,江西、宁夏未形成明确规定,其余网站均声明数据现阶段免费使用,一些网站声明保留数据浏览和数据下载收费的权利。

第三,用户权利含糊不清。现有许可声明对于用户数据访问、获取、传播、演绎、商业性利用等权利规定不明确, 未能对用户的自由使用权利,特别是商业使用权利予以明确清晰的保障。[2]江西等政府数据服务网仅有“用户义务”条款,而无“用户权利”规定。广东、山东等规定“用户不得有偿或无偿转让在本网站中获取的各种数据资源”,上海声明“用户不得有权转让在本网站获取的各种数据资源”,但对于“转让”二字未能清晰界定。

第四,存在较多的数据利用限制与要求。现有许可协议或声明一般都提出了一些限制与要求,一是数据应用情况需备案;二是配合需求调查和数据资源调查;三是用户APP应用发布需经审核;四是条款规定的义务同样需要得到再授权用户同意并认可。

总体而言,目前仅有贵州省明确用户对获取的政府“完全开放”数据不受歧视地享有免费访问、获取、使用的权利,不受限制地进行商业和非商业性利用的权利,不受限制地进行自由传播、分享的权利,其他地方政府对于数据利用者和再利用者准许做什么和受哪些限制规定得不够明确,存在较多限制与要求,不符合“开放许可”标准。

(二)国外政府数据开放许可现状

受语言水平限制,对国外政府数据开放许可的调查,主要选取了美国、英国、德国、法国、加拿大、澳大利亚、新加坡和欧盟。通过逐一访问上述国外政府开放门户网站,阅读网站有关数据许可的声明和每个数据集的元数据信息,研究发现:

1.数据集独立授权

国外政府全部采用每一数据集(Dataset)独立许可的形式,即每一数据集下都提供许可信息,提供许可协议具体信息的链接。欧盟虽采用网站法律公告的许可形式,但其在每一数据集的“license”下提供“法律公告”的超链接。

2.许可形式多样

国外政府数据开放许可协议基本包括以下类型:(1)国际组织制定的开放许可协议,主要包括知识共享许可协议(Creative Commons,CC)和开放数据共享许可协议(Open Data Commons,ODC);(2)政府制定的开放数据许可协议,如英国、法国、德国、加拿大、新加坡等专门制定了各自政府数据开放许可协议;(3)法律公告/使用条款,如欧盟、德国等;(4)其他声明:如法国、德国、澳大利亚等国的文字说明,如“其他(开放)”“其他(署名)”“其他(公共领域)”等形式。

3. 许可协议不够规范

在德国、法国和澳大利亚,存在多种许可类型。澳大利亚政府数据开放门户列出了近50种许可信息,实际上一些许可信息属于相同类型,但表述不一,存在不规范的情形。《开放数据晴雨表》(第3版)调查指出:“同一国家或同一机构、部门混杂着多种许可协议,主要是因为缺乏数据许可的统一政策;即使这些政策或指南确实存在,但是并未被不同的部门一致地应用或直接被忽视了。”[11]

总体而言,国外政府数据开放许可类型多样,大多数符合“开放”标准,授予用户全球范围(worldwide)、免于版权(royalty-free)、永久(perpetual)、非排他性(non-exclusive)的利用、包括商业性利用信息的权利。但仍然需要进一步明确各种许可协议的适用性,规范统一其应用。

三、政府数据开放许可协议类型及特征分析

(一)知识共享许可协议(Creative Commons licenses,CC)

知识共享许可协议由Creative Commons基金会发布,是为了构建一个网络环境下平衡而灵活的著作权体系,以实现知识创造成果的合法分享、再利用与演绎。2002年发布第1版,现已发布第4版(2013年)。使用CC协议,作者可以保留4种权利:(1)署名(Attribution,BY):注明原作者;(2)非商业使用(Noncommercial,NC):不得用于商业性目的。(3)禁止演绎(No Derivative Works,ND):不得修改原作品;(4)相同方式共享(Share Alike,SA):如果允许修改原作品,那么必须以相同的许可协议发布。这4种权利的不同排列组合形成不同的许可协议。总体而言,目前知识共享许可协议主要包括:署名(CC-BY),署名—相同方式分享(CC-BY-SA),署名—禁止演绎(CC-BY-ND),署名—非商业性使用(CC-BY-NC)、署名—非商业性使用—相同方式分享(CC-BY-NC-SA)和署名—非商业性使用—禁止演绎(CC-BY-NC-ND)。此外,知识共享组织还推出了Public Domain Mark(简称 PDM)和 CC0 两种协议,PDM 针对年代久远并且已经没有版权争议的作品,该协议的目的是使这些珍贵的作品能够更容易被发现并利用。CC0 是对自己所拥有作品的版权和其他权利放弃的一种声明协议,任何人可以以任何方式和任何目的使用CC0协议许可的作品。

CC协议的许可对象最早限于创作性作品(音乐、电影、文学、学术等),而且基于美国法律体系写成。2013年发布的CC4.0版本不仅更加简洁、通俗易懂,充分考虑了各国版权制度的差别,而且也有效解决了数据和数据库的共享问题,成为数据开放许可的一种灵活选择。目前,CC协议也是应用最为广泛的许可协议,成为美国、德国、法国、澳大利亚、新西兰等多个国家政府数据开放的许可协议之一。2011年,澳大利亚政府出台《政府开放获取与许可框架》(The Australian Government Open Access and Licensing Framework,AusGOAL), 将CC-BY(3.0)作为政府开放数据的默认协议。2014年2月,将CC4.0协议作为主要许可协议,并将CC-BY(4.0)设为默认协议。

总体而言,CC协议许可对象的范围广泛,应用也较为广泛,其CC0、署名许可(CC-BY)、署名—相同方式分享(CC-BY-SA)符合“开放”标准,而署名—禁止演绎(CC-BY-ND)、署名—非商业性使用(CC-BY-NC),署名—非商业性使用—相同方式共享(CC-BY-NC-SA)和署名—非商业性使用—禁止演绎(CC-BY-NC-ND)并不符合“开放”标准。CC0是较为理想的数据开放许可协议,CC-BY协议存在数据融合再利用中多重署名引起的问题,CC-BY-SA会同时存在多重署名及数据互操作性问题,影响商业应用。

(二)开放数据共享协议(Open Data Commons,ODC)

开放数据共享协议由开放知识基金会(Open Knowledge Foundation)推出,是专门针对数据库利用设立的许可协议。目前,开放数据共享协议共有三种:公共领域贡献和许可(Public Domain Dedication and License,PDDL)、开放数据库许可(Open Database License,ODbL)和开放数据共享署名许可(Open Data Commons Attribution License,ODC-By)。在赋予利用者全球范围、免版权、非排他、永久、不可撤销的版权许可权利时,分别设置了不同的使用条件与限制,具体见表1。

表1 开放数据共享协议的许可类型

开放数据共享协议的许可对象不同于其他版权保护内容,涉及数据库体系本身、数据库中的内容,以及基于这些内容和数据库体系的衍生作品。覆盖的权利包括版权和数据库权,版权是指数据库的版权及其邻接权,包括数据库模型、数据库表单和表单索引、数据条目、输出表单和内容的字段名;数据库权利包括对数据库内容的提炼和再利用。除了PDDL协议,利用者都需要针对数据库中独立内容的版权许可进行另行声明。此外,许可的权利并不包括创建或操作数据库的计算机程序、数据库及其内容的专利权、与数据库相关的商标权。

总体而言,开放数据共享协议属于开放范畴,但其许可对象较为单一,限于数据库权利,因此,通常需要与其他协议相结合使用。如英国政府的空间数据开放共享项目ShareGeo Open将PDDL协议与 CC-BY(3.0)结合使用,磁共振成像数据共享项目OpenfMRI将PDDL与ODC-BY结合使用。[12]此外,ODC协议被批评不够明晰和通俗易懂,会导致数据共享中较高的交易成本,未能进一步推动数据库利用的法律预期和确定性。[9]

(三)开放政府许可协议

英国、法国、加拿大、德国、新加坡等国家出台了专门针对政府数据开放的许可协议(见表2)。相较CC协议、ODC协议,这些政府数据开放许可协议具有如下特征:(1)专门以政府部门数据为许可对象,基于特定条件授予利用者全球范围、免版权、永久性、非排他性对数据利用与再利用的权利。(2)适应本国法律法规体系,如英国、法国涉及对数据库权的许可,而加拿大最初以英国的《开放政府许可》为模板,在征求讨论稿相关意见时,普遍反映加拿大法律并不涉及数据库权[13],所以加拿大政府数据开放许可协议仅适用版权保护的数据与信息;此外,各国的许可协议均与其信息公开、公共信息再利用、知识产权法相适应,豁免了相关数据与权利。(3)具有开放性与兼容性,各国政府数据许可协议均满足“开放”的条件,仅设置了“署名”的要求;此外,这些协议也与其他至少需要“署名”的许可协议相兼容,如CC-BY、ODC-BY等。

(四)使用条款或法律声明

使用条款或法律声明并不是一种“许可”机制,但是具有“许可”的属性,设置了数据利用的要求与限制,为数据提供者和数据利用者提供行为准则及实践指导。然而现有使用条款或法律声明并没有统一标准和要求,存在极度不规范、含混不清的问题。一些采取文件形式,例如欧盟的法律声明(legal notice);一些仅为一句话,例如澳大利亚、法国、德国等一些数据集的“License”仅为“其他(开放)”“其他(署名)”“限制获取”等信息。这不仅不利于数据利用者明确权利和利用限制,而且极度不利于数据的融合再利用。大数据时代,数据的交叉、关联与融合需要标准、具有兼容性的规范许可协议才能保证开放数据的获取与再利用。

需要注意的是,上述标准的法律许可及弃权声明在一定程度上保证了开放数据的获取与再使用, 但随着开放数据内容对象变得越来越复杂, 且缺乏专门针对政府数据开放的许可标准,就需要除从法律上进行许可外, 还需要采用其他社会性机制与政策保障数据开放与再利用的许可问题。例如开放数据共享(Open Data Commons,ODC)推出了“署名及相同方式共享社区规范(ODC Attribution-Sharealike Community Norms)”,建议将其与PDDL(公共领域贡献与许可)配合使用。OCLC除了采用开放数据共享署名许可外,还保留了“WorldCat权利和责任”这个合作社区规范。

综上所述,各种开放许可各有其优缺点。CC协议适用范围广泛、使用较为广泛,且已经在澳大利亚等国家的政府数据开放实践中得到认可。但是除了其CC0、CC-BY协议之外,其他协议都会对数据的增值再利用造成阻碍。除去不符合开放标准的三个协议,所有要求相同方式分享(Sharealike)的协议是与商业性应用开发相矛盾的。ODC协议虽然都属于开放范畴,但是仅针对数据库权利,需要对数据库中的独立内容进行单独授权,而且其协议内容较长,非专业人士难以理解。各个国家开放政府许可协议均仅提出“署名”限制,而且专门针对政府数据与信息,但是各国法律体系不一,许可语言用语不一,未能形成通用规范的术语和标识,会对数据的全球范围利用造成一定影响。

表2 部分国外政府数据开放许可协议

四、BT股完善我国政府数据开放许可的思考

目前,政府数据开放在我国有序开展,国家层面的政府数据开放门户也在推进中。政府数据开放不仅需要良好的政策支持,也需要设计良好的许可机制。

(一)树立政府数据开放许可的理念

如前所述,我国目前政府数据开放中的许可机制几乎均为各个地方的自发行为,并未采用任何标准、规范的许可协议,这样极不利于政府数据的增值利用。美国联邦政府出版物、数据都不受版权法约束,数据开放并不需要许可。2007年美国政府发布的《开放数据原则》也指出:“开放数据免于许可(License-Free)。”该原则虽然大幅度促进政府数据的开放,但是也带来许多知识产权问题,因此,美国政府在2013年5月发布的将政务信息状态默认为公开和可机读的新法令中将“免于许可”改为“采用开放许可”,为开放数据许可应用提出了明确要求。[7]

设计良好的规范性开放许可机制对于开放数据的成功非常关键。(1)明确数据利用的权利和义务:利用数据开放许可,可以通过简单的标识或文字告知数据利用者和提供者在数据提供、使用、分享和再利用中的权利和义务,推动政府数据的自由流动和合法利用。(2)简化许可程序:传统版权许可属于间接许可,需要对纷繁复杂的政府信息与数据进行分类区别,运用复杂的版权许可模式进行相应许可后才能再利用。开放许可则简化了许可机制,以简单、自动化、可机读的形式列出权限,直接将许可授予任何想利用它的人,促进政府数据的获取和传播。(3)增加数据可信度:目前开放许可协议的基本限制是“署名”条件,这样可以清晰地让利用者、再利用者了解信息来源,增加利用者对信息质量的认可和信心,进一步提高数据的知晓度和利用率。(4)更大的灵活性:开放许可机制的前提是承认创作者的版权,在此前提下,主张对知识创造成果合法分享、使用与演绎,这与政府部门信息增值和再利用的目标具有高度的契合性。

因此,我国在进行政府数据开发利用的过程中,必须树立“开放许可”的版权理念。开放许可是一类对利用者极少设置利用限制的许可方式,保证利用者自由、免费、非歧视、不限目的地对许可作品进行传播、改编等活动。但是在实际中,开放许可允许一些限制存在,如要求利用方署名所有者、创作者或权利持有人(attribution)、相同方式分享(share-alike)、提供出处(source)、保留版权声明和许可信息(notice)、提出“禁止侵权(non-aggression)”等附加条款等。

(二)我国政府数据开放许可协议的设计建议

本研究认为应该立足我国实际、全球视野,以知识共享许可协议、开放数据共享协议为许可蓝本,借鉴英国、法国、加拿大等国的经验,设计我国专门的政府数据开放许可协议,制定相应的版权许可方案和详细的许可授权操作指南,根据不同数据的特点与数据使用者的性质,划分并授予不同的许可使用模式和类型,实现数据的合理使用与价值最大化。

1.设计原则

政府数据开放是个复杂的问题,开放对象繁杂,并且涉及不同数据库中数据的融合再利用,因此,需要遵循以下原则:

(1)许可协议具有兼容性:大数据时代开放存取的对象主要是关联数据,因此,数据融合再利用要求许可机制必须具有兼容性,即尽可能少设限制。应学习英国、法国、加拿大、新加坡等国,理想的协议应为放弃所有权利或者仅仅提出“署名”要求,提高协议的兼容性。

(2)与国际通用协议接轨:为了避免各国政府数据开放许可协议因语言、法律体系不同造成的阻碍,可以仿效CC协议用特定标识的做法,以及分别提供许可协议的普通文本(即供普通人阅读的简明文字与图示说明)、法律文本(供法律人士看的正式许可条款,详细规定了协议双方的权利义务关系)和技术文本(即数字代码,将许可条款以机器阅读方式呈现出来,方便搜索引擎或其他应用程序辨识出采用了开放许可协议的作品),简化许可程序,支持机器阅读。

(3)与本国的法律、政策体系相一致:开放许可并不是对版权法的颠覆,需要尊重现行的版权政策,需与本国的个人隐私法、信息公开法、信息资源开发利用方面的法律相一致。

(4)适用广义的政府数据范畴。因为政府数据是公共记录、个人信息、版权著作和其他非公开数据的集合。既有研究报告、数据库、地图等因其具有创造性满足版权保护的要求,也有不受版权保护的数据,例如政府调查统计直接收集的数据或其他业务的副产品(如护照申请),这些数据并无创意,不受版权保护。我国虽然没有数据库权,但是著作权法保护汇编作品,一些对数据内容进行选择、编排体现独创性的数据库也在保护范围,因此数据内容(Contents)、数据库体系本身(Database)以及由这些内容与数据库体系生成的作品(Produced Work)都成为许可的对象。[14]这就需要许可协议具有较广的应用范围。

(5)明确数据豁免范围:为了平衡数据价值释放和风险管理的关系,涉及国家安全、商业秘密和个人隐私的数据,以及其他法律法规规定不得开放的数据列入开放豁免清单。[3]

2.许可协议文本框架设计

纵观英国、法国、德国的政府数据开放许可协议,较为简洁明晰,易于操作。其政策文本主要包括:前言、被许可人的权利与义务、许可人的权利与义务、豁免范围、非认可条款、免责条款、管辖法律条款、定义、有关协议的说明等。因此,我国的政府数据开放许可协议政策文本也应围绕这些方面进行设计。范佳佳构建的中国政府数据开放许可协议(CLOD)对政策文本设计的思路值得我们借鉴。[3]总体而言,在数据利用权利方面,许可协议应该符合“开放”标准,授予用户全球范围(worldwide)、免于版权(royalty-free)、永久(perpetual)、非排他性(non-exclusive)的利用,包括商业性利用信息的权利。但“为追踪和监管数据使用行为,政府(许可人)要求用户(被许可人)在新作品中注明数据来源”[3]。在政府管理方面,需要在协议文本中明确政府免责条款、豁免开放数据范围及政府的一些附加性要求(例如数据应用情况备案等)。

(三)完善我国政府数据许可利用的政策法规体系

《促进大数据发展行动纲要》《国家信息化发展战略纲要》《政务信息资源共享管理暂行办法》都为加强政府数据开放利用提供了政策支持,但是政府数据开放存在三个重要前提:信息自由概念的存在、良好的公共部门信息利用法律体系以及明确的有关数据开放许可协议的指导方针。[9]英国、澳大利亚等都在国家层面建立了统一的政府信息资源开发制度框架,对政府信息的公开和利用及其版权归属、国家秘密保护、个人数据保护等各个层面形成法律规范。例如,英国有《信息自由法》《数据保护法》《公共部门信息再利用指令》《英国政府许可框架》等;澳大利亚有《信息自由法》《隐私法》《公共部门信息公开原则》《联邦空间数据访问和定价政策》《澳大利亚统计局与其他机构共享数据的最佳指南》《澳大利亚政府机构知识产权声明原则》《澳大利亚政府知识产权手册》《政府CC许可应用指南》等。

为了进一步推动政府数据开放许可机制,我们还需进一步完善政府数据与信息开发利用的政策法规体系,形成“权属、权利、利用、保护”四位一体的政策法规架构。首先,划清政府数据的开放边界、商用边界、隐私边界,明确政府数据权属,确立政府信息与数据开放获取的立场。其次,形成政府信息知识产权政策与标准体系,明确数据主体(包括数据所指向的特定对象以及数据的收集、存储、传输、处理者等)对数据的控制、使用、收益等权利(如数据知情权、数据采集权、数据收益权、数据共享权、数据救济权等),同时坚持“数尽其用”原则,赋予他人利用数据的权利,并就“个人数据保护”等问题尽快制定专门的法律,构建完善的政府数据开放利用的政策法律制度框架,实现政府数据合法保护与合理利用之间的平衡。[15] 135-157

猜你喜欢
许可权利数据库
版权许可声明
版权许可声明
版权许可声明
我们的权利
本期作者介绍
股东权利知多少(一)
数据库
数据库
数据库
数据库