司 莉贾 欢 邢文明
(1.武汉大学信息资源研究中心 湖北武汉 430072)
(2.武汉大学信息管理学院 湖北武汉 430072)
(3.湘潭大学公共管理学院 湖南湘潭 411105)
科学数据是人类社会从事科技活动所产生的原始观测数据、探测数据、试验数据、实验数据、调查数据、考察数据、遥感数据、统计数据、研究数据以及相关的元数据和按照某种需求系统加工的数据。随着大数据时代的到来,数据密集型科研的兴起,科学数据已成为不可或缺的信息资源。在相当长时间以来科学数据被认为是由观测仪器自然产生,不属于智力劳动结果,不具有知识产权。但在现今科研模式下,大部分的科学数据在各个处理阶段都凝聚着科学家的智力劳动,包括观测仪器布置、数据模拟方法和数据处理方法等。科学数据不仅是“原材料”,而且具有再利用价值,对其进一步研究会促进知识的新发现。科学数据是一种研究资源,与学术论文和专利处于同等重要的战略位置。目前科学数据具有著作权已经成为共识,然而科学数据的使用存在著作权界定不清及其利益分配不当 (尤其是科学数据二次研发过程中的著作权分配)等问题。本文在分析科学数据著作权保护存在问题的基础上,探讨了相关对策。
著作权法是根据宪法制定,目的是保护文学、艺术和科学作品作者的著作权,以及与著作权有关的权益。当前科学数据著作权保护涉及到数据共享中的授权方式、数据出版及引用、技术措施、制度与法规、科学数据二次利用5个方面。
科学数据的授权是指赋予使用人合法使用科学数据的权利。科学数据授权中存在利益分配问题,不同类型及来源的科学数据需要多样化的授权方式。不同类型和不同来源科学数据的授权方式主要有:①不同类型科学数据的授权方式。科学数据共享有无偿和有偿两种数据共享授权方式。无偿授权方式又可分为非授权完全无偿共享、授权无偿共享、收回服务成本共享。科学数据按用途性质可分为公益性科学数据、战略性科学数据和商业性科学数据。对于基础性公益数据或事实,由于已完全进入公共领域,可采用非授权完全共享方式;对于公益性和战略性科学数据的原始数据和初步加工数据,可采用授权无偿共享方式;对于提供离线服务的公益性科学数据的原始数据和初步加工数据,以及各类数据的精细加工数据,可采用收回服务成本共享方式;而针对商业性科学数据和各类数据的精细加工数据,可采用有偿共享方式;②不同来源科学数据的授权方式。由政府部门监管下收集和维护的科学数据应当对非盈利的商业实体或非独占方式共享的实体开放,如《气象资料共享管理办法》规定各级气象主管机构负责共享气象资料提供工作的单位,应当通过网络适时、向社会发布基本气象资料,供公众无偿下载;由大学、研究机构、研究小组等通过公共基金收集产生的科学数据,当研究成果发布以后,应当公开其研究所依赖或产生的数据资源,实现开放授权。
对于属于保密范围的科学数据应当遵守相关法律规定,如保密数据应当严格遵守《中华人民共和国保守国家秘密法》、《中国人民共和国科学技术保密规定》以及其他相关部门颁布的保密规定。科学数据授权使用中的公共利益应与对国家安全、个人隐私和著作权保护的合法考虑取得平衡。如寒区旱区科学数据中心规定,从数据中心获取的数据如属数据保密范围,用户须与“寒区旱区科学数据中心”签署保密协议,并有义务遵守国家相关法律法规,如出现问题,用户承担完全责任。
2.2.1 数据出版中的著作权保护
科学数据出版是指将数据作为一种重要的科研成果,从科学研究的角度对科学数据进行同行审议和公开公布,创建标准和永久的数据引用信息,供其他研究性文章引证。数据出版是一种全新的数据共享机制,既可以解决数据知识产权保护问题,又可以推动数据的共享和再次利用,通过数据出版能充分体现数据的署名权。科学数据出版为科学数据的使用者提供了获取利用数据的渠道。对科学数据的产出者而言,能够帮助其在学术交流和出版体系获取应得的学术声望,以及相关的知识产权、版权等权益。
数据出版涉及数据提交、同行审议、数据发布和永久存储、数据引用和影响评价5个基本环节,目前科学数据出版面临数据出版动力不足的问题。其原因是科学数据未被纳入科研评价体系,导致研究者不愿意共享科学数据。作者在论文投稿时,期刊社应该要求研究者连同研究过程中的重要科学数据一同提交,经过专家审核,若论文被录用,期刊社则让研究者将科学数据按照一定的标准上传到指定的数据中心,之后再进行论文发表及数据出版。论文应与数据关联,无论是数据库中的电子文档或纸质文献,都应提供准确的数据链接,方便用户查看研究过程中的数据。同样,数据中心的数据也应提供对应文献的链接。目的是使整个科研过程更加完整地体现出来。如Dryad提供免费的提交集成服务,允许期刊出版商将数据提交到Dryad,确保文章和数据的双向链接,增加两者的可见度。另外,可以利用数据利用指标对出版数据进一步评价,如数据访问量、下载量和引用次数等具体评价指标,制定合理的评价指标,将科学数据纳入科研评价体系,从而解决数据出版动力不足的问题。
2.2.2 数据引用中的著作权保护
数据引用促进学术信誉和规范性,对数据贡献者的著作权进行了保护。数据引用是数据出版的重要环节,也是体现数据署名权的最佳方式。
目前,在数据引用中主要存在数据不引用的问题。面对数据使用者故意不标注的行为,数据提供者可明确提出要求数据使用者在发表成果中对数据进行引用,也可通过评审专家、期刊编辑、数据中心的引导或强制要求,更有效地规范作者在参考文献部分对数据进行引用;同时也需增强数据使用者的著作权意识,尊重他人创作成果。针对版权信息不清楚的科学数据资源,数据中心在收集和整理数据时应有意识地收集数据的版权信息,便于数据用户引用。如寒区旱区科学数据中心使用条款与免责声明中,要求用户对数据进行引用时需标明数据来源,并提供了数据引用的规范。其第二条规定:为保障数据开发者的著作权,用户在使用全部或部分“寒区旱区科学数据中心”所提供的数据的基础上产出的研究成果中(包括公开发表的论文、论著、数据产品和未公开发表的研究报告、数据产品、系统开发等),须在相关成果的显著位置上明确注明数据来源。除对数据来源署名有特殊要求以外,用户须依据以下规范注明数据来源:中文成果:“数据来源于寒区旱区科学数据中心(http://westdc.westgis.ac.cn)。”英文成果:“This data set is provided by Cold and Arid Regions Science Data Center at Lanzhou(http://westdc.westgis.ac.cn).”; 在使用 Dryad 数据仓储提供的数据时,需要同时对原始出版物和数据包进行引用。
另外,在数据引用过程中,也应注意数据引用规范不标准和数据引用地址易变等问题。
对数据引用规范不标准的问题,数据中心应制定并提供规范化的数据引用格式,如基础科学数据共享网项目组于2012年3月制定了《科学数据引用规范》。 吴立宗等提出了分别针对完全自主版权的数据、再加工数据、与正式出版文章相关的数据、来源信息不清晰数据的典型引用格式;对数据引用地址易变的问题,可采用数字对象唯一标识符(DOI),其能够解决互联网环境下数字资源的多重链接和版权转移问题,出版社和编辑部应推广DOI的使用等。
计算机技术与网络技术的发展为数据资源知识产权保护提供了技术支持。针对数据库及其服务系统安全,采用计算机安全技术加以保障,可以防止相关的著作权遭受不法侵犯,有效地保护科学数据资源的安全。
目前可采用防火墙技术、数据加密技术与软件加密技术、数字水印技术、认证技术、访问控制技术等技术措施来进行科学数据资源的著作权保护。如Creative Commons是美国一家为作者、科学家、艺术家、教育家提供“创作共享”的著作权认证的机构,只需计算机操作便可在“保留全部权利”、“保留部分权利”到“完全公开”中自主选择其权利范围和认证机制。其许可协议有6种组合方式:署名、署名-相同方式共享、署名-禁止演绎、署名-非商业性使用、署名-非商业性使用-相同方式共享、署名-非商业性使用-禁止演绎。访问控制是实现安全策略的系统安全技术,它管理所有资源的访问请求,即根据安全策略的要求,对一个资源访问请求做出是否许可的判断。它能够有效防止非法用户访问系统资源和合法用户非法使用资源。数字水印技术应考虑将版权信息映射为无意义水印信息的方式进行表达。任娜针对网络环境下瓦片数据非法下载、违法使用等安全问题,提出了一种改进的瓦片数据水印算法,实现适用于瓦片数据的版权保护系统。
目前,我国尚未将科学数据纳入著作权保护的范围,这导致科学数据得不到有效保护。应尽快建立科学数据著作权保护的制度与法规。可从以下方面推进科学数据著作权的保护。
(1)将“取得授权”纳入到科学数据著作权保护的制度中。数据授权是数据生产者在将数据发布到数据中心(或出版社)之前所作的数据版权声明和分割。其中,保密数据的共享,应当严格遵守《中华人民共和国保守国家秘密法》、《中国人民共和国科学技术保密规定》和其他相关部门颁布的保密规定,以及公有领域数据和开放获取数据不用取得授权,除此之外,作者应在将数据发布到数据中心之前对数据的使用对象和要求做出相关明确规定,数据中心作为中介将数据提供给符合条件的数据用户,负责将数据生产者对数据用户的各项要求准确传达,并与用户签署具有法律约束力的共享协议文件,数据中心有义务向数据生产者通报数据共享情况;或者是数据中心让数据生产者参与数据申请审批过程,使他们在了解用户将把数据用于何种用途的基础上决定是否给予提供。
(2)完善科学数据的标准体系。建立负责科学数据标准化的机构,从事科学数据标准化工作,制定科学数据标准、技术标准和方法标准;对国家投资产生的科学数据,必须按照科学数据标准进行提交;对企业或个人投资产生的科学数据,采取激励措施鼓励其实现科学数据标准化,或者在科学数据共享之前,提交给国家有关机构进行数据标准化工作,支付一定的标准化费用。
(3)建立利益协调机制。著作权专有性和科学数据共享性的冲突属于非完全对抗性冲突。权利人之间的利益能够通过协调的方式进行解决。科学数据共享过程中应协调好科学数据投资者、数据创造者以及数据用户之间的利益关系。关于建库单位和数据中心的数据利益协调问题,可参照《中国科学院数据应用环境建设与服务项目组》制定的《科学数据共享办法》中第八章关于数据使用与产权保护的条款。如第三十二条规定“通过建库单位共享服务平台获得的有偿服务收益归建库单位所有。通过科学数据中心共享服务平台进行有偿数据服务而获得的收益在科学数据中心和相关建库单位之间按照合同约定进行分配,如无合同约定的自行协商解决。”第三十三条规定“得到数据(库)所有者许可,科学数据中心有权联合建库单位对项目产生的数据或数据库开发数据产品,提供增值服务。由此得到的回报和利益在参与开发(服务)者和数据生产者或提供者之间进行合理的分配,具体分配方法由涉及方以合同的形式确定。”
科学数据与传统文献的区别之一在于其有二次利用价值。从不同的角度对科学数据进行分析会产生不同的结果,对不同来源的科学数据进行研究也可能有新收获,更加利于科学创新。数据集成和二次加工必然要对不同来源和版权的数据进行处理,涉及处理后数据和原始数据的知识产权关系等问题。目前国际上尚没有得到普遍认同的处理方式,亟待深入研究。数据的分发权和再编译权一定程度上会妨碍数据共享和二次加工,一般建议数据作者放弃这两项权利。数据发布前,编辑部一般要求数据作者签署数据授权协议,明确声明放弃数据的再编译权和发布权。另外,创作共用协议零权利声明(Creative Commons Zero,CC0)和公有领域贡献与许可协议(Public Domain Dedication and License,PDDL)均采用弃权方式解决数据及其衍生品的复杂权利问题。
本文从数据共享中的授权方式、数据出版及引用、技术措施、制度与法规、科学数据二次利用5个方面分别探讨了科学数据著作权保护存在的问题及对策。科学数据授权时应考虑对不同类型及来源的科学数据给予不同的授权方式;数据出版面临动力不足,数据引用中主要存在数据不引用等问题;可采用防火墙技术、数据加密技术与软件加密技术、数字水印技术、认证技术、访问控制技术等技术措施来进行科学数据资源的著作权保护;尽快建立科学数据著作权保护的制度与法规:如将“取得授权”纳入到科学数据著作权保护的制度中,完善科学数据的标准体系及建立利益协调机制;科学数据二次利用时涉及处理后数据和原始数据的知识产权关系等问题。我国需要借鉴国外经验,适应新兴知识产权机制(如Creative Commons和Science Commons licensing)以及传统著作权法,结合我国知识产权保护法、著作权法、专利法和中华人民共和国政府信息公开条例等已有法规条例,建立完善的科学数据著作权保护体系。
[1] 潘小多,李新,南卓铜,等.科学数据文档的研究[J].中国科技资源导刊,2010(3):30-35.
[2] 吴立宗,南卓铜,王亮绪.科学数据出版--促进数据共享的一种新模式[J].中国科技资源导刊,2014,46(5):72-78.
[3] 探索建立科研数据利用及知识产权共享机制[EB/OL].[2015-04-08].http://www.agridata.cn/dynamic/progressdetails.aspx?page_par=44.
[4] 朱雪忠,徐先东.浅析我国科学数据共享与知识产权保护的冲突与协调[J].管理学报,2007,4(4):477-482,487.
[5] 中华人民共和国著作权法[M].北京:人民出版社,2010.
[6] 刘润达,孙九林,廖顺宝.科学数据共享中数据授权问题初探[J].情报杂志,2010(12):15-18.
[7] 科学数据共享办法[EB/OL].[2015-04-07].http://www.csdb.cn/upload/101205/1012052023376830.pdf.
[8] 气象资料共享管理办法[EB/OL].[2015-05-12].http://cdc.nmic.cn/gxzc.do?method=getContent&typeId=22.
[9] 寒区旱区科学数据中心:使用条款与免责声明[EB/OL].[2015-05-11].http://westdc.westgis.ac.cn/about/terms.
[10] 吴立宗,王亮绪,南卓铜,等.科学数据出版现状及其体系框架[J].遥感技术与应用,2013(3):383-390.
[11] 袁曦临.E-science环境下学术规范的新领域:科学数据[J].甘肃社会科学,2014(3):85-88.
[12] Submission integration[EB/OL].[2015-07-21].http://datadryad.org/pages/submissionIntegration.
[13] 李红星,王亮绪,吴立宗,等.中国西部环境与生态科学数据中心的数据服务理念与成效[J].遥感技术与应用,2013(3):370-376.
[14] datadryad[EB/OL].[2015-07-06].http://datadryad.org/resource/doi:10.5061/dryad.1455.
[15] 科学数据引用规范[EB/OL].[2015-04-08].http://www.nsdc.cn/upload/120822/1208220929441440.pdf.
[16] 吴立宗,王亮绪,南卓铜,等.DOI在数据引用中的应用:问题与建议[J].遥感技术与应用,2013(3):377-382.
[17] 刘细文,熊瑞.国外科学数据开放获取政策特点分析[J].情报理论与实践,2009(9):5-9,18.
[18] About The Licenses[EB/OL].[2015-07-07].http://creativecommons.org/licenses/.
[19] 陈建孝,郭少杰,张志强,等.访问控制模型在科学数据共享平台的应用研究[J].科技管理研究,2010(17):210-212,237.
[20] 任娜,朱长青,任树敬.瓦片数据版权保护方法及应用研究[J].地球信息科学学报,2012,14(6):693-697.
[21] 徐先东,朱雪忠.知识产权专有性与科学数据共享性的冲突研究[J].武汉理工大学学报,2007,(7):164-167.
[22] 谷秀洁,李华伟.从Pandon原则看科学数据的法律属性与开放利用机制[J].图书情报知识,2012(4):88-94,102.
[23] Data Citation Standards and Practices[EB/OL].[2015-04-10].http://www.codata.org/task-groups/data-citation-standardsand-practices.