徐 轩 孙益武
(复旦大学图书馆 上海 200433)(杭州师范大学法学院 浙江 杭州 311121)
英国数据挖掘著作权例外条款研究及其启示*
徐轩孙益武
(复旦大学图书馆上海200433)
(杭州师范大学法学院浙江杭州311121)
数据挖掘是大数据时代重要的科学研究方法。国际图书馆界十分关注数据挖掘相关法律问题的研究,呼吁通过立法而不是以许可方式保障用户的数据挖掘权。英国新修订的著作权法为数据挖掘提供了著作权例外,明确规定例外适用的主体、目的、形式要件及限制,涵盖数据挖掘的完整过程,符合“三步测试法”的要求。我国图书馆界应当加强数据挖掘著作权例外的研究,关注并积极应对出版商关于数据挖掘的政策动向,并推动国际和国内的相关立法。
数据挖掘文本与数据挖掘著作权例外图书馆
对海量数据进行数据挖掘是数字环境下学习和科研创新不可或缺的部分[1]。为顺应科学研究的发展规律,满足国际著作权制度变革的需要,2014年6月英国修订著作权法时新增了数据挖掘例外条款。本文重点探讨英国关于数据挖掘的著作权例外条款,并为我国图书馆界提出若干建议。
1.1定义
数据挖掘(Text and Data Mining,简称TDM),又译“文本与数据挖掘”,是“基于计算机的从文本或数据中提取、组织数据的过程。它通过大量复制素材、提取数据并重组其识别模式、趋势和假设,或通过一定的方式重组挖掘到的信息”[2]。在计算机领域,数据挖掘与“数据库中的知识发现(Knowledge Discovery in Database)”“机器学习(Machine Learning)”等词义相近。本文所研究的“数据挖掘”采用较广义的定义,即“从大量文本与数据中挖掘有趣模式和知识的过程”[3]。
1.2流程
数据挖掘主要分为4个步骤[4]:首先,进行信息检索,收集要分析的目标信息集合;其次,识别目标信息,并将所有信息规范成机器可读的格式以便从中提取结构化数据;第三,利用计算机技术提取有用信息;最后,进行数据分析、测试假设并确定发现新的知识。
其中,获取、分析数据及对结果处理等步骤涉及诸多著作权问题,主要包括:(1)在进行数据挖掘时,研究人员必须以某种格式获取信息,那么研究人员是否有权免费获取或自由使用这些内容或数据,是否需获得数据所有者的许可或授权呢?(2)当使用某种程序或方法进行数据分析时,是否复制了源数据库的完整内容或核心内容?特定种类的挖掘程序或方法是否应禁止或限制?(3)对挖掘结果的处理和利用方式是否合乎法律规定?
在实际操作中,数据挖掘往往是对源数据(数据库)的内容进行复制,同时涉及数据库相关权利、合同法、著作权法等相关规定。英国新修订的著作权法从著作权例外的角度,为非商业性科学研究的数据挖掘提供了例外,充分考虑了数据挖掘流程中涉及的关键法律问题,构建了较为完善的著作权例外体系。
近年来,与数据挖掘相关的著作权议题成为世界知识产权组织(WIPO)“关于教育、教学和研究机构以及其他残疾人的例外与限制”及“图书馆和档案馆相关的例外与限制”两个条约议题的讨论内容,引发各利益相关方的激烈讨论。其中,非洲的集团、图书馆界代表等呼吁应为数据挖掘提供著作权例外。非洲多国代表认为,“应当将通过搜索引擎、自动化知识发现工具或任何目前所掌握或今后发现的其他数字手段对任何合法获取的受著作权保护的作品进行复制和再使用纳入著作权例外的范畴;上述手段包括:存储、归档、链接、数据挖掘程序、数据操作及虚拟科学试验等,但须在合理的可行范围内标明出处。”[5]国际图书馆协会和机构联合会(IFLA)建议将数据挖掘相关内容纳入数字时代图书馆相关例外与限制的国际文书,并在《关于图书馆和档案馆的著作权例外与限制的条约建议稿(4.4版本)》中为数据挖掘的著作权例外设立专门的条款,提出“如果为了分离、提取或便于使用其中所包含的事实或独立信息,应当允许对通过图书馆或档案馆获取的作品或邻接权保护材料进行改编和复制”[6]。
2011年5月,英国学者伊恩·哈格里夫斯(Ia n Hargreaves)发布题为《数字机遇:知识产权与发展的反思》的研究报告,并提出:法律不应限制新技术和工具在研究尤其是非商业性研究中的使用,英国的著作权例外条款已经不能满足社会和技术的变化;而数据挖掘是一种具有代表性的新型研究工具[7]。哈格里夫斯建议:英国政府应当为非商业性研究中的数据挖掘提供著作权例外,并在欧盟层面推动将以商业性研究为目的的数据挖掘亦纳入著作权例外范畴[7]。
在此背景下,2014年6月,英国在其修订的著作权法中新增了关于数据挖掘的著作权例外条款,对数据挖掘的主体、目的、形式等要件作出具体规范,同时明确规定构成著作权侵权的数据挖掘相关行为或情形。
英国在其2014年6月新修订的著作权法第29款“研究、个人学习和基于非商业目的文本与数据分析”中新增了基于非商业目的数据挖掘的例外条款,该条款规定:有权获取作品的主体开展的基于非商业性目的数据分析的复制行为,不构成著作权侵权[8]。条款对于数据挖掘著作权例外适用的主体、目的、形式及限制条件等都作出了明确规定。
3.1主体要件
数据挖掘的著作权例外的主体必须是拥有作品的“合法获取(lawful access)”权利的主体。但条款未明确“合法获取(lawful access)”的具体含义。查阅英国政府的说明文件可知,通常情况下,“合法获取(lawful access)”指的是依法享有的获取作品的权利,途径包括订阅图书或期刊、购买数据库以及遵循创作共同协议等[9]。因此,一般情况下,研究人员(或其所在的研究机构)通过与出版商签订购买合同,依据著作权法相关法律“合理使用”某些作品,或依据“创作共同(creative commons)”等新型许可方式合法获取作品。
3.2目的要件
英国新修订的著作权法规定,数据挖掘的例外适用于有获取权的主体对作品的复制,而复制目的应同时满足仅用于计算分析且基于单一的非商业性目的两个要件[8]。
一方面,这一规定既明确了数据挖掘是对大数据进行分析后发现潜在有用信息的过程这一核心内容,同时将范围限制在利用计算机开展数据处理而进行的复制。另一方面,该例外明确将其适用范围限定在“单一的非商业性目的”内,将商业性研究中的数据挖掘行为排除在外。例如,大学(科研人员)与企业合作开展的商业性研究不属于非商业性研究,不符合“单一的非商业性目的”的要件,因此无法适用于该例外,在开展数据挖掘时应获得所复制的著作权作品权利人的许可。
3.3形式要件
在开展非商业性研究的数据挖掘时,研究人员需通过注明出处等方式对复制的作品表示充分的尊重。如果因可行性或其他原因无法实现时(如因为海量的数据来源无法对原作品一一进行引注),则亦不认为是违反这一形式要件。该要件强调数据挖掘者对所复制作品著作权权利人的精神权利的充分尊重,但因注明所有作品的出处等方式并不切合实际,因此可通过注明大量作品的来源数据库等方式体现尊重。
3.4著作权例外的限制
英国著作权法在赋予著作权例外的同时,明确规定了转让限制、目的限制、交易限制等著作权例外的限制情形。在未取得著作权人授权或许可的情况下,如果将根据数据挖掘著作权例外条款而产生的复制件转让给其他任何主体(转让限制),或其利用复制件的目的超越了计算分析和非商业性研究这两个目的要件(目的限制),或数据挖掘结果用于出售、出租、许诺出售或出租以及为出售或出租而进行公开披露等交易行为(交易限制),均视为对原作品的侵权。
该规定进一步明确了数据挖掘过程中可能存在的构成著作权侵权行为,防止对数据挖掘所产生的复制件及数据挖掘结果的不合理滥用,保证其范围局限在非商业性研究范畴内,确保权利人的权益不受到侵害。
3.5与合同的关系
英国数据挖掘的著作权例外条款明确规定:任何阻止或限制本款中所指的不侵犯著作权之复制的合同条款不具有执行力[8]。该条款阐明了例外条款与合同的关系,确保条款的实施。
本条款重申尊重著作权例外的法定义务,其意义在于确保著作权相关的数据挖掘例外需要得到优先适用,尤其是在其规则与合同义务发生冲突之时。从意思自治①的角度来看,出版商(或数据库商)和图书馆作为市场主体可能对作品的出售、许可和传播设立相应的规则,但这种规则不应突破本条赋予的法定例外。然而,在实践中,由于出版商、数据库商掌握着著作权资源,往往具有较高的议价能力,在谈判中处于强势地位,双方签订的资源采购协议中可能含有限制图书馆行使法定例外的条款。根据英国数据挖掘著作权例外的相关规定,出版商等内容提供者可以采取合理的措施以保持网络的安全性和稳定性,前提是这些措施不应阻止或不合理地限制研究者复制其内容开展基于非商业性目的数据挖掘的行为。限制研究者对其合法获取的文本和材料进行复制以开展非商业性数据挖掘的合同条款应视为无效。
“三步测试法”是目前国际法领域被广泛承认和援引的判定著作权例外合法性的通用法则。其基本内容由《与贸易有关的知识产权协定》(以下简称TRIPS协定)第13条规定,而《世界知识产权组织版权条约》(WCT)第1条的议定声明将其运用范围拓展至数字环境[10],并在欧共体诉美国版权法110(5)节违反TRIPS协定的WTO争端(以下简称美国版权法WTO争端案)中得到运用和确认[11]。“三步测试法”基本内容是,合法设定的著作权例外应当符合以下三个条件:(1)应局限在特定的特殊情形( certain special cases);(2)不与作品的正常使用(normal exploitation)相冲突;(3)不得不合理地损害权利人的正当利益。笔者从“三步测试法”的角度分析英国数据挖掘著作权例外条款制度设计的合法性。
4.1特定的特殊情形
“三步测试法”的第一步是著作权例外应局限于“特定的特殊情形”,美国版权法WTO争端案的专家组认为,这一标准的内涵包括:一是例外应被明确限定,二是例外应被局限在狭窄的范围之内[12]。
英国著作权数据挖掘的例外条款对例外的主体要件、目的要件和形式要件作出了清晰界定,且将例外局限在对作品有合法获取权利的主体所开展的非商业性研究的范围内,排除了商业性的数据挖掘行为,符合“特定的特殊情形”的两层内涵。
4.2不与作品的正常使用相冲突
“三步测试法”的第二步是例外应不与作品的正常使用相冲突。其核心是明确“什么是正常使用”和“什么是不与作品的正常使用相冲突”。美国版权法WTO争端案专家组认为,通常情况下“使用(exploitation)”指的是“为自利的目的而使用”,“正常使用”应被理解为“类型化或标准化的、规则的、典型的、普通的”的利用方式,包含经验因素和规范因素[12],且应同时考虑这两种因素。因此,例外赋予的使用行为必然对著作权保护范围产生某种程度的减损,但是如果这种减损构成对著作权人全部专有权的完全使用,则应认定为与作品的正常使用相冲突[12]。
英国著作权数据挖掘的例外条款设立了例外的限制,明确规定转让行为、超越目的行为、交易行为等与“与作品的正常使用相冲突”而被认定为不适用于该例外的行为,再次明确“基于单一的非商业性目的”等要件,对可能出现的与作品的正常使用相冲突的行为进行预防性规范,防止第三人滥用例外规则同权利人产生经济性竞争[12],保障著作权权利人的利益。
4.3不得不合理地损害权利人的正当利益
由于任何例外都在事实上不可避免地对权利人利益产生某种程度的减损,因此,“三步测试法”的第三步“不得不合理地损害权利人的正当利益(legitimate interests)”的核心是确认这种损害是否在合理范围内。美国版权法WTO争端案专家组认为,权利人拥有经济性权利和精神权利等非经济性权利[12]。从实际操作的角度考虑,虽然正当利益不限于经济价值,但是考察权利人享有的专有权的经济价值仍然是衡量合理利益的保守方法。如果著作权例外造成或可能造成权利人收入的不合理损失,那么对权利人正当利益的损害就达到不合理的程度[12]。
一方面,英国数据挖掘的著作权例外条款仅限于单一的非商业性复制行为且同时规定应该对作品来源进行充分可能的标注;另一方面,规定例外条款不适用于数据复制之后的出售、出租、许诺出售、出租或为了出售或出租而进行的披露行为,从制度上最大程度地保护权利人的经济利益和精神权利,确保著作权例外造成权利人收入的损失控制在合理范围之内。
5.1认识数据挖掘对图书馆的重要意义,加强研究相关法律问题。
大数据背景下,数据挖掘已成为我国图书馆学和业界重要的研究方法和工作内容。网络和网络计量的研究日益成为图书馆学分支文献计量学的研究前沿[13],即利用各种软件、程序对图书馆学专业领域涉及的各种海量数据进行分析和处理,并总结出新的规律。实际工作中,图书馆员对各类数据(如文献利用数据、读者服务数据及学术产出数据等)进行分析和处理,发现潜在的新知识,为机构和政府提供决策支持,成为图书馆事业发展的新领域。
数据挖掘及相关技术在我国许多学科的研究中被普遍应用。为了更好地支持科研创新,促进知识产权保护和信息共享与利用的平衡,减少数据利用过程中的侵权风险,图书馆作为支持学科发展和科研创新的重要机构应当重视数据挖掘法律问题的研究。
我国图书馆界应对以下课题开展研究:(1)图书馆学及业界开展的数据挖掘可能存在的法律风险分析;(2)科研工作者开展的数据挖掘的内容来源、性质和结果处理方式;(3)数据库的权利保护与数据挖掘的著作权风险以及防范机制等。
5.2关注出版商调整数据挖掘政策的动向,积极争取使用资源的合理权利。
图书馆订购的文献资源,尤其是电子数据库,是数据挖掘的重要数据来源。2014年2月,出版商爱思唯尔(Elsevier)更新数据挖掘政策,允许研究人员在开展非商业性研究时对已订购资源进行数据挖掘,同时需通过爱思唯尔提供的在线应用程序接口(Application Programming Interface,简称API)批量下载机器可读的可扩展标记语言(XML)格式文献[14]。数据挖掘的结果可以在“署名和非商业性使用(CC-BY-NC)”许可模式[15]下进行非商业性利用。爱思唯尔已将数据挖掘相关内容纳入或更新至相应数据库采购合同。欧洲研究图书馆协会(Association of European Research Libraries,简称LIBER)认为,爱思唯尔关于数据挖掘的政策可能会限制研究者可以使用的工具、数据挖掘的方法,以及影响研究结果的透明性和再现性,最终可能对图书馆事业的发展和科研创新产生负面影响[16]。
对于出版商的数据挖掘政策,图书馆界应当保持关注,积极应对,对数据库采购中所涉及的权利和例外规则进行合法性分析,从图书馆的角度通过与数据库商的谈判,积极争取非商业性机构合理使用电子资源的权利,防止许可合同中不断增加的限制条款侵蚀图书馆的管理空间和研究者的科研自由,为图书馆的发展和科研进步争取更好的法律保障环境。
5.3完善数据挖掘著作权例外的国内立法,推动相关议题的国际协调。
我国《著作权法》第三次修订草案送审稿重新定义了复制权,即复制权是以印刷、复印、录制、翻拍及数字化等方式将作品固定在有形载体上的权利;并将“数字化”纳入了复制权的范畴[17]。然而,其中“数字化”的概念存在一定的模糊性,数据挖掘中涉及的复制是否可以纳入“数字化”范畴尚未明确,使得我国未来的《著作权法》可能仍然无法回答数据挖掘等数据分析的法律属性,存在一定滞后性。我国《著作权法》第三次修订应充分考虑新技术将对科学研究和个人学习产生的重要影响,将数据挖掘相关的合理使用规则纳入考虑范围。
我国有必要借鉴英国的相关做法,在时机成熟时将有权获取的主体开展的非商业性研究的数据挖掘行为纳入复制权的合理使用范畴。借鉴英国的立法模式,兼顾“三步测试法”的要求,全面考虑相关著作权或数据库保护的例外规则对利益相关方的影响,从数据的获取、利用和结果处理等各环节,建立健全著作权限制与例外条款。
在世界知识产权组织的舞台上,我国图书馆界应积极推动关于“图书馆、教育和科研”的著作权例外的国际文书的谈判和缔结,将数据挖掘等新技术因素纳入数字环境下国际著作权体系革新的框架,将非商业性科研目的的数据挖掘相关内容纳入著作权例外的范畴。
综上,完善国内立法,推动国际协调,将有助于数字时代图书馆提高信息服务能力、充分发挥职能,推动公共资源的有效利用,促进科研创新,构建数字环境下的平衡的著作权法体系。
注释:
①意思自治是指当事人依法享有自愿订立合同的权利,任何单位个人不得非法干预。
[1]IFLA. IFLA Statement on Text and Data Mining [EB/OL].[2015-03-06]. http://www.ifla.org/files/assets/clm/statements/ iflastatement_on_text_and_data_mining.pdf.
[2]UK Government. Text Mining and Data Analytics in Call for Evidence Responses [EB/OL]. [2015-03-06]. http://webarchive. nationalarchives.gov.uk/20140603093549/http://www.ipo.gov. uk/ipreview-doc-t.pdf.
[3]Han Jiawei, Kamber M.数据挖掘:概念与技术 [M]. 范明,孟小峰, 译. 北京:机械工业出版社, 2012:4.
[4]Joint Information Systems Committee. The Value and Benefits of Text Mining [EB/OL]. [2015-03-06]. http://www.jisc.ac.uk/sites/ default/files/value-text-mining.pdf.
[5]WIPO. Provisional Working Document Towards an Appropriate International Legal Instrument (in Whatever Form) on Limitations and Exceptions for Educational, Teaching and Research Institutions and Persons with other Disabilities Containing Comments and Textual Suggestions [EB/OL].[2015-03-07].http://www.wipo.int/edocs/ mdocs/copyright/en/sccr_27/sccr_27 _ref_sccr_26_4_prov.pdf.
[6]IFLA,ICA,EIEL&INNOVARTE. Treaty Proposal on Copyright Limitations and Exceptions for Libraries and Archives (Version 4.4)[EB/OL].[2015-03-07]. http://www.ifla.org/files/ assets/hq/ topics/exceptions-limitations/tlib_v4_4.pdf.
[7]Hargreaves I. Digital Opportunity: A Review of Intellectual Property and Growth [EB/OL].[2015-03-07].https://www.gov. uk/government/uploads/system/uploads/attachment_data/file/ 32563/ipreview-finalreport.pdf.
[8]British Council. The Copyright and Rights in Performances (Research, Education, Libraries and Archives) Regulations 2014 [EB/OL]. [2015-03-08]. http://www.legislation.gov.uk/uksi/ 2014/1372/regulation/3/made#regulation-3-1-a.
[9]UK Intellectual Property Office. Exceptions to Copyright:Research [EB/OL]. [2015-03-08]. https://www.gov.uk/ government/uploads/system/uploads/attachment_data/file/ 375954/Research.pdf.
[10]WIPO. Agreed Statements Concerning the WIPO Copyright Treaty [EB/OL].[2015-03-08]. http://www.wipo.int/treaties/en/ text.jsp?file_id=295456.
[11]朱理. 后TRIPS 时代版权限制和例外的国际标准:WTO 专家组首例版权争端裁决之下的三步测试法及其未来[J].知识产权,2006(1):74-80.
[12]United States — Section 110(5) of US Copyright Act (Complainant: European Communities)Panel Decision[EB/OL]. [2015-04-28]. https://www.wto.org/english/tratop_e/dispu_e/ cases_e/ds160_e.htm.
[13]赵蓉英, 许丽敏. 文献计量学发展演进与研究前沿的知识图谱探析[J]. 中国图书馆学报, 2010(5):60-68.
[14]Elsevier.Elsevier Updates Text-Mining Policy to Improve Access for Researchers [EB/OL]. [2015-03-09].http://www.elsevier. com/connect/elsevier-updates-text-mining-policy-toimprove-access-for-researchers.
[15]Attribution-NonCommercial 4.0 International (CC BY-NC 4.0)[EB/OL].[2015-03-10]. http://creativecommons.org/licenses/bync/4.0/.
[16]Association of European Research Libraries .LIBER Responds to Elsevier's Text and Data Mining Policy [EB/OL]. [2015-03-10]. http://libereurope.eu/blog/2014/03/28/liber-responds-toelseviers-text-and-data-mining-policy/.
[17]国务院法制办公室《.中华人民共和国著作权法(修订草案送审稿)》第13条[EB/OL]. [2015-03-09]. http://www.chinalaw.gov. cn/article/cazjgg/201406/20140600396188.shtml.
Research on UK Copyright Exceptions to Data Mining and Its Enlightenment
Data mining is an important method of scientific research in the big data era. International library community concerned about the legal issues related to data mining, and called for legislation rather than license to guarantee the users' rights of data mining. Newly-revised copyright law of UK provides copyright exceptions to data mining, stipulating the subject, purpose, formal elements and restrictions, when the exception applies, which covers the complete process of data mining, and in line with the requirements of "threestep test". Chinese library community should strengthen relative research, respond to the publishers' policy trends about data mining actively, and promote the improvement of domestic and international legislation.
Data mining; Text and data mining; Copyright exception; Library
G250
B
*本文系教育部人文社会科学研究青年基金项目“基于《马拉喀什条约》视角的图书馆无障碍服务版权制度研究”,项目编号:14YJC870023;上海图书馆学会一般课题“研究型图书馆电子图书阅读推广载体研究”,项目编号:14STX008C的研究成果之一。
徐轩女,1982年生,硕士,现工作于复旦大学图书馆,馆员。
孙益武男,1982年生,博士,现工作于杭州师范大学法学院,讲师。
2015-04-14 ]