唐思慧
大数据环境下文本和数据挖掘的版权例外研究
——以欧盟《DSM版权指令》提案为视角
唐思慧
大数据时代,文本和数据挖掘技术的广泛应用打破版权法构建的利益平衡机制,给我国著作权法带来了挑战,亟需调整。美国的应对是从默示许可转到无条件例外规则,而欧盟《DSM版权指令》提案以义务式的模式规定了“科学研究领域的文本和数据挖掘”例外规则,对科研促进及对版权保护力度适中,值得借鉴。我国著作权法修改应制定“文本和数据挖掘合理使用规则”,严格限制适用条件,重构利益平衡机制。
大数据 文本和数据挖掘 版权例外 利益平衡
大数据时代,数据的产生、收集、储存日益规模化,运用文本和数据挖掘技术从海量数据中发掘有用信息成为数据产业乃至科技创新的重要支撑。而文本和数据挖掘涉及对大量受版权保护客体的复制、使用,这打破了版权法所构建的利益平衡机制,亟需调整并应对。欧美国家所采取的因应措施值得借鉴。
文本和数据挖掘(Text and Data Mining,以下简称TDM)是指从大量文本数据中发掘信息和知识的计算机处理技术。《欧盟数字化单一市场版权指令》提案(以下简称《DSM版权指令》提案)将TDM定义为:“为了获取模式、趋势、相关关系等信息而对数字格式的文本与数据采取的任何自动化分析手段。”也有认为:“从机器的可读资料中提取有价值信息的过程,涉及对资料的大量复制、数据的提取以及数据的整合,从而识别出特定模式。”作为一种复杂的自动化处理技术,TDM包括多个阶段的计算机技术,初始阶段如对文本数据的复制、提取,后续阶段如对复制结果的处理、分析等,最终目的是发现规律或者趋势。其流程为获取信息来源、转换数据格式、载入数据、分析数据、形成报告。①参见樊佳怡:《欧盟有关文本和数据挖掘的法律框架》,载《信息资源管理学报》2016年第1期,第12–16页。
以往的知识发现过程建立在定量、采样的数据基础上,因此能做到对这些少量数据进行精确分析。TDM技术则实现了从依靠少量的数据样本到分析与事物相关的所有数据,从追求精确性到接受数据的纷繁复杂,从探求难以捉摸的因果关系到关注事物间的相关关系。②参见[英]维克托•迈尔—舍恩伯格、肯尼思•库克耶著:《大数据时代》,盛杨燕、周涛译,浙江人民出版社2013年版,第29页。TDM挖掘者利用自动化手段对海量的文本、数据进行复制、提取,将复制提取的结果(包括结构化数据、非结构化数据和半结构化数据)转换成能够被计算机处理的结构化数据,再进行分类、比较、解析等,最终得到分析总结报告。
(一)大数据环境下TDM技术的特征
TDM技术作为大数据时代重要的分析工具,具有以下新特征。
第一,主体的特殊性。TDM需要利用自动化技术(如网络爬虫,针对非结构化、半结构化数据的转换技术等)对文本和数据进行抓取、复制、处理、比较、分析,因此,挖掘主体需具备一定技术和物质条件,一般以非自然人的组织机构形式存在,如大学、图书馆或者其他研究机构等。
第二,复制范围广泛。TDM结果的质量很大程度上取决于采取样本的范围,传统的采样方式不再适应于对海量数据的挖掘,TDM采用“样本=总体”的全数据模式,利用自动化技术能够复制、提取所有与主题相关的文本数据。
第三,无法辨识被挖掘对象的权利状态。TDM作为自动化技术,只能根据人工设置的指令运行,本身并不能主动识别被挖掘对象的权利状态,如享有版权的主体、被挖掘文本数据是否受版权保护等。
第四,挖掘结果具有巨大价值。“数据就像一个神奇的钻石矿,当它的首要价值被发掘后仍然能不断给予……绝大部分都隐藏在表面之下”③[英]维克托•迈尔—舍恩伯格、肯尼思•库克耶著:《大数据时代》,盛杨燕、周涛译,浙江人民出版社2013年版,第127页。,数据的价值是“取之不尽,用之不竭”,而TDM就是发掘数据潜在价值的重要工具。通过自动化技术能及时有效地实现对数据的重组利用、再利用,得到所需的模式、趋势、相关关系等信息,这些在商业、科研、教学、社会管理中作用巨大。
(二)TDM技术对版权法的利益平衡机制的打破
互联网的开放、交互、共享等特性使作品的传播和获取简易化、多样化,使得“样本=总体”的全数据模式成为可能,海量文本和数据通过TDM技术被复制和提取,其中存在大量受版权保护的客体,这面临版权侵权的危险,主要问题有:
第一,TDM技术合法性存疑,易陷入侵权争议。一方面,TDM受版权或数据库权的限制,在大多数国家未制定相应的版权例外规则的情况下,因TDM技术导致的纠纷,往往只能判断其是否符合已有的版权例外规则。另一方面,关于合法访问是否默许TDM行为,亦存在较大的争议:以出版商为代表的权利人一方认为机构付费订阅的内容只包括缓存、阅读、打印以及在PDF文档中进行检索的权利,而不包括文本和数据挖掘;以研究人员为代表的挖掘者一方认为“有权阅读即有权挖掘”,不需要权利人再授权。④Peter Murray-Rust, The Right To Read Is The Right To Mine[OL].[2017.2.21]. https://blog.okfn.org/2012/06/01/the-right-to-read-is-the-rightto-mine/.
TDM技术在基础阶段通过自动化手段来完成对海量文本数据的复制提取。在对文本数据进行复制提取时,计算机无法识别挖掘对象的权利状态;由于TDM技术的隐秘性,权利人往往难以知晓自己权利受到侵害;加之网络技术的发达使得信息产生、传播复杂化、多样化,作品的权利主体难以确定;被复制对象的数量庞大,获取权利人授权的成本高昂。这些因素使得挖掘者通常不经过授权就对文本数据进行挖掘,易陷入侵权争议。
第二,市场和社会层面的利益冲突凸显。在版权市场中,一方面,TDM技术涉及对作品、数据库的复制、提取,权利人希望通过版权法来规制TDM,通过作品获取更多利益;另一方面,作为挖掘者,在版权法未赋予TDM版权例外规则的情况下,版权保护则构成实施TDM技术的障碍,而获得权利人许可往往成本高、程序繁杂,挖掘者则希望尽量降低获取、使用作品的成本。在社会层面上,在法律赋予TDM合法性之前,未经授权进行TDM意味着版权侵权;而大数据时代,TDM技术将是科研创新的重要支撑,在其价值性日益凸显的背景下,严格保护版权意味着TDM技术应用的举步维艰,私权保护和社会公共利益之间的冲突日益凸显。
(三)TDM技术给我国著作权法带来的挑战
一般而言,实施TDM技术的主体通常为具备科学研究能力的科研机构,包括大学、公共图书馆等非营利性法人或者其他非法人组织,也包括商业研究所、商业公司等营利性法人;TDM技术挖掘的对象是包括作品在内的海量数字文本内容,TDM的初始阶段涉及对作品的大量复制,后期涉及对作品、数据或信息的使用、分析与应用。
我国《著作权法》第10条第1款第(五)项明确规定著作权人对其作品享有复制权,并将复制定义为:以印刷、复印、拓印、录音、录像、翻录、翻拍等方式将作品制作一份或者多份的行为。在未经著作权人同意的情形下,利用TDM技术复制作品就构成对复制权的侵犯。TDM技术所涉及的复制行为能否适用著作权法中的合理使用或者法定许可规则?《著作权法》《信息网络传播条例》中没有明确规定TDM技术的著作权例外规则,涉及科学研究的例外制度分别是《著作权法》第22条的个人使用和科研教学使用(分别为该条第1款第(一)项;第(六)项)、《信息网络传播条例》第6条第3款,而法定许可并不涉及TDM技术。由于TDM的实施主体通常是有科研能力的研究机构,而个人使用的主体限于个人,或者扩展到其家庭,⑤吴汉东著:《知识产权法》,法律出版社2014年版,第100页。但不能扩展到单位,因此个人合理使用不能适用于研究机构;TDM运用自动化手段,对大量文本数据进行复制、提取,而科研教学使用将使用方式限制为“少量翻译或者复制”和“提供少量”,因此科研教学使用条款也不能适用于TDM技术。
综上,TDM不能适用合理使用或者法定许可规则,经授权才能赋予研究机构对作品进行TDM的合法性。大数据环境下,TDM技术的普及、应用引发的问题日益凸显,亟需立法予以规制,作出前瞻性安排。欧美的因应措施值得关注。
(一)美国:从默示许可到无条件例外——以Google Books案为线索
Google Books项目是指谷歌公司将大学图书馆等提供的书籍扫描数字化,然后在互联网上发布、向用户提供书籍的电子检索。Google Books项目通过复制纸质或数字作品,形成数据库,并建立“Google Books”搜索引擎,用户通过输入搜索关键词或者短语,能够得到数据库里面包含关键词或短语的所有书籍,以及这些词语在每本书中出现的次数。谷歌公司在Google图书馆项目中使用“ngrams”搜索工具,向用户提供几个世纪以来词语和短语的使用频率的统计信息,用户可以获得不同时期、不同语言地区对相关词语的使用频率,从而辨别社会就某一主题的兴趣变化;研究者还可以从大量谷歌扫描的图书中搜索到“词语频率、句法模式和主题标识”,从中发现术语、语法和文学风格的变迁。从Google Books项目复制书籍,到提供检索服务,最后通过对用户的历史搜索记录进行统计分析,得出某个主题或者领域的变化趋势,构成一个完整的TDM过程。
2005年9月,美国作家协会以及几位作家对Google网站提起集体诉讼,要求谷歌公司赔偿损失以及停止侵权。随后,美国五大出版社向Google提起了停止侵害诉讼。双方当事人于2009年11月13日达成和解协议,即《Google Books和解协议》。该协议中,谷歌公司可以不经版权人的事先授权而对受版权保护的图书进行数字化,并就其内容对外提供检索服务,而版权人则可决定其图书在线显示内容的多少和销售价格的高低,并可决定是否将其图书撤出谷歌数字图书馆。
显然,《Google Books和解协议》中采取了“默示许可”规则,实质上推定了权利人的事先授权,文本和数据挖掘者可以跳过授权这一环节而对其文本内容进行复制、提取,权利人可获得报酬以及随时决定是否撤回其授权许可。然而该案后续的审理结果并未采纳《Google Books和解协议》中的“默示许可”方案。
美国上诉法院于2015年10月16日作出判决,认定Google Books项目属于合理使用,案件被上诉到联邦最高法院,联邦最高法院于2016年维持原判。在上诉法院的判决中,法官根据《版权法》第107条合理使用规则予以综合考量:(1)使用的目的和性质,包括是否具有商业性质还是非营利的教育目的;(2)享有版权的作品的性质;(3)与享有版权的作品整体相比所使用部分的数量和实质性;(4)使用对享有版权的作品的潜在市场或价值的影响。最终认定谷歌未经授权对受版权保护著作加以数字化,设置搜索功能以及片段浏览功能属于非侵权的合理使用行为,其复制的目的具备高度转换性,文本仅作有限公开,其展示行为不会造成对原作品市场的替代,谷歌的商业性质不能作为排除合理使用的正当理由。
可见,在实践中认定TDM是否属于合理使用时,版权法并未规定具体的限制条件,而采用典型的因素主义,法官只需考量TDM行为是否符合四因素,这种认定方式可称为“无条件例外”模式。
(二)欧盟:有条件的版权例外
对文本和数据挖掘,也有在版权法中确立TDM版权例外制度,并严格限定其适用条件,可称为“有条件例外”模式,这典型体现在欧盟的《DSM版权指令》提案中。2016年9月14日,欧盟委员会发布了《DSM版权指令》,提案以义务式的模式规定了“科学研究领域的文本和数据挖掘”例外。
1.欧盟TDM版权例外规则的艰难抉择:基于比例性考察
欧盟现有的科学研究版权例外规则不适用于TDM,欧盟多样的许可实践产生不必要的交易费用以及单一市场法律制度不统一,导致TDM在欧洲科研中发展速度缓慢。⑥《Commission Staff Working Document Impact Assessment on the Modernisation of EU Copyright rules》,p125.对此欧盟曾提出四种解决方案:方案一:增强行业自律举措,而不改变欧盟法律框架;方案二:为非商业性科学研究制定TDM版权例外规则;方案三:针对公共利益研究组织进行的非商业性或商业性科研制定TDM版权例外规则;方案四:针对任何合法访问的主体(包括公共利益研究机构和商业研究机构)进行的商业目的或非商业目的科研制定TDM版权例外规则。
欧盟委员会将上述方案的效益、成本、对利益相关者的影响以及社会、基本权利的影响进行了对比,如表1所示,其中(0)表示中性评价或者无影响,(+)表示有一定积极影响,(++)表示有较强积极影响,(–)表示有一定消极影响,(– –)表示有较强消极影响。
表1 欧盟解决TDM问题的四种方案对比
⑦ Public-Private-Partners,公私合作关系。
续表1
方案1主张不做立法调整,其余三种方案主张制定TDM版权例外规则,这三种方案主要在受益主体和科学研究目的方面存在差异:方案2和方案4的受益主体既包括商业性的研究机构也包括公益研究机构,方案3只包括公共利益研究机构;方案2只允许非商业性的科学研究,而方案3和方案4允许商业性和非商业性的科学研究;方案3能够有效保证TDM的法律确定性,降低研究人员的交易成本,对出版商的TDM许可市场的影响也比较小,而且出版商付出的合规成本也较少。而方案1不能保证TDM的合法性,方案2不能确保PPPs项目中TDM的合法性,方案4给权利人带来高昂的成本同时还严重影响TDM许可市场。因而欧盟提案最终采用方案3,以期达到最佳利益平衡。
2.欧盟TDM版权例外规则的具体内容
《DSM版权指令》第3条⑧《DIRECTIVE OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on copyright in the Digital Single Market》Article 3:1. Member States shall provide for an exception to the rights provided for in Article 2 of Directive 2001/29/EC, Articles 5(a) and 7(1) of Directive 96/9/EC and Article 11(1) of this Directive for reproductions and extractions made by research organizations in order to carry out text and data mining of works or other subject-matter to which they have lawful access for the purposes of scienti fic research.2. Any contractual provision contrary to the exception provided for in paragraph 1 shall be unenforceable.3. Rightholders shall be allowed to apply measures to ensure the security and integrity of the networks and databases where the works or other subject-matter are hosted. Such measures shall not go beyond what is necessary to achieve that objective.4. Member States shall encourage rightholders and research organizations to de fine commonly-agreed best practices concerning the application of the measures referred to in paragraph 3.明确了文本和数据挖掘的版权例外规则,以义务式的模式规定成员国须在国内法进行转化,“成员国应对第2001/29/EC号指令第2条,第96/9/EC号指令第5(a)和7(1)条和本指令第11(1)条规定的权利作出例外规定:研究机构以科学研究目的,为了对合法访问的作品或其他客体进行文本和数据挖掘,可以采取复制和提取行为。”其构成要件为:
(1)行为主体:公共利益研究机构。《DSM版权指令》提案第1条将其定义为:大学、研究所或者其首要目标是开展科学研究或提供教育服务的组织。此类研究机构必须基于非营利性目的而研究或将其利润再投资于科研活动中,或者为了完成公益项目而进行研究。⑨《DIRECTIVE OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on copyright in the Digital Single Market》Article 1:(1) ‘research organisation’ means a university, a research institute or any other organisation the primary goal of which is to conduct scientific research or to conduct scientific research and provide educational services:(a) on a non-for-profit basis or by reinvesting all the profits in its scientific research; or(b) pursuant to a public interest mission recognised by a Member State; in such a way that the access to the results generated by the scientific research cannot be enjoyed on a preferential basis by an undertaking exercising a decisive influence upon such organisation.此项例外主要目的是为了促进科学研究,原文将科学研究、教育服务用“and”相连接。本文认为仅提供教育服务的机构不属于这里的研究机构,因为《DSM指令》第4条已单独针对教育服务规定了“在数字和跨境教学活动中使用作品和其他客体”的版权例外条款。
(2)行为目的:科学研究目的,包括商业性和非商业性的科学研究。欧盟在议定文本和数据挖掘时,曾提出三种方案:仅允许非商业性科学研究目的;允许非商业性和商业性科学研究目的,但限制商业性科学研究受益人的范围;允许非商业性和商业性科学研究,不限制受益人范围。欧盟最终优选第二种方案。
科学研究目的包括非商业性研究和商业性研究。该项例外条款的适用主体为公共利益研究机构;公共利益研究机构进行商业性研究,既可独立完成,也可通过PPPs框架完成,但研究机构必须将商业利润再投资于科研活动中。
(3)行为方式:“reproductions and extractions”明确研究机构的行为方式为复制和提取。但这些行为只是文本和数据挖掘的基础阶段,其后续阶段还包括对复制、提取结果的转化、处理以及分析等,这些后续阶段的行为是否仍然能够适用TDM版权例外规则?若不能适用,那么后续阶段的处理、分析行为是否受到改编、汇编、翻译等权利的限制呢?若研究机构进行复制、提取之后,并未将其结果用于TDM,那么此时能否继续适用TDM版权例外规则?
本文认为,条文中既然仅明确复制和提取行为的合法性,那么例外规则就不能适用于TDM的后续阶段。在TDM的后续阶段将复制提取结果转换成结构化的数据,再对其进行分类、比较、解析等,最终得到全新的内容,并不能体现出原有作品或数据库的内容或者表达方式,因此TDM后续阶段不涉及对作品或数据库的演绎、汇编。研究机构只能将复制提取的结果用于TDM,若是将复制提取的结果作其它用途,就不受TDM版权例外规则的保护。
(4)行为对象:合法访问的作品或者数据库。此处的合法访问包括经过权利人的授权⑩如果授权范围已经包括对文本内容的复制,则不必适用TDM版权例外规则,若授权范围不明确或者权利人禁止复制,才可能适用例外规则。或者访问内容对外公开。条文否定了“有权阅读就有权挖掘”这个命题,因为研究机构合法访问之后就已经获得了阅读的权利,但仍需要通过TDM版权例外来赋予复制和提取行为合法性,就说明有权阅读并不代表有权挖掘。
(5)限制的权利:对作品的复制权、对数据库的全部或部分的复制权、防止对数据库内容的全部或经定性或定量证明为实质部分进行撷取权利、新闻出版物的出版者的复制权。
(6)与合同的关系:该项例外规定是强制性例外,任何违反例外规定的合同条款都无效,在欧盟的现有版权许可市场中,版权人往往在许可合同条款中排除例外规则的适用,[11]《Proposal for a DIRECTIVE OF THE EUROPEAN PARLIAMENT AND OF THE COUNCIL on copyright in the Digital Single Market》,p117.而《DSM版权指令》提案一旦通过,意味着此类合同条款无效,这能够保障TDM例外规则的有效实施。
(7)对权利人的保护:权利人可以采取必要措施,确保承载作品或其他客体的网络和数据库的安全性和完整性,而且权利人和研究机构可以共同协商采取最佳措施,这项规定能够有效防止他人恶意破坏网络或数据库。
采用“有条件例外”模式的还有英国2014年最新版权法修改案,其增设了文本与数据分析的例外条款,在原条文“科学研究与个人学习的例外”条款之下增设了第29A条,“用于非商业性科学研究的文本与数据分析所需的复制”[12]《Copyright, Designs and Patents Act 1988》,29A Copies for text and data analysis for non-commercial research:(1) The making of a copy of a work by a person who has lawful access to the work does not infringe copyright in the work provided that—(a) the copy is made in order that a person who has lawful access to the work may carry out a computational analysis of anything recorded in the work for the sole purpose of research for a non-commercial purpose, and(b) the copy is accompanied by a sufficient acknowledgement (unless this would be impossible for reasons of practicality or otherwise).,在明确文本和数据挖掘行为合法性的同时,限制其适用条件为非商业性的科学研究。《新加坡版权法》公众征求意见稿也规定了TDM例外规则。
比较而言,“默示许可”的成本高、对科研活动的促进作用较低,权利人仍能控制文本内容;“无条件例外”模式成本最低,版权保护力度最弱,但易导致例外规则的滥用及盗版内容泛滥,对科研活动的作用未知;“有条件例外”模式中,成本、对科研的促进及对版权的保护力度都处居中位置。
在著作权领域,作品载体不再局限于纸质文档、光盘或CD,作品的数字化、电子化日益普遍且方兴未艾。TDM技术能实现对海量数据的获取、处理和分析,其带来版权保护问题亟需法律调整。
(一)TDM著作权例外规则的模式选择:基于利益平衡的分析
1.应对TDM的可选方案
结合国际最新立法与司法实践,我国可采用以下方案:“默示许可”方案、“解释兜底条款”及“制定TDM合理使用规则”。
默示许可是指作品使用人虽然没有得到著作权人的明示授权,但是通过著作权人的行为可以推定著作权人不排斥他人对其作品进行利用,作为一种补偿,使用人应当向著作权人支付报酬的一种著作权许可使用方式。[13]冯晓青、邓永泽:《数字网络环境下著作权默示许可制度研究》,载《南都学坛》2014年第5期。,较之传统授权模式,默示许可交易成本更低、程序更简捷,也能够有效保护著作权。尽管如此,当著作权人真实意思与此相反时,复制和提取行为实质上是对著作权的侵犯,而著作权人一旦撤回授权,复制和提取结果就不能继续使用。同时,依照默示许可,复制和提取者应向著作权人支付报酬,商业性研究主体和非商业性研究主体所承受的经济压力差异明显。
“解释兜底条款”体现在《著作权法》第三次修改送审稿中,其第43条第1款第(十三)项增加了“其他情形”,第2款则增加了“以前款规定的方式使用作品,不得影响作品的正常使用,也不得不合理地损害著作权人的合法利益”,即三步检验标准。送审稿中并未出现TDM例外条款,因此,可根据三步检验标准,对兜底条款进行解释。虽然解释兜底条款具有一定的灵活性,却增加了不确定性,在认定TDM是否侵权时,缺乏明确统一的标准,导致司法实践不统一,不利于著作权的保护。
制定“TDM合理使用规则”路径则沿袭了我国著作权限制条款的立法模式,在赋予TDM合法性的同时,严格限制其适用条件,如主体、目的等。适当的例外规则能够实现TDM的确定性,防止例外规则的滥用;既不会过度损害著作权,也能促进科学研究,充分考虑了权利人和科研机构、著作权人和社会公众之间的利益平衡。
2. TDM著作权例外规则的利益平衡
TDM例外规则是利益平衡原则的体现,在权利人与研究机构之间、私人利益和社会公益之间形成新的利益平衡点。在著作权人和科研机构之间,既要保护著作权人的正当权益,也要赋予科研机构利用TDM技术对作品进行复制的合法性。因此,需要在复制权的保护范围上打开一道缺口,而这道缺口仅针对有限的主体——即满足特定条件的科研机构——开放,科研机构的复制行为不能给著作权人造成巨大损失,同时也要衡量其进行TDM的正当性,而衡量的标准就是社会公益。
大数据环境下,TDM技术扩大了研究机构对他人作品的复制范围和数量,以更为便捷的方式实现了对海量数据的价值发掘,有利于推动科研创新,但此类复制仍在复制权的保护范围之内,著作权人专有权与社会公益之间失衡。一方面,著作权是私权,在私权领域,权利人的利益是第一位的,法律不能对私权人过多限制,以免抑制作品的创作;另一方面,科学研究能够带来技术的进步、文化的繁荣,考虑到社会公益,保障社众能够接近作品,著作权人应将其权利让渡一部分,让渡这部分权利不至于过度减损著作权,也足以实现社会公益。
(二)TDM著作权例外规则的具体立法
1.适用主体为非营利性研究机构
考虑到权利人的利益,不应将主体范围无限扩大;社会公益是合理使用规则确立的初衷,而商业性主体的首要目的是为了赚取利润,因此应当将其排除在外;我国民法典的编纂工作已经启动,民法总则将法人分为营利法人、非营利法人以及特殊法人,将非营利法人定义为:“为公益目的或者其他非营利目的成立,不向其出资人或者设立人分配所取得利润的法人”。可以将TDM例外规则的适用主体限制为非营利性的研究机构,非营利性则援引民法总则关于非营利法人的定义。
2.限制行为方式为复制
应考虑TDM技术的特点,赋予基于TDM所实施的复制行为的合法性。利用其它手段对作品进行复制则不受例外条款的保护,而且复制的结果只能用于实现文本和数据挖掘,研究机构不能将复制的结果提供(包括但不限于转让、向公众公开等方式)给其他不受例外规则保护的主体,否则构成对作品的侵权。
3.排除商业性科学研究
应考虑权利人和社会公众的利益平衡,科研机构进行TDM的目的是为社会公益,而非赚取利润;若允许商业性的科学研究,著作权人就相当于为商业性主体做了嫁衣,所以,应当将其行为目的限制为非商业性的科学研究。此目的将禁止非营利研究机构和商业公司合作,杜绝商业公司通过该条款搭便车的可能。
4. TDM结果可以免费对外公开
TDM结果是否可以对外公开,需要考虑两点因素:(1)TDM结果的公开行为是否受到著作权限制。诚如上言,TDM的后续阶段不涉及对著作权人作品的演绎、汇编等,其结果不能体现原作品的表达方式,因此TDM结果的公开不受著作权限制;(2)TDM结果的公开是否具备商业目的。合理使用条款只适用于非商业性的科学研究,如果研究机构最终将TDM结果作商业性使用,则不能获得合理使用条款的保护,在TDM的复制阶段,研究机构就已经构成侵权。因此,TDM结果可以免费公开,但不得作商业性用途。
5.不适用于未发表的作品
在确定行为对象时,应将未发表的作品排除在外。我国著作权取得方式为自动取得,即作者完成作品的创作就享有著作权,不以发表为权利取得要件。作者未发表其作品之前,著作权处于被作者绝对控制的状态,科研机构不得根据例外规则对此类作品进行复制。
综上,我国著作权法应当在“权利的限制”一章中增加TDM合理使用条款,在《〈中华人民共和国著作权法〉修改草案送审稿》第43条规定增加一项,规定“TDM合理使用”条款,将原第(十三)项“其他情形”推后为第(十四)项,具体规定为:
第四十三条 在下列情况下使用作品,可以不经著作权人许可,不向其支付报酬,但应当指明作者姓名或者名称、作品名称、作品出处,并且不得侵犯著作权人依照本法享有的其他权利:
……
(十三)非营利性的研究机构以非商业科学研究为目的,利用文本和数据挖掘技术对他人已发表的作品进行复制,但不得将复制结果向他人提供,也不得将挖掘结果作商业用途;
(十四)其他情形。
In the era of big data, the extensive application of text and data mining technology breaks the interest balance mechanism created by copyright law, which brings challenges to the copyright law of China and calls for urgent adjustment. The United States changes the implied license to the unconditional exception rules,while the Proposal for a Directive of the European Parliament and of the Council on Copyright in the Digital Single Market proposes an obligation model to specify “the exception rules of text and data mining in the field of scientific research.” It is worthwhile to draw attention to the promotion of scientific research and the moderate copyright protection. The revision of the Copyright Law in China should formulate the rules for the rational use of text and data mining, strictly restrict the applicable conditions and reconstruct the interests balance mechanism.
big data; text and data mining; copyright exception; interest balance
唐思慧,湘潭大学公共管理学院副教授,管理学博士,硕士生导师,“法治湖南建设与区域社会治理协同创新中心”研究员