图书馆数字化作品的著作权保护与TDM的冲突与兼容

2022-02-08 14:50郭津津汪焱梁
山东图书馆学刊 2022年4期
关键词:数据挖掘权利数字化

郭津津 汪焱梁

(山东大学法学院,山东青岛 266237)

当今世界正处于前所未有的大数据时代,数据信息的搜集、整合与利用对整个国家与社会经济发展乃至于国家竞争力的提升而言,均有着不容小觑的战略性意义。TDM技术,全称文本与数据挖掘技术,是一项对海量数据进行自动化分析与处理,以获取有价值信息的技术。该技术具有相当大的科研价值及经济价值,是数字时代面临的新机遇。图书馆作为公共文化服务主体,其所掌握的大批量数据与文本资料,是TDM重要的作用对象。当前各国都在寻找TDM在著作权传统合理使用制度转化上的新出路,以期建立著作权人代表的私人利益与图书馆代表的公共利益之间的平衡机制,推动本国文化和科学事业的创新。

1 图书馆数字化作品著作权保护与TDM技术的冲突体现

在当前的版权保护体系下,对图书馆的数字化作品应用文本与数据挖掘技术,面临着高概率的著作权侵权风险。在不同的技术操作阶段,存在着不同的侵权可能性。厘清图书馆数字化作品著作权保护与TDM技术之间的冲突表现并分析其缘由,有助于探寻其解决路径。

1.1 冲突的表现

1.1.1 TDM的应用招致图书馆数字化作品的侵权风险

可能侵犯复制权。在应用文本与数据挖掘技术对图书馆的数字化作品进行处理的阶段,行为人需要将所涉及到的数字化作品相对稳定地固定在相应服务器中,且要保证能够实现读取与再现的要求。该行为符合“复制行为”的两个特征:一是在有形物质载体上再现该作品,二是要固定在该有形物质载体上[1]。因此上述行为是需要受到著作权人复制权的保护范围的限制的。有观点认为可以“临时复制例外”或者现行“合理使用制度”来规避文本与数据挖掘技术的复制权侵权可能,但这是行不通的。且不讨论临时复制是否受制于复制权,即便其不属于权利人复制权的涵盖范围,“临时复制”也需要满足“临时、偶然”且“不具备独立经济地位”的要件,一方面,该技术所获取的数据是可以读取与再现的,另一方面,文本与数据挖掘技术的信息提取阶段所获得的数据结果毋庸置疑地具有不同程度上的经济价值[2]。而现行“合理使用制度”中,与文本与数据挖掘技术相关的无非是《中华人民共和国著作权法》(以下简称《著作权法》)第24条第1、6、8项,但是均无法为该技术实际运行过程中的合法性提供法理支撑。原因在于,第1项主体限于个人;第6项要求复制范围限于作品的片段,且目的也有限制;第8项要求复制目的为陈列或保存版本。虽然该条第13项规定了“法律、行政法规规定的其他情形”,却并非意味可以自行创造1至12项以外的合理使用类型。

可能侵犯演绎权。我国当前的知识产权立法中尚无“演绎”“演绎权”的概念,演绎权概念在我国可以分解为翻译权、改编权、汇编权等[3]。在数据利用阶段,多个环节的行为都有侵权可能性[4],原因在于文本与数据挖掘技术需要对目标文本与数据进行翻译、整理、汇总、格式转换等技术性操作,即数据“转码”行为,这在性质上就等同于著作权法意义上的“演绎”行为。行为人以原输入作品为基础,根据其进行挖掘行为的目的,将筛选模式设置好,输出有独创意义的演绎作品。此过程中的结果存在的侵权风险是指输出作品与输入作品有可能构成实质性相似,因此在对图书馆数字化作品运用文本与数据挖掘技术的进行结构化处理的阶段,需要受著作权人相应演绎权的限制。

可能侵犯作品传播权。在著作权体系中,获得作品的方式多种多样,传播权规制对象,就是公众获得作品无需转移作品载体所有权或占有,获得作品可理解为感知作品的内容[5]。文本与数据挖掘技术主要涉及的是信息网络传播权。因为文本与数据挖掘的整个操作流程都是数字化的,获取、处理、传输相关数字化材料的全部场景都可能侵犯原作品的信息网络传播权,同时挖掘成果的利用方式也极有可能涉及到原作品的其他公开传播权。在文本与数据挖掘的样本输出阶段,通常情况下基于其绝大多数样本受著作权法保护,且当前文本与数据挖掘技术的成果基本上都是在网络上发布的,所以该技术处理成果的输出对信息网络传播权就存在不容小觑的侵权风险[6]。

1.1.2 TDM的过度抑制会阻碍图书馆的现代化建设

文本与数据挖掘技术,采用数据化手段给人类带来了一种探索社会行为的新方式,从根本上拓宽了人类认识世界的渠道。近年来的国际图书馆联合会、欧洲研究图书馆协会、大英图书馆等利益相关方均采取了一系列相应措施,以表明其版权立场,为推动调整出版商版权政策贡献了新智慧[7]。促使以上主体采取行动的直接原因是图书馆对文本与数据挖掘技术有着迫切的需求。文本与数据挖掘技术的应用极大程度上提高了图书馆在业务办理、信息服务、事务执行等方面的效率。图书馆在新技术的推动下,改进原有的传统运营模式,逐步打造智慧型图书馆,文本与数据挖掘为图书馆的精准服务与智能化服务提供了契机,可以说是进一步促进公共文化服务领域繁荣的必要条件[8]。图书馆数字化作品的文本分类需要同时运用到人工智能与信息检索两大新兴技术,是数字图书馆的主要建设项目,目的在于以内容为基础进行综合性信息管理。将文本分类工作做好,能够极大地方便数字图书馆的用户、节省搜索等待时长、精确搜索结果。文本与数据挖掘对地方特色图书馆也有着不可忽视的意义。可以对地方图书馆的特色文献资源进行文本与数据挖掘,探索其潜在的历史、文化与社会价值,提高资源利用率。

许多国家已经意识到文本与数据挖掘对于图书馆建设的重要性,英国联合信息系统委员会甚至提出了这样一种看法,即如果文本与数据无法被充分地重视和利用起来,就极有可能会成为致使英国被其他广泛运用该技术的国家落下的原因之一[9]。英国图书情报理事会主席John Dolan更是指出,图书馆充分利用与提供信息资源是让英国成为世界经济与研究领军人物的必要条件之一[10]。因此倘若我国过度抑制对图书馆数字化作品进行文本与数据挖掘,必然会减缓图书馆的建设。

1.2 冲突的根源

1.2.1 既有法律规范对TDM的规制尚阙

文本与数据挖掘之所以存在侵权风险,原因在于我国著作权例外规范体系不能够提供豁免,导致该技术的运用缺乏合法性。举例来讲,数字化作品准备阶段就是机器学习的预备阶段,也可以称之为输入阶段[11]。在此阶段需要进行“数据喂养”以储备充足的数字化作品是文本与数据挖掘技术稳定运行的基础性工作。但包括对古诗词在内的各种文本与数据的著作权客体的获取,在当前的著作权“先授权后使用”的版权许可使用方式的法律体系下,只要未经授权的获取行为,都涉嫌侵犯著作权。图书馆的数字化作品汗牛充栋,其权利人也可谓星罗棋布,传统许可授权方式会整体拉低技术运行的效率,影响技术产出速度。实践中由于文本与数据挖掘技术应用问题而引发的著作权纠纷案件,所呈现的判决结果也是各不相同。出现类案不同判现象的原因就在于我国相关法律欠缺,法官无法可依。仅依据著作权设置的目的性条款去断定侵权与否终归不是长久之计。

法律是具有局限性的,针对新兴技术,日本、英国等一些国家已经将其纳入合理使用制度的范围,可即便如此,这些已经作出相应法律安排的国家,在司法实践中,也面临着适用难题——因存在个案判断、适用条件限制等个案差异,通过合理使用制度保护文本与数据挖掘运行的具体举措仍需要进一步探索[12]。聚焦到我国,我国在数据开发利用方面的法律政策上存在较为滞后的现象,当前现行的立法规范中并未出现对文本与数据挖掘技术的保护与规制规范设置,2021年6月开始实施的新《著作权法》,仍未对文本与数据挖掘技术作出立法回应。当下在学术界已经引起了广泛的探讨,文本与数据挖掘在科学研究、教育教学、文化传播等公共领域具有不可估计的潜力与能量,应当为其提供相应的技术操作与运行的立法保护,作出前瞻性法律安排,但是相关细节问题依然缺乏针对性的研讨[13]。图书馆所掌握着的数字化作品资源是文本与数据挖掘的重要样本来源,因此针对图书馆数字化作品的文本与数据挖掘行为应当在保证著作权人一定权益的情况下,释放“技术红利”“制度红利”[14]。

1.2.2 著作权人利益与公共利益的博弈激烈

版权保护与科研自由的冲突由来已久,根源就在于著作权人利益与公共利益之间的较量此起彼伏。知识产权私权公权化的趋势说明,知识产权法的立法必然要更多地考量公共利益所代表的社会价值。版权利益的本质是基于平衡冲突利益理念,在著作权人利益与公共利益之间达成妥协,在促进创新的前提下,适当让渡一定利益于社会公众,保障其接触与利用作品的需要。图书馆的基本属性带有公益色彩,是法定的著作权益让渡的受益主体,这是几乎所有国家的版权法专门对图书馆利用作品作出特殊制度安排、提供版权例外权利的原因[15]。在对图书馆数字化作品应用文本与数据挖掘技术的过程中,既要保障相当程度的科研自由,又要维护好版权人的利益,确保不打击甚至是要激发其创作热情。现今,已然形成了以大数据、物联网、人工智能等为代表的数字新技术,传统发展模式必将被改变[16]。对图书馆数字化作品进行文本数据挖掘的过程中,平衡好行为人与权利人之间的利益冲突,是决定文本与数据挖掘技术能够实现多少公益价值的关键。

2 对图书馆数字化作品运用TDM的合理性论证

图书馆的使命之一就是提供给公众获取知识的机会。便捷的检索方式、效率与质量,关乎着公众的信息获取体验。在国际图书馆界所举办的维权举措中,IFLA的《关于文本和数据挖掘的声明》就分析了文本与数据挖掘技术对图书馆资源利用、创新推动、信息服务的必要性,指出了现行版权制度阻碍对图书馆数字化作品应用文本与数据挖掘技术可能带来的损害[17]。LIBER也在其《促进开放科学的声明》中指出构建与实施文本与数据挖掘版权豁免制度对于提高科研成果产出的积极意义,表明了其为在图书馆的应用文本与数据挖掘技术清除版权障碍的决心[18]。在法理层面,对图书馆数字化作品运用文本与数据挖掘技术是具备法理学基础的。

2.1 著作权设置的利益平衡机制

图书馆的管理制度发展历程与著作权的法律制度发展历程在其宗旨、形成、优化方面均有特殊的连接点。利益平衡机制是构建著作权法体系的基石,图书馆则是著作权法利益平衡机制稳定运行程序中的重要担当。图书馆的身份具有双重属性,既是作品的使用者,又是作品的传播者。知识产权客体即知识产品也具有双重属性,即私人产品和公共产品,整个知识产权法在价值构造上表现为一系列的平衡模式和与此相适应的制度安排[19]。图书馆制度与著作权法的宗旨是契合的,均为促进人类科学和文化事业的发展,实现人文社会的整体繁荣。虽然著作权法设置的核心利益是保护著作权人的专有权,但为了保证公众对作品的正常接近与利用、维护社会公共利益,也同时设置了权利限制制度,此为图书馆等主体及社会公众的著作权豁免的法理基础。图书馆应当肩负起促进权利人利益与社会公共利益在作品的创作、传播与合理使用之间的平衡的责任。分析著作权的宪法基础可得,对著作权人的权利限制与著作权本身有着同等重要的法律地位,著作权的权利设置必须以宪法为依托。宪法将发展教育、科学和文化事业作为国家义务和社会目标,这也是我国版权体系立法的宪法渊源,著作权利不应当成为阻碍该宪法目标实现的绊脚石[20]。

作为大数据产物的文本与数据挖掘技术,以其为基础对图书馆数字化作品进行数据分析与提取,是一种高效率的技术探索。利益平衡制度要求达到数字化作品生产、传播与利用之间的平衡。虽然创作人的利益保护是传播、利用人行使权益的基础,此种有效保护是刺激创作人创作积极性的驱动力,但保护程度需要受到利益平衡制度的限制,原因在于过高的保护程度会抑制对作品的传播与应用,反而会影响创作人的利益。知识产权立法应当合理划分专有权利保护与社会财富分享的界限,找到平衡点。当今图书馆面临着需要分析数十年来收集的大量数字化作品的新阶段,文本与数据挖掘技术可以保证在投入较少心力、时间的前提下更为快速地找到目标信息并进行处理。该技术运行的结果就是提出新预测、得到新模型,以探索此前尚未解决或者解决方式繁琐的新途径。文本与数据挖掘所能够带来的价值就决定了学界与实务界都必须重视其所带来的版权冲突问题,而从作为著作权设置基础的利益平衡机制的角度出发,扫清文本与数据挖掘技术的发展障碍是符合法理基础的。

2.2 图书馆作为文本与数据挖掘的主体具有公益属性

图书馆是大规模数字化作品的持有者,对这些数字化作品的支配占主导地位,从图书馆肩负的社会责任来看,积极开展文本与数据分析是图书馆的一项重要任务。在技术操作过程中,图书馆能够发现潜在的有价值的信息,创新图书馆的服务模式。权利人的利益保护应当同公众接近与利用作品的社会需求相平衡。版权管理知识的所有权与发布权,所以版权政策和版权制度就是图书馆行业组织与图书馆员关切的问题。 事实上,在生物、医学等领域,尤其是疫情防控严峻形势下,世界各国都在探索高效的抗疫途径,作为抗疫的重要工具,文本与数据挖掘技术在疫情数据监控、病毒机理分析、防控举措执行等方面都发挥了中流砥柱的作用[21]。在此背景下,每获取一个文本或者数据都要去履行得到相关著作权人的许可的话,结果必然是提高了交易成本,降低了科研效率。基于疫情防控进行文本与数据挖掘所得到的结果的受益人是整个社会,且公众并不被要求付费就能够享受该研究结果所带来的好处。这正是文本与数据挖掘技术所带来的正外部性后果[22]。

欧盟在《数字单一市场版权指令》中指出,出于科研目的而有权实施文本与数据挖掘的例外主体被限定为科研机构与文化遗产机构;美国、法国、日本等国家则直接将商业性公司也划入了文本与数据挖掘的例外主体的行列。质言之,无论在以上哪一国家,图书馆作为公益性组织,均具备实施文本与数据挖掘的主体条件。

3 图书馆数字化作品著作权保护与TDM的兼容路径

信息时代的国际战略格局正在悄然变化,大数据的运用能力已然成为衡量一国综合国力的重要指标,“十四五”规划对大数据的发展方向和趋势进行了整体部署。探索文本与数据挖掘的版权豁免规则有着迫切的现实需求,针对图书馆数字化作品的文本与数据挖掘权利对数据的开发利用至关重要,站在国际角度上,构建TDM版权例外规则,已然是大多数国家、地区应对此问题的主流做法。该技术所可能涉及到的著作权人事实上也并不是抵触该技术的运用,更多的是希望能够通过法律规范相关TDM行为,并从中获益。

3.1 探寻可能的兼容路径

3.1.1 协议许可模式

协议许可模式事实上是以版权方为主导的制度体现,主要有默示许可模式、公共版权许可模式以及授权协议模式。默示许可模式指的是没有许可协议的前提下,如果权利人没有以特定的方式作出退出的表示,就会被推定为授权许可使用,实施主体就可以未经授权而直接利用受著作权法律体系保护的作品、数据库等[23]。但默示许可模式不符合著作权“选择进入”的基本原则,且“先使用”的模式并不足以弥补版权人已经遭受的侵权损害,并因此而受到版权制度的道德责难。公共版权许可模式是国际知识产权界促进知识共享、防止版权人权利过度扩张运动的产物,主要以“知识共享协议”为代表。其为版权人设置了可供其选择的例如署名、非商业性使用、禁止演绎行为等在内的权利限制要求,实施者在尊重版权人提出的权利限制要求的基础上即可利用目标作品。但是该模式不能契合文本与数据挖掘技术对作品许可使用的要求,主要原因在于大多数版权人会选择的禁止演绎行为的权利限制要求无法满足文本与数据挖掘的技术运行需要。现在的一些数据库商也已经开始探索文本与数据挖掘技术的业务发展,但以数据库商所主导的授权协议模式因其商业性质而在技术运用方面、可获得的内容方面仍然受到较大的限制,无法满足未来一段时期内文本与数据挖掘技术的运行需求。

3.1.2 法定许可模式

根据法定许可制度,权利人享有固有的选择退出的权利,行为人可以在不侵犯权利人其他权利并按规定支付报酬的前提下,自由使用其作品,而不需要获得许可。较著作权许可制度而言,法定许可制度可以有效地提高交易效率、提高作品利用率,平衡各方利益。但适用中,因怠于支付报酬而承担超出报酬金以外的法律责任的案例极少出现,越来越多的行为人抱有侥幸心理,意图在被发现后或者被起诉后再行支付报酬,这就导致权利金陷入支付难的困境。著作权集体管理组织的法定许可权利金转付职能被视作可以解决此问题的关键[24]。但执行成果并非尽如人意。原因在于,对于选择退出的作品的权利金支付问题是集体管理组织不能够解决的;集体管理组织事实上只是代收主体,并不能根本扭转大规模应诉后付费的现象;权利人需投入的包括许可公示备案等的相关成本较高。

3.1.3 合理使用例外模式

对以科学研究为目的而采用文本与数据挖掘的行为适用合理使用例外制度进行保护,具备理论上的可行性,也已有国际范例。

美国以其判例法为基础,依据合理使用的“一般条款”,即“四要素标准”判断法,来界定案涉文本与数据挖掘行为是否可以为著作权合理使用例外体系所涵盖。其中最关键的就是“使用的目的和性质”要素,主要指两点,即“转换性使用”和“商业目的”,主要由法官逐案判断是否符合版权法激励创新的宗旨。商业目的自不必说,而判断是否构成转换性使用需要考察文本与数据挖掘行为是否加入了新表达、新视角、新功能或新方式,倘若仅再现作品原本的价值、内容或理念则不能认定为具有“转换性”。美国学者Pierrel Leval认为,对于作品的利用具有合法性多寡的判断,主要就看该利用行为是不是具备“转换性”及具备的程度。总体来讲,以美国为典型代表,包括韩国、菲律宾等国家在内,其对待技术时代的作品使用行为的态度是开放与灵活的。

英国则主要以立法形式来确保文本与数据挖掘行为的合法性。为应对大数据环境下新型技术开发与利用的时代要求,英国在2014年修订了《版权与表演权(研究、教育、图书馆与档案馆)条例》,在29条第A款增设了文本与数据挖掘著作权例外规则,即无须版权人同意,任何主体都有权进行除出于商业目的以外的文本与数据挖掘行为。但要求该技术所利用的信息不能够转让或者进行除以信息分析为目的其他行为。并且明确了文本与数据挖掘行为不受合同约定的阻止或限制[25]。

欧盟在2019年批准实施的《数字化单一市场版权指令》中对于科研机构和非科研机构进行文本与数据挖掘的权利采取区别对待。科研机构有权在科学研究目的下开展文本与数据挖掘活动而进行复制、撷取行为,且可以适当兼具商业目的,权利人通过合同非法排除前述权利无效。非科研机构所能够开展的活动有限,仅临时复制行为是被允许的,且权利人还可以通过一定的方式阻止前述行为[26]。

文本与数据挖掘技术对图书馆数字化作品进行机器学习与分析的过程,纵然会涉及到对作品的复制、改编、汇编等行为,但其目的并不在于直接传播作品,换言之,此过程不会造成该作品的市场替代。作品也好、权利人也罢,均因存在公众这个受体而有被保护的原动力,著作权保护的框架是以利益平衡原则为根基的,权利人有权专有使用作品,而公众有权消费性使用作品。将以科学研究为目的的文本与数据挖掘行为利用合理使用制度进行保护,前提在于合法取得作品,其中所可能涉及到的侵权行为应当利用著作权侵权法律规范加以规制,以侵权损害结果的产生作为禁止条件。

3.2 对我国构建著作权合理使用例外规则的思考

合理使用例外制度已经得到了大多数国家或地区的认可,只是在适用理由与制度安排等具体细节方面略有不同,我国仍然需要在借鉴国外的立法经验的基础上,结合我国实际情况定制适用于我国的合理使用例外规则。该规则的构建需要把握两个要点,其一是要对该文本与数据挖掘行为进行严格控制;其二是要以进行文本与数据挖掘行为为例外,以保护权利人著作权为基点。借鉴国外立法与司法实践经验,结合我国图书馆、公众及权利人的现实需求,建议从主体、客体、目的、行为几个方面入手。

在主体条件上,基于国家发展利益、社会公共利益的考量,对于实施主体的范围应予以适当扩大,应当涵盖包括自然人、科研机构、科研组织、图书馆、文化遗产机构、博物馆等在内的特定主体。在客体条件上,应当强制性要求作品是合法获取的。“合法获取”意指通过订阅期刊与图书等文献资料、购买数据库、基于创作共同协议等方式获得作品或取得权利人的授权。虽然以美国、德国等为典型代表的国家未将来源合法性作为限制条件,但考虑到如放开被挖掘对象来源合法性的条件,将导致权利人的智力成果在过大的程度与范围上被无偿使用,甚至会实质性打击权利人的创作热情,从长远计,是不利于社会主义文化和科学事业的发展与繁荣的。在目的条件上,应限定为“为科学研究或其他合理目的”,不采用“非商业目的”表述的原因在于,科学研究从根本上讲是以公共利益为本质的,其范围更大,既包括商业性研究,也包括非商业性研究。如前所述,只要文本与数据挖掘的成果不对原作品造成实质性替代,就不会触及权利人利益,因此商业性的科学研究不应被限制。“其他合理目的”的表述是为了公共利益最大化,为除科学研究的其他项目开发提供法律基础,例如公共健康风险评估、重大公共卫生事件研究、食品安全监控等。在行为条件上,各国对文本与数据挖掘的行为条件所进行限制略有不同,英国只允许复制行为,日本是在复制外允许进行改编行为,欧盟则在复制外允许提取行为,德国则限于复制和传播(限于特定的科研人员或者是第三方检测科研质量的主体)。我国应限为复制、改编、传播三个层面。前两个层面属于该技术运行的基础性环节,因而应当被保障。对于文本与数据挖掘可能涉及的传播行为,原则上禁止将其挖掘结果对外传播,是相关各界已经达成的共识。需强调的是若传送或保存行为无独立法律意义,则不在此限。

在此制度模式下,图书馆是有权进行文本与数据挖掘行为的主体,而作为图书馆合法获取的数字化作品,图书馆有权将其作为文本与数据挖掘的行为对象。对图书馆数字化作品进行文本与数据挖掘的目的应限于为科学研究或其他合理目的,即可以允许一定的商业性研究行为。而其受保障的行为限于复制、改编与传播。

3.3 鼓励图书馆与权利人合作以化解版权冲突

欧盟、英国还鼓励图书馆与利益相关人协商、合作以达到化解可能涉及的版权冲突的目的。版权法的主体并非“零和博弈”的游戏者,并非一定要造成你输我赢的局面,而是一种合作型博弈。正因如此,目前图书馆涉及版权领域的许多问题,相比于经由司法途径解决,双方都更青睐于磋商机制。我国目前可适当借鉴此做法。图书馆应当主动总结梳理文本与数据挖掘技术实践与版权管理的特点,积极与相关权利主体进行联系与友好协商,争取双方达成合作,促使磋商机制在消融相关版权分歧的过程中实现更高的社会价值。

4 结语

图书馆数字化作品蕴含着极大的财富与价值亟待挖掘,若对图书馆数字化作品运用文本与数据挖掘技术进行过度限制,将极大地影响图书馆管理与服务的质量与效率。著作权合理使用例外制度是基于著作权法领域的利益平衡理论而提出的,对数字化作品权利人进行有效著作权保护的同时,又可以有效回应大数据时代的新技术对版权所带来的挑战。希望著作权合理使用例外制度的构建,有助于早日解决相应的版权管理困境。

猜你喜欢
数据挖掘权利数字化
家纺业亟待数字化赋能
探讨人工智能与数据挖掘发展趋势
我们的权利
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
股东权利知多少(一)
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
数字化制胜
权利套装
高级数据挖掘与应用国际学术会议