文本与数据挖掘行为的著作权法分析

2021-09-16 05:08李国英李健
关键词:实质性著作权法权利

李国英,李健

(南京理工大学 知识产权学院,江苏 南京 210094)

一、问题的提出

“数据”成为第四次工业革命发展的关键驱动力[1]。文本与数据挖掘(text and data mining,TDM)技术是将“数据”转化成“知识”和“服务”的重要分析工具,不仅创造了全新的商业模式,也为科学研究和学术创作增加了潜在价值[2]。TDM技术的运用需要海量作品的输入,包含复制与使用大量受著作权保护的作品,势必引发权利人和TDM使用者之间的利益博弈。

在涉及TDM的系列著作权侵权诉讼中,“Google图书扫描”案最具代表性。该案中,众多著作权人难以接受Google公司未经许可免费扫描2 000多万本图书的行为(1)See Authors Guide, Inc. v. Google, Inc. 804F.3d 202(2d Cir. 2015).。权利人秉持“有价值的地方就有权利”(if valued than rights)的观点[3],认为使用者的行为落入了作品专有权范畴,不合理地损害了著作权人的利益,要求Google公司与作者分享对作品进行文本与数据挖掘所带来的巨大商业利益。而TDM技术的使用者和部分学者认为,对作品的文本与数据挖掘不属于著作权法调整的范围。理由在于,“机器也应当享有阅读权”,就像人类阅读不需要权利人的单独同意一样[4],必须允许TDM技术对包含作品的数据进行自动分析。事实上,“阅读权”并不是一项法定权利,人类阅读通常是为了汲取作品的思想部分,而与作品的表达并无关涉。将机器阅读与人类阅读相比较,是试图将TDM技术对作品的使用纳入思想领域,以实现对该行为的合理辩护。因此,认定TDM行为侵权与否并非易事:一边是数以百万计著作权人的经济利益,另一边是数字技术服务公司的商业创新,著作权利益平衡的天平该倾向何处?

不仅权利人与TDM使用者所持观点互相对立,法院对TDM行为的裁判结果也不一致。“Google图书扫描”案中,美国法院采用合理使用“四要素”分析法,认定TDM行为构成对作品的“转换性使用”①,属于著作权人独占权利的排除范围,适用合理使用豁免。我国“王莘诉谷歌案”中,北京市第一中级人民法院采取了不同的分析思路:TDM行为下,作品获取与使用行为应当分开判断,两种行为独立存在、互不影响。因此,一审判决“北京谷翔公司”的复制行为构成侵权,而为用户提供搜索服务的使用行为则构成合理使用(2)参见北京市第一中级人民法院(2011)一中民初字第1321号民事判决书。。虽然基于同一案件事实,但两家法院最终裁判结果不一致:美国法院采用“一体分析法”,对作品获取与使用行为不作区分,统一纳入合理使用分析;而我国法院并不承认作品的获取与TDM使用行为之间存在关联性。在实务上,是否将合理使用范畴覆盖TDM行为的数据获取阶段存在裁判思路上的重大分歧。

当TDM技术成为科学研究的重要分析工具,或其生成作品与输入作品构成实质性相似时,问题就变得更为复杂。2015年,在“安妮·弗兰克日记”案中,荷兰法院援引《欧盟基本权利宪章》第13条规定的“科研自由权”,并以权利优位为由驳回了原告的著作权侵权索赔请求(3)See Anne Frank’s diary case, Rechtbank Amsterdam, C/13/583257 / HA ZA 15-270.。可见,荷兰法院认为,以科学研究为目的的TDM行为,不需要分析对著作权人的利益影响,属于绝对的合理使用。然而,是否所有以科学研究为目的的TDM行为都属于合理使用,在理论认识上并不统一。2019年4月,欧盟通过《数字化单一市场版权指令》(简称CDSM指令),将使用主体限定为科研机构和文化遗产机构,招致了广泛的批评与质疑[5]。此外,在“伦勃朗自画像”(the next Rembrandt)项目中,研究人员通过TDM技术挖掘伦勃朗生前创作的作品,制作出与其艺术风格一致的画像[6]。该项目所生成的作品已经构成对原作品的表达性使用,如果伦勃朗的作品还在著作权保护期内,TDM输出的作品必然招致著作权侵权问题。当TDM负载了科学研究使用行为或输出了实质性相似作品时,单纯以合理使用制度来协调,能否实现著作权法上的利益平衡并与著作权法倡导的价值相一致,这一问题值得商榷。

概言之,TDM技术的应用给著作权法带来了理论研究的盲点和制度设计的挑战。需要科学分析TDM行为的著作权法性质,并针对该行为给出明确的制度设计,以有效协调权利人与使用者之间的利益冲突。

二、TDM输入与输出行为的定性分析

TDM行为是一个概括性描述,并非著作权法意义上的法律行为。不论是著作权人主张“有利益的地方就有权利”,还是使用者倡导的“机器也享有阅读权”,都仅停留于经济、技术层面的呼吁。对TDM行为的分析应以著作权具体权能为依归。厘清该行为侵犯的具体权利,并对侵权行为进行分类,是TDM行为定性的首要步骤。

(一)TDM行为及其二分的原因

TDM行为是指从大量数据中挖掘有趣内容和提取新知识的过程。实施TDM行为的原始数据包括数据库、数据仓库、Web、其他信息存储库或动态流入系统的数据[7]。TDM技术广泛运用于社会科学、自然科学以及人文科学的研究,以及搜索引擎、商务智能、新闻媒体等商业领域[4]1。它不仅成为研究人员和研究机构挖掘科研学术潜在价值的重要工具,也是信息技术进化下的新型商业模式。然而,大多数TDM行为输入的数据中涵盖了受著作权保护的书籍、期刊文献、图片等作品。TDM技术与生俱来带有著作权侵权的原罪。

TDM技术的运用包含多个著作权法意义上的侵权行为。计算机领域对TDM技术的分解包括:数据获取、数据清理、数据集成、数据选择、数据变换、数据挖掘(狭义)、模式评估和知识表示八个步骤[2]6,详细展现了其对文本和数据的获取与加工处理的过程。其中,可能涉及侵权的行为为数据获取、数据处理(涵盖数据清理、数据集成、数据选择、数据变换、狭义数据挖掘、模式评估)和知识表示三个阶段,依次用“输入阶段”“机器阅读阶段”和“输出阶段”表示[8],如图1所示。

图1 TDM步骤的著作权法划分

整个TDM过程可能涉及的著作权侵权行为以输入阶段和输出阶段为分界。首先,输入阶段对知识和信息的数字化获取,需要复制大量受著作权保护的作品和提取数据库内容,这直接侵犯了作者、新闻出版者和数据库权利人的专有权。其次,机器阅读阶段以获取的作品副本为实施对象,虽然存在格式转换、改编、翻译等多种形式的利用,权利人却难以直接证明TDM使用者对上述作品实施了演绎行为[9]。TDM技术对作品价值的发掘和提取处于特定的私密空间内,权利人在技术的“黑箱”之外,难以给出TDM使用者实施演绎行为的直接证据。该阶段类似于人类阅读,其对作品的利用形式与著作权法意义上的使用行为关涉不大[10]。最后,输出阶段生成的作品可能与输入作品在表达上具有实质性相似,存在对在先作品权利侵犯的潜在可能性。因此,输入阶段和输出阶段是著作权侵权判断的关键节点。

输入与输出阶段不存在必然的因果联系,二者的差异在于:(1)技术上的依赖性不同。输入阶段的数据获取虽然是TDM技术运用的先决条件,但不存在对技术的依赖,与TDM技术的关涉不紧密;输出阶段的生成作品是TDM技术成果的主要表现形式,该作品的创作与TDM的核心技术息息相关。(2)侵犯著作权的具体权利不同。输入阶段采用数字化、自动抓取、提取数据库内容等形式实现对海量数据的获取,可能侵犯权利人的复制权;输出作品主要可能与输入作品构成实质性相似,侵犯作品的演绎权。(3)二者侵权判断标准不同。输入阶段的侵权判断仅需直接举证证明具有复制行为,不存在事实认定的困难;而对输出作品的侵权判断采用的是“接触+实质性相似”标准。(4)产生的知识增值不同。输入阶段主要是对作品的复制,尚未负载TDM技术,不发生知识增值效应;输出作品是TDM技术实施的成果,产生知识增值。因此,输入阶段与输出阶段不论在技术还是在著作权法的分析思路上都存在较大差异,需要对其引发的著作权问题进行独立判断。

(二)TDM输入行为的性质界定

TDM输入阶段对受著作权保护作品的扫描、复制、抓取和制作副本的行为,直接侵害了著作权人的专有权利。输入阶段获取的作品,类似于“磨坊中有待加工的谷物”[11]。因此,对TDM原材料的获取,需要向权利人支付“谷物”收购费,还是能够获得合理使用的豁免?

输入阶段的复制行为不应采用“转换性使用”的评价思路。合理使用“四要素法”是美国法院分析著作权侵权行为正当性的主要方法。而在技术合理使用的分析过程中,Leval[12]法官的“转换性使用”分析法备受推崇。从“TVeyes案”到“Google图书扫描”案,“转换性使用”标准几乎成了合理使用认定的必要裁判思路。“转换性使用”是对合理使用四要素中第一个要素“使用目的和特征”的进一步深化,发展出“新作品是取代了原作品,还是添加了新的东西,即是否用新的表达、意义或信息改变了原作品”的判断标准。在技术合理使用中,该判断原则也被称为“知识增值”判断(4)See Campbell v. Acuff-Rose Music, Inc., 510 U.S.569, 579(1994).。从上述分析可知,TDM输入阶段的作品复制行为并不涉及知识增值。正如磨坊中等待加工的谷物,仅仅是空间上发生了转移,谷物并没有被磨成面粉,TDM作品获取行为也没有对作品的性质和特征产生丝毫影响。“转换性使用”的知识增值标准难以覆盖到作品输入阶段。

输入阶段的复制行为对权利人的作品市场产生了较大影响。在认定作品获取阶段的正当性时,合理使用的第四个要素是重要判断依据。复制行为的合理性判断有赖于对原作品著作权市场的界定,而多大程度上取代了原作品的使用是“市场影响”的重要判断依据[8]659。有学者认为,TDM行为并未影响权利人的传统市场,其获得巨大商业成功的潜在市场不属于权利人所控制的范围,著作权法不应当将作者的垄断性权利延及知识增值行为所获得的市场[13]。采用一体化方式分析TDM行为,很容易得出上述结论。然而,该推理存在逻辑上以偏概全的错误:将TDM输出作品的市场作为对权利人市场影响的分析范围,忽略了输入阶段对著作权人的市场影响。作品是进行TDM必不可少的数据原料,输入阶段对作品的复制是TDM的前提。与一般复制行为类似,输入阶段和TDM技术本身关涉不大,将其一概排除出著作权人专有权利的范畴难以形成著作权理念价值上的逻辑自洽。就像不论谷物在磨坊中将被加工成什么样,都应当认为对谷物的交易属于农民的市场。如果忽视和否认这一点,认为“自然人的获取需要受到著作权的规制,而机器的获取却能够得到豁免”[14],那么合理使用将变成机器对著作权人剥削和压榨的工具。

“市场失灵”是输入阶段的复制行为获得著作权豁免的本质原因。将作品输入行为纳入合理使用豁免的范畴并不能得到合理使用第一要素和第四要素的支持。美国以合理使用原则为输入阶段作品复制行为辩护,并且主张合理使用能够为TDM行为扫清著作权上的障碍。究其本质是,美国认识到TDM技术将成为未来国际竞争主题,也是新一轮科技创新的关键技术[13]。TDM技术需要海量作品的输入,一旦技术的实施需要作品权利人逐个授权,将产生高额的交易成本,以至于不是把TDM拖入诉讼的泥潭,就是产生技术的“寒蝉效应”(chilling effect)。在“市场失灵”思想的影响下,相比于欧盟仅赋予TDM行为在特定情形下的著作权豁免,美国的态度更为开放:将所有TDM获取行为都纳入合理使用的伞盖下,通过合理使用制度为技术与商业竞争提供庇护。

(三)TDM输出行为的性质界定

TDM输出作品并不必然构成合理使用,当其与输入作品具备实质性相似特点时,在阅读阶段对作品的演绎性使用就难以认定为仅是对思想的使用。即使作品的输入获得了著作权人的授权,输出作品仍然可能构成侵权。Sag[15]对TDM输出作品一概用“非表达性使用”(non-expressive use)来涵盖,并认为其属于合理使用中的“转换性使用”。虽然该结论值得商榷,但“非表达性使用”概念本身的提出具有进步意义。

与“表达性使用”(消费性使用)相对应,“非表达性使用”也称“非消费性使用”或者“生产性使用”,它在TDM行为的作品输出合理使用的认定中发展起来。Sobel[16]在《人工智能的合理使用危机》中详细论述了“表达性使用”与“非表达性使用”的区别,并主张“任何人都不能以‘仅属于展示在他人处所学到的东西’来反驳侵权指控,即使后来将这些东西用于生产性用途,并获得了知识增值”。Sobel教授进一步得出结论,表达性合理使用获得合理使用豁免的可能性较小。我国也有学者在此基础上,进一步将“表达型使用”细分为“普通表达型使用”和“特殊表达型使用”,并主张二者是合理使用与侵权使用的界限[17]。“表达性使用”概念给出了输出阶段作品侵权认定的依据:一旦输出作品与原作品相比,具备构成实质性相似的可能,就应从合理使用角度转换为侵权角度来审视其对著作权的影响。

“表达性使用”给在先作品潜在市场带来的危害比人类作品带来的危害更为严重。表达性使用作品的行为不仅侵犯作者的单个作品市场,还将威胁到作者自身创造性表达的地位。在索尼计算机科学实验室的“巴赫作曲”项目中,研究人员对音乐家巴赫创作的300多首歌曲进行文本挖掘,并输出与原作者风格一致的音乐作品。输出作品的测评显示,一半以上听众认为该“作品”为巴赫所创作[18]。因此,一旦放任这种表达性作品的大量输出,不仅会替代作者自身的创作,也会剥夺作者基于自身独创性表达和人格所形成的读者市场。作品是作者人格和精神的外化,当人格和精神表达被TDM技术模仿时,作者具有独创性的个人地位和写作风格也会被机器取代。TDM技术对具有作者创作风格的表达性作品输出,既是对人类创作的打击,也是对著作人格权的挑衅。

三、输入阶段的合理使用认定标准

不论合理使用是对权利人征税以对抗知识产品的私人垄断,还是再分配机制下的利益平衡器[19],TDM输入阶段的合理使用制度设计必须以克服“市场失灵”为宗旨:其既不能以过度侵蚀权利人经济利益为代价,也不因过度保护数据而阻碍技术的创新与应用。

(一)合理使用范围的限定

TDM输入行为合理使用具体制度的设计以美国和欧盟为代表。美国采用开放式的合理使用模式,不区分TDM输入行为的使用目的,将商业性使用和非商业性使用一起纳入合理使用范畴,以促进技术进步和商业性使用。美国充分利用合理使用制度的灵活性,将其作为创新政策的杠杆,为数字经济下TDM的商业竞争扫清著作权的障碍。然而,合理使用过度介入著作权人的市场将对权利人的经济利益会造成较大冲击,尤其是商业性的使用。例如,Google、今日头条等强大的TDM技术服务公司,它们一方面是免费材料的获取者,另一方面又对终端用户收取费用。在合理使用制度下成长起来的商业TDM技术服务公司,反而利用合理使用作为屏障,将权利人对著作权经济利益的让渡截留到公司囊中。商业性使用的“市场失灵”现象在理论上并不明显,TDM使用者不需要与权利人进行一一谈判,美国发达的集体管理组织能够用法定许可消解该问题。合理使用在商业领域的介入是克服市场失灵、降低交易成本,还是意图剥夺权利人的利益作为技术创新的燃料,二者界限并不明晰[16]85。

相比于美国激进的制度设计,欧盟的态度较为缓和。欧盟的CDSM指令第三条将TDM版权例外的主体限制为“科研机构和文化遗产机构”,使用目的限制为“科学研究”。第四条对一般主体的TDM使用限定为“文本与数据挖掘目的”,同时赋予权利人“选择-退出”(opt-out)权,以实现对著作权限制的限制[20]。欧盟明确将TDM的商业性使用排除在外,只允许非营利性的研究组织为公共利益目的和一般主体为非商业性目的进行文本与数据挖掘。该制度设计以权利人为出发点,充分尊重和保障了著作权人的利益。然而,该制度对TDM行为中作品获取的限定过于严格。CDSM指令只解决了特定机构和普通人员采用TDM技术进行科学研究的“市场失灵”问题,却拒绝了商业性使用的著作权豁免,将商业性使用的“市场失灵”问题交给企业自己解决。当今TDM技术成为数字时代创新发展的重要工具,欧盟过于严格的制度设计必然会限制数字驱动型经济的发展,可能出现“TDM技术服务企业移居海外”“TDM投资方减少在欧盟的投资”“TDM人才流失”等不利于国家和地区经济发展的技术贫瘠现象[5]23,难以为欧盟倡导的促进知识流动和创新的“第五个自由”提供著作权法的保障[21]。

基于以上分析,笔者认为,区分商业性使用与非商业性使用是解决“市场失灵”与平衡著作权人利益的重要手段。非商业性使用应当获得合理使用制度的保障,以推动科学研究和技术的进步;而商业性使用即使受到合理使用制度的庇护,也应当赋予权利人声明退出合理使用的权利,以实现对著作权限制制度的再限制,防止以公共利益和技术进步之名不合理地侵蚀权利人的利益。

(二)合法获取为合理使用的前提

TDM对科学研究具有重要价值,为科研人员解决了学术领域信息过载的困扰,成为发现有价值学术问题和开辟新型学术领域的基础工具。现已证明,TDM技术在医学、遗传学等理工科领域发挥了人类难以企及的作用。此外,TDM技术对社会科学也产生了深远影响。2009年,Lazer等[22]科学家在Nature上发表文章,揭示数据挖掘、计算分析等技术颠覆社会学研究范式的现象。在该文章发表后至今的近十年时间内,计算社会科学在TDM等技术的驱动下实现了蓬勃发展。因此,社会科学也离不开TDM技术这一基础研究工具。

以科学研究为目的的TDM需要输入大量具有高价值的科研文献和书籍,由此引发对作品的输入是否需要以合法获取为前提、非法获取行为是否还能获得合理使用豁免的争议。TDM技术在科研领域运用中复制的大量作品可能来自于侵权产品,例如从Sci-Hub中提取有价值的期刊文献[23]、从Booksc.org中复制与研究相关的书籍。该输入行为主要影响作者的复制权和文献期刊数据库权利人的权利。有学者主张合理使用不以善意获取为前提,对侵权获取作品的TDM行为仍属于合理使用:“以作品的合法性来源限制合理使用,将会破坏合理使用所提供的平衡,即剥夺社会二次使用的权利,以此作为对先前行为的惩罚是不合适的,因为该侵权行为本就应承担责任。”[13]957但欧盟采取的态度较为谨慎,无论是在2016年CDSM指令草案中还是在2019年正式通过的CDSM指令中,都规定了TDM行为必须以“合法获取”为前提。

TDM对科学研究的重要价值难以推导出非法获取行为应当受到合理使用的庇护,而且该推导本身也是危险的。TDM技术的科研价值对研究人员极具诱惑,如果输入阶段作品非法获取的成本远低于合法获取成本,研究人员极有可能采用违法方式获取TDM技术带来的科研利益。一旦法律默认非法行为将产生合法利益,无疑会鼓励人们用低成本侵权方式来达到想要的结果,并且该结果还被法律隐去了侵权的烙印。一旦该违法的口子被撕开,使用者从Sci-hub中获取期刊文献进行数据挖掘只是冰山一角,任意规避期刊数据库的技术措施、入侵期刊数据库等更为恶劣的行为将接踵而至。非法获取行为受到合理使用制度的保护违反了“不洁之手”原则,这既是对“任何人不应从违法行为中获利”法谚的践踏,也是承认著作权法鼓励不择手段的科技创新和科学研究。

(三)合理使用不是克服“市场失灵”的唯一方式

市场经济下,著作权法既不是克服知识产品“市场失灵”的唯一途径,也不是最好方式。诉诸法律是权利人之间不能实现利益分配平衡的最后手段。自由市场中,商业竞争和谈判是促进技术发展和克服“市场失灵”的重要方式,在利益相关主体间开发新型合作模式将比利用法律产生更好的商业效果。因此,欧盟在赋予特定主体为科研目的进行TDM行为的著作权例外的同时,也鼓励“权利人、研究机构、文化遗产机构共同商定关于适用文本与数据挖掘版权例外的最佳方式”。

当下,许多技术、服务型公司走在法律之前,已经探索出适于TDM技术合作使用的模式。例如,Elsevier针对TDM的科学研究开发了新型合作模式,提供将期刊文章和书籍转换为机器可读的XML格式服务,并通过应用程序接口(API)为进行非商业研究的文本挖掘提供便利,将TDM技术服务开发为购买期刊访问权的附随福利[24]。Springer Nature也意识到新研究技术的重要性,在增加数据库科学出版物数量的同时致力于TDM软件工具的改进,并尽可能简化TDM过程。Springer Nature期刊中越来越多的文章能够开放获取,因此通常可以无限制地将这些出版物用于TDM技术下的科学研究[25]。

可见,合理使用并不是克服“市场失灵”的最好手段,也不是消解“输入垃圾、输出垃圾”算法偏见的唯一方式。用企业合作和商业服务重新定义著作权市场比利用合理使用生硬剥夺著作权人的权益更为有效。

四、输出阶段的著作权侵权判定

TDM技术下表达性作品的输出存在侵权可能:当与输入作品的独创性表达构成实质性相似时,输出作品不能获得合理使用豁免;相反,应当接受著作权侵权的检视。TDM技术下输出作品与自然人创作作品相比具有其独特性,以“接触+实质性相似-合理抗辩=侵权成立”作为TDM输出作品侵权判断的标准。其中,难点在于对“实质性相似”认定。

(一)表达性使用作品的类型

由于输入作品类型的差异和实施TDM所要达到的目的不同,输出作品往往以不同方式呈现。例如,Google公司运用TDM技术实施Gmail项目,并成功开发出邮件自动回复功能:通过提取数字图书馆的表达和私人邮件回复的撰写句法,将极具创意的表达性语句运用于邮件的自动回复[26]。Google公司对输入作品的使用虽然是表达性使用,但其提取的表达性元素来自多元化的作品,且表达方式丰富多彩。输出作品与某单一性作品构成实质性相似的可能微乎其微,其对作品的演绎性使用可以归入思想领域,难以与某个特定作者的作品表达构成实质性相似。

然而,“伦勃朗自画像”项目与“巴赫作曲”项目输出的作品却与之不同。上述项目中,TDM输入的作品具备单一性。首先,无论是模仿伦勃朗的艺术表达进行绘画创作还是学习巴赫的音乐手法创作相同风格的曲目,TDM的对象都是特定作者的作品。项目研究人员提取属于该作家独有的艺术创作风格并进行模仿。其次,输出作品是对作家艺术风格的模仿。这类特殊的输出作品并不与某一特定作品构成实质性相似,而是对作家整体艺术人格的再现。也就是说,这是对作者毕生创作作品形成的独创性艺术表达的提取与重新排列组合。该类作品的每个创作手法都打上了作者独特表达方式的烙印,其对输入作品的使用不再属于思想领域,更加体现为对作者独创性表达的再现。

TDM输出作品具有“特定的属性”。自然人创作的作品仅可能与某一在先作品构成实质性相似,而TDM输出作品的实质性相似却是相对于整个输入体系而言的。若输入作品是某位作家毕生或某一特定时期创作成果的集合,则输出作品可能与该输入作品的整体构成实质性相似。由于输出作品以输入作品为学习对象,采用传统的判断方法将输出作品与输入作品进行逐一对比变得不现实。

(二)传统侵权判断标准的局限性

在自然人作品的著作权侵权诉讼中,被诉侵权作品对原告作品的使用难以直接证明。因而,美国司法中发展出“推定性相似”的侵权判断逻辑(5)See Arnstein v. Porter, 154 F. 2d 464(2d Cir. 1946).,采用“接触实质性相似”标准克服原告举证不能的困境。“实质性相似”标准并不是一个明确的概念,在作品侵权判断,尤其是对非文字性作品的侵权判断中,“以实质性相似标准划定侵权与合法这条界限,无论划在哪里都具有任意性”[27]。 为了使这一抽象性概念在司法上能方便运用,衍生出“整体观感法”和“抽象分离法”的具体判断方法。然而,这两种适用于自然人作品的传统侵权判断方法不能直接适用于TDM输出作品的侵权判断。

1. “整体观感法”作为TDM输出作品侵权判断的局限性

“整体观感法”发端于Roth案所创立的“整体概念和观感”(6)See Roth Greeting Cards v. United Card Co., 429 F. 2d 1106(9th Cir. 1970).的裁判思路,在Kroff案中进行了更为深入的发展(7)See Sid & Marty Krofft Television Prods., Inc. v. McDonald’s Crop., 562 F. 2d 1157(9th Cir. 1977).,并确定为作品侵权实质性相似判断的重要标准。“整体观感法”着重于对两部作品在整体上进行对比,而不是只关注作品的某个具体部分。该分析方法主要用于绘画、广告、设计等具有高度艺术性和抽象性的非文字性作品的侵权判定[28]。TDM输出作品是对海量输入作品学习后得出的结果,与输入作品中单个作品的相似度很低。若TDM输出作品与其中单个作品进行整体对比,几乎不具备侵权可能性。而将输入作品视为一个整体作为侵权对比的对象是否合适,这个问题值得商榷。

TDM输入作品具有海量的特征。如“巴赫作曲”项目中输入了300多首巴赫的音乐作品,这些作品代表了艺术家毕生创作的艺术风格,是作者独创性表达的集合。如果将输入作品整体作为输出作品的对比对象,首先,该项工作超越了普通读者和法官的判断能力,需要该领域专家在大量输入作品中抽象出作者艺术创作风格和独创性表达;其次,与输入作品集合进行整体对比过于原则化,仅凭借对比人员对作者艺术风格的整体把握和主观性判断,不同对比人员将得出不同结论,以至于对输出作品的侵权判定变成研究者之间无休止的辩论;再者,对输入作品的整体对比违反了著作权不保护思想、只保护表达的基本原则。整体作品中包含大量属于思想领域的内容,判断人员无法在海量输入作品中精准把握作者独创性表达。此外,作者的艺术风格也属于相对模糊的概念,既包含作者的世界观、性格气质、生活阅历等属于思想领域的内容,也包含作者在艺术作品中所独有的表达性创作,以此作为判断标准,将导致大量不受著作权保护的内容纳入对比体系,得出的结论不具备可靠性。

2. “抽象分离法”作为TDM输出作品侵权判断的局限性

“抽象分离法”采用抽象手段,分离出作品中不受保护的思想、事实或通用元素,将受保护的部分与在先作品进行对比,进而判定两件作品的实质性相似程度[29]。“抽象分离法”坚持著作权思想与表达的二分,采用“抽象、分离、比较”步骤将被控侵权作品中不属于著作权保护范围的内容进行过滤。其对作品的“抽象、分离”,容易将部分独创性表达排除在外,人为地缩小了著作权法保护的范围[30]。

相比于“抽象分离法”,“整体观感法”往往拓宽了作品的著作权保护范围,将属于思想领域的内容纳入侵权判断对比中。但即便如此,将“整体观感法”运用于TDM输出作品的侵权判断,由于单个作品对输出作品表达的贡献微乎其微,整体观感法下的输出作品与某个特定输入作品进行对比仍难以构成侵权。“抽象分离法”经过对被控侵权作品思想领域内容的抽象与分离,即使没有缩小作品独创性表达的范围,能够与在先作品进行对比的部分相比于“整体观感法”也更少。在“整体观感法”下都难以构成对单个作品侵权的情况下,“抽象分离法”更不可能找到与输出作品实质性相似程度较高的在先作品。若将“抽象分离法”运用于对整个输入作品集合的抽象,以确定作者具有独创性的艺术风格,再与该独创性的艺术表达库进行对比更不现实。对单个作品进行抽象、分离与对比的工作量已经较大,要在海量输入作品中抽象、分离出独创性表达,这几乎不可能。此外,由于作品的组成部分难以脱离作品整体而单独存在[31],“抽象分离法”在非计算机软件侵权领域的应用本身就受到了质疑,将其引入TDM输出的文字、绘画等多元化艺术作品的实质性侵权认定标准,得出的结果不具有科学性。

(三)TDM输出作品的新型侵权判断标准

为实现对创作的激励,著作权法赋予权利人对作品排他性的垄断权,为作品在自由市场的竞争提供产权的保障。市场上出现与某部作品构成实质性相似的作品会部分替代作者的读者市场,损害权利人的合法利益。TDM技术下的输出作品对作者作品的市场影响更为严重。基于对作者海量作品的深度学习,TDM输出作品体现出了对该作者创作风格和独特表达方式的模仿。输出作品虽与著作权人的某部特定作品不形成市场上的竞争,但却构成与作者整体艺术风格的实质性相似。作者基于自身独特的艺术风格所产出的作品已经形成了稳定的读者市场,TDM技术模仿作者创作风格并利用作者的独创性表达获取利益属于“搭便车”行为。构建新型侵权判断标准有助于防止新技术下“公地悲剧”的出现。

TDM输出作品侵权判断应当突破单独对比原则。无论是“整体观感法”还是“抽象分离法”,对自然人作品的侵权判断都采取与某一在先作品单独对比原则,以确定是否存在实质性相似。TDM技术下的作品创作方式不是对单一作品的抄袭与演绎,更多体现为对多个艺术作品独创性表达提取后的重组,从而达到以假乱真,取代作者创作的目的。TDM输出作品对作者经济利益的影响更多体现为取代稳定读者群。仅与单一输入作品进行对比难以准确把握TDM的创作特点和侵权本质。当下,自然人侵权行为也不限于对单个作品的复制与改编,还有对多个作品进行“融梗”的复杂侵权方式,且越来越多采用“多作单梗”“多作多梗”等更为隐蔽的侵权手法。例如,典型的融梗侵权作品《少年的你,如此美丽》,就是对《白夜行》《嫌犯人X的身份》等多部作品情节的抽取与重新组合。突破单独对比原则也是自然人侵权判断的发展趋势。因而,TDM输出作品的侵权判断摒弃单独对比原则,既有技术上的必然性,也有理论上的科学性。

综上,不论是与输入作品的整体对比,还是与某一作品的单独对比,都难以判断TDM输出作品与作者艺术风格的相似。对TDM技术下的输出作品的著作权分析应从理论呼吁的循环,走向具体侵权判断标准的设计。TDM输出作品虽然是对作者整体艺术创作风格的模仿,但是艺术风格的相似不能作为侵权判断的依据。作品侵权只能是对在先作品独创性表达的使用,对其侵权判断应当落实到具体作品上。将TDM输出作品与特定作品的对比仍然是判断侵权的基础性方法。基于此,将“整体观感法”与“抽象分离法”进行组合,形成组合进阶式的判断方法是建构TDM技术下输出作品侵权判断标准的有效路径。

组合进阶式侵权判断方法分为两个步骤。首先,采用“整体观感法”找出与输入作品最为接近的多部在先作品。“整体观感法”是对作品整体创作情节、艺术、风格的把握。通过“整体观感法”与某部作品整体性的对比来实现侵权判断,该判断方法简单易行、便于操作。采用“整体观感法”将TDM输出作品与输入作品数据库中的作品进行对比,确定3~5部与之相似程度最高的作品,可将侵权范围由整个输入数据库缩小到特定的、有可能构成实质性相似的几部作品范围内,为实质性相似的精细化对比限定范围。其次,通过“抽象分离法”进行组合式的精细化对比。在确定最有可能构成侵权的作品后,对特定侵权作品的独创性表达内容进行抽象分离,并将抽象分离出的部分与输出作品进行逐一对比。实质性相似部分为上述输入作品逐一对比后的叠加,当叠加相似程度达到一定高度时,应当认定TDM输出作品构成与作者原创性表达风格的相似,属于对在先作品著作权的侵犯。

五、结 语

TDM技术的发展给著作权法带来了一定挑战,无论是输入行为还是输出行为,都对著作权法的理论架构带来冲击。传统的著作权合理使用制度难以准确适用,而输出作品的侵权判断标准也难以采用当下自然人作品侵权判断原则。“如果没有规则所提供的事前确定性,某些不好的行为就可能发生”[32]。法律应当适应技术的发展,明确的法律规范和确定的裁判标准才能给技术的发展减少制度不确定性带来的阻碍,漠视著作权法的作用将会给权利人的经济利益带来不确定的损失。

针对TDM技术引发的著作权法律问题,根据该技术获取和使用作品行为性质、与技术关联程度、侵权判断标准的不同,建议将其划分为“输入阶段”和“输出阶段”两部分进行独立分析。输入阶段海量复制与制作临时副本的行为存在“市场失灵”现象,应将其纳入合理使用范畴。同时,为了维护权利人的利益,也应当赋予作者在营利性使用中的“选择-退出” 权,防止过度侵害著作权人的利益。其次,TDM输出作品不能一概视为合理使用。当其抓取作品片段过多,对在线作品表达达到实质性相似程度时,应以侵权视角审视。以组合进阶式标准作为侵权判断的原则是:首先,利用“整体观感法”从整体上缩小实质性相似作品的范围;其次,采用“抽象分离法”对抽象分离出的独创性表达进行精细化比对,以确定实质性相似程度的高低。

猜你喜欢
实质性著作权法权利
新《著作权法》视域下视听作品的界定
拜登和习近平举行“广泛和实质性”视频会晤
众议新《著作权法》 版权保护覆盖面扩容,期待相应细则出台
股东权利知多少(二)
孤独会造成实质性伤害
股东权利知多少(一)
法律援助的实质性分析
权利套装
爱一个人