馆藏版权清算的困境与出路
——兼议“孤儿作品”使用立法的必要性

2022-07-07 09:19陈晓屏
海峡法学 2022年2期
关键词:孤儿馆藏区块

陈晓屏

一、研究缘起

自本世纪伊始,各国纷纷对文化遗产开展大规模系统性的数字化转录。随着实体文献陆续转化为数字形态,图书馆、档案馆、博物馆、美术馆等文化记忆机构(以下简称“记忆机构”)的社会定位也在悄然发生变化,不再只是文化遗产和国家记忆的保管场所,而是日益转变为集文化资源的挖掘提取、保藏修复、关联整合、传播展示等功能于一身的“创新使能者”。①张喆昱、张磊:《记忆机构的开放数据建设和数字化服务转型》,载《图书馆论坛》2020年第5期,第21页。然而,相对于数字馆藏的规模,当前总体的开放获取水平还不高,与信息获取新常态下公众对于广泛访问数字文化资源的需求存在较大差距。此中的障碍主要来自版权法上的授权使用法则。

“先授权后使用”是现代版权法上的金科玉律。无论记忆机构还是其他主体在对数字馆藏作进一步的传播和利用前都必须实施版权清算,以确保使用的合法性。版权清算(copyright clearance)是对以获取作品使用权限为目的而采取的一系列活动的统称,包括确认作品版权状态与归属,查找并与权利人取得联系,获得授权许可以及支付版权费用等。但馆藏文献的版权信息缺失问题比较严重——尤以“作品孤儿化”现象为甚,①“孤儿作品”(orphan works)是指版权人身份不明或者身份明确但无法联系的、受版权保护的作品。极大增加了清算难度。大部分公共记忆机构的可支配资源和风险承受力十分有限,②侵权使用除了可能引发诉讼和赔偿,给记忆机构的财务造成负担并有损其社会声誉,因此它们通常对法律风险持排斥和回避态度。全面开放馆藏所需的清算成本和潜在风险均超出其承受范围。③例如,根据粗略估算,英国电影研究院在为期4年的“解锁电影遗产项目”中花费的版权清算成本为285200英镑,平均每件作品耗费55.17英镑。大英图书馆的“发现文学项目”提供的清算成本数据则以工时为形式:平均每件作品耗时为12小时(含对员工进行版权知识培训),按最终查明400名创作者计算,共计耗时4800小时;保守估计需支出报酬61536英镑。See Victoria Stobo,etal.,EnDow Project Report 3,at https://diligentsearch.eu/resources/,last visited 2020-11-10,下载日期:2020年11月10日。.从既往研究来看,记忆机构对于版权清算普遍持谨慎保守态度,往往根据使用需要对于潜在清算对象进行前期摸底评估(pre-clearanceresearch)和风险计算(risk calculation),有选择地实施确权清算并根据清算结果决定后续的利用方式和开放程度。④例如,中国国家图书馆的“民国文献资源开放存取”项目就是以民国文献数字资源建设和公有领域文献筛查等工作为基础,根据文献的版权状态进行区别处置:仍在版权保护期内且能找到权利人的,先获取相应授权再进行汇编、网络传输等利用;无法判定版权状态或找不到权利人的文献,仅开放目录和摘要;已逾版权保护期的或本身不受版权保护的文献,方可开放全部内容。不乏开放获取项目因预期成本过高而被搁置。⑤例如,奥地利因斯布鲁克大学图书馆斥资15万欧元,完成了对216000件发表于1925-1988年的德文论著(占馆藏图书期刊15%-20%)数字化,此后却无意继续寻找权利人,一个重要原因就是后续投入版权清算的成本可能高达到数字化成本的20-50倍。See Anna Vuopala.Assessment of the Orphan works issue and Costsfor Rights Clearance,European Commission DG Information Society and Media Unit E4 Accessto Information,2010,p.24.时至今日,包括中国国家图书馆和英国国家档案馆在内的众多一流记忆机构仍囿于清算困难而未能全面开放数字馆藏。⑥参见李华伟:《民国文献数字化利用及其著作权问题——以国家图书馆馆藏为例》,载《图书馆建设》2010年第10期,第18页。Also see Intellectual Property Officeof UK.Consultation on reducing the duration of copyright in unpublished(“2039”)worksinaccordance withsection170(2)of theCopyright,Designsand PatentsAct1988,Annex A,athttps://www.gov.uk/government/consultations/reducing-the-dura tion-of copyright-in-certain-unpublished-works,下载日期:2020年6月5日。美国联邦版权局曾一针见血地指出这种状况对社会效益和版权法宗旨的弊害:“当版权状态的不确定性成为公众获取作品的绊脚石时,即使权利人实际未主张权利或者事实上并不反对他人使用,公共福祉依然有受损之虞。”⑦Copyright Office,Library of Congress.Orphan Works:Noticeof inquiry,at http://www.copyright.gov/fedreg/2005/70fr3739.html,下载日期:2018年8月9日。

馆藏版权清算困境的形成机理可以表示为图1的闭环结构。资源、成本和收益中任何一者的固有弱点均在其余二者的挟制下被凸显和放大:(1)资源稀缺性一方面制约了清算工作的开展和优化,另一方面烘托出成本的高昂;(2)确权清算的成本以及由清算失误和清算未果招致的风险成本,相对于非营利性记忆机构的资源承载力和清算取得的成效,难谓经济合理性;(3)资源供给与成本需求之间差距悬殊,确权清算进展缓慢,导致可供合法利用的文献在馆藏体量中占比不高。在无外力介入的情况下,三者形成了较稳定的低效均衡状态;唯有改变三者的力量对比或者引入新的常量,才可能推动它演化至更高阶的有效均衡。

图1:版权清算困境的闭环结构

当今世界已迎来新一轮信息化和智能化技术革命浪潮,在大数据、云计算、区块链、人工智能、开源、众包等新技术、新方法的赋能下,诸多传统领域实现了升级、变革和创新。技术赋能的理论和应用成为法律、出版传播、图情等学科研究的热点和趋势。在这种背景下,域内外学者就破解馆藏版权清算困境、推动数字馆藏开放获取提出了三种以技术赋能为核心特征的思路。

二、解决思路一:借助区块链改善馆藏版权清算的信息环境

区块链是集成了共识机制、加密算法、分布式数据存储和点对点传输等多方面研究成果的综合性技术系统。依靠数据记录、存储和维护的多方参与,数据交换的去中介化,数据与合约的链式存储等核心技术架构,区块链在所有参与者间实现了信息的共享、共识、共担,在信息不对称的环境中建立起价值交互所需的“信用机制”,为经济转型和社会治理提供了新的思路。①腾讯研究院等:《腾讯区块链方案白皮书——打造数字经济时代信任基石》,载https://trustsql.qq.com/chain_oss/TrustSQL_WhitePaper.html,下载日期:2018年11月1日。在版权实务和司法领域,区块链应用已从概念验证走向规模化落地。

(一)对区块链应用思路的梳理

不少学者相信区块链技术在信息管理方面的优势特征将为解决馆藏资源的版权清算和“孤儿作品”问题带来福音,并提出了两种不同方向的应用思路。

第一种思路是全面构建“版权登记区块链”,整体改善版权信息状况,减轻因信息不对称给版权清算制造的难度和成本。②华喆:《区块链技术与智能合约在知识产权确权和交易中的运用及其法律规制》,载《知识产权》2018年第2期,第15页。在我国现行法上,除版权质押以登记为效力要件外,版权的取得、转让和许可均以自愿登记为原则,登记仅有有限的证明力;③刘春田主编:《知识产权法(第五版)》,中国人民大学出版社2014年版,第86页。登记机构和规范不统一,手续不便、费用较高等也是公众自愿登记积极性不高的原因。④邵燕:《孤儿作品著作权登记制度研究》,载《广西政法管理干部学院学报》2017年第4期,第17页。从某种意义上说,作品孤儿化现象的发生就是由于缺少一本公开、内容完整的版权“账本”。区块链的技术特征能够在某些方面改善版权交易中的信息不对称:数据上链时自动加时间戳并依次形成相连区块,为司法实践中认定创作完成先后、权利移转时间等提供了有力证据;原始数据及更新数据在上链时面向全网“实时广播”,减轻了因分散登记造成的版权信息共享不畅。

第二种思路是构建“孤儿作品登记区块链”,将使用者为查找权利人而采取的步骤、结果和经查实的孤儿作品信息通过区块链加以记录和共享,利用区块链的公开可查询,让后来使用者免于重复查找;①吕炳斌:《区块链技术能否解决“孤儿作品”版权难题》,载《人民论坛·学术前沿》2020年第5期,第89页。凭借区块链难以篡改性,将查找过程与结果形成电子存证,便利事前行政审查或事后司法审查。②SeeJakeGoldenfein&Dan Hunter,Blockchains,Orphan Works,andthePublic Domain,41ColumbiaJournalof Law&theArts1(2017),p.24.

(二)对区块链应用思路的再检视

这两种思路皆旨在借助区块链的公开性和难以篡改性从源改善版权信息不对称,提升清算效率,有一定合理性;但从馆藏资源的特点、作品孤儿化现象的成因以及区块链技术特征等方面来看,均非解决馆藏版权清算难题的自足方案。

1.区块链无法自发地纠正信息偏在

版权客体的形而上特征、现代创作活动的专业分工以及信息搜集处理的高成本,导致与授权使用相关的信息在占有与需求两方面严重分离。权利人主动提供和第三人查找是公众获取作品版权信息的两种渠道。权利人是版权信息的主要生产者和提供者,但生产与提供信息需要成本投入。在无外力强制的情况下,只有当预期效用大于机会成本时,权利人才愿意“投资”;当成本明显大于预期效用时,则不会自发地向市场提供信息。③美国版权局2015年《孤儿作品与大规模数字化报告》承认,作品数字化登记对广大视觉艺术家来说意味着时间和经济方面的负担,唯富有者才能承受;专为视觉艺术作品在线登记而设的PLUS(Picture Licensing Universal System)实际上主要是为职业艺术家服务,并不适合于所有摄影者。See Orphan Works and Mass Digitization:A Report of the Register of Copyrights,U.S.Copyright Office,2015,p.52.有学者批评美国版权局关于创设线上作品登记系统以完善版权信息、改善勤勉查找效率的想法是建立在一个似是而非的假定前提之上——有了登记系统权利人就会欣然前来办理登记。See Aaron C.Young,Copyright's Not So Little Secret:The Orphan Works Problem and Proposed Orphan Works Legislation,7 Cybaris Intellectual Property Law Review.202(2016).p.221.权利人缺乏权利宣示和权利管理的动机是导致作品孤儿化的根本原因,这在馆藏文献中表现尤为突出。④馆藏文献的一个特点是年代较早的作品在总量中占比较大。据兰德斯和波斯纳等学者的研究,绝大多数作品的市场价值随时间推移而急遽衰减。另一特点是非商业性作品占比较大。与流媒体音乐等率先试水区块链的版权对象不同,馆藏文献的经济价值远远低于其史料、文化价值。因此,虽然整体上看,引入区块链有助于提升版权登记的效率,但对大部分馆藏文献权利人的行为选择不会产生显著影响,也就难以通过自愿登记来纠正信息偏在。

由于权利人自愿登记激励不足,第三方(记忆机构及其他有意使用者)的查证事实上成为获取馆藏文献版权信息的唯一一手信息来源。“孤儿作品登记区块链”仅能作到对查证的孤儿作品信息进行数字存证和共享,从而避免重复查找,但是对于最关键的初次查找没有直接助益。缺少了活跃的初次查找,孤儿作品信息登记共享也就成了一个伪命题。加之,我国自民国以来的大量孤本、手稿、地方特色史料等多为独家收藏,馆际重复查找造成的效率损失并不突出,在这种情况下区块链介入的意义也就不大。

2.区块链无法保证上链数据的可信性

数据的可信性是区块链存证应用的价值前提。区块链电子证据效力建立在存证平台的固证技术能够清晰反映数据的来源、生成及传递路径的基础上,为取缔网络侵权提供了高效可靠的证明手段。但在版权登记和孤儿作品信息登记的场景下,相关数据均来源于链外且多形成于线下,单凭区块链本身无法对上链数据进行溯源与核实,难以防范“僭称创作”“侵权登记”等现象;也没有统一的标准或者验证机制对第三方提供的孤儿作品查证信息加以验证。

综上所述,由于行动成本较高而缺乏相应激励,早期馆藏文献的权利人和潜在使用者不太可能自发地供给版权信息,进而导致以区块链为底层技术构建的版权登记系统和孤儿作品登记系统成为“无本之木”,无法起到改善馆藏版权清算环境的作用。事实上,无论是区块链还是区块链基础上的智能合约,都要与外界实现数据交换,无法剔除人的因素而自足地运行。在这个意义上,人工智能技术作为一种不受行为经济学规律约束的“人力资源”,为破解馆藏版权清算难题提供了另一条技术赋能型思路。

三、解决思路二:利用人工智能提升馆藏版权清算的查找效率

“人工智能是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术和应用系统的一门新的技术科学”,①腾讯研究院等编著:《人工智能》,中国人民大学出版社2020年版,第23页。目标是“让机器做本来由人类智能做的事情”。②[美]史蒂芬·卢奇,丹尼·科佩克著:《人工智能(第二版)》,林赐译,北京邮电出版社2018年版,第5页。人工智能应用在许多领域展现出了人无法比拟的优势,也被寄望于改善版权信息查找的效率。更有学者建议在未来条件成熟时考虑直接赋予标准化的智能查找以法律效力,省却人工审查,降低孤儿作品使用制度的运行成本。③SeeJakeGoldenfein&Dan Hunter,Blockchains,Orphan Works,andthePublic Domain,41ColumbiaJournalof Law&theArts1(2017),p.34.

(一)智能查找分析在馆藏版权清算中的应用

始于2008年的ARROW是版权信息智能查找分析的先驱,全称是“版权信息登记与孤儿作品系统”(Accessible Registries of Rights Information and Orphan Workstowards Europeana),旨在通过“一站式权利信息检索平台”推动泛欧盟文化遗产数字化进程中的孤儿作品确认与授权使用难题的解决。④See IFLA Trend Report:Advancesin artificial intelligence,at https://trends.ifla.org/lit-erature-review/advances-in-artificial-intelli gence,last visited,下载日期:2017年4月28日。ARROW的基本技术架构包括在线交互界面、分布式作品数据库网络、搜索引擎以及可写入的登记系统。成员国的公共记忆机构可以用户身份在ARROW平台上提交使用某一作品的申请。搜索引擎将向各国的公共图书馆、研究型图书馆、档案馆、出版商协会、复制权集体管理组织、创作者行业协会等组成的数据库网络发送作品信息查询和数据交换请求,再将反馈的元数据转换为统一格式的代码。系统自动从反馈数据中提取有效信息,判断被查询作品的版权状态,并按照“尚在著作权保护期抑或归入公有领域”“已经绝版抑或仍在流通”“是否属于孤儿作品或‘疑似孤儿作品’”进行标记后收录进对应编目,并将结果反馈给用户。⑤See Cinzia Caroli&Gabriella Scipione,ARROW:Accessible Registriesof Rights Information and Orphan Works Towards Europeana,at ht tp://www.dlib.org/dlib/january12/caroli/01caroli.html,下载日期:2019年11月30日。.

英、荷、意等国几所高校的研究团队开展了名为“以分布式孤儿作品版权清算改善20世纪文化遗产的获取”(Enhancing Access to 20th Century Cultural Heritage through Distributed Orphan Works Clearance,缩写为EnDOW)的课题。他们认为欧盟《孤儿作品指令》在成员国转化实施效果不尽如人意的原因在于“勤勉查找”(diligent search)要件在可执行性较弱,并提出信息检索和查询的智能化是提升公共记忆机构查找效率的出路,并构思了一个双层多步骤的智能运算系统。⑥See Jake Goldenfein&Dan Hunter,Blockchains,Orphan Works,and the Public Domain,41Columbia Journalof Law&the Arts1(2017),p.20.第一层的“公共领域计算器”将根据用户输入的信息推算被查询作品的版权保护期。若作品已落入公共领域,则查找流程到此结束;若版权保护期尚未届满或无法确定,则继续执行第二层运算。第二层的搜索引擎以“作品首次出版或播放地所在国法”为准据法——对未出版且未播放者则为馆藏所在地国法——确定查找范围,在数据库网络中查找权利人信息。查找结果分为三种:其一,作品被认定归入公有领域,查找流程到此结束;其二,作品仍在版权保护期内但权利人查找无果,该作品构成孤儿作品;其三,作品仍在版权保护期内且找到其权利人。计算机系统将自动对查找结果进行分类备案并反馈给查询用户,以便用户根据作品版权状况采取相应行动——自由无偿使用、寻求授权、依孤儿作品使用规则使用或者放弃使用。

上述两例均利用了计算机程序来模拟人类专家求解的过程。这种由人机交互界面、推理机、知识库和综合数据库等核心组件构成、运用知识和推理来解决复杂问题的计算机程序被称为“专家系统”,是“最早走向实用的人工智能技术”,也是法律实务中应用最多的人工智能技术。①李德毅主编:《人工智能导论》,中国科学技术出版社2018年版,第133页。交互界面是用户输入数据和获得反馈的端口。通常,系统会引导用户提供已知事实并对需要解决的问题进行准确描述和限定。推理机根据一定策略对知识库中的规则进行检测,看是否有规则的前提被已知事实满足;如果满足,则输出该规则的结论,再以之为前提继续下一轮推理或者执行输出的操作指令(如搜索互联网);如此进行,直至目标被某个规则推出或者再无结论被推出为止。至此,系统对上述各阶段输出的结论进行汇总并计算其逻辑关系,形成结论报告。

专家系统的引入大大降低了人的因素(如情绪、疲劳)的影响,提高了工作效率。有数据显示,ARROW在法、德、西、英四国的试运行较之人工查找分别节约了88%、94%、72%和97%的时间,在人工费用较高的情况下,也就相应节省了资金。②http://www.dlib.org/dlib/january12/caroli/01caroli.html,last visited,下载日期:2019年11月30日。不过,在欧盟统一层面上,利用ARROW进行查找仅是“勤勉查找”中的一步,这表明单凭该项技术操作还难以实现全面查找。

(二)人工智能在版权清算中的应用瓶颈

版权清算集事实查明与法律分析于一体,本质是对有法律意义的信息的收集和处理。尽管智能化是未来法律业务升级的趋势,但现阶段要在馆藏版权清算场景中实现高度智能化的查找分析还面临较大障碍。

1.经验性知识不易提取。“知识是智能的基础。”③李德毅主编:《人工智能导论》,中国科学技术出版社2018年版,第23页。要使计算机模拟人的智能行为,就必须赋予其知识。馆藏版权清算所需的专业知识中有大量来自实践积累的经验性认知,而经验蕴含着不精确性及模糊性,④同上,第25页。专家个人虽然能够凭借经验开展工作和解决问题,却未必能提炼出供机器使用的知识。现实中,图书馆、档案馆专业学会或协会制定的最佳查找指南(Best Practice)历来都以专业人士为预设的阅读者和指导对象;也只有专业人士能够凭借知识、经验和直觉理解指南中大量非精确的知识描述。若机械地将操作指南转化为规则和算法,运行起来必然是粗糙的。

2.知识库覆盖性不足。专家系统的运作机理是利用产生式规则从知识库中匹配出一个最靠谱的答案,在知识库涵盖范围内运行良好,一旦超出知识库范围内,性能就急剧下降甚至无法求解。一般来说,领域知识越容易被结构化描述,专家系统的研发和应用越容易取得成功;反之,对人更加依赖。在互联网高度普及的今天,与版权清算有关的元知识呈现出形式多媒体性①数字技术改变了知识表达样态,网络又为不同样态的知识提供了承载空间和传播媒介。例如网上一段对作家生平的介绍就可能包含文本、视频、结构化的信息框等多种形式。、分布分散性②相关知识无法自发地以集中或相互关联的形式呈现,例如民国时期作者的基本信息可以从百科、传记、地方志中查找,但著述的发表和出版情况通常要从民国文献数据库或图书馆、档案馆获取。、存在隐蔽性③一些有价值的知识可能隐藏在链接或资源文件中,甚至隐含在文献语义中,无法用爬虫程序爬取。和组织异构性④知识本体语言表示的差异,知识概念化的不匹配等都会导致知识结构形式的差异。例如,建模者可能出于不同需要将作品划分为自然人作品和法人作品,也可能划分为职务作品和非职务作品。又如,英美法上“雇佣作品”(work madefor hire)的外延大致同于我国著作权法上的职务作品与委托作品外延之和。机器不能自主识别这些术语的关系。等特点,极大限制了知识库的扩展与更新。在互联网之外,还有许多数据和知识因人为或技术的限制而无法被远程访问和获取⑤例如,在英国知识产权局列出的211个必须查询的数据库中,可线上访问的仅约七成,超过两成必须亲赴实地索取信息。See Marcella Favale,Simone Schroff&Aura Bertoni,EnDow Project Report 1,athttps://diligentsearch.eu/resources/,下载日期:2020年11月10日。。

3.机器自学的条件尚不具备。不同于人类可以从少量数据中学习到模式特征,建立超出其经验的推论,专家系统还没有自主获取知识的能力,只能从人那里被动地接受知识。“惟有具备学习能力才能克服人工智能发展的‘知识瓶颈’”,“让机器持续不断地有足够的数据可用。”⑥刘东亮:《技术性正当程序:人工智能时代程序法和算法的双重变奏》,载《比较法研究》2020年第5期,第68页。自20世纪80年代起,机器学习理论被提出并发展为人工智能最重要的分支。机器学习是通过对历史数据的分析和建模,挖掘有价值的信息来改善算法模型对新数据的处理能力,是一个“从统计到逻辑”的过程。⑦杨延超著:《机器人法:构建人类未来新秩序》,法律出版社2019年版,第84页。机器学习的实际表现与其所属领域的数据和目标能否被结构化描述、数据规模和完整性、无法预知的情况出现的概率以及评价标准的主客观性等诸多因素有关。以深度学习为代表的无监督学习模型尤为依赖海量数据集的投喂和持续的实践应用训练。⑧腾讯研究院等编著:《人工智能》,中国人民大学出版社2020年版,第23页。然而,囿于资金和技术限制,馆藏版权清算实践积累薄弱,难以产生足够的历史数据满足机器学习之需;已获得的实践经验和历史数据往往未经标准化、结构化处理,也不能直接为机器学习所用。因此至今鲜有以馆藏版权清算为应用场景的机器学习实例。

综上所述,由于知识获取的瓶颈和训练数据的稀缺,短期内人工智能仅能作为人的辅助工具而无法独当一面,人的作用依然不可或缺。要弥合公共记忆机构在版权清算中存在的资源约束——成本过高——效率偏低的闭环,就必须引入外部的人力资源。下文提及的“众包”作为一种开放创新协作模式,有望引入外部智力来支持打破传统上封闭集中的馆藏版权清算格局,形成“内外双循环”的动力机制。

四、解决思路三:运用众包缓解馆藏版权清算的资源约束

众包(Crowdsourcing)一词最初指将原本由企业员工执行的任务外包给不特定的网络大众,利用大众的知识盈余来创造价值的商业模式,⑨[美]杰夫•豪著:《众包:大众力量缘何推动商业未来》,牛文静译,中信出版社2009年版,第VI页。如今其外延已扩大为“个人、机构、非营利组织或公司,面向知识参差、性质各异、数量不定的群体公开征募志愿者来完成特定任务的参与式网络活动”。⑩E.Estellés-Arolas&F.González-Ladrón-de-Guevara,Towardsan Integrated Crowdsourcing Definition,2 Journal of InformationScie nce189(2012),p.197.近年来,众包已经超越了商务和计算领域,许多专业学科都开始关注众包在特定行业和背景下的应用。格拉斯哥大学“版权与创新经济中心”的学者将利用众包模式实现版权信息分布式查找,视为解决馆藏版权清算困境的蹊径。①See Maurizio Borghi,Kris Erickson&Marcella Favale,With Enough Eyeballs All Searches Are Diligent:Mobilizing the Crowd in Copyrig ht Clearance for Mass Digitization,16 Chicago-Kent Journal of Intellectual Property 135(2016).

(一)众包在馆藏版权清算中应用的合理性

基础理论研究认为,作为一种新生产组织模式的众包具备以下基本特征:

其一,众包属于网络活动范畴。以信息网络技术为代表的新生产力和以参与式文化为代表的新型社会生产关系是众包形成的基础条件。“互联网的敏捷性、广域性、时间灵活性、匿名性、交互性、低准入以及承载各种形式的能力,使其成为一种促进创造性参与的良好媒介。”②[美]达伦•C.布拉汉姆著:《众包》,余渭深、王旭译,重庆大学出版社2016年版,第21~22页。

其二,它是“自上而下的组织管理”与“自下而上的价值创造”的有机结合。发包方是价值创造活动的激发者、引导者和组织者,有权设定目标和验收成果。③Richard A.Epstein.The Political Economy of Crowdsourcing:Markets for Labor,Rewards,and Securities,82 University of Chicago Law R eview Dialogue35(2015),p.39.接包方为网络社群成员,他们参与自愿,退出自由,自主决定采用何种方式解决问题、完成任务。个体的独立性、异质性和多样性是创造力迸发的源泉。④刘晓芳著:《众包:微观时代》,商务印书馆2011年版,第61页。

其三,参与双方均能从中实现某种需求。发包方取得接包方创造的价值;接包方投入劳动、金钱、知识和经验,从任务执行过程和完成结果中实现某种需求,例如经济回报、心理满足、知识技能、集体认同、娱乐消遣等。⑤[美]达伦•C.布拉汉姆著:《众包》,余渭深、王旭译,重庆大学出版社2016年版,第21~22页。

众包的特点与馆藏版权清算的任务特点较为契合,众包的优势又因应了馆藏版权清算的诉求。

首先,馆藏版权清算的主要任务是确认文献的版权状态和查找权利人性质,属于“知识发现和管理”。近十年来,众包在知识发现和管理方面的效率优势已经在商业、社会治理、文化等方面广为应用,例如美、澳、英等国的知识产权行政主管机关曾利用Peer-to-Patent项目征募大众协助查找与专利申请相关的在先技术,缓解专利审查员的负荷。又如Zooniverse平台开展的“Old Weather”航海日志天气数据摘录项目,上海图书馆的盛宣怀档案抄录项目,Distributed Proofreaders平台对“古滕堡项目”数字图像的文本转录众包等,将计算机难以处理的文本、图像交给大众处理。这些实践不仅提供了前车之鉴,而且起到了架设平台、聚集用户、引发关注的作用。

其次,鉴于版权清算的目的是根据文献版权状态依法使用、避免侵权,记忆机构必须把控完成的质量。众包模式在引入大众协作理念的同时,又保留了“自上而下控制”的层级特点,符合馆藏版权清算的需要,具体表现为:记忆机构作为发包方,合理设定任务颗粒,⑥例如将一篇文献的清算任务拆分为确认作者国籍、作品创作年代、版权状态、出版单位、作者的生卒年和继承情况或其他某项版权信息等细小的“颗粒”。任务颗粒化有助于提高完成率,增强参与者的满足感,还可以防止个别任务完成质量不佳(如查找遗漏、认定结果有误或无法按时完成)而给整体进程造成实质影响。引导参与者选择感兴趣且得心应手的任务,以期提高完成率,激发参与热情;审核参与者提交的成果,决定是否采纳其结论和佐证、是否需要补充查找。

最后,众包以网络为依托和媒介开展分布式协作,降低了大众的参与门槛,为记忆机构以较低成本获取外部智力支持提供了入口。一项以15所欧洲记忆机构为调查对象的实证研究发现,全职从事版权清算的人员通常不到2人。①See Victoria Stobo,et al.,EnDow Project Report 3,at https://diligentsearch.eu/resources/,下载日期:2020年11月10日。众包放大馆藏版权清算的工作环境和执行者的范围,有助于打破成本过高而效率偏低的闭环,带来一定的规模经济效应和范围经济效应。②在产业经济学上,规模经济是指在给定技术水平上,因生产规模加大,同种产品产量增加,单位产品的生产经营成本得以降低,从而带来的经济性;范围经济是指企业利用原有生产条件同时生产多种产品时,使单位产品的生产经营成本低于分别生产每种产品时的单位成本而形成的经济性。此处,众包的规模经济效益体现为以较低成本获取较丰富的人力资源;范围经济效益则源于参与者多样化的知识结构和创造性思维方式。

(二)众包在馆藏版权清算中应用的制约因素

1.有效激励不足可能动摇众包基础

众包的生产力源于网络群体的规模化和异质性;众包的可行性和有效性主要取决于能否征募到足够多的、适格的参与者。而创设有效激励是众包应用的关键。因为根据行为经济学理论,公众在决定参与之前会基于相关信息评估个人的预期效用,只有当其相对于个人偏好的价值大于给个人施加的成本时,才能产生动员参与的效果。③[美]曼瑟尔•奥尔森著:《集体行动的逻辑:公共物品与集团理论》,陈郁等译,格致出版社、上海人民出版社2019年版,第61页。

然而,任务的专业性与资源的有限性极易导致馆藏版权清算众包的有效激励不足。一方面,馆藏版权清算对参与者的法律知识、检索技术、文史知识甚至外语水平有一定要求,客观上限制了参与者的规模。通常,参与者的专业水平越高,从事众包的机会成本也越高,也更难被激励和调动。另一方面,大多数记忆机构的财务并不宽裕,无法提供有吸引力的物质回报或者个性化的激励。有理由推断,凡参与非营利性众包的志愿者大都出于物质利益以外的动机;与受高额报酬驱动的参与者相比,前者对个人投入的成本更为敏感。因此,将个人成本控制在参与者合理承受范围内殊为必要。

2.记忆机构不敢轻易采信外部人员的查询结论

作为公共文化服务提供者,社会声誉是记忆机构的核心评价指标,这使它们十分顾忌侵权指控与败诉结果带来的不良影响。康奈尔大学图书馆高级政策顾问Peter Hirtle曾声明,“‘不构成侵权’与‘虽然构成侵权、被诉及高额判赔风险很低’之间是有天壤之别的。康奈尔大学的原则是不从事任何侵犯版权的行为,而非‘畏于高额赔偿而不从事侵权行为’。”④David Hansen,Digitizing Orphan Works:Legal Strategiesto Reduce Risksfor Open Accessto Copyrighted Orphan Work,Harvard Library,No.27840430(2016),p.32.风险排斥型行为取向导致记忆机构不敢轻易采信外部参与者的查找结果,令众包失去意义,显得得不偿失。

可见,众包模式在实践中很可能面临“供需两不旺”的尴尬处境。无论如何,应当明确的是,现阶段公共记忆机构可用于引进新技术、构建新模式的资源与可投入版权清算的资源一样是有限的,因此,在寄望于技术赋能的同时,必须将资源约束纳入可行性分析,权衡利弊,确保将有限的资源投入更具效益的方向。

五、馆藏版权清算困境的出路选择

(一)技术路径的“通病”:激励机制缺失导致技术赋能效果受限

不同于物权对象主要通过权利人“自用”来实现价值,知识产权对象的价值实现更多依赖于“他用”,即授权或许可他人使用。人们对文化产品的需求是弹性的,当使用成本过高时便会放弃使用或者转向替代品。如果不能保证清算主体在清算未果时得以一定条件使用作品,必然使其对这种高投入低回报的活动敬而远之。相反,如能赋予尽到“勤勉查找”仍然无果的清算主体以有条件使用作品的资格,或对其使用作品招致的侵权责任予以限制,不仅可以使清算成本更加可控、可预测,还将切实提升可供依法使用的馆藏文献比率,避免清算无果带来的净损失,对于记忆机构实施清算具有激励作用。

我国尚未建立“孤儿作品”使用制度。著作权法上虽有若干条款在调整对象与适用范围上与孤儿作品存在交叉,但在内容合理性、可操作性和适用对象范围等方面皆有欠缺,不足以为数字馆藏一体化开放和创新性利用提供系统的授权使用方案。《著作权法》第三次修订过程中一度对此作了正面回应:2014年“送审稿”曾就“孤儿作品许可使用”作了原则性规定,旨在克服制约海量作品数字化使用的授权瓶颈。但该条款终未出现在2020年全国人大常委会的“审议稿”及同年通过的修正案中,也未代之以其他规定。同时,此次修正案的“合理使用”条款延续了封闭列举的立法模式,对馆藏开放利用的支持力度有限。因此,在今后一段时期内馆藏文献资源的合法利用仍面临授权使用法则和版权清算困境的双重制约。

再观前述三种解决馆藏版权清算困境的思路,均试图依靠信息化、智能化技术赋能,从“找资源”“降成本”“提效率”等方面入手,改变馆藏版权清算的低效闭环格局。但由于相关制度规范的缺位,记忆机构及其他潜在使用者无法从实施繁琐而成本高昂的版权清算活动中获得可预期的收益——合法使用作品的机会,不仅挫伤了他们实施版权清算的积极性,也连带限制了技术赋能的作为空间及效果。

第一种路径旨在利用区块链技术架构的公开透明性和不可篡改性来改变版权信息缺失严重的现状,提升清算效率。但在现行著作权法的权利义务结构下,版权信息和“孤儿作品”查证信息的供给与准确性均无从保证,区块链作为一种数字存证工具对解决馆藏版权清算困境的作用不大。

第二种路径是引入人工智能技术来分担记忆机构的查找负担。但理论和实践表明,人工智能目前还无法自主分析处理馆藏版权清算所涉及的复杂的事实问题和法律问题。更重要的是,由于我国著作权法缺少规范意义上的“孤儿作品”和“勤勉查找”概念,未就查找范围和方式作出合理限定,人工智能系统开发者在初始阶段设定运算目标与任务时缺乏明确、统一的指针,以智能运算结果作为清算和后续使用的依据仍存在较大的责任风险,不能使馆藏版权清算高投入低回报的状况得到根本改观。

第三种路径是采用众包作为版权清算的组织模式,实质上是利用互联网通讯技术放大版权清算的工作环境,挖掘潜在的人力资源。但由于馆藏版权清算的资源约束和专业属性,众包的可行性及成效极可能因有效激励不足而受到影响。并且,借助网络大众的智慧进行分布式查找同样面临着查找过程与后续使用“无法可依”的窘境。

(二)取道制度路径:为版权清算的实施与优化提供激励机制

技术路径既非自足,现阶段唯有从制度层面明确地对版权信息查找方式和查找结果的法律效力予以规范,保障清算成本投入获得相应收益,才能瓦解资源-成本-收益之间的低效闭环结构,调动记忆机构和其他潜在的文献使用者投身和投资于版权信息这种公共产品的生产与供给,消除馆藏资源开放获取和转化利用的障碍。

1.创设孤儿作品使用机制以扩展馆藏文献的可合法使用比例

在现行制度下,孤儿作品因无从获得授权许可而缺少合法使用途径,对以使用为目的的清算主体来说,前期投入成本基本沦为净损失——鉴于孤儿作品广泛存在于馆藏资源中,由此造成的损失规模不可小觑。创设孤儿作品合法使用机制,允许清算主体在查找无果时以一定条件、遵循一定方式使用此类作品,将显著扩展可合法使用的馆藏文献比例,扭转馆藏版权清算“高投入低回报”的劣势,从而提高记忆机构实施版权清算的激励水平。

2.规范查找方式与渠道以控制清算成本与风险成本

纵观域外孤儿作品使用立法例,皆以适恰查找而未果作为确认孤儿作品的基本方式和允许查找者依法使用该作品的前提条件。若无明确规范加以指引,实践中可能走向虚假查找或者过度查找两个极端——前者可能产生大量“假阳性”结果,损害“非孤儿作品”版权人的利益,后者既不公平又浪费资源,无助于解决版权清算困境。建议将规则模式的确定性与标准模式的弹性相结合,根据文献种类列举基本的查询渠道,并将“诚信合理的努力”作为抽象标准以填补列举之不足或减除列举之冗余。这样一来,清算主体便得以建立标准化的查找模式,改善清算过程与成本的可预期性和可控性,还将消弭规范不明确时对人类专家知识和经验的依赖性,增强人工智能、众包等应用的可行性。

3.设计激励相容的版权人救济机制以实现权义结构的再平衡

版权所有者是否以及如何进行权利宣示和权利管理属于私权自治范畴。用美国版权法专家David Nimmer的话说,版权法允许权利人“袖手旁观”(sit back and do nothing),他们没有义务主动披露权利信息的义务或者积极回应他人许可请求;法律不能因其不作为而惩罚性地限制其权利。①Authors Guild v.Google,Inc.,770 F.Supp.2d 666(S.D.N.Y.2011),at 681.这极易使我们忽略:权利人在给定条件下最大化个人效用的动机是导致大量低经济价值的馆藏文献因信息缺失而难以清算的根本原因——制度、市场、技术、文化等因素仅仅是作用于个人成本-收益结构而影响其行为决策。在大多数情况下,权利人是孤儿作品问题负外部性的“最小成本防范者”。②Ariel Katz,The Orphans,the Market,and the Copyright Dogma:A Modest Solution for a Grand Problem,27 Berkeley TechnologyLawJourn al 1285(2012),p.1306.因此,要从根本上克服孤儿作品对馆藏版权清算的阻碍,不能仅从事后维度考虑如何在相关主体之间分配由此产生的社会成本——这实质上是将权利人不愿内化的权利宣示和权利管理成本转嫁给潜在使用者和最终消费者;而应当从事前维度考虑如何促使信息占优的权利人主动宣示权利,以及如何遏制权利人实施事后机会主义行为的动机。可兹采用的制度设计主要包括:由权利人对清算者“未尽诚信合理的努力”进行举证;以法律形式或者由第三方确定孤儿作品的使用费;对权利人行使费用请求权设定期限;对权利人行使停止使用请求权的情形加以限制。上述制度设计在满足《伯尔尼公约》之“三步检验法”的基础上实现了“激励相容”,因而能够促使权利人选择“合作”,达到保护清算主体的信赖利益、增进社会效益的目的。

猜你喜欢
孤儿馆藏区块
馆藏几件残损《佚目》书画琐记
黑龙江省书法活动中心馆藏拓片选
云南省档案馆馆藏《东巴经》
区块链:一个改变未来的幽灵
区块链:主要角色和衍生应用
《红楼梦》的数字化述评——兼及区块链的启示
一场区块链引发的全民狂欢
孤儿
介绍两件馆藏青铜器
孤儿也感到好幸福