占春红,袁庆东(江苏师范大学图书馆)
独创性是世界各国著作权法对作品以及汇编作品的实质性判断要件,包含独立性和创造性,独立性即独立完成,区别复制和抄袭,而创造性要求非机械性或技术性。自建数据库属于汇编作品,对汇编作品的独创性标准,国际公约、区域协议以及各国国内法多有立法规定,《保护文学和艺术作品伯尔尼公约》第2条第5款规定了对内容的选择和整理须具备智力创造,而《世界知识产权组织版权条约》第5条与《与贸易有关的知识产权协议》第10条第2款以相近似的语句规定了数据或其内容的独创性汇编受著作权法保护,而《欧洲议会与欧盟理事会关于数据库法律保护的批令(96/9/EC)》第1条第2款以“系统有序”等字眼明确了数据库定义并对独创性的数据库也提供毋庸置疑的保护。
与国际做法一致,我国立法也明确规定受著作权法保护的汇编作品必须具有独创性,《中华人民共和国著作权法》(以下简称《著作权法》)第14条规定:“汇编若干作品、作品的片段或者不构成作品的数据或者其他材料,对其内容的选择或者编排体现独创性的作品,为汇编作品,其著作权由汇编人享有,但行使著作权时,不得侵犯原作品的著作权”。[1]据此,作为汇编作品的一种,自建数据库取得著作权法保护需满足独创性标准,必须要“对其内容的选择或者编排”体现独创性,即这种选择或编排需有一定的智力创造,与他人已有的选择或编排是有所区别的。
《著作权法》立法或司法解释中都没有对独创性涵义进行阐述,从国际化角度看独创性标准在英美法系和大陆法系中的理解和实行亦有差异,英美法系国家对独创性标准可以概括为“额头出汗”原则即实质性投入,后随着社会发展提高到“最低程度的创造性上”,集中于独立而对创造要求较低,大陆法系的独创性标准则要求作品具有一定的“创作高度”,体现更多的“作者个性”,[2]对创造性要求高。在司法认定中实行不同的独创性标准,自建数据库的著作权地位将不同。
鉴于著作权法仅保护具有独创性的数据库,探讨自建数据库著作权保护可从“对其内容的选择或者编排”独创性的表达入手。在知网、万方、维普数据库中,查找以数据库独创性为主题的文章,检索截至2018年1月6日,分别获得219、234、38篇,剔除重复及相关性较弱文献,共获得有效文献159篇,但多为对数据库及其内容的著作权保护法律模式或侵权风险规避方面的论述,鲜见涉及如何提高数据库的独创性从而获得著作权法保护的研究。
对当前著作权法独创性的保护模式上,有学者认为,著作权客体地位不明晰、保护标准不统一、保护力度较弱、司法审判主观性等突出问题使其对数据库的保护具有局限性、不确定性和微弱性的缺陷,[3,4]甚至有学者认为独创性为著作权保护数据库的障碍,综合原因有三点:① 数据库的独创性与材料的量相关,如汇编材料越全,则选择性越小,就越不能获得著作权法保护;[5]② 数据库的独创性与材料著作权相关,不具有著作权的材料组成的数据库独创性程度低,[6]如数值或事实型数据库等;[7]③ 数据库著作权保护与营利性质相关,如非营利数据库即使有独创性也只能受到著作权法弱保护。[8]上述观点说明了缺少独创性才是数据库无法获得著作权保护的根本原因。
对独创性认定上,有学者认为在内容选择与编排上不采用社会普遍惯用的标准并且独立完成、能够体现出最低限度的独创性即可;[9,10]陈传夫则基于数据库产业发展水平和信息资源公共获取水平角度提出独创性的“选择与安排”标准,即数据库对内容的“选择”与“安排”同时具备独创性才能受到著作权法保护。[11]但其作为认定标准则会使当前很多数据库失去了著作权法保护,只可以作为制作者投入智力体现独创性的建设标准。
解读《著作权法》第14条“对其内容的选择或者编排”知悉,数据库独创性的认定,只需要对内容的选择或编排具备独创性,满足其一即可受到著作权法的保护,立法倾向于最低限度的独创性。并且司法认定有迹可循,如,1994年,广西广播电视报社、广西媒矿工人报社电视节目预告表使用权纠纷案,中级法院认定电视节目预告表属于预告性新闻范畴,不具备著作权法上的独创性,不受著作权法保护;1999年,海南经天公司诉徐溪公司复制海南经天公司“中国大法规数据库”案中,法院认定该数据库在部委规章二级分类、法规标题缩略等方面具有一定的独创性,经天公司作为数据库的汇编人享有著作权。以上案例体现,独创性对数据库获得著作权法保护显而易见非常重要,独创性不仅是由制作者独立完成,还应有最低限度的创造性,此外,从选择编排方式的量来看,可供选择和编排的方式是唯一的或者是有限的、可穷尽的,则不具有独创性;选择和编排方式受到行业领域的限制,必须符合行业标准的,不具有独创性;已成为普遍、普通、惯常的选择和编排方式,也不具有独创性。
数据库的独创性是相对变化的,一种选择和编排方法并不能限制他人使用相同方法组织新数据库,而这种方法变得普遍甚至成为规则后,它就彻底丧失了独创性。这一特点在书目类数据库上表现尤为突出。作为自建数据库主要类型之一的书目类数据库(包括文摘索引等)是图书馆在网上提供给读者查询的数据库,其中书目数据库主要通过著者、题名、分类号、文献类型等字段进行检索,文摘数据库是图书馆提供进行读者文献摘要检索,对文献进行简明扼要的介绍,具有短、精、完整的特点,以供读者确定有无必要阅读原文,两者为满足读者检索习惯和标准统一,多以MARC标准格式著录、编排,普遍独创性程度低。
独创性是与数据库内容结合在一起的结构形式的独创性,如,用某数据库的选择和编排方法去构建其他内容(包括对前者内容的变换表达或不同词句描述同样内容)而新建成的数据库并不会侵犯原有数据库的著作权。再者,复制某数据库内容的唯一表达而采用其他选取和编排方法组建而成的数据库也不会侵犯原有数据库的著作权,只有依据相同的选择和编排方法组织相同的内容表达而形成的数据库才会侵犯其著作权,而离开数据库的具体内容就无法体现它在选择或编排上的独创性。
换言之,数据库内容选择与编排并不是抽象存在的。独创性的表达,包括制作者对数据库包含哪些内容(语言、题材),以什么顺序或方式编排等问题做出独立的最低限度创造性的选择。这些选择不由内容的功能、所采用的方法或技术以及适用标准或规则决定的,亦非原本就存在的,而是基于制作者的意志,它反映了制作者以什么方式将什么内容提供给用户并与用户进行交互的判断,所谓的“选取与编排特征”并不是指数据库中抽象存在的选取与编排方法。因此,著作权法对数据库的独创性选取与编排要求是可以认识的,并非虚无的,探究独创性表达以使其获得著作权法保护则变得可行。
综观高校图书馆自建数据库,独创性水平参差不齐,独创性弱或无独创性的书目文摘题录类型数据库占开发的多数,虽全文数据库开发的也不在少数,但大多以用户熟悉的方式编排,从编排上也较难体现独创性;多媒体数据库为数据库技术与多媒体技术结合的产物,有独特的表现形式,可以具有较高的独创性,但因开发难度大、独创性要求高,开发多见于重点大学。[12]
已有学者指出,独创性差为自建数据库著作权保护限制的内部缘由,如,书目文摘类数据库缘于用户检索习惯和标准统一等不能体现建库者的思想,而全文数据库基于读者习惯在编排上也很难体现独创性。[8]从图书馆角度看,独创性差的根本缘由在于数据库建设时没有对内容选择和编排投入足够的智力,形式上多借鉴与模仿而少革新与创造,内容重复、功能类似,选择和编排缺乏个性;从用户角度看,习惯是养成的而需求是变化的,选择和编排类似在于没有完全考虑不断变化的用户需求;从著作权法角度而言,促进科学发展才是著作权立法的根本目的,缺少独创性的自建数据库则失去了著作权意义。
目前,高校图书馆自建数据库多为自建自用,鲜少涉及著作权侵权诉讼案件。然而随着《中华人民共和国公共图书馆法》颁布实施,有条件的学校图书馆将逐步对社会公众开放,在此背景下,整体上独创性程度不高的自建数据库必将置于一个没有任何标识、不知边界的雷区。作为一名图书馆人,从图书馆学、法学角度,探讨如何提高自建数据库的独创性,对高校图书馆资源建设和保护具有一定的理论意义和实践意义。
如前所言,数据库若想获得著作权法保护,其内容选择和编排上必须具有独创性。鉴于独创性之判定个案性极强、且极具实践性,往往需要对有著作权争议的两部作品进行比较,将比较集中在具体的作品上,范围缩小,分析就会更准确。[13]本文通过网络调查的方法,以江苏师范大学中国汉画像石(砖)数据库和北京大学汉画研究所汉画相关数据库为例,从“内容选择与收录”“要旨编撰及元数据著录”“材料分类设定”“结构编排设置”四个维度分析其内容选择与编排独创性的表达,以期探讨提高自建数据库独创性的方法和路径。
中国汉画像石(砖)数据库属全国首个以汉画像石砖研究为主题的特色数据库,包括11个子库,收录了汉画像文献以及多媒体材料,旨在为汉代政治、经济、思想、文化、艺术、技术等研究提供专业资源保障。北京大学汉画研究所官网古文献数据库、研究文献数据库、图像数据库,为北京大学汉画研究所与各收藏、保管单位的合作项目,属中国国家数据库,受国家项目资金资助。
收录方法上,中国汉画像石(砖)数据库采取拓片与图录扫描、实物照相、实境拍摄等多种方法;北京大学汉画研究所对数据图像采用三种方式记录:照相以存其貌,拓片以显其图,线描以辨其形;收录内容形式上,前者收录书目、文摘、全文、图像以及音视频等各种材料,后者主要收录全文和图像;内容选择和收录范围上,前者收录徐州乃至全国的汉画像石(砖)图像及研究材料,后者收录全国所有存世的汉画像图像,除石砖之外,还包括壁画、帛画、器具图样等多种图像材料,及相关研究材料,除此之外,还专门收录了古文献材料。
两者在材料的选择与收录方面各有侧重和特点,体现了一定程度的独创性,如,前者收录方法上使用了实境拍摄而后者使用了线描,前者收录的内容形式更多,后者收录和选择的内容范围更广。
要旨,或称提要,揭示材料的主要内容或特征,形式上体现为摘录要点,编成简介或成标识。中国汉画像石(砖)数据库编撰要旨见于图像数据库中,主要体现在金石拓片及原器物介绍、汉画像石砖雕刻图案内容的描述说明上,著录字段为画像题名、内容、说明、类型、特征以及金石附注等。原材料有要旨者,由专业馆员审阅取舍后再收编;原材料无要旨者,由专业人员编撰或考证后再著录,不同专业人员不同侧重,分析与编撰结果亦不同,撰写方式及内容各有特色,体现了一定程度的独创性。
元数据著录,中国汉画像石(砖)数据库库著录及其字段主要依照中国高等教育文献保障系统(China Academic Library&Information System,CALIS) 元数据规范,同时考虑汉画像石、砖等资源类型和特点,因此制作者参考《CALIS特色库子项目描述元数据规范及相关规则》等特色库子项目描述元数据规范,制定了《汉画像石、砖图像描述元数据著录规则》①《研究材料数据库著录规则》②《视频资源元数据标准及著录规则》③,明确了著录字段。其中大部分著录字段为独创。以图像为例,描述元数据著录字段有33个,其中有17个,如,画像题名、石刻年代、资源形式、铭文语种、画像内容、铭刻文字、金石版刻、拓印版本、画面尺寸、原出土地、现存藏地、原石类型、原始尺寸、画像主题、雕刻技法、原石方位、发布来源等字段为制作者独创,其他16个如客观题名、别名、其他题名、责任者、金石附注、拓片附注、著录文献、关键词、时空范围、标识符、权限、影印版本、载体形态、收藏历史、馆藏信息、书法特征等字段则与《拓片元数据库规范推荐稿-0507》④一致。
北京大学汉画研究所图像数据库的编撰要旨因官网权限不能了解详细内容,但可从图像数据库图像描述以及研究文献数据库提要字段检索知其有编撰要旨,图像数据库元数据著录字段如拓片号、总编目号、所属墓葬、出土/征集地点、相关位置、收藏地等为其独创。
图片、古文献、研究材料的分类,在数据库表现形式上可以体现独创。中国汉画像石(砖)数据库和北京大学汉画研究所相关数据库在内容分类设定上均不相同,各有其独创之处。
前者制定了相关资源的分类标准,主要有汉画像石(砖)雕刻技法分类表、汉画像石(砖)分布区域分类表、汉画像石(砖)内容题材分类表。在图像上设置内容题材、雕刻技法、分布区域三大导航,其下分为若干大类,如,内容题材下分为7大类,雕刻技法分为2大类,分布区域分为19大类,每一小类再细细划分,最深达5级;研究材料设置分类为综述、艺术风格、思想观念、民风民俗、乐舞百戏、政治经济、文化教育、天文星象、建筑工程、文学美学、考古文物、医药卫生、人物故事、其他等;音视频设置分类为新闻、讲座、纪录片、娱乐、影视、其他。
后者图像数据库分布地域按行政区划分为河南、陕西以及断代,按照横、竖、其他、全部等形状分类显示;古文献数据库将文献分类为全汉文、全后汉文、全三国文、全晋文;研究文献数据库只提供查询入口,主页未见分类导航。
结构编排和版面设置上,中国汉画像石(砖)数据库,制作者按照不同材料类型设立11个子库,结构如图所示。各子库行距字数、段落缩排方式、栏目名称、检索字段等,依照不同类型材料设计不同的编排结构,如图像显示方式采用缩略图、不同分辨率大图权限分级浏览、拓片与原石对照浏览、静态图像与原物实境及动态影像互动展示。关联设置上,子库内部关联与子库之间关联相结合,通过主题、年代、技法、类型、方位、出土地、存藏地、发布来源、关键词等字段信息进行图像与图像关联,通过题名、主题、技法、关键词、出土地、馆藏地、发布来源等字段信息进行图像与文字等子库之间关联,由系统自动关联检索并显示。除关联各子库外,数据库版面还设置“汉画百科”“存藏概览”“汉韵今风”等特色栏目。
值得一提的是,在对内容深加工时,制作者进行数据清理并析出文献,发掘出的汉代体育部分章节中论述了汉画像石(砖)的内容、图像与白描对照内容、研究专家及社会影响评价等内容,受到建库所用知网TPI软件平台结构的限制,因涉及软件二次开发及经费问题而未能实现。
图 中国汉画像石(砖)数据库框架结构
北京大学汉画研究所按研究文献、古文献、图像文献建成三大数据库,古文献数据库版面分栏设置左边为目录,右边显示内容,研究文献数据库提供关键字、作者、题目、出处、出版者、年代页码、内容提要、备注等字段作为查询入口,其结构编排和版面设置的独创性主要体现在图像数据库的排序和检索设置上,图像数据库保持目前数据库主流的“名称检索”模式,在规范术语基础上,订立术语表。按照总编目号、出土/征集时间、收藏地并可设置时间范围进行排序,通过拓片号、总编目号、所属墓葬、出土/征集地点、相关位置、收藏地、关键字、主题词关联进行检索。与之相对的是,中国汉画像石(砖)数据库排序和检索方式更丰富,可以按照更新时间、画像题名、石刻年代、原出土地、现存藏地进行排序,通过画像题名、责任者、石刻年代、画像主题、画像内容、雕刻技法、原石类型、原出土地、现存藏地、发布来源、关键词、简体题名、简体主题进行检索。
通过实证比较,中国汉画像石(砖)数据库在建设中,制作者经过思考、研制环节,关注用户定位、价值定位、文化定位等因素,充分发挥了自身智慧,数据库内容的选择和编排均有其独创性,可以归为三个层次。① 整体理念、框架的独创性;②基于数据挖掘而体现的要旨编撰、著录以及材料分类的独创性;③ 具体内容表达的选择和编排的独创性。在自建数据库建设中不能充分展现独创性的因素有:① 技术平台限制,建库所用商用软件不能完全体现制作者个性化的选择和编排;② 行业规范限制,文献大致上遵照CALIS规则著录,制作者个性和情感展示的不够充分。
由上可知,自建数据库的独创性是对既存材料的内容进行非常规的、个性化的选择或编排的结果,体现了制作者对信息内容和呈现方式的独特认识,展现了制作者的主观判断或体现了特殊情感。结合汉画像石(砖)数据库内容选择和编排独创性的表达及限制,自建数据库独创性之提高可藉由以下方法和路径达致。
古人云:“取法乎上,仅得其中;取法乎中,仅得其下”。该论断同样适用于学术研究和创作领域。就自建数据库而言,独创指在借鉴与继承基础上,还有革新和创造。首先,要求制作者在品格、境界、框架等方面向其他高校已有的数据库学习和借鉴经验,奠定革新和创造的基础;其次,“取法乎上”,继而领悟和反思,摒弃迷信和盲从,目的在于塑造自我、超越自我,彰显本馆特色,“问渠那得清如许,为有源头活水来”,否则只能“仅得其中”甚至“仅得其下”;再次,因自建数据库的实用性和读者使用习惯,取法参照是无法回避也不必回避的,横向概括纵向追索,创新思维独辟蹊径,寻求形式上的突破,树立整体理念和框架。
自建数据库制作者做为思维创新活动的群体主体,与具有个别性、相对独立性、时空局限性、相对随意性等个性特征的个体主体比较而言,具有主体活动的整体性、相关性、互补协调性和功能活动优化性等特征,其发展要求不断自我突破,对既有思维自我批判,对原有路径理性否定,探寻新路径、新方法,在创新的实质性上下功夫。
建设筹备阶段,注重收集和保存相关资源。资源是自建数据库建设和图书馆提供服务的基础,多样化资源有利于促进图书馆知识创新和服务创新。自建数据库所涉及到的资源,从来源看,除正式发表并流通的白色文献外,还包括私人收藏、行业内部材料、政府官方材料等灰色文献和黑色文献;从类型来看,除图书、期刊、专利等传统文献资源外,还包括人物、项目、机构、事件、图片、多媒体、新闻报道、史迹场所、网络数据等非传统文献资源。基于用户需求,图书馆拓宽渠道,收集各种类型资源,将有利于率先建立一些具有独创性的数据库,如,各高校依托本校重点学科,结合当地社会发展特点建设而成的数据库如本校文库、地方文献资源库、专题特色数据库等具有较高的独创性。以中国汉画像石(砖)数据库为例,制作者除依托徐州得天独厚的汉画像石(砖)墓葬及相关研究机构资源外,还利用地理优势,向山东、河南、安徽、四川、陕北、陕西等主要发掘和收藏地域辐射,开展收集整理工作。又以北京大学图书馆数字特藏为例,通过多方途径收集资源,发掘包括馆藏、校内师生言论及名人在北大的讲座、私人藏书及赠书等丰富的资源,为数据库内容的选择和编排方式的独创性提供了无限发挥的空间。
2017年,以“新时代、新征程、新作为”为主题的第十届中国版权年会上,国家版权局专职副局长周慧琳提出“实施创新驱动战略”“加强版权创造”“加强版权保护”“加强版权运用”等要求,旨在促进未来经济发展文化繁荣。[14]在当前互联网内容抄袭蔚然成风的环境下,高校图书馆自建数据库应当独树一帜精选优质内容,以独具匠心的表现形式提供给用户。
自建数据库的存在和发展在于用户需求,优质内容才能锁住用户的心,创新分类才能吸引用户的眼球。从用户需求来看,高校图书馆自建数据库需要具有深度的内容,好内容天然自带流量,亦被赋予高要求,核心便是人格化、权威化,即“人无我有,人有我精”。此外,分类是固定的,用户需求是变化的,图书馆应该根据用户需求创新分类。以当前书目数据库MARC分类法为例,分类主要是基于图书馆角度而非用户角度,用户认知度不够,诸如考研考级、就业辅导、心理辅导、畅销书、休闲期刊、教材教参等主观需求并不能体现出来。只有在内容收录方面遵循完整真实性、官方权威性、实用性等原则,分类和编排上基于用户需求又独出心裁,自建数据库才能在未来经济发展与文化繁荣中独当一面。
数据库需要体现独创性,不仅要对海量数据汇总集聚,更需要对海量数据挖掘与分析,形式上表现制作者基于数据的智力洞察和决策判断。有关数据组织、数据域及其关系的元数据,一部分通过图书馆采编典藏等业务系统和数据商获取,多数不具有独创性,而独创性的元数据数据库商一般也不轻易提供给图书馆,即使提供也会设置各种限制。制作者在建设中必须对所有材料进行数据清洗,然后设置和保存元数据,元数据标准格式的基础字段和扩展字段中,基础字段不能任意修改,扩展字段根据需要扩充。一些基于资源发现的元数据耗费了制作者的心血,具有很高的学术价值,也具备一定的独创性。[15]如对传统图书、期刊、专利文献使用MARC、DC等元数据描述,同质化严重,而非传统的文献资源则缺乏相应的元数据规范,需要对内容深度加工以进行深层次的数据挖掘。通过数据分类聚类、关联规则探讨与运用、回归与预测分析、系列分析等方法,糅合制作者个性化判断和决策,并据此制定特有的元数据著录规则,在建设中一以贯之,以体现内容选择和编排的独创性。
数据库版面语言可帮助用户在较短时间内对数据库信息判断和利用。版面栏目、标题、版序、字号、色彩、图表、线条、空白……这些视觉元素形成不同排列组合,别开生面凸显不同的风格和主题。首页以概要框突出热点和重点,设置分类导航,开辟特色栏目;字体运用中,可从字体统一法则表现版面的主题:统一字体斜度、方向、笔画粗细、整体风格、空间等,整体避免笔画变化过多、注重字体色调与背景色反差与协调;图片运用中,静态图片能够引起用户的选择性注意、理解和记忆,而动图则会造成信息和视觉冲击力相互抵消,但动图具有叙事的完整性和动态性,因其主题需要合理选择图片缔造印象效果。文字、图片和图表三者,以文字叙述事件,以图表展现数据变化,以图片描述事实,根据主题需要灵活运用以上三种表达方式设置风格版面。
自建数据库的软件平台来源有四种:向软件供应商或者数据库供应商购置、图书馆组织力量自行开发、与软件供商共同开发以及与本校图书馆有合作关系的供应商免费提供。从著作权法角度来看,组织力量自行开发的软件平台更加个性化,对数据库内容的选择和编排更能体现独创性,而购置的软件平台则相对缺乏针对性,如,中国汉画像石(砖)数据库建库所用知网TPI软件平台对版面设置甚至内容选择的限制,又如,联机计算机图书馆中心(Online Computer Library Center,OCLC)书目数据库WorldCat,其“Tagging”“Ask a Librarian”“Widget”“WorldCat Identities”等个性化设计,虽令国内图书馆刻板的书目数据库黯然失色,然而因其外语界面、网页链接、用户群体等“痛点”而在国内无法普及。[16]在当前大数据环境下,国内图书馆为实现媒资管理自行开发适合本馆特色的软件平台,既有利于提供个性化服务,亦有利于提高整个数据库的独创性。
建设各种类型的数据库,高校图书馆需要发挥不同专业背景的人才优势,以实现行业内文献知识的汇集增值,提高自建数据库的独创性,提升图书馆利用自建数据库服务创新的能力。制作者捕捉时代先机,密切关注行业动态,积极学习新知识,充分发挥专业特长,处理诸如软件的选择使用、挖掘隐性信息资源、数据库保存、资源整合及检索等技术工作。以场景数据库为例,增强现实技术(Augmented Reality,AR)、虚拟现实技术(Virtual reality,VR)对于面向场景的数据库结构设计和模块功能提供了新的可供研究的空间,但同时对合理分类和细化场景节点均有较高的挑战和要求,图书馆学需与计算机知识密切结合;又如建设中国汉画像石(砖)数据库,除图书馆学技术人员外,还需要历史、文物考古、文化艺术、摄影等专业人才。
[注释]
① 江苏师范大学图书馆,《“汉代画像石(砖)”数据库验收材料汇编》(未公开发表),第83页,2012年9月5日。
② 江苏师范大学图书馆,《“汉代画像石(砖)”数据库验收材料汇编》(未公开发表),第93页,2012年9月5日。
③ 江苏师范大学图书馆,《“汉代画像石(砖)”数据库验收材料汇编》(未公开发表),第101页,2012年9月5日。
④ 江苏师范大学图书馆,《“汉代画像石(砖)”数据库验收材料汇编》(未公开发表),第89页,2012年9月5日。