公版文献资源数字化开发问题研究

2022-07-07 12:58李业根
山东图书馆学刊 2022年3期
关键词:公版公益文献

李业根

(中共江西省委党校图书馆,江西南昌 330108)

公版文献资源是超出版权(主要是财产权)保护时效之外的文献资源的统称。 版权是现代文化产业发展和繁荣的重要基石,但版权保护某种程度上也提高了公众获取作品的门槛,形成了版权人与公众利益之间的紧张关系[1]。 设置版权保护期限,可以拓展文化公共领域,促进知识增殖和文化繁衍[2],平衡版权人和公众之间的利益冲突。 在我国,一般文化产品的版权保护期限为作者终生及去世后50年。 过了版权保护期限的作品即进入公有领域,出版、流通和交易过程无需再承担版权成本。

人类漫长的历史积累了无数公版文献作品,这些作品传承社会文明,传播知识文化,是全人类公有共享的知识宝库。 近年来,世界各国日益重视传统文化的发掘、保护和传承,其一个重要着力点即是对公版文献资源的系统化整理、数字化开发和开放式利用。 不少国家设立了全面整理出版传统文化典籍的项目,更有许多大型的公版文献资源数据库产品问世。 如美国国会图书馆主导开发的世界数字图书馆项目(The World Digital Library),法国国家图书馆数字图书馆项目(GALLICA),中国国家图书馆的“中华古籍资源库”、CALIS 管理中心的“高校古文献资源库”等。 一些社会公益组织也积极参与开发公版文献资源,例如“古腾堡计划”“国际乐谱典藏计划”“公版影像典藏计划”等。

虽然公版文献资源数字化开发项目众多,成就斐然,但公版文献资源数字化开发的相关理论研究却较为稀少,同时公版文献资源数字化开发过程中的杂乱无序、重复低效等问题也日益严重,公众获取各类公版文献资源的门槛依然较高,公版文献资源数字化开发利用工作亟待整理和规范。

1 公版文献资源数字化开发的兴起与发展

1.1 需求驱动:传统文化复兴激活公版文献市场

优秀传统文化是国家民族的灵魂,代表着一个国家民族独特的精神标识,是国家文化软实力的根基和源泉。 改革开放以来,党和政府一直重视对传统文化的整理保护,2017 年发布的《关于实施中华优秀传统文化传承发展工程的意见》,更是提出要构建中华优秀传统文化传承发展体系,协同推进传统文化的研究阐发、教育普及、保护传承、创新发展、传播交流。 高校、社科院所相继成立有关国学、传统文化、儒释道思想的学术研究机构,电视广播、报纸杂志、网站及多媒体视听平台纷纷打造传统文化专栏频道,公众了解学习传统文化的热情越来越高,国学热潮持续升温,国学教育、国学消费蓬勃兴起,传统文化复兴已成燎原之势。

公版文献是传统文化的重要载体,传统文化研习热潮迅速传导到了公版文献消费市场,带动了公版书籍的畅销[3]。 由于读者消费需求增加,加上公版书不存在稿费、版税支出,出版成本较低,公版书整体出版规模以及单品销量都呈现快速增长趋势。20 世纪80 年代,我国每年平均出版古籍整理图书400 种左右;近年来特别是十八大以来,每年平均出版古籍整理图书增至1800 种左右。 “中华经典名著全本全注全译丛书”销售量达到420 万册,“中国古典名著译注丛书”销量近120 万册。[4]据当当公布的数据显示,其销量前五十的图书中,公版书所占比重越来越多,从2016 年的9%上升至2018 年的15%,增长超过60%。[5]公版图书高涨的消费热情以及对传统文化复兴的强烈愿景,推动了公版图书资源系统化整理和数字化开发进程,不仅发行了大量数字化的公版图书,而且还诞生了一大批公版文献资源数据库。

1.2 技术支撑:数字技术赋能公版文献规模化开发

纵观出版业发展的历史,技术的革新和迭代在每一个阶段都发挥着至关重要的作用。 造纸术与手工印刷技术的发明,形成了第一次出版革命;机械化印刷与造纸技术以及编辑专业化技术的出现,推动了第二次出版革命;当前以计算机信息技术为基础,编辑技术、复制技术、介质技术、发行技术的数字化、网络化、自动化与一体化,则开启了第三次出版革命[6]。 数字技术本质上是一种具有处理、存储、传输、呈现信息功能的通用技术,数字技术赋能使得传统出版业朝着数字化转型方向发展,并逐步形成了一种全新的数字出版业态,利用数字技术进行内容编辑加工,并通过网络传播数字内容产品。 数字技术具有自生长性和融合性的技术属性、可编辑与可扩展的内容属性,开放性和关联性的结构属性[7],与公版文献资源规模极为庞大、数量不断增长、内容相互关联的特点相契合,数字出版为公版文献资源的全面整理、集中展示、便捷检索和有效利用提供了成熟的解决方案。

随着信息技术的快速迭代发展,公版文献数字出版也在快速进化革新。 内容制作经历了从人工录入到慢速扫描,再到高速扫描录入;产品介质从软盘到光盘、U 盘、磁盘,发展到到现在的镜像站、云存储;阅览方式从单机版到局域网版,发展到在线版、多终端版、移动版。 从数字出版单本公版图书到数字出版成套公版图书,发展到出版大型公版文献数据库产品,在这一过程中,高速扫描技术、文字识别技术、智能校对技术、数据库技术的成熟和应用发挥了巨大作用,实现了公版文献资源数字化开发的规模化、产业化,公版文献数字化产品日益丰富,推动了公版文献资源的普及和利用。

1.3 多方介入:公版文献数字产品供给日益丰富

由于没有版权掣肘,公版文献资源成为一种全民所有、开放共享的文化资源,其数字化开发也引来了多方关注,呈现出多路并进、共同开发的景象,公版文献数字产品供给日益丰富。 这其中,公益组织、学术机构、数字出版商是主要的开发力量。

秉持资源共享、消除知识贫富鸿沟的愿景,公益组织率先投入对公版文献资源的数字化开发工作。美国的古腾堡计划(Project Gutenberg)是最早的公版文献资源数字化项目,创建于1971 年,由志愿者制作公版电子图书并向公众免费开放。 国际乐谱典藏计划(International Music Score Library Project)成立于2006 年,主要收录失去版权保护的音乐乐谱扫描影像,建立免费乐谱资源库。 网易公司2018 年发起公版影像典藏计划,致力于成为“公版影像百科全书”。 此外,日本的青空文库、美国的Making Of America(MOA),以及中国哲学书电子化计划、中国京剧戏考等等,都是影响较大、收录资源较多的公版文献资源数字化开发公益项目。

学术机构、图书馆参与公版文献资源数字化开发,重在历史文献的整理、保护和研究利用。 中国国家图书馆建成的公版文献资源库,包含古籍、方志、碑帖、民国文献、西夏文献、赵城金藏、甲骨影像等公版文献。 上海图书馆主管主办的“全国报刊索引”数据库,收录了大量近代期刊、中英文近代报纸以及图片。 作为CALIS 二期专题特色库重点项目的“高校古文献资源库”,由北京大学图书馆牵头,联合南京大学、北京师范大学和四川大学图书馆共同建成,收录的公版资源包括古籍图书、古籍元数据、书影和全文图像。 中国社科院国家哲学社会科学文献中心建成的古籍库,收录大量经、史、子、集、志各类古籍文献。

数字出版企业期望通过公版文献资源的数字化开发获取商业利润,在人员、资金、技术等各方面强有力的投入和保障下,数字出版商很快将公版文献资源数字化开发带上了产业化发展、商业化运营的轨道。 相较公益组织、学术机构的公版文献资源数字化开发,数字出版商推出的产品规模更大、增长更快、服务也更周到。 表1 是我国目前10 种较有影响的公版文献商业数据库基本情况。

表1 10 种商业古籍全文数据库一览表

1.4 模式创新:“互联网+”催生公版文献服务新形态

数字技术、“互联网+”重塑了公版文献资源的形式、组织及获取方式,也深刻影响了文献信息服务的内容、手段、方式等一系列形态表现。 由于年代久远,公版文献资源虽然总量巨大,但单种文献往往存量不多,甚至有不少图书属于珍本孤本,以往主要保存于藏书楼、图书馆,或散佚民间,公众阅览研究极为不便。 在“互联网+”时代,公版文献的资源基础、技术手段、用户环境都发生了深刻变化。 通过大规模的文献整理和数字化开发,公版文献数字化产品的推出有效缓解了资源匮乏的问题,文献检索和传递的门槛大为降低,文献资源分布的不平衡性大为改善。 公版文献即便是珍本孤本,都从稀缺资源变成了人人皆可获取的普通资源,公版文献服务也从封闭的机构走向广阔的社会,成为开放的、社会信息服务链的一环。

“互联网+”的最终目标是链接一切[8],传统的线性通道变成网状联结。 “互联网+”打破了公版文献资源传统的信息闭塞环境,推动了公版文献资源的流动传播,对公版文献服务的主体内容也进行了重新构建。 传统的公版文献服务主要提供作为知识载体的图书资料,“互联网+”拓展了公版文献服务的深度和广度,转变为提供建立在公版文献研究基础上的知识服务。 通过挖掘文献之间的各种关联,大量的文献在“互联网+”环境下编织成多维关联的文献知识图谱;利用多文本链接,用户能够快速往返于每一个知识节点,从而获取更全面的文献信息。同时,大数据、“互联网+”提供了对用户精准画像的条件,凭借对用户注册、检索、消费、互动、评论等信息的综合分析,识别出用户的信息偏好、文献需求及行为习惯,公版文献服务实现了从“人找书”被动式服务到“书找人”主动式服务的转变。

2 公版文献资源数字化开发的困境

2.1 全面开发与精准识别的困境

公版文献规模庞大,记录了人类发展错综复杂的历史全貌。 单本公版文献价值有限,只有对公版文献进行系统整理和全面开发,“整体大于局部之和”,才能充分实现公版文献作为整体的研究利用价值。 但目前公版文献的全面开发,面临精准识别的困境,包括古籍文献的版本识别和近现代文献的版权识别两个难题。 古籍文献版本多,内容在传抄翻刻过程中往往会有细微变化,如何找到并识别出其中的祖本和善本,避免版本上的良莠不齐和内容上的以讹传讹,是公版文献数字化开发者需要克服的难题。 世界各国对公版作品的认定均采用“超过版权保护期的作品”这一标准,年代久远的古籍文献基本可以明确已经进入公有领域,但民国以来的现当代作品,由于出版环境复杂、著作权人信息不详,很难确认作品是否已经进入公有领域[9]。 公版作品认定,需要明确的事实包括:(1)作者是公民、法人或其他组织;(2)自然人作者的死亡时间;(3)法人或其他组织作品的首次发表时间;(4)作者所在国;(5)作品起源国;(6)作品被要求保护国;(7)其他事实。 由于作品数量太多,要掌握所有上述信息,工作量无疑很大,需要付出的成本高昂。 目前,世界各国均未设置专门的官方机构清查公版文献,只能依靠于民间组织或企业经营者,公版文献资源数字化开发项目普遍并未遵循严格的公版作品认定程序,即便是古登堡计划,也是按照按伯尔尼公约规定的期限推后一定时间来认定公版与否。 由于公版文献版本和版权属性识别的困难,以及公版文献数量庞大且不断增长,导致公版文献资源的全面数字化开发难以实现,仍有大量的的公版文献存在检索利用的困难和散佚的风险。

2.2 公益开发与资源短缺的困境

习近平指出,公共资源不能为少数人垄断享用[10]。 公版文献资源作为一种社会公共文化资源,理应由全体社会成员公有共享。 对公版文献资源进行数字化开发并免费向所有公众开放使用,可以最大限度体现公版文献公共资源属性,达到充分利用人类文明成果、消除知识贫富差距、推动社会文明进步的目的。 为了实现这一目标,众多热心公益的个人和机构投入公版文献资源数字化开发工作中。 古腾堡计划、国际乐谱典藏计划、青空文库、中国哲学书电子化计划等等,代表了众多民间组织和个人的公益宏愿,通过多年的实践行动,取得了令人瞩目的成就。 但是,相对于创建者宏伟的目标,面对浩如烟海的公版文献资源,这些项目目前的成绩仍较为有限。 缺乏完善的公益链和公益生态,就很难建立起公益事业的可持续发展机制[11]。 公版文献数字化开发公益项目普遍面临资金不足、管理松散、人员队伍不稳定、设施设备不完善等问题,一旦外部支持减少或停顿,项目进展就会迟缓不前,或半途而废,陷入生存困境。 古腾堡计划发展至今,只上线了6 万余册图书;公版影像典藏计划建设数年,只收录了600 余件作品。 与之对比,以市场模式运作的公版文献资源数字化商业项目,在获得企业充足的资金投入后,应用先进的文献数字化技术,将文献数字化工作改造成高效快速的工厂流水线,上线的公版文献资源在规模和总量上都遥遥领先。 公版文献资源数字化公益项目承载着众多参与者的美好愿景,如何解决发展过程中遇到的资源、经费、人员短缺等种种问题,关系着项目能否可持续发展以及最终能走多远。

2.3 市场开发与知识共享的困境

公版文献资源蕴含丰富的市场价值,被喻为“谁都想吃的唐僧肉”[12],自然受到资本市场的青睐。 以市场模式运作的公版文献资源数字化开发,可以优化资源配置,弥补公益开发资源不足的短板,建立起公版文献资源数字化开发的市场调节机制,有效促进公版文献资源的整理、保护、传承和利用。 但是,资本有逐利的本能,市场开发追求的重要目标是利润,与公众期待的公版文献知识共享的公共资源属性存在价值冲突。 公版文献资源商业数据库的主要客户是各级各类图书馆、科研单位,其使用对象通常限于内部读者和职工。 出版商利用其公版文献资源整理开发的先发优势,在占据了一定的市场垄断地位之后,数字资源价格往往逐年上涨,已经使不少采购单位不堪重负[13]。 部分公版文献资源商业数据库对个人用户开放,但设置了较高的收费门槛,如中国基本古籍库个人版年卡价格为1000 元,卡限内只能检索和浏览,下载还需另外付费;中华经典古籍库个人版年卡价格3500 元。 虽然市场上公版文献数字资源总量增加,但普通公众获取资源的难度依然较高。 公版文献有可能逐渐沦为资本逐利的工具,加深知识差距的贫富鸿沟,达不到资源共有、知识共享的目的。

2.4 政府开发与效益不高的困境

政府公版文献资源开发是指以政府财政拨款为经费来源、各类行政事业单位和科研机构主持或参与的公版文献开发,是政府公共文化服务建设的重要内容。 政府以委托代建的方式,通过项目申请或招标,将公版文献资源数字化开发项目交由科研单位、图书馆或其他学术机构进行开发,其成果一般为公版文献资源数据库,属于公共文化服务产品,面向公众开放使用。 政府开发拥有较为充足的经费保障、人员队伍和可供调配的公版文献资源,能够产出较为成熟的公版文献资源数字化产品,但同时也面临效益不高的问题。 由于缺乏成本核算,没有基于收益的绩效压力,政府开发的公版文献资源数据库产品使用率并不高。 公共文化服务强调社会效益而非经济收益,使用率越高其效益也越高,但有些单位开发的公版文献数据库仅对内部人员开放,对外部用户则设置了各种限制使用门槛。 例如作为CALIS二期专题特色库重点项目建成的“高校古文献资源库”,将用户分为普通用户、阅览室用户、图书馆馆员三级,普通用户无法查阅高精度图像,也无法打印、下载文献资源。 北大图书馆“祕籍琳琅——北京大学数字图书馆古文献资源库”规定,普通用户获取库中古文献图像或全文,需要支付费用后再传送内容给用户。 复旦大学的“民国书刊”数据库,只有认证用户才能使用。 此外,政府公版文献资源数字化开发项目众多,但各个项目之间缺乏协同共享,导致部分公版文献重复数字化、项目成本上升、数字化产品格式不统一等问题,浪费了社会资源,也增加了公众检索使用公版文献的难度。

3 公版文献资源数字化开发的路径优化

3.1 统筹资源整理,推进全面开发

无序存在的海量公版文献不仅保存、管理、检索和使用困难,还有可能在没有察觉的情况下遗失和损坏,甚至彻底湮灭。 对公版文献资源进行全面整理和数字化开发势在必行。 古籍数字化开发应与全国古籍整理出版规划领导小组密切合作,对收集到的古籍文献进行审慎鉴别,强化对版本的校勘和选择,挑选出古籍的祖本和善本进行数字化开发。 民国以来的现当代公版文献的价值不逊于古籍文献,在整理和保护上不应存在厚古薄今思想。 国家图书馆2008 年启动了一项持续多年的“公有领域图书筛查项目”,对以民国图书为主的疑似公有领域图书进行版权筛查,甄别了大量公版文献[14]。 全面整理现当代公版文献资源,应成立一个类似古籍整理小组的全国性工作机构,整合各方力量,信息共享,持续开展公有领域图书筛查,将公版文献的整理开发工作制度化、规范化。 要充分利用现代信息技术,建设全国统一的文献资源信息数据库,建立完善的版权信息管理机制,录入每件作品的出版信息,尤其是涉及版权的相关信息。 借助大数据,通过与其他数据库进行数据关联,交叉比对,快速筛查作品是否已经进入公有领域。 要建立全国统一的文献版权信息查询平台,公开作品版权信息,减少版权纠纷,为公版作品的数字化开发和利用提供信息依据。 对于新出版作品,主管部门可以未雨绸缪,实行版权注册登记制度和电子稿呈缴制度,强制要求出版机构注册登记版权,并提交一份文献的电子版文件,若干年后作品进入公版领域,电子版作品即向公众开放使用,自动成为全民共享的公共文化资源。

3.2 加强生态建设,扶持公益开发

扶持公益项目,是公共服务供给侧改革的重要内容[15]。 社会组织和个人创建的公版文献资源数字化开发公益项目,是对文化领域公共服务的有益补充,也是满足公众精神文化需求的有效路径之一。政府应鼓励社会组织、企业和个人参与公版文献资源公益开发,制定相应的扶持政策,引导其专业化运作、常态化发展。 公益生态环境决定公益项目能否长期可持续健康发展,是由社会组织、社会工作、志愿者、社区、政府和其他关联主体互动作用所构成的公益服务输送体系[16],各种资源要素在体系内各个互动主体之间流动和整合,形成主体间相互作用的公益生态链。 公版文献资源数字化开发公益项目中,社会组织、政府、志愿者、文献拥有者、资金捐献者、用户等是公益生态主体,而公版文献、资金、技术、设备、场地等则属于资源要素。 建设良好的公版文献数字化开发公益生态环境,首先要保持项目的开放性,主体之间的互动和资源要素的流动要保持畅通,各主体以互利的方式共同进化;其次要促进各主体之间良好的合作关系,为实现公版文献数字化开发的整体目标履行各自职责;最后,要通过制度创新、信任关系以及新技术的采用,降低各主体之间互动交易的成本,提高生态链的运转效率。 从实践层面看,政府主管部门应与公版文献资源数字化开发公益组织保持联系和提供服务,完善公益项目管理的制度建设,及时帮助解决公益组织遇到的问题。政府可以购买公版文献资源公益项目的开发成果,使其成为政府公共文化服务建设的一部分,解决公益项目资金短板。 企业赞助公版文献开发公益项目,可以按规定予以相应的税务减免,鼓励企业长期持续资助公版文献资源的数字化开发。 鼓励学术机构、图书馆与公益组织合作,充分利用学术机构、图书馆的资源优势,提供收藏的公版文献资源供公益组织进行数字化加工和开放使用。 公益组织要增强其项目的开放性和透明度,通过项目的社会效益前景、取得的成就以及健全的管理制度来赢取社会信任,从而获得持续的资金捐助和更多志愿者参与。

3.3 遏制过度逐利,规范市场开发

《中共中央关于全面深化改革若干重大问题的决定》提出应发挥市场在资源配置中的决定性作用,通过市场规则、市场价格、市场竞争实现资源配置的效益和效率最大化。 我国从上世纪八十年代开放文化市场,经过几十年的努力,实现了文化产业的大繁荣大发展,证明市场对文化资源配置的有效性和高效率。 公版文献资源符合“公地喜剧”模型,对其开发利用只会增加资源效益而不会减少资源总量,在需求增大而供给不足的情况下,必然会吸引商业资本介入开发。 目前比较知名的公版文献商业数据库已有数十个,主要收录从先秦到民国的典籍、史料、方志、书画、期刊、报纸等,涵盖范围广,文献总量大。 市场开发促进了公版文献资源的整理和保护,推动了文献数字化技术的发展和应用,为社会公众和研究者提供了检索使用公版文献的更多渠道。 但是,资本是把双刃剑,其追逐利润的本性也会带来诸多负面效应,目前即存在资源价格高、用户负担重的问题。 在鼓励资本介入公版文献资源市场开发的同时,政府要采取措施,规范企业行为,防范企业因过度逐利而可能造成的公众获取使用公版文献门槛增高、难度增大问题。 针对当前部分公版文献商业数据库定价较高的问题,政府有关部门应调查其是否滥用市场垄断地位或事实上形成垄断价格,拆分或引进更多企业进行公版文献数字化开发,形成良性竞争,鼓励企业优化资源配置,采用新技术降低开发成本,合理定价,减轻用户经济负担。 国有或集体所有企业从事公版文献数字化开发,应将社会效益与经济效益并重,以社会效益为先,承担更多建设文化强国的社会责任,为公众便捷获取使用公版文献创造条件。 要坚持有效市场和有为政府有机结合,既要发挥市场配置资源的决定性作用,提高公版文献开发的效率和效益,又要加强政府的公共服务和市场监管职能,有效治理公版文献开发中的垄断和资本无序扩张乱象,避免社会资源的低效配置和重复浪费。

3.4 提升公共服务,推进政府开发

公共资源属于全民所有,保障每一个公民平等地获得基本公共资源的权利,是政府义不容辞的责任和义务[17]。 党的十九届五中全会提出要在2035年把我国建设成为文化强国,要实现这个目标,必须加强国家重大文化设施和文化项目的建设,创新实施文化惠民工程,推进公共文化服务体系建设。 公版文献资源的数字化开发,可以作为政府提升公共文化服务的一项重要任务,将其建设成为覆盖城乡、惠及全民的知识基础设施工程,筑牢公共文化服务资源根基,充分发挥公版文献对传播传统文化、共享文明成果、建设文化强国的作用。 政府首先要做好公版文献资源数字化开发的规划设计,统筹各方力量,协调部署,有序推进公版文献资源的开发利用。应建立全国性的公版文献资源管理机构,明确公版文献资源数字化开发目标,完善工作机制和管理制度,做好经费预算和任务分配。 其次要加强公版文献资源数字化开发的技术和工具研发,规范公版文献资源数字化开发流程,统一质量标准,搭建公版文献资源网络发布平台。 学术机构、图书馆等利用公共财政进行公版文献资源数字化开发,应在统一的规划部署之下进行,摒弃狭隘的部门利益和保护主义,开展广泛的合作交流,协同配合,成果共享,避免各自为阵,闭门开发。 政府应加强对公益组织、出版企业的管理和服务,在统一的规划部署下协调各方参与公版文献资源数字化开发,强化协作共享,优化资源配置,防止低效无序和重复开发。 可以通过项目招标、委托代建的方式,让企业承担公版文献资源数字化项目,提高开发效率。 最后,要强化公版文献资源数字化开发成果验收,建立相应的考核反馈机制,加强公版文献资源的宣传推广和使用。 政府主导的公版文献资源数字化开发成果,属于公共服务资源,应向全体公众免费开放使用。 要为公众使用公版文献数字化资源提供便利,简化操作流程,提高服务效能,不断提升公版文献资源使用的社会效益。

猜你喜欢
公版公益文献
Hostile takeovers in China and Japan
公益
公益
公益
公版还是非公版永不落幕的话题
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
“公版”图书的知识产权保护问题研究
“公版”图书的知识产权保护问题研究
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
The Role and Significant of Professional Ethics in Accounting and Auditing