余力,管家娃
(1.南京出版社,南京 210016;2.南京大学信息管理学院,南京 210046)
我国古籍数字化建设现状分析及发展研究
余力1,管家娃2
(1.南京出版社,南京 210016;2.南京大学信息管理学院,南京 210046)
本文通过文献调研和文献计量方法,从政策、研究和实践三方面梳理我国古籍数字化建设的现状,并剖析其制约因素和发展对策。研究认为,目前制约我国古籍数字化的因素主要包括缺乏统筹规划、缺乏统一标准、技术问题凸显和专业人才匮乏四方面,并据此提出相应对策。研究结论可为古籍数字化建设提供借鉴参考。
古籍;古籍数字化;数字出版
我国的古籍浩如烟海,对传统文化的传承起着举足轻重的作用,然而其原始载体形式不可避免地随着岁月的侵蚀逐渐老化乃至消失,所以许多藏馆不得不将其束之高阁。但这在保护古籍的同时,对古籍的研究利用工作造成极大阻碍。为解决古籍资源藏和用的矛盾,同时实现对古籍的保护和利用,古籍的数字化工作势在必行。
古籍数字化工作开始于20世纪七八十年代,是以古籍的保护和利用为目的,以现代信息技术为手段,通过将古籍中的语言文字或图形符号转化成计算机可识别的数字符号,从而完成古籍的影印、点校、注释、辑佚、索引、编纂等一系列加工处理工作,进而制成文献书目数据库和全文数据库,最终实现古籍整理、存储、检索、阅读和传输的电子化系统工作[1-3]。古籍数字化是传统古籍整理方法的延续与创新,也是古籍再生性保护的重要手段,对我国传统文化的继承、弘扬和传播乃至我国的经济建设和文化建设都具有重大意义[1]。迄今为止,古籍数字化工作已经发展近三十年,但还存在诸多问题,远未达到成熟状态。因此,本文从政策、研究和实践三方面梳理我国古籍数字化建设的现状,并分析其制约因素和发展对策,以期为后续研究及实践活动提供参考。
古籍是我国文化遗产的重要组成部分。从法律到行政法规,再到各类部门规章和行政规范性文件,在众多政策法规的支撑下,对古籍的保护工作开展已久。而随着信息技术的发展以及古籍数字化研究和实践的兴起,古籍保护的政策引导逐步细化到古籍数字化的层面。
2007年1月,国务院办公厅印发《关于进一步加强古籍保护工作的意见》,明确指出从2007年开始,用3—5年普查全国各系统的古籍收藏和保护状况,并制订古籍数字化标准,规范古籍数字化工作,建立中华古籍联合目录和古籍数字资源库,以实现古籍资源的保护和有效利用[4]。《关于进一步加强古籍保护工作的意见》提出在“十一五”期间要大力实施“中华古籍保护计划”[5],这是我国历史上首个由政府主持的古籍保护领域的国家级重要文化工程。
2011年3月,为使古籍保护工作在“十二五”期间更加深入、扎实地开展,文化部下发《关于进一步加强古籍保护工作的通知》[6],敦促加快古籍数字化建设工作的步伐,努力实现古籍保护工作成果的全社会共享。2012年2月,中共中央办公厅、国务院办公厅印发《国家“十二五”时期文化改革发展规划纲要》[7],再次强调开展古籍修复、数字化出版的任务,并提出实施少数民族古籍资源数字化建设工程,编纂出版《中国少数民族古籍总目提要》。据此,文化部以文政法发〔2012〕13号在2012年5月印发《文化部“十二五”时期文化改革发展规划》[8],提出继续推进古籍保护工作,并明确“中华古籍保护计划”的阶段任务。
2017年,中共中央办公厅、国务院办公厅印发《关于实施中华优秀传统文化传承发展工程的意见》[9],将“深入阐发文化精髓”列为重点任务,提出“实施国家古籍保护工程,完善国家珍贵古籍名录和全国古籍重点保护单位评定制度”。此外,《国家“十三五”时期文化改革发展规划纲要》再次纳入中华古籍保护计划,提出统筹推进古籍整理出版数字化,建设包括古籍资源在内的中华文化资源数据库[10];文化部据此编制《文化部“十三五”时期文化改革发展规划》[11],对古籍的数字化工作做出进一步要求。
由此可见,古籍保护一直是文化传承与改革的重点工作内容,而数字化则是古籍保护的重点方向。在中央政策指导下,地方政府出台了相应的地方政策,因地制宜地指导古籍数字化建设工作,由此构成的政策网络为古籍的数字化建设指引了方向,大力促成古籍数字化的研究发展和实践落地。
典籍泛指古代图书,在以往研究中,对文化典籍和典籍、古籍、文化古籍的概念没有严格的区分。因此在CNKI期刊数据库中以检索式TI =(“典籍”+“古籍”)AND TI =“数字化”进行检索(检索日期为2017年9月15日),共得到文献417篇,去除重复文献、无关文献等,剩余文献408篇。本文以此为基础,简要分析我国古籍数字化研究的进展。
从时间上看,408篇文献中最早发表在1997年,此后近十年里,年度文献量有所增长,文献累积量表现为上升曲线,但上升进度缓慢,截至2006年,文献总量仍不足100篇。2007年,“中华古籍保护计划”启动,我国古籍数字化工作迈上新的台阶,在此后数年间,相关研究的文献量也较此前有较明显的增长,年度文献量虽然有所起伏,但整体呈现平稳状态。图1为截取近十年的累计文献量变化情况,通过直线方程拟合,结果表明显著性小于0.001,这充分说明学界对于古籍数字化的课题保持稳定的研究投入,古籍数字化的研究尚在发展,并且存在较大的研究空间。
利用SATI工具,提取并统计408篇文献的关键词,生成矩阵并利用Netdraw软件制作关键词共现图谱(见图2),保留共现次数不小于3次的关键词,并通过线的粗细表示共现关系强弱。根据图中陈列的关键词信息及共现关系,可以看出研究者在古籍数字化课题上的研究重点主要有基础理论研究、技术问题研究、实践应用研究、标准体系研究和专题古籍数字化研究(见表1)。
图1 近十年古籍数字化研究文献累积量
图2 古籍数字化研究关键词共现图谱
表1 古籍数字化的研究重点
古籍数字化最早是从美国开始的。20世纪70年代末,联机计算机图书馆中心和学术研究图书馆信息网络先后编制朱熹大学章句索引、王阳明传习录索引、戴震原善索引等数据库[12-14]。受此影响,20世纪80年代以来,台湾、香港和大陆地区才陆续展开古籍数字化的工作。
20世纪80年代初,台湾地区“中央图书馆”将所藏善本编制成《台湾地区善本古籍联合目录》,后以此为基础进行扩充,建成中文古籍书目数据库;除书目数据库外,自1984年,台湾地区陆续开发史语所古籍数据库、简帛金石资料库、史语所藏内阁大库档案、中华电子佛典线上藏经阁大正藏全文检索系统等全文数据库;1989年,台湾地区提出“数字典藏计划”[15]。香港地区的古籍数字化工作也从20世纪80年代开始迅速发展,最具代表性的是香港中文大学中国文化研究所成立的古文献数据库中心,并先后推出先秦两汉古籍逐字索引丛刊和汉达古籍数据库检索系统[14]。
相较于台湾和香港地区,大陆地区的古籍数字化工作开展较晚,于20世纪90年代中期才真正开启,但其发展速度不容小觑,“中国数字图书馆工程”“中华再造善本工程”“中华字库工程”等重点项目陆续展开,参与古籍数字化工作的主体越来越庞大,数字化工作覆盖的古籍文献也日渐丰富和全面。具体而言,一方面,图书馆与科研学术机构在古籍数字化工作中扮演重要角色。如目前国家图书馆已经建成包含36个子库(中华古籍资源库、古代古籍、四部丛刊等)的古籍资源库,北京大学建设数字图书馆古文献资源库——秘籍琳琅,全国24家重点高校图书馆共建高校古文献资源库——学苑汲古[15],以及首都图书馆[16]、南京图书馆[17]、东北师范大学古籍研究所[18]等机构针对各自馆藏特色古籍资源展开的数字化项目,这些都为大陆地区古籍数字化工作的发展做出了令人瞩目的贡献。另一方面,更多商业机构参与古籍资源的开发,成为古籍数字化工作中不容小觑的一股力量。如北京爱如生数字化技术研究中心研制中国方志库,并同北大方正集团有限公司及黄山书社合作出版中国基本古籍库;北京书同文数字化技术有限公司与香港迪志文化出版有限公司、上海人民出版社合作研制文渊阁四库全书,并且独立开发了《四部丛刊》全文检索系统;北京时代瀚堂科技有限公司开发龙语瀚堂典籍数据库;北京国学时代文化传播股份有限公司研制国学宝典[15,19]。值得注意的是,数字化对象除经典古籍外,国家图书馆推出的碑砧菁华、西夏碎金、敦煌遗珍等专题数据库,上海图书馆建立的家谱书目数据库,以及各地的地方志文献数字化工程与项目,都将越来越多的特色古籍资源纳入古籍数字化事业中[14-15]。
此外,由于古籍数字化过程的特殊要求,其标准建设成为古籍数字化的一项重点工作内容。随着我国古籍数字化的研究实践,已经建立一些现行标准。张文亮等于2016年整理我国古籍数字化标准体系,指出其共包括11条国家标准、10条文化行业标准、2条档案行业标准和1条新闻出版行业标准,其中大部分是元数据规范和数据加工规范等技术标准[20]。
之所以开展古籍数字化国际合作,一方面是由于历史原因造成我国大量古籍资源流散海外,据粗略统计,在美国、英国、法国、俄国、日本等20个国家的90余所大型博物馆和美术馆中都收藏有中华古籍文献[21],对这部分古籍的普查、整理和出版工作,一直都是我国古籍资源保护和利用的重要内容之一,而这项工作的展开必须依托于国际合作;另一方面是因为国外文献资源的数字化工作较国内有更先进的技术和更丰富的经验,而对中华古籍的数字化过程中需涉及的人文历史知识、古籍的修复与维护技能,则给国外的独立研究造成难以逾越的障碍[21]。因此,在国内外双方需求的共同促使下,大量国际合作项目应运而生。表2列出了其中具有代表性和影响力的部分合作项目。
表2 古籍数字化的国际合作成果[21-27]
可以看到,古籍数字化的国际合作为古籍资源的全球化共享提供了解决方案,为海内外中华古籍研究提供更加完整准确的资料库支持,同时共享古籍数字化的技术经验,提高古籍数据质量。尤其对古籍数字化发展相对缓慢的国内来说,这种交流合作帮助我国在框架构建、标准确立等方面迈出重要一步,缩短与国外的技术经验差距。总而言之,古籍数字化的国际合作是一项互惠互利的必要性措施,也是古籍数字化工作发展的重要趋势。
纵观我国古籍数字化的成就,可以归纳出如下几个典型特征。
(1)政策大力扶持。党和政府历来重视古籍的保护,21世纪以来,对古籍的数字化工作更在政策上给予高度重视和支持。中央号召,地方响应,鼓励学界、业界各方力量积极参与投入,为我国古籍数字化工作的繁荣发展打下坚实基础。
(2)多方积极参与。除不同级别的图书馆与科研学术机构,越来越多的商业机构参与古籍数字化的工作;同时从参与到组织,古籍数字化的国际合作力量也在日益壮大,为古籍数字化的发展不断补充新的内容和方法。
(3)内容丰富多样。从经典文集到方志家谱,从纸质善本到碑帖甲骨,我国古籍资源不计其数,所带来的古籍数字化工作在内容上同样不胜枚举。民族古籍、农业古籍、中医药古籍等,专题古籍数字化工作正不断深化与细化,逐渐完善现有的古籍数字化成果。
(4)技术独树一帜。古籍的数字化是古籍整理工作的延伸和发展,数字化过程中面临的字库构建、版本选择及古籍整理的基础技术等问题,国外的技术和经验难以完全为国内古籍数字化建设提供借鉴,这要求国内的古籍数字化工作者研究一套适用于中华古籍的数字化技术方案,并不断优化和升级。
在近三十年的发展中,我国古籍数字化建设卓有成效,但也存在诸多制约其发展速度和质量的因素。
古籍的数字化是一项系统工程,需要通过科学合理的规划和长远的发展战略进行统筹。然而目前我国古籍数字化工作缺乏一定的宏观管理和调控,在此环境下,建设单位多根据自身业务需求开展古籍的数字化工作,缺乏分工协作的意识[28-29]。同时,各单位已有的古籍数字化建设,也呈现出诸多弊端:第一,选题出现偏颇,资源集中于热点项目,尤其一些商业机构在资源开发时通常集中在少数常用古籍,对文化传承和学术研究同样重要的一些冷门项目却无人问津[30-31];第二,资源集中导致大量重复建设,极大地浪费人力、物力和财力,如《文渊阁四库全书》《二十五史》等古籍资源存在多种电子版本[19]。
我国虽然已经出台一些规范古籍数字化工作的标准,但还存在制度不规范、内容不全面、原则不明确等问题[32]。现行的标准尚不能构成一个统一协调的有机整体,无法对古籍数字化工作予以全面系统的规范和指导,加之有些单位的封闭式建设,造成不同的字符集、著录格式、数据格式、文字编码等古籍加工方式并存,以及不同资源库的系统建设、检索技术、访问控制和服务模式差异化严重,这些问题不仅造成数字化成果在质量上的割裂,也不利于资源共享和用户使用,大大降低了古籍资源库的使用效率[15,28,33-34]。
已有技术尚不能满足古籍数字化事业,文字处理、检索方式选择、图像制作、古籍文字识别、辅助功能选择等问题都亟待解决[17]。其中,文字处理问题是古籍数字化工作中最早出现的问题,古籍中使用的文字多是繁体字,同时含有大量生僻字、异体字、通假字、避讳字等,而在字符集收录文字不够全的情况下,难免对古籍的数字化工作造成困扰[2,13,19],进一步给检索的准确性带来麻烦,容易造成检索结果失真。现阶段古籍资源库的检索技术是基于文本形式的关键词检索,但古籍的数字化还存在图形、图像等格式[14,19],因此现有检索技术的能力在检索深度上还很有限。
古籍数字化本质上是古籍整理的延伸,是数字化和古籍整理的结合。因此需要通晓古籍知识的人才参与,同时需要精通计算机信息技术的人员助力[2,15,35]。为满足上述条件,我国古籍数字化工作的参与人员一般由从事古籍整理和从事信息技术的专业人员构成[36]。但是“隔行如隔山”,随学科分类日趋精细,日渐增大的学科鸿沟要求两者兼通的复合型人才[30,35],就目前而言,这类人才十分稀缺,并不能满足实际工作需求。
由我国古籍保护中心等机构牵头组织,有效规划、合理分工,统筹古籍资源共同建设,为控制管理好古籍数字化工作的选题,一要避免重复建设、盲目建设;二要鼓励和推动特色古籍资源的数字化建设,使古籍的数字化工作健康全面地发展。此外,通过统筹规划打破建设单位另起炉灶的困局,对共建共享提出更高要求,最大程度地整合和利用已有数字化成果,提高使用效率,减少人力、物力和财力的浪费。
要真正实现古籍数字化建设单位间的共建共享,必须先为其提供统一规范的建设“章法”。需正视我国古籍数字化工作的标准化建设问题,按开放性、系统性、实用性、拓展性等原则,充分利用古籍数字化生命周期等理论,科学构建以技术标准体系为主、管理标准体系和工作标准体系为辅的古籍数字化标准体系[28,32]。通过建立健全标准化体系,推动古籍数字化工作向专业、规范的方向迈进,保障数字化工作的质量,适应古籍资源开发利用的共享趋势。
攻克技术难题可从以下两方面开展,一是提高古籍数字化水平,解决字符集偏小、扫描精度不高、文字转换效率低下等基础技术问题,为古籍资源库的高效率、高质量建设提供技术保障;二是强化检索技术,力求对古籍资源库的深度开发,为资源库的深度利用提供技术支持,实现数据化增值。此外,加强实现技术进步所必需的专业人才培养,尤其是精通古籍知识和计算机技术的复合型人才培养,从科研和实践两方面入手进行探索和创新,在保证数字化工作质量的基础上力争实现更大的突破。
进一步加强与国外古籍数字化建设单位的共建共享,一方面扩充完善我国的古籍资源库,为文化传承和学术研究提供更强有力的支持;另一方面更深入地学习国外的古籍数字化工作经验,为国内古籍数字化工作提供技术补充。以标准化为例,国外一些古籍资源标准化建设已经相对成熟,学习其经验可以给我国带来更多启示。张文亮等分析英国古籍数字化标准建设现状后,提出我国古籍数字化应该加强存储规范标准建设、字符处理标准的统一、制定专门的数据加工标准、制定专门的数据库检索标准和古籍文献资源分类与管理标准等[37]。
因此,统筹规划、资源共享、标准体系、质量保障、技术攻关、人才培养、国际合作等方面应该是我国古籍数字化建设需要重点考虑的对策。为此构建古籍数字化建设的对策框架如图3所示。
图3 古籍数字化发展对策的框架设计
其中统筹规划是所有对策中的重要基础和基本要求,统筹规划的核心内容可以从质量保障、技术攻关和国际合作三方面入手,而标准体系建设和人才培养则是发展对策的两大支撑,最终目的是实现古籍的资源共享,为我国古籍的传承和交流奠定基础。
古籍数字化是实现古籍保护和利用的必然趋势,是一项长期复杂的系统工程。就我国古籍数字化建设的现状而言,相关的研究和实践还有待进一步的发展。本文从政策、研究、实践三个角度出发,剖析我国古籍数字化工作的进展,并基于此讨论了目前制约国内古籍数字化的主要因素和相应的应对策略,以期给相关工作者提供参考和帮助。古籍资源建设意义重大,是国家文化建设的一项长期工作,同时也相信,在更丰富的实践经验和更深刻的理论研究相结合指导下,我国古籍数字化建设工作必将迎来更加健康快速的发展。
[1]牛红广.古籍文献数字化与现代文献数字化的区别分析[J].史志学刊,2013(2):114-115,171.
[2]许静.古籍数字化面临的新问题及对策研究[J].内蒙古科技与经济,2013(15):157-158.
[3]李国新.中国古籍资源数字化的进展与任务[J].大学图书馆学报,2002,20(1):21-26,41-49.
[4]国务院办公厅.国务院办公厅关于进一步加强古籍保护工作的意见[EB/OL].(2007-01-29)[2017-09-17].http://www.gov.cn/zwgk/2007-01/29/content_511825.htm.
[5]中国古籍保护网.中华古籍保护计划[EB/OL].[2017-09-17].http://www.nlc.gov.cn/pcab/bhjh/jj/.
[6]中华人民共和国文化部.文化部关于进一步加强古籍保护工作的通知[EB/OL].(2011-03-29)[2017-09-17].http://www.mcprc.gov.cn/whzx/ggtz/201111/t20111121_420553.html.
[7]中华人民共和国人民政府.中办国办印发国家“十二五”文化改革发展规划纲要[EB/OL].(2012-02-15)[2017-09-17].http://www.gov.cn/jrzg/2012-02/15/content_2067781.htm.
[8]中华人民共和国国务院新闻办公室.文化部关于印发《文化部“十二五”时期文化改革发展规划》的通知[EB/OL].(2014-02-20)[2017-09-17].http://www.scio.gov.cn/xwfbh/xwbfbh/wqfbh/2014/20140224/xgzc30494/Document/1364215/1364215_1.htm.
[9]中华人民共和国人民政府.中共中央办公厅 国务院办公厅印发《关于实施中华优秀传统文化传承发展工程的意见》[EB/OL].(2017-01-25)[2017-09-17].http://www.gov.cn/zhengce/2017-01/25/content_5163472.htm.
[10]中华人民共和国人民政府.中共中央办公厅 国务院办公厅印发《国家“十三五”时期文化发展改革规划纲要》[EB/OL].[2017-09-17].http://www.gov.cn/zhengce/2017-05/07/content_5191604.htm.
[11]中华人民共和国文化部 文化部“十三五”时期文化发展改革规划[EB/OL].(2017-02-23)[2017-09-17].http://zwgk.mcprc.gov.cn/auto255/201702/t20170223_491392.html.
[12]李明杰,肖秋慧.中国古籍数字化资源调查与分析[J].图书馆杂志,2002(5):25-28.
[13]刘金荣.古籍资源数字化过程中的问题[J].吉林省教育学院学报,2015,31(8):144-146.
[14]梁达讯.浅谈古籍文献的数字化之路[J].才智,2015(29):286-287.
[15]姜妮.国内古籍数字化之解析与探讨[J].四川图书馆学报,2016(1):72-75.[16]胡艳杰.古籍数字化资源的交换及其意义初探[J].图书馆工作与研究,2014,1(12):45-47.
[17]李洋.古籍文献数字化之思考[J].农业图书情报学刊,2015,27(3):47-49.
[18]赵士斌,杨艳红,陈金,等.中医古籍数字化的现状与必要性[J].中国市场,2015(24):191-192.
[19]林竹鸣,朱翠萍.古籍数字化的历史、现状及问题探析[J].淮北师范大学学报(哲学社会科学版),2014,35(6):192-194.
[20]张文亮,薄丽辉.我国古籍数字化标准体系现状及应对策略研究[J].新世纪图书馆,2016(2):38-42.
[21]刘家真,陈美.中华古籍数字化的国际合作[J].图书情报知识,2013(5):46-55.[22]高娟,刘家真.中国大陆地区古籍数字化问题及对策[J].中国图书馆学报,2013,39(4):110-119.
[23]国家数字图书馆.中华古籍善本国际联合书目系统[EB/OL].[2017-09-19].http://mylib.nlc.cn/system/application/search/display/zhonghuaguji shanben/db.htm.
[24]IDP. The International Dunhuang Project:The Silk Road Online[EB/OL].[2017-09-19].http://idp.bl.uk/.
[25]CADAL.项目简介[EB/OL].[2017-09-19].http://www.cadal.cn/xmjj/.
[26]国家数字图书馆.哈佛大学哈佛燕京图书馆藏中文善本古籍特藏资源库[EB/OL].[2017-09-20].http://mylib.nlc.cn/web/guest/hafoyanjing.
[27]国家数字图书馆.东京大学东洋文化研究所汉籍全文影像数据库[EB/OL].[2017-09-19].http://mylib.nlc.cn/web/guest/dongwenyanhanjiyingxiangku.
[28]葛怀东.论古籍数字化标准体系建设[J].图书馆学刊,2013,35(1):47-49.
[29]梁爱民,陈荔京.古籍数字化与共建共享[J].国家图书馆学刊,2012,21(5):108-112.
[30]邵正坤.古籍数字化的困局及应对策略[J].图书馆学研究,2014(12):32-34,79.
[31]朱锁玲,包平.我国古籍数字化进展与研究述评[J].图书馆理论与实践,2009(9):18-21.
[32]张文亮,尚奋宇.我国古籍数字化标准体系现状调查及优化策略[J].国家图书馆学刊,2015,24(6):83-89.
[33]龙伟.以“中华古籍保护计划”为契机推进文献典籍资源数字化[J].数字与缩微影像,2012(3):36-39.
[34]尚奋宇,张文亮.基于DLC的我国古籍数字化标准体系框架研究[J].图书馆学研究,2017(3):21-27.
[35]王向前.高校图书馆古籍数字化建设层次、问题及应对策略[J].贵图学苑,2016(1):65-67.
[36]王红茹.论图书馆文献典籍的数字化保护和传承[J].兰台世界,2015,484(26):107-109.
[37]张文亮,彭媛媛.英国古籍数字化标准建设现状及其启示[J].新世纪图书馆,2016(5):85-89.
余力,女,1963年生,硕士,副编审,研究方向:编辑出版,E-mail:yulizhu842@sina.com。
管家娃,女,1993年生,硕士研究生,研究方向:网络信息资源管理。
A Situation and Development Analysis on the Digitalization of Ancient Books in China
YU Li1, GUAN JiaWa2
(1.Nanjing Publishing House, Nanjing 210016, China; 2.School of Information Management, Nanjing University, Nanjing 210046, China)
By means of literature research and bibliometric method, this paper analyzed the current situation of the digitization of ancient books from three angles which were policy, research and practice. On this basis, this paper analyzed the restricting factors and countermeasures of China’s digital work of ancient books, and concluded that it was restricted by the lack of overall planning, standards, technical capability and professional talents. Furthermore, four corresponding strategies were put forward. The fi ndings would provide reference for the development of research and practice on the digitization of ancient books in China.
Ancient Books; Digitization of Ancient Books; Digital Publishing
G255.1
10.3772/j.issn.1673-2286.2017.11.007
2017-10-09)