钟伶
摘要:选择香港8所公立大学,通过网络访问、文献调研的方式调查高校古籍特色资源建设与共享现状,总结香港高校特色数据库建设与共享方面的特点,以期为今后古籍特色库建设及共享提供建议。
关键词:古籍特色库;香港;高校图书馆;共享
中图分类号:R2-5 文献标识码:A 文章编号:2095-5707(2016)03-0006-05
古籍是研究古代政治、文化、经济的一手资料,极具收藏与学术研究价值。据2003年《香港所藏古籍书目》记载,香港中文大学、香港大学、香港浸会大学、香港科技大学、香港城市大学、香港理工大学等11家高校图书馆所收藏的1911年(含1911年)以前写、抄、刻、印之各类中文古籍有7368种,丛书子目达18718种。为扩大珍贵古籍的利用,各高校先后开始了古籍数字化工作,建立了一批古籍的特色资源库,并在建设与共享方面有着自己的特色。
本研究选择香港8所公立大学,通过网络远程访问各所高校的图书馆或古籍研究机构的网站,收集、整理各高校建立的古籍特色库目录、可访问及共享情况、特色库内容,以及各个特色库的建设与发展历程:同时通过文献调研方式,收集并参考有关香港高校古籍特色库建设方面的各类文献,包括图书、期刊论文、会议论文、会议演示文档、新闻报道等,对古籍特色资源建设与共享现状进行调研,以期为今后古籍特色库建设及共享提供建议。
1.8所高校古籍特色库建设现状
本研究中的香港8所公立大学包括香港城市大学、香港浸会大学、岭南大学、香港中文大学、香港教育学院、香港理工大学、香港科技大学、香港大学。除香港教育学院、香港理工大学以外,其他6所高校均对古籍进行了数字化,并逐步建立古籍特色库。其中以香港中文大学、香港科技大学、香港大学等建设的古籍特色库最为丰富,见表1。
2.香港高校古籍特色库特点分析
2.1统筹规划,有计划进行
古籍的特色库建设是一项长期而艰巨的工程,包括古籍的清查、整序、数字化、研究与开发等诸多内容。香港几所高校的古籍数字化工作大多数没有国家或政府层面的统筹规划,每个高校的研究机构或图书馆根据单位古籍藏书情况,将古籍特色库建设作为一项长期的、有计划的项目来进行,对工作进行长期规划,分阶段制定详细的工作计划,颁布细致的工作流程与规范,并及时将工程进展、取得成果对外公布。
如香港科技大学图书馆“About Rare&SpecialeZone”(http://lbezone.ust.hk/rse/about)就是对正在进行与已经完成的古籍特色库项目建立的专门介绍网页,介绍古籍特色库的由来、典藏的范围与内容,以及项目进展情况等。
2.2古籍范围宽泛
在中国大陆地区,古籍是指1911年以前(含1911年)在中国书写或印刷的书籍。而香港由于历史原因,受西方影响较大,在古籍时间限定上没有1911年这个时间节点的限制,一般以时间超过100年的资源就作为古籍来处理。香港高校收集古籍的范围除了中国传统古籍外,同时也收集了西方出版的一些古典著作,以及日本、韩国的古籍。如香港城市大学图书馆建立了“英国法律特藏”书库(http://www.cityu.edu.hk/lib/collect/law/englaw/chinese sc.htm.),以收录1900年以前出版的英国法律珍本书为主,同时也收录北美、英联邦国家与法律相关的哲学、社会科学、语言、文学等古籍。香港大学冯平山图书馆收藏的古籍以中文古籍善本、日文古籍为主,是世界著名的东亚文化研究中心。在古籍的类型方面,大陆地区以书为主,而在香港地区的古籍范围相对宽泛,类型包括多样,如线装书、卷轴、甲骨、舆图、竹简等,甚至是现代文献中常见的图书、期刊、图片等。
2.3经费来源多元化
古籍特色库的建设与维护需要花费大量的人力、物力与财力,故经费问题是特色数据库建设当中不得不考虑的问题。与内地高校特色馆藏数字化经费主要来源于政府部门或专门机构等不同,香港高校古籍特色馆藏的数字化与特色库的建立经费来源渠道更为丰富,主要有以下3个来源。
2.3.1自筹 自筹经费是香港高校古籍特色库建设资金的主要来源,也可见香港各高校对古籍数字化十分重视。如香港浸会大学的“基督教古籍数据库”,由香港浸会大学图书馆与香港浸会大学校牧处合作建立。
2.3.2政府或行政部门资助 如香港中文大学中国文化研究所建立的“汉达文库”(http:llwww.cuhk.edu.hk/ics/rccat/database.html)包括多个子库,不同的子库其资助来源不同。比如,1994年获得“大学及理工拨款委员会”资助,建立了“竹简、帛书出土文献数据库”;1996年获得“香港大学拨款委员会”资助,开展“甲骨文全文数据库”研究计划;1999年又得到“香港研究资助局”拨款资助,开展“金文全文数据库”建设;2000年得到“香港研究资助局”拨款,建立中国古代类书计算机化数据库。
2.3.3个人资助 例如香港科技大学古籍系列特色库的主要经费来源于意得集团有限公司高佩璇博士300万港币捐款,捐款主要用于修建一个开放的图书馆特藏与大学档案展览厅,另外一部分是用于3年内把特藏扫描成高分辨率的数字文档。
2.4数字化水平高
香港高校对古籍的整理早于20世纪90年代初,但数字化的工作大多在21世纪才开始进行。此时古籍的数字化已经达到一定水平,因此,香港各高校的古籍数字化可借鉴的经验以及技术比较多,古籍数字化起点较高。各高校建立的古籍特色库除了浏览的功能外,大多可以进行检索,并且古籍页面清晰,辨识度高,有利于教学与研究。如香港中文大学中国文化研究所与图书馆合作开发的“汉达文库”,从1989年创建至今,经历了20多年,尚在不断完善当中。其中“甲骨文资料库”是将7种甲骨要籍中所收录的甲骨文字重新临摹,并加校勘、释文,在窗口系统上,可同时显示甲骨文字原字形及隶定释文(隶定古文的目的是让后人认识和读懂古文,其做法是以隶书或楷书的笔法来写古文的字形,或以己释的局部结构来组合古文整字。它是古文字考释的前期步骤。隶定古文有时以“释文”的身份出现,但它与古文并不能一一对应);“金文资料库”以《殷周金文集成》为素材,分设汉字部首和原形部首2种检索法,释文分A、B两种形式显示:释文A依据铭文原来位置,以隶定字对应显示,方便读者了解铭文原貌;释文B以隶定字顺序显示,并加句读;提供金文原形字和释文点击对应显示;附有金文的时代、出土、现藏、著录等资料。
2.5元数据规范
自建特色库最突出的问题之一就是元数据的规范化问题,元数据的规范化、标准化有利于资料特别是数字化古籍资料的交流、整合,以达到最大范围的共建共享。为了实现文献资源的共建共享,1967年成立的香港高校图书馆咨询委员会(JULAC)发起了“中文名称规范合作计划”与“中文资料编目共享项目”对中文资料编目进行规范化处理。“中文名称规范合作计划”建立了人名、团体名称、会议名称、统一题名及丛编题名的统一标准,以及多语种、多脚本的统一数据库。“中文资料编目共享项目”则建立了CNMARC、CMMARC、LC CJK MARC三者整合的元数据库,在不改变各成员馆编目习惯的基础上,实现编目数据的共建与共享。同时8所高校使用同样的图书管理系统innopac,使馆际之间的合作更为方便与容易。
2.6重视共建共享
香港各大学在古籍特色库建设方面重视与大陆、台湾、澳门等地区的合作。如联合目录建设方面,香港中文大学冯平山图书馆与香港中文大学图书馆均参与了台湾国立图书馆牵头建立的“中文古籍书目资料库”的建设。香港中文大学从2007年开始,参与了“中美百万册书数字图书馆合作计划”(即高等学校中英文图书数字化国际合作计划,CADAL),将1923年以前出版的超过3000本西方语言书籍进行数字化,还能分享超过65万册民国时期出版的书刊。在全文共享方面,香港城市大学的“汉古籍特藏”、香港浸会大学的“基督教古籍数据库”等都可从网络上免费检索与浏览全文。不仅如此,香港高校的古籍特色库积极在世界各开放获取知识库中注册,以便更大范围的共享。如香港中文大学的“中国古籍库”(http://udi.1ib.cuhk.edu.hk/p rojects/chinese-rare-bookdigital-collection/open-access?language=zh-hans)分别在BASE、Directory of Open Access Repositories(OpenDOAR)、OCLC WorldCat OAIster、OpenArchives Initiative、Registry of Open Access Repositories等开放获取平台中注册,供全世界古籍爱好者阅读与研究。
2.7注重版权问题
对于可以在网络免费使用的古籍特色库,香港高校图书馆都对资源使用时的版权作了不同程度的声明,告知读者应遵守的相应规定。如香港城市大学图书馆在读者使用特色库之前,将其必须遵守的使用条款先呈现出来,读者只有在接受相关条款后方可使用相关的特色库,在使用条款中明确规定了使用规范、版权、撤回政策、声明、联络方式等相关内容。香港科技大学图书馆对古籍特色库的使用条款中则明确规定,古籍特色库的使用不得用于商业目的或衍生物性工作,如果超出该范围,需事先提交申请,以便合理合法使用古籍特色库资源。
3.香港高校古籍特色库建设与共享的启示
3.1立足于本馆馆藏,重视管理与利用
随着人们对古籍文化价值与经济价值的了解,古籍作为一种稀有资源,获取越来越困难,与其花费大量的资金在购买古籍上,不如基于现有馆藏,重视其管理与利用,发挥古籍应有的价值。香港各高校的古籍特色库资源多来源于本馆已有的收藏,后期的古籍主要来源于私人捐赠或交换,各高校大多数设立了特藏部,负责保管与数字化处理古籍等特色馆藏,以期最大程度使古籍被读者查询与利用。相比之下,大陆虽然有不少高校拥有丰富的古籍,但总体来说,数字化程度不高,大多数只能提供书目或提要信息查询服务,多数不能进行全文浏览或全文浏览受限,更不能进行全文检索;还有一些高校的古籍束之高阁,或仅供少数人使用。因而古籍的管理与利用是应该重视的方向。
3.2重视古籍研究及专业人员培养
古籍的数字化与古籍特色库的建立不是简单的扫描与电子化过程,而是在研究的基础上,对古文献的重新提取与整理。古籍采用文字竖版排列,且无句读,在录入与识别时需要古籍处理人员有一定古文献的知识,才能保存古籍的原貌。另外,古籍对现代人来说内容晦涩难懂,缺漏字现象普通存在,古籍版本众多,在数字化过程中均需要古籍特色库建设者对古籍有一定的研究基础,才能准确反映原作者的思想,保留著作本来风格。因而古籍特色库的建立需要融入研究成果,才能真正建立起出色的数据库。香港中文大学的“汉达文库”“走马楼三国吴简,嘉禾吏民田家莉资料库”等均建立在研究的基础上,汇集了多方的研究成果,这样的古籍特色库使读者不仅能看到古籍的原文,而且同时能参考研究者的研究成果,更好地了解古籍、学习古籍、利用古籍。另外,古籍特色库的建设亦要重视专业人员的培养,特别是古籍研究人员与古籍数字化专业人员的培养,使真正懂古籍的专业人员来建立专业的古籍特色库。
3.3注意古籍特色库标准建设与应用
古籍特色库的标准问题一直是困扰古籍共建共享的关键基础性问题。目前,在古籍字符方面,有ISO/IEC 10646标准可以参考,以满足简体字、繁体字、异形字及难字的编码问题;在计算机处理方面有Unicode提供支持,实现计算机跨语言、跨平台的文本转换及处理;在元数据方面,国内已经有由中国高等教育文献保障系统(China Academic Library&Information System,CALIS)制定的《我国数字图书馆标准规范专门数字对象描述元数据规范》,针对具有中国文化特色的文献资料类型如古籍、拓片、舆图等,建立元数据格式及其扩展和互操作规则等;在特色数据库建设方面,CALIS也颁布了一系列的标准规范。但在国内高校中遵循以上标准者仅限于CALIS资助下的系列专题特色库,其他古籍特色库建设者无论是著录格式还是其他方面依然采用各自的标准。另外,在文档格式、分辨率、文件大小等方面均无统一标准;特色库建设与管理平台建设多种多样。以上问题均可造成古籍特色库在共建共享中的壁垒,因而需要如CALLS甚至更大范围、更高规格的统筹与规划平台,加强古籍特色库建设的规划与管理,为共建共享提供技术层面的保障。
3.4逐步开发,实现全文检索
从实际应用出发,全文检索是古籍数字化的核心技术,因为现代人对于古籍的检索需求大于系统的全书浏览模式,故强大的全文检索系统对于古籍特色库是必须的。而全文检索的实现,对特色库的建设者来说是非常艰巨的挑战。全文检索主要采用逐字标引的方式实现,而古籍的繁体字、异体字、通假字、避讳字等形式的存在,无疑使得检索效果大打折扣。另外,利用扫描仪录入原文也必须把文字图像转换成计算机可读的字符,检索功能才能得以发挥,而Unicode定义的汉字也并不能包括现有古籍中的全部字符,使得全文检索的实现更加难上加难。除此之外,古籍版本众多,同名异书、同书异名等现象普通存在,地名、人名等也存在这种状况。如南京,历史上先后称为冶城、越城、金陵、建业、建康、应天等;而唐代诗人杜甫,又被称之为诗圣、杜工部、杜少陵、杜拾遗等。因此,古籍特色库全文检索的实现,既要保持古籍原貌的完整,又要实现全文检索,应该先易后难,逐步开发。另外,加强古籍通用知识支撑系统的建立,如人名、地名、朝代等通用知识,对于实现古籍全文检索也很重要。
3.5考虑开放荻取
古籍资源是一种不可再生资源,并随着时间变迁,变得越来越稀少。古籍存在的意义并不是束之高阁或供少数人使用,最大范围地被人们利用,使古老的文化焕发新的生命力,才是古籍最好的归宿。要扩大古籍的使用,开放获取是当今公认最佳的方式之一。由于联机目录的广泛使用,查询到古籍的书目信息已经不是困难的事情,但全文获取仍有困难。可喜的是,已有部分高校或研究机构意识到开放获取对古籍保护与利用的价值,纷纷将馆藏古籍建立成古籍特色库,并在开放获取注册平台上注册,供全世界古籍研究者和爱好者使用,著名的如“哈佛大学哈佛燕京图书馆藏中文善本古籍特藏”“东京大学东洋文化研究所汉籍影像数据库”等。今后国内高校古籍特色库的建立,也应考虑资源的开放获取,以利于古籍能发挥出更大的价值。