○盛莉
传统与未来之间:构筑“古籍电子文献目录学”之路
——评张三夕、毛建军《汉语古籍电子文献知见录》
○盛莉
21世纪,随着数字化技术的飞速发展,传统知识文化的研究传播领域也处处伴随着数字革命。中国古典文献成为信息技术的重要开发对象。从传统汉语古籍的数字化检索到汉语古籍的人工智能开发,汉语古籍电子文献的制作应用日趋专业化、学科化。近二十年来,世界各地研发机构、高校、图书馆制作的重要汉语古籍电子产品约有二百七十五种,①这还不包括各种普通的古籍电子图书和工具软件。汉语古籍电子文献成为从传统中国古典文献中衍生而出的一种新型文献形式,从而也催生了撰写新型“古籍电子文献目录”之必要。
由张三夕教授、毛建军博士主编的《汉语古籍电子文献知见录》于2015年经世界图书出版公司发行,该书正是一部尝试“古籍电子文献目录提要”的开山之作。《汉语古籍电子文献知见录》根据广大文史研究者要求编写,编写初始,即“从古典文献学教学资源利用视野对这些电子文献进行了科学分类与导航设计”②。收录文献数据库数量众多,基本将编者目见所及的汉语古籍电子文献全部收录,可说囊括了当今已经问世的大部分汉语古籍电子文献。
较之传统古籍文献书目的解题形式,《汉语古籍电子文献知见录》具有如下特点:
1.改变传统书目以“经、史、子、集”及其下设各小类进行分类提要的标准,以古籍电子文献开发所在区域和机构个人设置一、二级目录进行解题。一级目录的安排次序为:中国大陆、中国台湾、中国香港、中国澳门、国外(日本、韩国、美国、欧美、澳洲);二级目录安排次序为:图书馆、档案馆等古籍典藏机构、高校等研究机构、古籍数字化企业公司、个人等。其中,中国大陆有古籍电子文献166种;中国台湾有古籍电子文献70种;中国香港有古籍电子文献9种;中国澳门有古籍电子文献2种;国外地区有古籍电子文献22种;合作开发的古籍电子文献有6种。二级目录里所列古籍电子文献共计275种,每种都有展现其研究特色的数据库名称。
按照这种新型标准进行古籍分类,能避免传统“经、史、子、集”的文献分类标准与现代学科研究疏离的弊病,将基于各学科研究方向所需的古籍电子文献内容要点,在二级目录中的电子文献名称里予以展示。同时,以地域和机构作为一、二级目录,能使读者更好地了解世界各地古籍文献的数字化现状和应用方向。
2.改变传统书目对古典文献的版本分类,将古籍电子文献分为古籍书目数据库、古汉语电子语料库、古籍全文数据库、数字图书馆、古籍电子出版平台。这种新型的文献分类方式主要着眼于古籍电子文献的数字服务模式,不仅涉及到古籍文献的学科检索内容,更和古籍内容阅读消费、学习形态的数字化紧密相关。
3.改变传统书目对古典文献的解题内容,新设解题内容包括:电子文献名称、开发或建置单位、数据库性质、数据库包含的内容、检索方式、检索语言、数据库评价。凡提供在线服务的数据库,均在数据库介绍之后罗列参考网址。解题内容图文并茂,除文字描述,还有数据库图片形式的直观表达。
显然,《汉语古籍电子文献知见录》针对当今古籍数字资源库产品众多的现状,引入自定的古籍电子文献目录学标准,诸如古籍分类体系、古籍著录体例等。而在古籍电子文献著录的内容方面,《汉语古籍电子文献知见录》也体现出数字化环境下古典文献提要的撰写特点,表现为:
1.善本数据库的知见入录。《汉语古籍电子文献知见录》关注当代善本、珍本古籍的电子化进程,对所见善本目录数据库进行详解。其中如中国国家图书馆“中华古籍善本国际联合书目系统”“古籍特藏‘宋人文集’资源库”、首都图书馆“古籍善本书目数据库”、苏州图书馆“古籍善本目录数据库”、上海中医药大学图书馆“中医古籍善本书目提要数据库”等,均为全国影响较大的善本数据库。而书中介绍的大连图书馆“《小方壶斋舆地丛钞三补编》”,稿本现存大连图书馆,为海内孤本,此编取材于清末翻译西书,包括江南制造局、京师同文馆和教会机构出版的地理文献,具有珍贵的文献价值。
2.特色数据库的知见入录。除对中国传统经、史、子、集四部电子文献予以搜览外,《汉语古籍电子文献知见录》介绍了很多今人研制的特色数据库,如首都图书馆“古籍插图图像数据库”,从首都图书馆馆藏古籍文献中拣选制作插图数据。插图内容包括人物、小说、戏曲、军事、宗教、动物、植物、风景、建筑、历史故事等几大类。研究者可以根据这些古籍插图进一步理解古籍中的相关内容。再如北京尚品大成数据技术有限公司“大成老旧刊全文数据库”收录清朝末到1949年新中国成立以前,中国出版的七千多种期刊,共十三多万期,二百二十多万篇文章。很多期刊属于国内不多见的珍本,是研究各学科发展和科技传承脉络不可或缺的数据库工具。
3.海外古籍电子文献的知见入录。海外古籍电子文献囊括了中国台湾、中国香港、中国澳门及韩国、日本、新加坡、美国、英国、澳大利亚等地的汉语古籍数据库,其中多有大陆地区未及之汉学研究资料。如韩国庆尚大学图书馆“文泉阁古籍数据库”收录有南冥学研究资料,即南冥曹植(1501年—1572年)学派及庆尚右地道区与儒学家相关的文集与记录类,提供南冥曹植《南冥先生文集》的各种版本与校勘本,其年谱、门人录、德川书院相关记录,及从游南冥者24人,门人50名的个人信息及文集记录。这对研究宋代理学在东亚的流播影响具有重要价值。此外,日本是海外收藏中文古籍最丰富的国家,其重要的汉籍数据库已尽数载入《汉语古籍电子文献知见录》,可为中国古代文史研究者提供具体的文献书目检索信息。
4.专业化、学术化的叙录提要。全书的提要撰写由古典文献学专业的博士和硕士分工完成,因而也具有可供文史研究者参考的学科视角。例如“《全宋诗》分析系统”提要云:“‘《全宋诗》分析系统’的应用领域主要在以下几个方面:(1)在古代文学研究方面可应用于:诗人风格研究、诗歌流变研究、诗文相关研究、地域文化与诗歌特征研究等。(2)在古代汉语研究方面可应用于:古代诗歌语言模式分析、诗歌字及词组频率分析、诗歌语言发展史研究、音韵学相关研究等。(3)在古代文献整理方面可应用于:重出诗整理分析、误收诗分析等。(4)在古代文学教学方面可应用于:格律诗教学模拟系统研究、诗作评价、诗作相似性分析等。(5)在跨学科研究方面可应用于:计算机技术与古代文学相关研究、古代文献数据深层挖掘、古代文献数据自动化整理等。”③像这样的提要文字在书中多处可见,能为研究者提供学术视角和研究方法上的参考。
5.对当前古籍电子化的不足提出建议。例如“中国科技史数字图书馆资料库”提要云:“这一数据库提供的文本图像浏览及检索功能,基于各数据库实际情况设计,检索点简洁而方便,搜索功能强大而准确。但是,这一数据库也存在着不足,在文献基础上,除了‘二十五史’和部分科技人物传记辞典外,多依靠清华大学本校古籍文本和整理成果,范围未免狭小;分数据库‘科技典籍全文库’本应为‘中国科技史数字图书馆资料库’的最主要的分数据库,但是这一分数据库所建设的内容非常有限,仅有‘数学典籍’‘天文历法典籍’‘工程技术典籍’三个下辖数据库,未能涵盖‘中国科技史’的主题范围,且‘天文历法典籍’数据库还在建设中,无法提供浏览和查询;‘科学家专题资料库’所录科学家仅华罗庚、刘仙洲两人,还应加强建设;虽然数据库网站提供了相关研究机构和文献资源的链接,但是关联度不够,可以建立联合查询导航,构建更为宽广的中国科学技术史电子文献网络。”④
要之,《汉语古籍电子文献知见录》一书不仅介绍了各种汉语古籍电子文献的功能、使用,还对当前的古籍电子化进行了基于学术研究视野的思考。
步入数字时代,随着古籍数字光盘、网络古籍资源这些新古籍载体的大量涌现,目录学研究对象也发生了变化。南开大学柯平教授提出了“数字目录学”的理念。⑤这一理念说明21世纪古典目录学研究的新任务将就如何有效解决古籍数字化资源的揭示、组织和传播展开深入探讨。而张三夕教授、毛建军博士主编的《汉语古籍电子文献知见录》无疑就“古籍电子文献目录学”这一新型学科的建立进行了初步尝试,传统与未来之间,中国古典目录学正在悄然迈向质的飞跃。
(作者单位:武汉语言文化研究中心江汉大学人文学院)
①275种的具体数字据张三夕教授、毛建军博士主编《汉语古籍电子文献知见录》一书统计所得。
②③④张三夕、毛建军主编《汉语古籍电子文献知见录》[M],北京:世界图书出版公司,2015年版,第3页,第70页,第45-46页。
⑤柯平《数字目录学——当代目录学的发展方向》[J],《图书情报知识》,2005年第3期。