◎郝雪丽
(西华师范大学 四川 南充 637009)
1900年道士王圆箓在敦煌莫高窟藏经洞内发现了从十六国到北宋初期纸质或绢帛的写本、绘画与印刷文献,多达五万多件,随后敦煌文献流散各国,给研究者带来极大的不便。随着现代信息技术的应用及电子出版物的普及,大数据时代的文献储存方式逐渐向数字化发展,这也是未来敦煌文献整理的趋势。
敦煌文献的整理工作在其发现之日就开始进行了,结合前代学者的研究[1],现在可将敦煌文献的整理大致分为三个阶段:第一个阶段(1909-1960),此阶段敦煌文献的刊布与整理以学者抄录为主。1909年,法国汉学家伯希和(Paul Pelliot,1878-1945)截获敦煌遗书的第二年,在北京向罗振玉、蒋斧、王仁俊等学者展示了部分写本,罗振玉在第二天便撰写了《敦煌石室书目及发现之原始》。敦煌藏经洞的发现震惊中外,各国学者对敦煌文献的编目工作也如火如荼展开[2-4]。第二阶段(1960-2000)敦煌文献的刊布与整理以缩微胶卷及影印图版的出版为主。1957年前后,英国博物馆制作的英藏敦煌文献6980号缩微胶卷传入中国,此后法国在七十年代亦公布了缩微胶卷,随后各国陆续公布。随着影印技术的进步,敦煌文献图版类出版物开始发行,如《敦煌宝藏》《英藏敦煌文献》 《法藏敦煌西域文献》 《俄藏敦煌文献》《王重民向达所摄敦煌西域文献照片合集》等,由于这些图版部头大,价格昂贵,因此流传范围不太广泛。第三阶段(2000年至今)以敦煌国际项目的建立为标志,敦煌文献的刊布与整理进入了数字化时代。除了敦煌国际项目网,笔者所知的国内外敦煌文献数据库检索平台有近十家。现就较完备、易使用的数字化平台进行介绍。
敦煌国际项目(International Dunhuang Project,简称 IDP)的网址:http://idp.bl.uk/。1998年 10月IDP网站正式开通,用户可以在网上进入IDP数据库免费检索,目前在IDP上公布敦煌文献数据的机构有21家。在IPD“收集品”条目下可了解各国收藏信息及写本图版获取方式,IDP的开放是敦煌文献数字化工作的开端,是国际敦煌学研究的重要里程碑。该网站能获取敦煌写本的高清彩色图版,其缺点在于公布的图版部分卷背或正面空白的部分未提供,造成写本信息的遗漏;还有就是IDP合作机构众多,网络不稳定,查阅者有时无法获得急需图版。
敦煌文献库又称敦煌文献数字图书馆,网址:http://dunhuang.HanjiLibrary.com,由陕西师范大学出版总社开发制作,是《汉籍数字图书馆》2.0版的专库之一,2016年上线,由敦煌文献目录数据库和敦煌文献图版数据库两部分组成。该库收录14类机构所藏的敦煌文献,其“文献详细信息”中包含文献编号、文献机构、文献释文、研究著录、题记说明、规格品形等多项,目前仅可查到某一件写本的所藏单位及其在相关图版书中的具体页码,对写本外部形态及内容描述还相当薄弱。
法国国家图书馆的数字图书馆项目Gallica是可在网上访问的世界上最大的数字图书馆之一,网址:http://gallica.bnf.fr/。Gallica手稿部中可查阅的法藏敦煌文献彩色图版分为三类:一是伯希和汉文文献(Pelliot chinois,简称 P.ch 或 P.);二是伯希和藏文文献(Pelliot tibétain);三是伯希和其他收藏品(Pelliot autres collections),包括维吾尔文(ouïgour)、梵文(sanscrit)、粟特文(sogdien)、西夏文(xixia)等。Gallica是目前最为完备、最有诚意的敦煌文献整理数字化平台,部分写本内容描述甚至精确到第几行抄录的内容。
2018年3月,法国国家图书馆藏敦煌文献数字资源正式在中国国家图书馆网站“中华古籍资源库”发布,该批资源吸收了法藏敦煌文献共计5300余条,读者可于中国国家图书馆网站在线进行检索和全文浏览。
鼎秀古籍全文检索平台网址:http://www.dingxiu.com,其实现了全文检索大型古籍典藏数据库。鼎秀可以实现敦煌文献原图显示、文本显示、图文并排显示等不同显示方法,不足之处在于收集的敦煌文献不全面,不能显示敦煌文献收藏机构、编号、尺寸等基本信息。对于字迹模糊、书写潦草的敦煌文献,其文字信息错误较多。
“敦煌在中国,而敦煌学在世界”,莫高窟藏经洞内发现的敦煌文献流散海外,乃中国学术之伤心史,但同时我们也应当关注到国际力量为保护敦煌文献所付出的巨大努力。梁任公说“学术乃天下之公器”,在开放与共享为主题的大数据时代,国际敦煌文献整理秉承合作共赢的态度,最终找到每一个写本或写本群在敦煌文献中的位置,从而促进对古代中国、古代世界文明的研究。
目前敦煌数据库建设已取得喜人成果,随着科学技术的发展,我们还应该做到以下几点:
其一,敦煌学的国际性决定了从事敦煌研究的学者需拥有国际视野,具备良好的与国际文献接轨的能力。IDP和国外各大图书馆的数据库虽支持中文访问方式,但还不够完善,要求访问者具备较高的外语水平。
其二,利用现代摄影技术将长卷正反面完全扫描上网,展现写本完整的正反面高清照片,便能够省去保存敦煌文献图版时编号、拼合工作之劳。
其三,关注敦煌写本与写本之间的联系,还原写本时代敦煌文献生成的原生态。在藏经洞发现时,敦煌写本原有的秩序已经打乱,被各国收藏机构编上了毫无逻辑关系的序号。利用现代考古技术可对部分写本的质地、年代进行还原与鉴别,通过对写本的释读可联系内容、年代相关写本群,这些相关写本群的信息在数据库应当有所展现。
其四,数据库在全面展示敦煌写本全貌的同时,还需充分吸收、及时更新学界研究成果,包含准确的文献目录、录文与校勘、单篇研究成果及缀合关系等。
建设学术价值更丰富、查阅更便捷、内容更全面的敦煌文献数据库是敦煌文献数字化的方向,拙文为敦煌学徒一点学习心得,不妥之处,恳请方家指正。