迈向数智时代:西南少数民族古籍数字化开发共享的创新路径

2024-06-07 06:34:07牛凌燕
出版广角 2024年7期
关键词:东巴古籍少数民族

【摘要】西南少数民族古籍面临流失、破损、失传等危机,其数字化工作存在进展缓慢、数据共享平台缺乏、数字化技术手段单一等不足。为加快西南少数民族古籍数字化速度,应建立数据联动机制,运用GIS时空分析、知识图谱等新型技术手段对少数民族古籍进行深层次开发和可视化展示,促使少数民族古籍建设迈向智能化,以更好地保护与传承中华优秀传统文化。

【关  键  词】少数民族古籍;数据挖掘;共享平台;文化建设

【作者单位】牛凌燕,云南师范大学传媒学院,四川大学道教与宗教文化研究所。

【中图分类号】G255.1;G239.2【文献标识码】A【DOI】10.16491/j.cnki.cn45-1216/g2.2024.07.011

数字化技术及其应用方兴未艾,已深入诸多领域,并且向智能化迭代,这对古籍价值再造影响深远。《国家古籍整理出版“十五”(2001—2005年)重点规划》(2001年)、《关于推进新时代古籍工作的意见》(2022年)等文件明确提出,要与时俱进地推动古籍电子版出版,开展古籍影印出版和缩微工作,统筹古籍的数字化建设,挖掘古籍的时代价值,促进古籍的有效利用。

中华古籍浩如烟海,少数民族古籍属于其中不可或缺的有机组成。包和平[1]、张次第[2]、朱宗晓[3]、李雯[4]等学者分别探索了新兴数字技术对少数民族古籍整理保护、传承利用的作用。此类研究尽管有助于引发人们对少数民族古籍保存、利用的关注,但大多侧重于宏观现象描述,有时容易导致研究结论泛化。李小平等虽进行了诸如“西南地区少数民族古籍医药文献数字化建设”的类型研究,但受特定分类所限,影响了跨学科、跨地区、跨平台等数据共享机制的建构。鉴于此,本文聚焦“西南少数民族古籍数字化”议题,探究如何更好地推进其数字化进程、达成资源共享、实现价值重构的优化路径,为古籍开发实践提供参考。

一、西南少数民族古籍的特征、现状及存在问题

对古籍的区域性研究可以系统地反映该区域内自然、政治、经济、文化等历史,揭示区域文化的源流走向。云南、贵州、四川、西藏、重庆等5个省区市所在西南地区,共有30多个少数民族,其地理环境独特,历史文化、风俗习惯相较中原地区有较大不同,对应古籍种类繁多、资源丰富。这些典籍见证了中华民族相互交融、和谐共處的历史与智慧。只有明确西南少数民族古籍的特点与问题,才能更好地强化研究的针对性,达成对其进行数字化开发、利用的目的。

1.载体的不可再生性

西南少数民族地区存世古籍的载体形制包括书册、碑刻、摩崖、木刻、皮书、布书等,以纸书为绝大部分,但制造技艺各有不同。藏族古籍的纸张以狼毒草、沉香等为主要原料,防虫防潮,存储时间长,但由于制造工艺繁杂,且对人体有一定的毒害作用,传承藏纸工艺的匠人屈指可数。纳西族先民留下了数以万计的古籍文献——《东巴经》,但制作《东巴经》的东巴纸制造成本高且生产效率低,造纸技术大多只传授给东巴家族内的男丁,东巴古籍的传承极其可贵。傣族的古籍大部分是贝叶经,由于存世稀少,也被誉为“佛教熊猫”。除有文字记载的文献典籍之外,西南少数民族也留存下大量口头文献,如彝族的《勒俄特依》、藏族的《格萨尔王传》、景颇族的《目瑙斋瓦》等。口传古籍的传承往往受社会变迁、文化冲击、传承者个人能力差异的影响较大。

西南少数民族古籍载体丰富多样,极具地域特色,因各种原因限制,对少数民族古籍的开发利用不足。一方面,古籍因本身的文物性、脆弱性需要好好对待和保护,很多少数民族古籍由于年久失修或得不到妥善保管,出现了虫蚀、脆变、污化等情况,需要进行保存技术处理、严格管理,甚至需要花大力气改善收藏条件。另一方面,西南各地的民间博物馆、民俗博物馆、民族文化传习所等对少数民族古籍文献的保管缺乏专业性、技术性的条件支持,少数民族古籍文物保护责任落实不到位,古籍保护形势严峻。

2.古籍解读的门槛条件

西南少数民族古籍大多用少数民族语言载录,在书写、解读、传承上都有一定的门槛条件。彝族的语言文字历史悠久、影响深远,但其内部分为多个具有方言、地域特色的流派,且相互之间差异较大,如同义字写法不一、常用字与异写字区别不一、同形字读音表义不一等,相互交流困难,相互查阅文献亦不易。纳西东巴在念诵古籍经典时需要在东巴文的基础上加工整理,形成韵律协调、抑扬顿挫的口语,与书面语有一定的脱离。每一代东巴在解读经书时,不仅保留了纳西古语中有深刻内涵和宗教概念的词汇,还加入了一些具有时代特色和地域特色的语言表达,再加上以东巴文为雏形的象形文字具有单义、多义、引申义、比喻义等,导致大多数人都不具备解读东巴经籍的能力。

《中国语言生活状况报告(2020)》显示:2017年,独龙族掌握本民族语言的人数占比由2010年的92.5%下降至59%,普米族掌握普米语的人数由2010年的75.4%下降至59.9%,藏族掌握藏语的人数由2010年的91.6%下降至67.4%[5]。在少数民族大学生中,能读写本民族语言文字的人寥寥无几。藏族的格萨尔说唱艺人、普米韩规、纳西东巴、彝族毕摩、苗族师公等民间艺人、学者,有的年事已高、后继无人,有的因谢世而“人”“文”俱亡。少数民族古籍解读的难度本身就大,再加上掌握少数民族语言文化人才的减少,少数民族文化传承面临严峻危机。

3.多类收藏的复杂性

西南少数民族古籍的收藏可以分为官方有组织的收藏、民间收藏以及海外收藏3种类型。随着国家各级机关、部门积极开展少数民族古籍整理工作,古籍整理工作取得了丰硕的成果,但随之而来也呈现古籍收藏整理机构较多、古籍藏品分散的特点。如:西藏自治区图书馆收藏藏文古籍10万余册,西藏自治区档案馆、西藏自治区博物馆、西藏自治区文物管理委员会、西藏自治区党校图书馆、西藏大学图书馆等也收藏有部分藏文古籍;云南省少数民族古籍整理出版规划办公室收藏傣族贝叶经100余册,云南省博物馆收藏贝叶经64册,西双版纳傣族自治州档案局收藏贝叶经174部507册。

西南少数民族古籍的民间收藏途径主要为寺庙收藏和群众收藏。布达拉宫收藏有大量藏文古籍,其中尤为珍贵的是金字修缮的《甘珠尔》《丹珠尔》和藏文的《大藏经》。云南民间的藏文古籍大多收藏在松赞林寺、东竹林寺等寺庙中。西双版纳傣族自治州勐罕镇曼春满古佛寺、芒市镇奘罕佛寺中也收藏了傣族古籍。散存在云南民间的彝文古籍、东巴古籍、藏文古籍等有10余万册(卷)[6]。

此外,还有大批少数民族古籍流散海外。“约有三万册东巴经典收藏在世界各国,其中国外约一万五千册分别收藏在美国、法国、德国、意大利等国,哈佛大学收藏598册。”[7]“流散欧美的瑶族文献约有4300余册,日本南山大学图书馆也藏有163册。”[8]

完整性和系统性是我国古籍整理的重要规划和战略部署。条块分割的少数民族古籍收藏现象不利于对民族知识全面深入地传承和理解,不利于构建完善的知识体系,这在一定程度上影响了少数民族古籍的系统化整理。

4.古籍整理成果应用的简单化

西南少数民族古籍抢救保护工作自20世纪80年代开始,通过复制、影印、译注、修复等手段全面开展少数民族古籍的抢救、整理、出版及研究工作,成果迭出。诸如《云南少数民族绘画典籍集成》《云南少数民族古籍珍本集成》《红河彝族文化遗产古籍典藏》等古籍的影印整理、复制再造,能够减少对古籍原件的损坏,达到保护古籍的目的。为了便于解读及研究,西南地区已完成《纳西东巴古籍译注全集》《彝族毕摩经典译注》以及《中国贝叶经全集》等的注音、字译及意译。数十年来,云南省古籍保护中心经过不懈的努力,抢救性地修复了彝文古籍14080余页、藏文经籍3066页、东巴古籍490页、傣文古籍360页。

遗憾的是,虽然国家各级机构投入了大量的资金、人力、物力对少数民族古籍进行抢救和整理,但许多成果束之高阁,收藏在古籍保护机构、档案馆、博物馆、研究所,不为普通大众所接触。部分整理出来的古籍成果虽然存放于图书馆,但借阅人员多为专业人士、研究人员,其价值发挥非常有限。可以说,少数民族古籍并没有因为整理而焕发应有的“活态”。

二、西南少数民族古籍数字化开发的进展与局限

古籍的数字化开发共享是新时代背景下古籍工作的一个重要举措。利用现代信息技术,将古籍文献转化为数字信息,经过加工、处理以便对古籍进行检索、利用和深入开发,从而展现古籍中所包含的丰富信息及资源,实现古籍的价值,是题中应有之义。但目前西南少数民族古籍的数字化开发存在一些局限。

1.有数字化意识但进展缓慢

2017年,文化部关于印发《“十三五”时期全国古籍保护工作规划》的通知要求加快推进少数民族文字古籍文献的抢救保护和整理研究,加大对少数民族文字古籍文献的普查登记、修复、影印出版、数字化等工作力度,促进少数民族文字古籍文献的传承和利用。西南地区纷纷开展少数民族古籍数字化建设工作,尤其是少数民族古籍的普查和目录整理、识别和扫描上网、数据库建设等工作。目前,云南已登记藏文古籍2285部、傣文古籍1874部3376册、彝文古籍127部230册,其中81部少数民族文字古籍入选国家珍贵古籍名录。贵州少数民族古籍数字化平台收录了超过2万条少数民族古籍总目提要,西南民族大学少数民族古籍文献研究中心收集整理少数民族古籍电子图书548册、电子音像制品350余种,内容涉及哲学、宗教、医药、建筑工艺、天文历算、地理历史、文学艺术等30多个学科领域。

我国的少数民族古籍卷帙浩繁,数量庞大,其中不少珍贵古籍因年代久远已破损严重,不少口传古籍因传承人年纪大面临失传的危险。西南地区对少数民族古籍数字化建设虽然取得了一定成效,但是其数字化速度仍然较为缓慢,少数民族古籍数字化的任务艰巨。

2.有数据库平台但缺乏联动与共享

我国自2007年实施“中华古籍保护计划”,对全国各个领域的古籍收藏和保护情况进行全面调查,建立古籍数字资源库和中华古籍联合目录。其中较有影响力的是国家图书馆(国家古籍保护中心)的“中华古籍资源库”“中国古籍影印丛书查询数据库”“中华再造善本数据库”,中华书局推出的“中华经典古籍库”,上海古籍出版社开发的“尚古汇典·古籍数字服务平台”等。

西南地区近年来也纷纷建设自己的民族古籍数据库。云南少数民族古籍整理出版与规划办公室建设“云南少数民族古籍数据库平台”,收录了傣、彝、藏、白、傈僳、纳西、佤、怒、拉祜、基诺等多个少数民族的古籍。云南省文化和旅游厅创建了15个展示少数民族特色的多媒体资源库,如傣族文献信息专题数据库、东巴文献专题资源库等。国家社会科学基金资助建设“东巴经典传承体系数字化国际共享平台”,运用数字化网络化等現代信息科技手段对东巴经典文化进行信息的采集、处理、存储及传播。

虽然各机构完成了少数民族古籍数字化资源库的建设,突破了时间、空间、专业、行业等壁垒和界限,实现了少数民族古籍资源的保护、整理、查阅等功能,但同时也存在一些亟须处理的问题,如不同资源平台有不同的端口、文献格式和版本不一、搜索引擎和搜索关键词各异等,这需要各数据库建设单位间统筹协调。

3.内容呈现手段较为单一

就如何开展古籍数字化工作,《关于推进新时代古籍工作的意见》《国务院办公厅关于进一步加强古籍保护工作的意见》《“十四五”文物保护和科技创新规划》等文件指出,要制定古籍数字化标准,规范古籍数字化工作,开展古籍文本结构化、知识体系化、利用智能化的研究和实践,加速推动古籍整理利用转型升级。

西南少数民族古籍门类繁多,数字化形式也呈现多样性。云南少数民族古籍数据库平台建设分为文字古籍库、口传古籍库、整理研究库,成果包括《滇南彝族指路经》《彝族打歌调》《求取占卜经(纳西族)》等。云南省非物质文化遗产数据库共完成云南8个人口较少民族的原生音乐和9个少数民族11部口头传唱史诗的拍摄和出版,组织拍摄了以传统音乐、舞蹈、技艺为主的影像资料1047条。贵州省初步完成了少数民族古籍数字化平台的建设,将2万多条少数民族古籍总目提要录入系统。西南民族大学少数民族古籍文献研究中心打算建立国内规模最大的少数民族古籍文献电子阅览室和数据中心,涵盖彝学、藏学、民族古籍综合文献等多个领域。

从整体上看,西南少数民族古籍的数字化建设仍然停留在简单的数字化录入阶段,其基本形式仍以图文的扫描上传和口传文本、史诗的摄影摄像为主,古籍数字化形式较为单一。而且各少数民族古籍数据库检索形式单一,大多按民族进行分类,或按传统古籍的标题、责任人、题名卷数等进行分类,没有进一步细化检索,再加上各数据库网站不支持图片检索,因此,古籍的数字化资源开发利用较为有限。

三、西南少数民族古籍的数字化创新路径

数字时代是以信息技术为核心,以数字化为特征,以网络化为基础,以智能化为方向的新时代。先进的数字技术手段促使海量的数据和信息产生,但业内对信息的存储、处理、传播和利用提出了新的需求和挑战。

1.以数字化技术手段加速少数民族古籍数字化进程

随着科技水平的不断发展,在计算机、人工智能的辅助下,古籍的整理工作获得了长足的进步。目前国内应用在古籍数字化上的技术手段主要为OCR(Optical Character Recognition,光学字符识别) 和NLP(Natural Language Processing,自然语言处理)技术。OCR是指利用电子设备,如数码相机或扫描仪,捕捉各种载体上的字符,然后用字符识别方法将其转换成计算机文本的过程。OCR对印刷体文本的正确识别率高、出错少,大大提升了数字化古籍从图片扫描到文本处理的速度。但在运用过程中,也要注意突破“版式多样(横版、竖版、小字双行等)、格式各异(除文字外还有碑帖拓片、舆图等实物、图像类)、异体字众多、字形字体多变、字符集大而标注样本少等困难”[9]。NLP主要用于古籍文本内容的自动标点,自动断句标点技术的出现可以提高古籍整理效率,为古籍的推广使用带来便利。北京大学“吾与点”古籍智能处理系统就集成了多种深度学习AI模型。

除与新兴技术的深度融合之外,古籍数字化还需化面为点,强化深度加工、标引,实现知识单元的颗粒化、关联化,构建古籍数字内容知识库,完善个性化的知识服务,从整体上实现古籍的价值再造[10]。

2.整合古籍资源,搭建完备的数据共享平台

建设完备的古籍数据共享平台,除加强对现有古籍数据库的联动共享之外,还要做好对散落在外古籍的收集、复制、整理、利用等工作,推动少数民族文字古籍文献的抢救性保护。

新中国成立以来,西南少数民族古籍文献不断回归。目前,云南完成了美国国会图书馆所藏3038件纳西族东巴文献的考订编目工作;2004年,美国国会图书馆亚洲部数字化小组将所藏纳西文献进行扫描后在国会图书馆网上推出,实现全世界共享[11]。国家科技部充分发挥大批派往各国留学人员的作用,以多种方式进行少数民族古籍的代理调研,制作目录,有针对性地拷贝复制品。

民间收藏少数民族古籍的数字化回归是一种较为经济实用且易于实施的办法。少数民族古籍的民间个人收藏,有的是祖辈传承下来的家族藏品不轻易外露,有的现在还在各种宗教或文化活动中传承使用,较难实现原生性回归。这部分少数民族古籍的回归可以在得到收藏家庭许可的基础上,以现场整理、拍摄,通过缩微、复制、翻录等形式回归。

除实现收藏在外少数民族古籍的数字化回归与共享之外,我们还需要全面了解全国古籍存藏情况,建立古籍总台账,加强管理与规划,避免重复建设,实现数据间的互联互通,以便进一步开发利用少数民族古籍。

3.推进古籍内容的深度加工与多重开发

目前西南少数民族古籍数字化开发仍停留在浅表性的识别、校对、注释上,应通过智能化手段,对少数民族古籍进行深度加工、挖掘、提炼,以达到更好的古籍推广与使用目的。

对西南少数民族古籍的数字化开发应是学科融合基础上的数字化和技术化,可以通过三维建模、人工智能、音视频技术、虚拟现实等相关技术实现古籍的可视化,将抽象的符号文本转换为直观的视觉空间,降低转化解读少数民族古籍的门槛,使少数民族古籍真正“活”起来。也可以打破学科壁垒和专业局限,采用文本聚类、数据挖掘、本体构建、社会网络分析、GIS时空分析、知识图谱等方法,加强对少数民族古籍的符号数据的深层次知识加工。比如,台湾地区利用GIS技术和遥感影像技术在《中国历史地图册》的基础上整合明清地方志目录资料等数据,构建了以中国为空间范围,以原始社会至现在的中国历史为时间范围,以中国文明为内涵资源的整合性应用环境,用户可以古代地图为入口了解当时的地名设置、区域大小、重要道路以及其他重要文化信息”[12]。类似技术手段的使用为西南少数民族古籍的深层次开发和使用提供了借鉴。

西南少数民族古籍作为中华优秀传统文化的重要组成部分,其数字化进程是一个系统性的漫长过程,对其进行开发利用和价值再造,不仅需要久久为功,完成抢救性发掘与保存工作,还需借助先进的技术手段进行开发和挖掘,更好地彰显其历史和文化价值,促进民族文化的发展传播,弘扬中华民族的优秀文化,提升国家的软实力。这是适应数字时代和文化创新的必然选择,也是实现中国式现代化建设的必然要求。

|参考文献|

[1]包和平. 关于我国少数民族古籍资源数字化建设探讨[J]. 图书馆建设,2003(4):25-26.

[2]張次第. 少数民族文献资源建设研究[J]. 中国图书馆学报,2011(5):115-119.

[3]朱宗晓,王江晴,田微,等. 少数民族古籍的数字化传播[J]. 图书馆建设,2013(3):23-26.

[4]李雯. 略论云南少数民族历史档案数字化建设活态研究[J]. 档案学研究,2018(6):64-69.

[5]国家语言文字工作委员会. 中国语言生活状况报告(2020)[M]. 北京:商务印书馆,2020.

[6]普学旺,李克忠. 云南民族古籍与历史文化研究[M]. 昆明:云南美术出版社,2013.

[7]中国社会科学院民族学与人类学研究所,丽江市东巴文化研究院,哈佛燕京学社. 哈佛燕京学社藏纳西东巴经书[M]. 北京:中国社会科学出版社,2011.

[8]徐菲. 论海外瑶族文献的保护与利用:以牛津大学图书馆馆藏瑶族文献为例[J]. 郑州轻工业学院学报(社会科学版),2020(5):43-49.

[9]王丽丽,张宁. 数字人文视角下的古籍知识关联探析[J]. 农业图书情报学报,2022(9):51-59.

[10]欧阳剑. 数智时代古籍数字出版中的价值再造[J]. 出版科学,2023(4):17-25.

[11]何红一. 海外中国少数民族文献的保护与抢救:以美国国会图书馆中国少数民族文献收藏为中心[J]. 江西社会科学,2010(12):168-173.

[12]余传明. 基于GIS的数字图书馆:原理及应用[J]. 情报理论与实践,2004(6):651-653.

猜你喜欢
东巴古籍少数民族
中医古籍“疒”部俗字考辨举隅
云南省档案馆馆藏《东巴经》
云南档案(2021年1期)2021-04-08 11:01:14
关于版本学的问答——《古籍善本》修订重版说明
天一阁文丛(2020年0期)2020-11-05 08:28:06
我认识的少数民族
关于古籍保护人才培养的若干思考
天一阁文丛(2018年0期)2018-11-29 07:48:08
白地吴树湾村汝卡东巴经《内内抒》片段译释
我是古籍修复师
金桥(2017年5期)2017-07-05 08:14:41
少数民族治疗感冒的蕨类植物(一)
少数民族治疗感冒的蕨类植物(二)
探寻东巴源
中国西部(2016年1期)2016-03-16 07:56:10