我国古籍数字出版的目标演进、转向与进路

2024-01-08 02:39
出版科学 2023年4期
关键词:古籍数据库数字化

张 宁

(北京师范大学文理学院,珠海,519087)

2022 年4 月以来,中共中央办公厅、国务院办公厅相继印发了《关于推进新时代古籍工作的意见》《关于推进实施国家文化数字化战略的意见》《“十四五”文化发展规划》,分别提出:(1)推进古籍数字化、普及与传播,加强古籍数字化资源管理和开放共享等;(2)古籍整理更要顺应时代发展要求,加速数字化进程;(3) 加强中华优秀传统文化的传承与发展,实施国家古籍数字化工程。上述政策指明新时代古籍数字化出版是落实优秀传统文化传承与发展工作的重要实践内容。

因此,总结梳理我国古籍数字出版工作的目标演进情况,分析其转向趋势,据此针对性地提出新时期古籍数字出版工作的前进路径已十分必要。

1 从“再生性”到“传承性”的古籍数字出版目标演进

古籍数字化工作错综庞杂,涉及诸多学科的知识调用与多产业覆盖,包括古籍著录、内容整理、知识组织、产品发布、查询利用、网络传播与共享等全流程、多维度、多层次的数字化工作,各环节无缝衔接、高度集成[1][2],使得古籍整理相较其他文献难度更大,对从业人员的素质要求更高。自20 世纪80 年代初开始,古籍数字化工作与研究已走过了40多年的历程,一路走来取得了瞩目的历史成就。按照时间先后顺序,以其出版目标和侧重点为划分依据可将其分为四个方向。

1.1 面向再生性保护的古籍数字出版,侧重对纸质古籍的数字替代

随着时间的推移,纸质古籍物理形态的损伤是无法避免的,当前的古籍整理以复制的方式将记录在古籍中的精神文明保留下来,使其传播久远。古籍的“原生性”出版是古籍修复,其形态仍旧以纸质版形式存在,而古籍的数字出版是其“再生性”保护的重要手段,是一种专门的出版类型[3],常见的有影印采集,使内容以图文方式存储起来。

古籍数字化的一种形式是电子出版,即依托扫描设备与缩微技术将复制的纸质古籍内容以二进制代码的形式存储于光盘等介质中出版[4],例如以U 盘的形式出版的张希清等主编的《宋会要辑稿》数据库。在内容上是利用扫描、OCR 识别、版面还原等技术复制古籍原文内容,其目的是保存古籍内容。古籍数字化的业务有:古籍书目数字化、古籍书影数字化、古籍资料平台建设与服务等[5]。古籍数字化的另一种形式则是互联网出版,即将扫描版古籍内容存储于云端数据库,例如图像型古籍数据库有《汉籍数字图书馆》《大成古籍》等,读者可在线翻阅数字版的古籍原文内容。

基于数字技术的古籍“再生性”保护依然是新时期古籍数字化的基础性任务,目前出版的汉字古籍数量仅占出版数量的1/20[6],我国目前尚存在大量黑白影像古籍资源,分辨率较低,难以满足读者和研究人员的需要。对于已经数字化的古籍仍需进一步提升出版质量,为推动古籍数字化工作高质量发展,古籍甄别、系统梳理、版本识别、等级划分需要在数字化工作开展之前完成,随后逐步开展古籍书目数字化、古籍书影数字化、古籍资料平台/数据库建设与服务。

总体而言,以再生性保护为目标的古籍数字化工作将古籍的文物价值与使用价值以数字复制的方式进行剥离,将古籍内容妥善地保存在存储介质上,方便传输与共享,这种形式虽保存了古籍内容,但内容检索不便;实现了保护的目的,但使用人群多为文史领域的专业学者,传播面较窄[7][8]。该阶段的古籍数字出版工作主要解决古籍内容保护与获取的问题,处于对纸质文本的数字替代阶段。

1.2 面向古籍信息查询与利用的数据库与平台建设,侧重文本检索的“全”与“准”

基于古籍内容整理与知识标引、服务于用户检索的古籍数据库出版提升了古籍数据库的利用率,其出版类型从资源内容上而言分为古籍编目数据库与古籍原文数据库两种:古籍编目数据库的意义在于版本与馆藏信息查询,古籍原文数据库出版的核心目标是忠实还原文献内容和文献检索。

无论是检索古籍的编目信息、亦或是原文内容信息,均需对古籍相关信息资源按照一定的元数据规范进行结构化处理,以期实现全文检索的目的,部分数据库还支持图像与文字进行对照,配置以相关的在线辅助功能(如简繁字体转换、注释、背景切换),为用户提供统一便捷的阅读、检索、使用和下载等服务[9][10]。

在古籍内容的整理方面,除了依赖传统的古典文献学家对古籍原文进行校勘、标点、注释、今译、辑佚、索引等加工,当前的古籍数据库出版在技术上多维地采用人工智能技术,实现了文字识别、自动校勘、自动标点、自动注释、自动翻译等古籍整理的基础性工作,节省人力成本,提升工作效率。用户则通过在线版、镜像版甚至微信版等渠道浏览、阅览、使用或下载古籍内容。目前代表性的图文型古籍数据库有《中国基本古籍库》《鼎秀古籍》等,文本型的数据库有《二十五史全文检索系统》等,代表性的古籍数字化整理与发布平台有中华书局建设的“籍合网”和上海古籍出版社推出的“汇典• 古籍数字服务平台”。

此类数据库通常以实现文献检索的“求全率”与“求准率”为标准,该阶段的古籍数字出版除了进一步赋能古籍保护,更是让用户获取古籍内容突破了时空方面的限制。但受限于专业知识和古今文化差异等因素,读者群体依旧是文史领域的专业人员,使得古籍数据库使用仅限于小众群体。古籍数据库建设与开放一定程度上满足了文史哲领域学者获取古籍的需求,但普通读者在理解古籍内容方面仍存在障碍,该阶段的古籍数字化出版工作未能将古籍阅读从小众推向大众。

1.3 面向古籍知识服务的数字人文平台建设,侧重实现知识关联与发现,强调古籍知识获取的丰富性与便捷性

古籍内容推广需要帮助用户实现知识发现,要求古籍数字化工作在数据层面实现知识单元的细粒度化、知识组织的语义化、知识呈现的可视化,才能揭示和关联重组古籍内容知识单元。为协助当代读者理解古籍知识,对古籍内容进行深度揭示与关联的数字人文平台也是当前的出版物之一。

与还原保护文献和文献获取为目标的古籍数据库产品不同,古籍数字人文平台建设的目的是知识服务,需对古籍信息资源进行聚类与发现,这需要深挖文本内容、在细粒度层面提取、标引、可视化古籍信息[11]。目前常见的技术实现方式有利用关联数据、知识挖掘、地理信息系统、知识组织等数字化技术开发古籍全文内容,形成人物、时间、地点和事件等不同维度的知识网络,探索几类数据资源间的相关关系;通过可视化与地理信息系统,将古籍事件的演变、联系以图文并茂的方式展示,支撑内在关系研究与探索。

在尊重知识产权的前提下,各主体对已数字化的古籍信息资源进行整合开发,通过提供多元关联、互融相通的数据服务,提升古籍资源利用率。从目前的实践来看古籍数字人文平台的出版分为两种:(1)古籍结构化知识库构建与平台应用,如人名、地理信息、术语库等,即按照一定的结构与数据规范对已有的古籍内容进行特征提取与标引,代表性的有著录历史人物的职业、亲属关系、社会关系等数据字段的中国历代人物传记数据库,方便用户对人物、人群、地域、职官等多方面数据进行交叉分析[12];(2)基于古籍知识元自由集成的平台构建与应用,即利用知识标引深度链接、组织多源异构的古籍数据库内容,使其既能独立使用又可统一为一个平台查询调用[13],例如浙江大学徐永明教授及其团队建设的“智慧古籍平台”借助社会网络分析技术以人物社会关系数据库为基础,借助图数据库的功能,实现社会网络和家族世系的可视化;借助ArcGIS、QGIS 等地理信息系统软件,结合在线地理信息系统,使古籍中留存的地理信息可视化;利用结构化地名、人名、职官、词典等数据库对上传的文本进行批量标引,使文本与后台的数据关联,如此满足读者一站式、查询、阅读与研究需求[14]。

基于数字人文技术的古籍知识平台建设目标转变为以研究者为服务指向的高端智能检索系统,一方面创建了结构化的古籍内容检索平台,另一方面系统性地整合碎片化的信息,帮助用户快速地从海量古籍数据中发掘更为有效的、系统的、全面的、具象化知识点,立体重构和生动再现典籍知识内容,能有效发挥古籍在传承和弘扬中华优秀传统文化中的重要作用。这种古籍资源的深度开发具有鲜明的学术特征和文化色彩[15],其用户群体多为文史、数字人文领域的学者与爱好者,社会化传播程度仍有不足。

1.4 面向大众文化传播的古籍活化利用,侧重用户的文化体验与兴趣培养,强调古籍内容基因的传承性

在推动中华优秀传统文化创造性转化、创新性发展的时代需求下,古籍整理与出版机构也意识到非专业的普通读者应该是古籍整理出版物的主要受众,是传统文化普及的核心对象。因此古籍数字化出版的服务对象也从服务学术研究者扩大到服务非专业的普通读者,古籍数字化创意应用则成了社会化传播的有力抓手。

古籍数字化创意应用是将数字技术与创意设计充分结合,在古籍资源的基础上利用现代通讯技术和人(团队)的创造力推动传播内容的数字化创造、传播和使用。目前出版社、图书馆、博物馆、教学研究机构、文化科技企业等单位也逐渐布局走古籍数字创意应用出版路线,以推进其普及化与大众化传播。基本思路是依托新一代全媒体技术,在内容上有两种路径:第一,对适宜的内容进行深加工,提升内容的趣味性、观赏性、体验性;第二,对复杂内容进行简易化处理,降低阅读认知难度。这两种路径也可共存同一出版物。古籍数字化创意应用也表现出多样化的特征,代表性的有以下四种情况。

1.4.1 基于社交平台的古籍元素整理与出版

当前借助微信视频号、微博、抖音短视频、VLOG 古籍阅读推广已成为常态现象[16],以短视频方式出版古籍元素顺应了数字化时代出版物的潮流,其视像化、快餐性、娱乐性、移动性、高效性极度符合绝大多数读者休闲化、碎片化、非专业的阅读特点,基于短视频的古籍阅读推广也变得更容易为大众接受和观赏[17]。

官方和个人的微信公众号是目前古籍出版传播的重要渠道之一,相较短视频方式内容更为详尽和专业。例如经典古籍库、古籍馆、国家古籍保护中心等,其推文通常以介绍特色古籍资源、内容阅读推广、古籍整理出版业界动态、专家观点等内容为主。

在线直播也是用户获取古籍文化的重要渠道,相较前者其推广力度和用户的参与度更强。例如2020 年浙江省宁波市天一阁博物馆等文旅单位以“略谈现存最早的包公小说”为主题在中国联通5G Live、爱奇艺、斗鱼、等平台举办5G 互动直播活动,为古籍资源数字化传承开辟新路径[18]。

1.4.2 有声古籍讲解与朗读

以“喜马拉雅”平台为代表的音频古籍出版也非常普及,其形式有专家讲解古籍内容和古籍内容配音朗读,前者代表性的出版物如于丹读《论语》、南怀瑾讲解《道德经》,这种形式通常由领域专家融会贯通古今相关知识与案例向现代读者以通俗易懂、可共情、可类比、趣味性强的方式阐释与传播书中内容。后者代表性的出版物如《古文观止》朗读、《庄子》原文朗读等,该形式以音频方式一字一句复现文字,方便读者随身听取古籍内容,力求扩大古籍传播面。

1.4.3 古籍移动App 和小程序应用

智能手机端的古籍App 应用是用户在移动端获取古籍内容的主流形式,如中医古籍、国学宝典、中原术数类专著古籍等App 应用,其特征是基于移动端口按照一定的内容标准向文史图书馆、研究机构、专业人员和爱好者用户提供古籍原文内容、对照译文、内容检索与知识点发现,可供用户利用碎片化时间学习古籍内容。 除此之外, 基于微信小程序中的古籍出版与传播应用日渐增多,如古联数字公司开发的“句读pro”,以兼具文化性和趣味性的游戏方式培训用户古籍标点符号的文化知识;再如由北京大学中文系博士与海淀重点中学教师基于人工智能技术合作开发的“如文·国学经典”小程序,根据用户画像提供覆盖小学、初中、高中、大学、职场各阶段的文言文阅读体验和个性化内容推荐。

1.4.4 基于元宇宙技术的古籍活化利用

元宇宙出版需要借助一系列技术底座,当前的出版物主要以VR、AR、MR 为代表的XR 古籍产品,代表性的如湖南岳麓书社推出的VR 阅读四大名著系列图书,读者借助手机扫描图书二维码能亲眼看见“刘姥姥初见大观园”时的立体景象,又如 VR 版“清明上河图”、VR《旧唐书·杨贵妃传》等尝试为读者提供身临其境、寓教于乐的古籍阅读体验[19]。此外,基于古籍内容的元宇宙数字人和数字藏品的发布已成为目前各古籍研究与出版单位打造自身文化IP 的风向标。

2 从“活下来”到“火起来”的古籍数字出版转向

古籍数字出版的演进折射出古籍数字化的目标从延长古籍的生命力转向古籍文化的大众普及,让古籍从“活下来”转向“活起来”再到“火起来”,这是古籍整理与出版部门落实二十大“繁荣发展文化事业和文化产业”“增强中华文明传播力影响力”的重要实践。其出版主体、技术、内容、用户、时代在新时期都表现出了如下转向趋势。

2.1 主体:从机构为主转向多元主体协同并存的局面

古籍数字化整理与出版在规模上仍以数字出版商为主体。 当前古籍数字出版物以古籍数据库为代表,服务于古籍再生性保护和科研教学用户的检索利用,常见古籍数据库主体为数字技术公司、高校、科研院所、文化服务机构(图书馆等)、出版社,其中以数字出版商开发的古籍数据库规模和总量占据首位[20][21],近年来以高校和科研院所为主体建设的古籍知识服务平台日益增多,平台功能日渐丰富。

数字技术发展降低了出版门槛,多元群体涌入古籍内容制作与发布。低门槛要求使得所有多元学历背景与知识层次的网民用户均可参与出版内容制作与发布,尤其是基于新媒体的内容发布、App 端口的创意应用等[22]。从古籍数字化研究与实践的发展来看,与全球的古籍爱好者、研究者和工作者共建、共享、发布古籍数字资源是大势所趋[23]。

具有社区化功能属性的在线古籍整理与发布系统使得古籍资源生产和出版模式从专人负责转向共建共享、多元群体参与。例如,中国哲学书电子化计划作为线上古典文献检索系统,允许用户在讨论区提问和参与相关问题讨论,在维基区共同编辑、纠正古籍全文中的错字;又如“籍合网”创建了线上知识社区“古籍圈”,用户在圈内可以自由提问、发言、组成团体,对相关问题进行讨论、互助解决问题,还可以分享学术成果、研究心得[24][25],用户参与内容创造的知识生产与传播让大众成为知识的输出者与传播者。

古籍数字化整理与发布呈现众包化趋势,工作任务进一步垂直下沉、从业人群呈现多样化特征。例如古联公司建设的籍合网在线整理和发布系统,打破了传统出版以纸张为载体的出版模式,为古籍编辑出版方式的改变提供了强大的技术支持,有效提高了生产效率[26]。为解决古籍数据编校工作量大、专业化程度高的问题,古联公司建立了专门的古籍整理众包平台及“i 编纂”小程序,多群体终端用户可在应用程序上编校古籍内容。

多元主体协同合作,提升古籍整理与出版质量。例如武汉大学图书馆古籍保护中心与文学院、古籍研究所、历史学院、信息管理学院、中国传统文化研究中心等单位的密切协作,将古籍整理打造为武汉大学图书馆特色文献资源,成为享誉业内高质量古籍整理的标杆单位[27]。又如,北京大学-字节跳动数字人文开放实验室”联合研发的古籍数字化阅读平台“识典古籍”也是采用“众包”的方式,邀请全社会一起参与古籍数字化。

元宇宙中的古籍文化出版与传播活动将常态化存在。元宇宙超越自然宇宙而存在,虚实共生是元宇宙的核心价值,将阅读的物理空间和虚拟空间合二为一,彻底改变人类生产、生活、学习和创造方式。在这里一切的行为成为阅读、一切的产业都成为出版,基于古籍内容或元素的文化展现与传播活动成为企业、机构、用户的日常行为。

2.2 技术:从单一类型转向多样态技术叠加融合模式

古籍数字化应用的技术载体由电磁存储设备逐步转向电脑、移动终端与可穿戴设备并存的局面。 例如中华书局出版的《中华经典古籍库》向用户提供了PC 端和手机端应用[28],“籍合学院”古籍整理培训平台推出了PC 端和移动端应用,元宇宙技术环境下基于可穿戴显示设备的VR 古籍出版物、数字藏品、数字人发布已成为新动向。

古籍内容传播从单一技术渠道转向多技术渠道并存模式。 随着古籍数字化载体技术演进,其传播渠道从传统的机构/个人购买电磁存储资源获取古籍内容逐步转向以电脑、移动终端、可穿戴设备端口的资源获取。基于互联网技术,每一种载体都能提供多样化的内容获取渠道,例如基于电脑端的古籍数据库、智能化古籍平台、新媒体、文教平台、移动应用App、微信小程序、VR 版古籍体验等。代表性案例如《中华经典古籍库》陆续推出镜像版、网络版(在线版)、微信版、微信专业版,还在“学习强国”上设有渠道,多渠道发力推进古籍内容与活动推广;又如清华大学出土文献研究与保护中心与出版单位合作建立《清华大学藏战国竹简》电子书网站,同时还开发了“楚文字综合整理工作平台”,方便读者获取资源[29]。

古籍数字化应用的底层支撑技术从单一走向多元复用的模式。主要表现为:(1)复用多种数字人文技术的古籍数字人文平台搭建。在新技术环境下,古籍出版捕捉到了数智时代的发展机遇,大力拓展数据来源和研究领域,开展用户需求感知、多模态语义理解、精准推送等智慧化服务,典型的代表案例有浙江大学徐永明教授及其团队建设的“智慧古籍平台”[30]; (2)基于系列前沿技术的元宇宙虚实相生古籍出版也是一种代表形式,它基于由拓展现实、数字孪生、机器人、脑机接口、人工智能、云计算等技术构成的数字环境,在更遥远的未来,人类还极有可能通过脑机接口,将大脑的记忆和思想融入元宇宙,由此获得“数字重生”或“数字永生”[31],目前代表性的古籍出版内容有古籍数字藏品、数字人IP、VR 古书应用等。

古籍数字化应用的显示(感知调用)技术从赋能双通道认知转向多模态多通道聚合认知方式。教育心理学家理查德•梅耶(Richard Mayer)提出的多媒体学习认知理论认为人类信息处理由处理语言的语言通道和处理画面的视觉通道两个独立通道构成,数字图文、视听信息通过语言和视觉两个通道经过人耳、眼传递给人脑,经过工作记忆场合的认知加工存储于人的长时记忆之中,后期用以指导人的行为实践[32]。古籍出版物的电子载体随着技术的发展而不断丰富,基于手机、电脑屏幕的古籍出版与阅读是调动用户双通道认知的时代,以AR/VR/MR/XR 设备、数据衣、VR 行走仪等为代表的元宇宙古籍出版载体不仅调用用户的听觉、视觉认知通道,还能同时调用人体触觉、动觉、方位和动力感知等多个认知通道获取更为丰富、立体、具象的认知信息,形成更长久的记忆效果[33]。

2.3 内容:从古籍文献转向知识服务与文化体验

古籍数字化应用最初是对纸质古籍文本内容的数字替代,只是一种数字化的文献服务,该文献可能以影印方式存在、也可借助OCR 技术将其存储为文本方式。从文献服务到知识服务需要将文本内容按照一定的元数据加工、存储、交换方式进行结构化处理,再利用智慧技术对文献内容命名实体和关系实体进行提取与关联,再借助地理信息等对相关实体进行可视化演示,以期实现面向用户的知识服务。古籍的文化体验服务强调用户在特定场景下的体验经历,当前呈现出碎片化、移动化、具象化、娱乐化的特征,使古籍文化内容以基因的形式普遍渗透在用户的社交、娱乐、购物等多情景之中。具体表现在如下五个重要方面。

从古籍文献数字化保护转向平台化、情景式的知识服务,古籍数字化向数字人文进化。古籍文本内容结构化数字出版是数字人文研究的基础条件,古籍数字化初期致力于文本数据和书目数据的获取、存储、组织、加工、检索利用,代表性的出版物有古籍电子书、数据库,逐步发展到通过一系列数据技术进行知识组织、开发知识产品、提供知识服务,如古籍数字人文平台与古籍知识服务平台的搭建,这种平台化、情景式的知识服务成为当前古籍数字化工作的新模式[34]。

从异构多元数据类型的古籍数据库出版转向古籍数据协同化与汇聚共享式的文化体验平台建设。随着数字技术演进,古籍数字化出版呈现出越发明显的平台化特征,例如籍合网整合了资源类型多元化的数据库和应用型在线系统,为用户提供统一古籍查阅与整理服务[35]。

古籍数字化内容从全文检索服务转向碎片式文化体验服务。古籍数字化工作从最初的文献全文整理、校对、查询利用逐步转型至利用数字人文的方法对古籍数据库中的文献数据进行分析、挖掘从而获得新的知识,或者使碎片化的知识系统化、使隐性化的知识显性化[36]。在古籍内容活化利用方面利用新媒体、元宇宙全媒介对古籍文化基因进行碎片化整理、加工与传播,以短视频、音频、游戏、VR 影片等形式进行创造性转化与创新性发展,加强中华传统文化基因的传播力与渗透力。

古籍内容呈现的资源类型从二维文图转向多维多媒体内容复合体验的形式。随着古籍数字化载体(设备)的进步和内容组织技术的多模态复用,古籍内容从二维静态的图文符号转向立体动态性的视频、3D 模型、VR影片、3D 音效等富媒体资源符号,随之内容的组织呈现出叙事化、场景化、游戏化和交互式的特征。

古籍内容呈现由抽象到直观、从专业到通俗。美国视听教育学家埃得加·戴尔(Edgar Dale)提出的“经验之塔”(Cone of Experience)理论认为学习过程中的语言和视觉符号属于更为抽象的学习内容,其理解对用户认知能力和信息储备的要求高,对用户的运动系统和感知系统的调用低,而以参与活动和有目的的实践活动为代表的“做的经验”对用户的认知能力和信息储备要求更低,对其运动系统和感知系统要求较高[37]。以文献服务和知识服务为目的的古籍数字出版内容通常以文本为主,属于抽象且专业的出版方式,而以文化体验为目的的古籍数字出版弱化了文本的比重,增加了视听乃至调用人体多维感知通道的富媒体内容,直观的内容呈现随之降低了古籍内容理解的难度,这种通俗化的文化表征更具渗透力与传承价值。

2.4 用户:古籍数字阅读用户从小众转向分众、大众群体

就古籍数字阅读而言,“小众”是指以文史学者为代表的以科研、教学为工作导向的用户, “大众”是指非文史领域专业用户、普通读者。

从面向专业人群的文献服务转向社会化大众文化体验传播,呈现出“小众”+“大众”的模式。在古籍数字化初期,其书目内容与文本内容本质上与纸质内容一致,只是出版物的载体发生了转变,因而其使用人群依旧是文史领域的专业人员,初始服务目标为支撑学术研究[38],因而长久以来,电磁存储介质、数据库、数字人文平台的搭建都是以古籍数字化保护为基础、以学术研究为导向的设计,在使用效果上并未实现社会化传播与普及[39]。古籍文化唯有从知识精英小众群体走向社会大众才能实现传统文化“走出去”的第一步, 数字技术的发展也使得这一设想成为可能,基于新媒体、移动端、元宇宙技术端口的古籍读物日渐增多,古籍内容以通俗化、碎片化、个性化乃至私人化的方式渗透到大众群体的阅读中,甚至大众群体参与到古籍元素相关内容的创作与传播活动中。

用户数字阅读古籍的方式从检索式、浏览式转向沉浸式、交互式的体验。从古籍数据库、数字人文平台过渡到古籍创意应用,体现的不仅是古籍出版物形态的变迁,也是古籍出版与读者的关系从以古籍文献为中心的出版转向以读者为中心的多元服务, 用户的阅读行为从以文献查询检索转向以轻松、开放、交互式的文化体验、激发其阅读兴趣作为其业务核心。

用户寓教于乐成为古籍数字阅读转向的核心特征。随着体验经济的发展,阅读的娱乐功能也被提升到前所未有的高度,以短视频、游戏小程序、在线直播等具备趣味性的内容出版深受用户喜爱,另外以VR/AR/MR等沉浸式交互技术为支撑的文化体验方式也成为用户乐于接受的阅读方式。寓教于乐的阅读方式成为古籍出版社吸引用户、生存、发展的法宝[40][41]。

古籍数字化内容的大众阅读规模呈现日趋繁荣趋势。根据2022 年8 月国家互联网信息办公室发布《数字中国发展报告(2021 年)》显示我国的数字阅读产品蓬勃发展,数字阅读用户规模首次突破5 亿,对传统文化和古籍感兴趣的一般用户在人群基数上要远多于专业学者,长远来看,以古籍数字化创意应用为形式的中国传统文化基因传播效果将实现指数级增长。

2.5 网络环境:从Web2.0 迈向Web.3.0 时期,数字藏品与数字人成为古籍出版的IP 新宠

古籍文化单位相继布局元宇宙(Web3.0)出版,已成为文化IP 新风尚。

古籍数字藏品是古籍数字出版走向元宇宙时代的核心IP风尚。数字藏品使用区块链技术生成的唯一数字凭证,对应特定的作品、艺术品,在保护其数字版权的基础上,实现真实可信的数字化发行、购买、收藏和使用,这种科技赋能文化出版的方式不仅重塑古籍出版的产业链与价值链,也带来了古籍出版的新产品、新服务、新模式和新业态。国内古籍数字藏品主要有:(1)在NFT 平台上出售数字化古籍衍生品获取收益,同时推广古籍文化传播;(2)将珍贵古籍制作成NFT在元宇宙发行;(3)古籍与其他行业的融合推出跨界NFT[42],代表性案例如2022 年2月我国发布首个中医药古籍IP 数字藏品《本草纲目》,其原型为中国中医科学院中医药信息研究所馆藏的《本草纲目》[43]。随后国家图书馆、敦煌、锦绣中华等优质文化IP相继与天下秀旗下自媒体数字藏品工具集“TopHolder 头号藏家”等合作,分别发布《诗词中的国家图书馆》《三世千佛 敦煌众生》《五佛冠》数字藏品。

数字人是古籍元宇宙出版的数字代言人和文化推荐官,是链接人的新渠道、重塑文化体验的新载体。2022 年9 月,在中华书局成立110 周年之际,古联公司联合元宇宙生态链企业北京谛听视界文化科技有限公司正式发布元宇宙数字人苏东坡,基于古籍文献内容和数字技术将全国首位“3D 超写实数字人苏东坡”呈现给用户,数字人的制作经历了三个阶段:(1)基于古联公司70 多亿的古籍史料图文内容,梳理凝练符合苏东坡人物性格、体态、外貌等人设数据库及知识图谱的开发,提炼出角色形象;(2)基于角色样稿和详细的人物设定需求制作苏东坡数字人3D 模型;(3)在3D 超写实数字人模型的基础上进行骨骼绑定和蒙皮权重,赋予数字人自然的骨骼系统和肌肉系统,再接入动作捕捉系统和配音内容,如此活化其肢体动作、面部表情、说话口型。通过上述技术,古联公司以逼真形式还原苏东坡形象与精神风貌,这对古籍数字化出版创新、文化普及教育、城市文化宣传、数字形象代言等全新场景的应用均具有重要意义[44]。

3 新时期我国古籍数字出版工作的进路

我国古籍数字出版的演进历程折射出其目标从“再生性”保护转变到以知识服务和大众文化传播为目的的“传承性”传播,这种演进并非后者替代前者的“迭代式”推进,而是相辅相成、相得益彰的共生局面。新时期的古籍数字出版可从如下三大方面推进。

3.1 数据为王:以古籍数据库建设为基石,建设全国古籍大数据平台对接国家文化大数据体系

统一古籍整理、加工、交换的数据标准,持续推进纸质古籍数字化工作。截至目前我国现存古籍约20 万种,实现文本数字化的只有3—4 万种,尚有4/5 的古籍资源未完成数字化转录,以古籍数据库为代表的古籍数字化整理工作依然是新时期古籍数字化工作的基础与重心所在,古籍整理与出版单位应充分利用文本识别、自动标点技术,按照行业标准与规范持续推进纸质古籍资源批量转录为结构化数据资源,实现古籍数据保护、流通与协同管理。

建设智能化古籍整理与服务平台,推动古籍整理利用从分散的数据服务转向系统的知识服务。古籍整理与出版单位应充分利用自然语言处理技术对古籍文献进行智能标引、利用知识图谱和关联数据技术深度挖掘专题知识,为用户提供统一入口一键检索,多元、立体、关联的系统化知识服务。

建设全国古籍大数据平台,汇聚共享古籍数字资源,对接国家文化大数据体系。古籍大数据平台建设是一项系统性工作,数据涵盖古籍原生数据和衍生数据两类,平台建设需要规范古籍数据的标准、伦理、技术、内容、监管政策、参与者、场景落地,该平台能够根据用户画像与多元需求将文化内容精准推荐给用户。对接国家文化大数据体系可将古籍文化数据与其他数据平台无缝对接共享,数据的关联、流通、利用的深度与广度进一步加深,用户利用古籍数据乃至其他文化数据的场景更加多元、立体、丰富。

3.2 人才为基:分层次、多方位布局古籍数字化人才培养点,供给高素养从业人员

高素质的人才队伍是新时期古籍数字化高质量发展的关键,然而传统的古籍编辑出版人才已经不能满足日益变化的古籍数字化出版工作,兼具计算机技术与古籍内容整理素养的复合型人才严重断档,已成为新时代古籍工作进一步发展的瓶颈。分层次、多方位布局古籍数字化人才培养需要做到如下方面。

梳理定位人才需求,差异化、有侧重地开展人才培养。从古籍数字化出版的演进与转向来看,古籍整理与出版单位需要三类人才:第一,面向古籍再生性保护的数字化人才,应着重培养其古籍整理与编辑知识体系和古籍信息处理的基本技能; 第二,面向古籍知识服务的数字化人才,应着重培养学生的产品经理思维与素养,此外需掌握自然语言处理、机器学习、数据挖掘、信息系统构建与服务的知识体系;第三,面向古籍活化传承的数字化人才,应着重培养学生关于内容策划与编辑、多媒体资源设计与处理技能等。

持续推进古籍数字化高等教育与职业教育。古籍数字化的研究领域持续扩展,学科化趋势日益明显。目前,形成了古籍数字化基础理论、资源建设、资源管理、政策研究、数字技术等涵盖理论与实践、技术与政策、应用与管理多维系统视角,这为古籍数字化人才培养的学科建设提供了沃土。 高等教育应当注重古籍数字化产品策划与统筹、古籍整理理论素养与文化底蕴、交叉技能的培养,职业教育要重点关注具体产品落地的数字技能培养,例如文本转录、数据库建设、多媒体内容处理软件操作等。

依托优质专家资源开展古籍数字化行业培训,持续提升从业人员技能与素养。古籍数字化出版机构可以采用“以老带新”,采用项目制、师徒制的方式,充分发挥资深专家的指导和示范作用,引领青年编辑人才熟悉业务工作、参加重点项目,让其按照“成长型—成熟型—学者型”思路成长,在完成项目的同时也培养了专业素养过硬、编辑经验丰富、协作能力强的古籍数字化人才。仅靠出版机构培育古籍数字化人才是远远不够的, 业界也可以依托优质平台开展行业培训,例如“籍合学院”组织实践经验丰富的专家开设在线培训课程,为古籍数字化从业人员素养提升提供继续教育服务。举办专题研讨会,精准交流古籍数字化定点内容,例如由北京大学数字人文研究中心、北京大学-字节跳动数字人文开放实验室、北京大学人工智能研究院举办的“古籍智能”系列研讨会已完成9 个系列讲座内容,在学术交流和人才培育方面产生了良好的效果。 开展主题培训班/研修班,例如全国古籍整理出版规划领导小组办公室(以下简称“古籍办”)自2001 年起举办了第一次古籍整理培训班,迄今已举办19期,培养高质量出版人才2000 多人。

实行“产学研”三位一体的古籍数字化人才培养模式,供给理论结合实践、知行合一的复合型从业人员。实行院校与古籍收藏单位/ 研究单位联合培养的培育模式,例如武汉大学古籍保护暨文献修复研究中心与信息管理学院、历史学院双向联动,在学生教育、科研、服务方面相互借力,培育了优秀的古籍数字化从业人员。实行校企联合培养模式,学生培养实行学科专业导师和古籍出版业界导师双导师制度,例如清华大学设置科技编辑双学士学位,它打通文史教学模块,培养又专又通的人才,定向输送古典文献学专业学生去中华书局就业。

3.3 活化传承:发挥多元技术赋能优势,开展以用户体验为核心的古籍数字化创意产品设计

基于全媒体多项技术的古籍活化利用是重要的古籍文创数字作品,这是落实立体化古籍大众传播、将古籍文化知识贯穿国民教育的重要实践。

以用户古籍文化体验需求为导向,利用多元技术赋能古籍数字化创意与生产,创新古籍文化消费的新模式与新业态。以AI、XR、区块链等元宇宙技术底座为代表的信息技术已日渐推进古籍活化利用与科技深度融合,古籍出版机构应充分利用多渠道、多媒介,立体化开发古籍大众传播产品,据此需储备相关人才,组织和发掘已有古籍资源文化基因,发挥技术赋能文化平台建设与产品设计的优势,布局古籍活化出版市场。

以用户文化需求为核心,提升古籍文化服务的易用性,彰显数智时代应有的人文关怀。除服务文史哲领域的专家学者之外,古籍整理与出版单位还应分析孩童、传统文化爱好者、低文化群体、海外读者等群体的用户画像与文化诉求,从细分领域用户需求和阅读痛点出发为其打造可体验、可沉浸、可感触的活态古籍文化产品。

打造高质量的古籍数字化产品消费场景,引导用户的数字文化消费习惯。当前面向大众传播的古籍数字化产品呈现社交化、全息化、移动化、具身化的特征,古籍文化消费场景更加多元,文化内容愈加丰富。高质量的古籍数字出版物消费场景能反向推动用户投入消费环节,继而塑造新的古籍数字出版物消费习惯,实现古籍内容生产与内容消费双向联动,推动古籍数字出版业态健康持续发展。

猜你喜欢
古籍数据库数字化
中医古籍“疒”部俗字考辨举隅
家纺业亟待数字化赋能
关于版本学的问答——《古籍善本》修订重版说明
高中数学“一对一”数字化学习实践探索
高中数学“一对一”数字化学习实践探索
关于古籍保护人才培养的若干思考
我是古籍修复师
数据库
数字化制胜
数据库