徐 毅 钱智勇
2021年,国家“十四五”规划纲要草案提出实施文化产业数字化战略。2022年5月22日,中共中央办公厅、国务院办公厅印发《关于推进实施国家文化数字化战略的意见》(以下简称《意见》),成为推动实施国家文化数字化战略、建设国家文化大数据体系的框架性、指导性文件。《意见》提出的重点任务包括:促进文化机构数字化转型升级,推动图书馆等收藏机构加强公共文化数字资源建设,统筹推进国家文化大数据体系、全国智慧图书馆体系和公共文化云建设,增强公共文化数字内容的供给能力,提升公共文化服务数字化水平。《意见》要求到“十四五”期末基本建成文化数字化基础设施和服务平台,形成线上线下融合互动、立体覆盖的文化服务供给体系。文化资源经过数字化加工整理,通过多终端广泛传播,就会走出博物馆、图书馆、档案馆,打破时空限制,让人们随时共享悠久璀璨的中华优秀文化成果。因此,国家文化数字化战略的实施将极大地推进图书馆数字化转型和服务创新。
自上世纪90年代后期开始,馆藏资源数字化建设使得图书馆积累了丰富的数字化技术应用经验,从光盘存储到联机数据库,再到网络数据库,20余年的资源共建共享和数据库建设极大地丰富了传统馆藏资源,实现了基于文本的馆藏文献纸电一体化全文检索和共享利用。随着大数据技术、语义网技术、区块链技术、人工智能技术、虚拟现实技术等在智慧图书馆的广泛应用,图书馆业务组织也面临数字化管理、技术与传统工作的融合、跨学科跨机构合作等重要问题。如果技术只是服务于传统的图书馆工作方式,而不能利用技术创新提升图书馆业务和服务模式,必然会放缓图书馆数字化建设的进程[1]。图书馆传统业务和服务模式向数字化转型,实现业务工作与信息技术同步发展,已成为图书馆贯彻落实国家文化数字化战略和加快自身数字化发展的必然选择。本文借鉴国内外图书馆数字化建设成果,结合南通城市记忆文化遗产“张謇学濒危稀见文献”数字化保护和利用实践,探索了南通大学图书馆在贯彻落实国家文化数字化发展战略,以及数字化转型、技术路径和服务模式上的创新举措,并为图书馆数字化的可持续发展提供经验。
文献是了解历史文化信息的一把钥匙,保护好文献遗产是城市文化传承不可或缺的一环,更是城市文化高地建设中至关重要的基础,收集和保存人类文化遗产是图书馆担负的社会职能。在信息化社会里,对文献文化遗产进行数字化保护和利用是新时代图书馆社会职能的扩展,是确保图书馆始终成为人类文化遗产的储存中心的重要立足点[2]。图书馆近二十年的文化遗产数字化研究与建设实践为本文研究提供了理论方法和技术指导。
国内于20世纪末就开始了古籍数字化建设,并取得了一系列成果。上海图书馆早期开发了“古籍影像光盘制作及检索系统”[3],国家图书馆构建了“馆藏善本古籍文献书目总库”[4];又如地方特藏古籍书目数据库有成都图书馆特藏善本古籍目录数据库[5]、南京农业大学“民国农业书目数据库”[6]等等。国外中文古籍数据库亦有不少亮眼建设,如哈佛大学古籍善本特藏、东京大学图书馆“汉籍目录”、韩国国立汉城大学图书馆“奎章阁古籍检索系统”、大英图书馆“中文图书联合检索”等[7]。而今,大型全文古籍数据库也有了较成熟的发展。公共服务共享资源库有中国国家数字图书馆“中华古籍资源库”,商业古籍资源库有“中国基本古籍库”“雕龙古籍数据库”“鼎秀古籍数据库”等等,已经实现了分类检索、条目检索、全文检索、二次检索等古籍基本检索功能。
随着古籍数字化建设的不断发展,相关标准规范也开始为人关注。中山大学在构建“岭南记忆”网络平台时,提出了岭南文化遗产资源数字化优先策略[8];兰州大学图书馆探索了甘肃非物质文化遗产的数字化保护策略[9];上海交通大学图书馆构建了地方历史文献的数字化管理和规范体系[10]。此外,已有的文献文化遗产数字化保护和利用相关标准有国际标准《信息与文献文化遗产信息交换的参考本体》(ISO21127:2014)、国家标准《古籍著录规则》(GB/T3792.7-2009)、行业标准《古籍元数据规范》(WH/T66-2014)等等。这些标准规范对地方文献文化遗产数字化标准化建设,实现异构文献文化遗产资源数字化共建共享和语义互操作等方面具有重要指导作用。
由于信息技术日新月异,很多新的数字技术开始应用于古籍数字化保护之中。翟珊珊等研究基于关联数据技术聚合文化遗产资源[11],王晓光等通过建立敦煌壁画叙词表揭示了敦煌图像的语义[12],陈涛等致力于IIIF与AI结合的文化遗产图像资源组织研究[13]。哈佛大学燕京学社与北京大学合作构建了中国历代人物传记资料库(CBDB),为数字人文提供了基础数据资源[14];英国牛津大学的研究人员阿塞尔·雅尼斯等利用深度神经网络模型,对被破坏的古希腊文献遗产中的铭文段落进行了文字修复和深度还原[15]。德国埃尔朗根-纽伦堡大学的丹尼尔·斯特罗默等利用计算机断层扫描的新方法,将竹简和木简上的文献数字化,使得隐藏的文字内容变得可读[16]。新技术应用对濒临毁坏的文献遗产进行修复和揭示,实现了基于时空信息的文化遗产数字化和语义化知识组织、存储、保护、利用。
初景利认为确立图书馆服务战略转型的核心是真正确立“以用户为中心”的服务理念,积极推动嵌入式学科知识服务[17]。吴建中提出大学图书馆数字化转型应主动融入大学整体发展、推进图书馆数字化转型、创新的全素养教育[18]。何秀全等认为图书馆应在学校整体转型发展中实现图书馆的数字化转型[19]。姚晓霞等认为图书馆应以用户为中心、以服务为抓手、以数据为核心、以技术为基础、以人才为根本,积极开展数字化转型和服务创新实践[20]。刘嘉琪等提出图书馆应关注国际实践,合作共建数字借阅资源共享平台,推进实体馆藏数字化服务转型[21]。
文献文化遗产数字化保护和利用是图书馆贯彻实施国家文化数字化战略的重要举措。本文以地域文献文化遗产——张謇学濒危稀见文献数字化保护和利用为例,探索图书馆文化遗产数字化保护创新实践。张謇为清末状元,是“中国近代第一城”——南通的缔造者[22]。1956年2月毛泽东主席在接见黄炎培时,就认为提起民族工业,在中国近代史上有四个人不能忘记,其中“轻工业不能忘记海门的张謇”。2020年习近平总书记在南通考察时指出:“张謇在兴办实业的同时,积极兴办教育和社会公益事业,造福乡梓,帮助群众,影响深远,是中国民营企业家的先贤和楷模。”张謇一生致力于创实业、办教育、兴修水利、海防、边疆、垦牧等早期城市现代化建设,南通地区留存了大量有关张謇的近代史文献文化遗产和历史遗迹,收藏于图书馆、博物馆、档案馆等机构。还有许多张謇学濒危稀见文献散落在国内外或流落民间。一些近代城市建设中的水利、海防、边疆等方面文献和遗迹遗存,随着自然环境的变化,城镇建设的加快,一部分已经消亡,幸免的遗迹也面临消亡的危险,这些被人忽略的城市记忆历史遗迹、流落民间的文物、域外汉籍中的资料等等,是张謇学基础文献不可或缺的部分,其文献价值独特而重要。
利用数字化技术对张謇学濒危稀见文献进行保护就是为了尊重历史、抢救和保护典籍,其初心是让张謇学濒危稀见文献走出图书馆、走出博物馆、走出档案馆,更好地为大众服务,更好地、全方位地展示历史上地张謇。这不仅可以服务于学术研究,而且可以面向普通大众,从而实现中华优秀传统地域文化在最大范围内的传承和利用。南通大学图书馆以国内濒危的重要张謇历史遗迹、民间文物及稀见的域外张謇学文献为重点发掘和保护对象,组织跨学科的学术团队,探索张謇学濒危稀见文献数字化保护路径,构建数字人文研究平台。通过项目驱动促进图书馆数字化业务模式创新、技术路径创新和服务创新发展。
张謇学濒危稀见文献具有多类型、多语言、跨学科等特征,对这些珍贵的文献遗产进行收集整理和数字化处理的工作量及难度非常大,技术要求高,必须采用新的研究方法和技术手段进行数字化保护和利用。这就需要更新观念,大胆创新,突破传统的图书馆管理模式,以项目驱动跨学科跨机构合作,通过图书馆业务数字化转型,嵌入式培养馆员数字素养,提升数字化服务水平和能力。
2.1.1 项目驱动跨机构跨学科合作
国家文化数字化战略需求和地方文化遗产数字化保护与利用的内在需要必将促进图书馆、档案馆、博物馆等文化记忆机构之间的协同合作。文化记忆机构可以通过合作申报各类国家级和省市地方文化数字化项目,以项目驱动和促进文化结构之间的业务协作。本项目以南通大学图书馆原有张謇研究特色数据库(该数据库曾获CALIS全国高校专题特色库子项目验收评比二等奖)为基础,以申报国家冷门绝学重大团队项目为契机,组织由图书馆馆长(张謇学文献域外汉籍专家)领衔的跨学科学术团队,邀请政府文化部门领导、南通市图书馆、档案馆、博物馆领导及张謇嫡孙张绪武先生等一批张謇学研究专家作为核心成员担任项目指导,由南京大学域外汉籍研究所古典文献学、域外汉籍专家,以及南京大学江苏省数据工程与知识服务重点实验室数据技术权威专家、上海图书馆数字人文领军学者等组成跨学科团队,多方合作共建张謇学城市记忆文化遗产数字化保护项目。项目组聚集了一批文史专家、民间收藏家和一批朝气蓬勃、年富力强的青年学者。所涉及学科包括图书馆学、古典文献学、域外汉籍、历史学、博物馆学、档案学、信息科学等多学科交叉领域,以项目建设驱动城市记忆文献文化遗产的跨机构跨学科合作。通过项目契约合同和平等协作机制,在共同目标兴趣和利益需求的驱动下,不同机构合作者有较强的自主意愿,可有效促进南通地域文化资源互补,人力和技术共享,实现效益最大化。同时,通过项目可以增强城市文化记忆机构之间的业务交流与合作,提升机构的业务水平和资源共享服务能力,强化特色地域文化的数字化保护和传承利用,加快地方文化资源融入国家文化大数据体系,实现地域文化资源的数字化共建共享和传播利用。
2.1.2 促进图书馆业务数字化转型
在贯彻实施国家文化数字化战略的进程中,数字资源的组织、新技术的应用、服务的创新等等都需要改革图书馆传统业务运作模式,从传统服务模式向数字化转型是图书馆现代化进程中的必然选择。南通大学图书馆围绕地方文化遗产“张謇学濒危稀见文献”的数字化保护和利用,在项目实践中探索图书馆业务工作数字化转型的方式与具体实现方法,采用自上而下的项目管理与自下而上的扁平化组织相结合的方法推进图书馆业务工作的数字化转型(图1)。
图1 项目驱动图书馆业务数字化转型
首先,建立自上而下的管理机制。图书馆领导集体以高度一致的思想、行动引导项目的正确方向,将其纳入南通大学图书馆“十四五”规划重点工作。成立了南通大学“张謇学数字人文研究平台”建设中心,由分管副校长、南通市政协副主席担任中心主任,邀请张謇的嫡孙张绪武先生担任总顾问。将“张謇学数字人文研究平台”的建设作为南通大学图书馆的“一把手”工程来组织管理。每月召开平台建设汇报推进会,书记、馆长轮流主持,各个项目组分别汇报一个月以来的工作进展,侧重于成效与困难,馆长布置平台建设的下一个月工作任务,会后形成《工作简报》。图书馆基层党组织完全融入张謇学术团队,党建与学术“双核”推进,在张謇学研究中切实发挥党员甘于奉献、敢为人先的先锋作用,科学而扎实地推进项目建设和业务工作数字化转型。
其次,构建项目驱动的自下而上的扁平化组织结构。大数据环境下,图书馆传统流程被附加了更多网络化、主题化、语义化的新内容,传统组织结构已不能满足多部门协同联动的业务方式,以职能方向为基础的扁平化组织结构有利于减少协调沟通成本,有效提高业务运行效率[23]。南通大学图书馆以文化遗产数字化保护项目为驱动,推进实施以项目组为载体的图书馆业务工作扁平化管理。围绕张謇学濒危稀见文献数字化保护和利用,成立了张謇研究资源建设、张謇原典收集与整理、域外张謇文献及研究、国内张謇文献及研究、张謇数字人文研究、张謇数据库技术、张謇研究著作解题等七个工作组,成员来自全馆各个部门,打破图书馆部门之间的业务界线,发挥馆员的不同专长,同时将项目建设与业务工作相结合,促进部门之间的业务交叉,加快了图书馆业务工作的数字化转型。
2.1.3 实现馆员数字素养嵌入式培养
数字素养是指个人在数字时代所需具备的数字意识、数字知识、数字能力与数字伦理等方面的综合素养[24]。馆员的数字素养具体指在数字环境下利用数字技术手段和方法,发现和获取信息,组织与管理信息、理解与评价信息、整合与利用信息、交流与共享信息的综合素养。培养馆员的数字素养是图书馆数字化转型能否顺利实现的基础,也是数字化建设的重要目标之一。图书馆可以采用项目驱动的嵌入式方法培养馆员的数字素养。项目驱动式又称项目引领式培养,它是建立在建构主义理论基础上的培养模式,与传统的培养模式相比,项目驱动式培养能更大地激发馆员的学习兴趣和求知欲望,在项目研究过程中学习并掌握数字化技能与方法,培养自主学习、分析和解决问题的能力。
图书馆采用项目驱动的跨学科嵌入式培养模式,以需要解决的主要问题为导向,以项目实施为牵引,对馆员采用在职研修的嵌入式数字素养培养模式,将数字技术、多媒体技术、语义技术、软件工程等模块嵌入数字人文课程体系和数字化项目培训。围绕项目实践设立馆员嵌入式培养目标,注重培养项目组织实施能力、数字化技术操作能力及馆员跨学科知识多元化应用能力。构建项目虚拟共享学习平台,馆员和文献学专家、信息技术专家及其他领域的专家学者进行实时在线的学习和交流。建立不同任务小组进行基于任务的合作学习和实践,在数据采集、数据组织、标注算法、数据关联、数据挖掘、数据呈现、数字版权、内容传播等方面进行研讨和学习。这种开放式的培养模式一方面有利于馆员在项目研究进程中学习数字技术和研究方法,另一方面可以增强学科馆员与不同学科专家的沟通和协作,在提升信息技术应用能力的同时,推进项目的顺利进行。通过长期的项目实践,不断提高馆员的数字素养,促进图书馆业务数字化转型和文化遗产数字化项目的可持续发展。
张謇学濒危稀见文献搜集、辑佚和数字化保护工作需要解决稀见张謇古籍文字识别,多语种多媒体类型的元数据语义标注、实体关系抽取、关联数据转换发布,时空知识图谱及文献文物遗产的虚拟化展示与语义关联等诸多技术问题。本文提出以融入国家文化遗产大数据体系和地方文化遗产数字化产业需求为导向,以构建“张謇学濒危稀见文献数字化保护和数字人文研究平台”为具体目标的技术实现路径。首先通过案例调研和专家访谈,明确张謇学数字人文研究平台的功能需求,分析归纳需要解决的技术难题和可行性;然后与数据库技术开发商、上海图书馆、南京大学等多方合作进行平台开发,平台采用边建设,边开发,边实践,再总结,再开发完善的探索性的开发建设思路。初步设计了三层架构平台,分别为信息资源层、整合支撑层、应用层(图2)。
图2 张謇学濒危稀见文献数字人文研究平台
2.2.1 第一层,信息资源层
信息资源层是依据数字化加工规范对收集的文献进行数字化加工、识别、分类标引和内容发布。数字化加工规范参照国内外最新的数字化技术标准制定,具体有《张謇古籍资源采集和加工规范》 《张謇档案资源采集和加工规范》《张謇图像资源采集和加工规范》等等。文本识别是先依据数字加工规范对收集到的张謇濒危稀见文献进行扫描存储,再完成古籍识别、编辑、审校。内容发布是对数字化的张謇文献进行元数据标引和内容发布。信息资源层的难点是对张謇古籍文献、张謇手稿、碑刻及实物文献的数字识别。首先,利用现有汉字计算机编码标准和字库进行OCR自动识别,最新的《古籍印刷汉字规范》(2022年5月1日实施)给出了14250个古籍印刷通用字形、字音及在国际编码字符集ISO/IEC10646中的码位,可识别大部分传世古籍的印刷体通用汉字。
部分张謇手书、楹联、题跋、碑刻、木刻等珍稀文献的文字排版、间距、行距规整,资料信息完整度高,底板颜色与文字颜色对比度高,底板颜色纯净,文字及字体规范的资料识别效果好(图3.1)。对一部分难识别的稀见文献可通过以下方法提高识别率:针对底色杂乱、底色高饱和的图像(图3.2),将RGB彩色图像转为灰度图像,并做直方图均衡化处理增强图像对比度,凸显目标文字形状特征,减少干扰像素数据,提升识别速度和精度(图3.3);阴刻的文献资料需先做像素反相处理(图3.4);再进行前述步骤(图3.5);最后将处理过的图像上传平台,针对文本排版错杂或文本密集的情况,逐页或逐列切分文本区域,点击自动OCR,系统将调用汉王OCR、书同文OCR等外部字库资源自行动识别文本,点击保存JOCR,保存识别结果为所选区域的文本标注内容。
图3 张謇学濒危稀见文献OCR识别
张謇濒危稀见文献中还有许多手书字体、字迹模糊破损、异体生僻字等识别难度更高的文字,采用传统的“预处理—切分—特征提取—识别”的路径方法识别率很低。目前,基于深度学习的汉字识别技术性能较好,如经典的深度学习神经网络结构——卷积神经网络(CNN),利用机器替代人工完成提取特征的步骤,在精度和效率上都有质的提升。难度更高的手写草书、异体字、异形字、破损残缺字的识别,主要采取联机和脱机两种方法。联机的方法可以通过网络众包模式,利用人工识别抄写转录,如上海图书馆盛宣怀档案手稿文本化就是采用众包模式,由网上用户进行注册登陆完成识别抄录[25]。在人工书写过程中还能获取笔画顺序信息,再结合机器学习,将会识别效果更佳。脱机的方法由于缺少笔顺信息,又受图像分辨率、背景噪声等因素影响,还有很大的探索空间。
2.2.2 第二层,整合支撑层
整合支撑层的主要作用是以元数据规范、资源描述框架和本体规范、国际图像互操作框架等技术标准规范为基础,支持张謇濒危稀见文献的数字资源描述、语义知识组织和数字人文研究(图4)。
图4 张謇学文献知识组织整合支撑技术路径
(1)数字资源描述规范。描述文献文化遗产的主要元数据规范包括:DC(都柏林核心元素)、《古籍著录规则》 (GB/T3792.7-2009)、《档案著录规则》(DA/T18-2022)、《国家图书馆拓片元数据规范与著录规则》、《可视化艺术品资源元数据规范》 (VRACore)、《地理信息元数据》 (GB/T19710-2005)等等。以这些标准与规则规范为基础,建立张謇著述古籍文献、档案文献、信札手稿文献、碑刻文献、家谱文献、图像文献、音视频文献、以及其他史迹文献等元数据描述框架,建立元数据标注模型。基于通用性、可扩展性原则,结合张謇学文献的不同特征,从载体和内容两个维度构建张謇学文献元数据框架和描述规则。
(2)语义知识组织。文化遗产语义知识组织常用技术规范和标准包括:由国际万维网联盟(简称W3C)发布的可扩展标记语言(XML)与资源描述框架(RDF)、本体语言(OWL)与描述逻辑(DLs),国际图像互操作框架(IIIF),以及人工智能(AI)、虚拟现实(VR)、增强现实(AR)、混合现实(MR)等技术标准。其中RDF是用来描述文化遗产资源及相互关系的数据模型,它是语义网技术体系的基石[26]。RDF通过三元组结构<主语谓语宾语>描述某一资源的特定属性与属性值。OWL是基于描述逻辑的本体建模语言。本体是共享概念的明确的形式化的规范说明[27]。通过领域本体,可以在资源元数据描述的基础上,实现不同元数据类型之间的语义化描述和语义互操作。国际图像互操作框架标准(IIIF)是一组用于定义文化记忆机构互操作性框架的标准,IIIF通过标准的应用程序编程接口(API),提供在Web上描述和访问图像资源的统一方法,通过应用程序API接口,采用基于本体和RDF的图像语义标注,可以实现张謇学文献文化遗产的图像对象资源和外部关联数据集的语义关联,还可进一步实现更广范围的文化遗产知识关联和知识发现。文化遗产数字化保护还可使用虚拟现实(VR)、增强现实(AR)、混合现实(MR)等技术方法对张謇学濒危文献遗产进行数字恢复、数字还原,场景再现等数字化保护和利用。
2.2.3 第三层,应用层
应用层主要功能是基于张謇学濒危稀见文献的语义化知识组织,构建张謇知识图谱、张謇研究学谱、张謇行迹地图、张謇讯息博物馆等应用场景,集成数字人文研究工具,帮助学者利用数字技术进行张謇学数字人文的跨学科应用研究。
本文案例选取《张謇辞典》文本进行基于元数据的内容标注,该辞典由国内40多名张謇研究知名专家学者历经10余年编纂完成,收录张謇学相关人物、事件、地名、典制、业绩、著述、史迹等方面词条1693条,较全面地反映了与张謇相关的人、时、地、物、事件、业绩、著述等历史资料,是了解张謇、研究张謇的重要工具书[28]。根据《张謇辞典》内容分类构建张謇知识本体,定义本体的10个实体概念类分别为:人物、事件、地名、典制、业绩、史迹、研究、行迹、其他类,再分别定义每个类的属性,见表1。
表1 张謇学濒危稀见文献知识本体类属性表
(1)构建张謇知识图谱。首先通过本体建模元语,设计本体类、属性、属性关系,构建张謇知识文献知识本体。然后依据本体对《张謇词典》文本进行实体、关系标注和抽取,再通过由节点、关系、属性、标签等元素构建的数据模型,将结构化《张謇词典》文本数据存储为由关系连接的图数据库。图5中详细展示了张謇知识本体中与张謇有“生意合作”关系的人物知识图谱,通过对象属性关联到人物、业绩、典制、著述等本体类,可实现多维度张謇本体知识关联检索。张謇知识图谱以可视化图形效果增强了张謇知识搜索的关联性和浏览趣味性,还可以逐层打开探索事件内部关联,再通过知识图谱的查询推理获得更多的张謇人物、事件、地点、时间等未知关系的知识发现。此外,通过对张謇著述和张謇研究文献的语义标注和知识关联,构建张謇学谱,从时间、空间和不同主题、不同类型等多个维度可视化、系统地展示张謇学研究成果。
图5 张謇人物关系知识图谱
(2)构建张謇行迹地图。依据“编年”与“系地”并重的理念,对张謇行迹进行数据建模,依据模型标注原始文献中的编年信息和地理信息,标注内容主要包括时间、地点、地点经纬度、事件概述等几个部分。对《张謇年谱》中的时间、地点等结构化信息,可依据规则匹配,利用正则表达式标注,获得较高精确率,使用自动标记功能给出段落标记,再将已获取的地点信息去重,使用历史地名查询工具(TWGIS)逐一获取经纬度信息;然后在Excel中使用vlookup函数将具有相同段落标记的时间、地点和事件信息对应,将地点名称与经纬度信息对应,事件概述使用规则标记并提取每段第一句描述性文本;再将标注结果导出为张謇行迹Excel表;最后利用ARCGIS地图工具转换Excel表数据,将经纬度添加到图层中完成地图构建。图6展示了张謇晚清时期的行迹历程。利用关联数据属性URL可以将张謇行迹地图与知识图谱进行关联,通过时间维度检索和呈现张謇出生地、经行地、科举地、任职地、经商地、与友人交往地等等不同地方的人物、经历和事件。
图6 张謇行迹历程图
(3)构建张謇虚拟博物馆。张謇虚拟博物馆融合移动互联网、虚拟现实、三维全景、多媒体和数字陈展等技术,采用三维虚拟漫游技术,设计虚拟展厅三维模型,为虚拟展厅提供空间载体。所有展品均陈列在虚拟展厅的展位或展示架。再基于三维展厅设计创建三维虚拟展厅地图,地图支持场景漫游、寻路算法、角色对话、信息热点绑定等功能(图7)。系统通过虚拟空间全景沉浸式体验模式展示展馆内的所有影像信息。在720VR中嵌入电子书,可在720度全景视角中,直接翻页阅读文献。通过灵活的交互方式来提升用户体验感,同时支持挂接视频资源,让整个展馆动起来、活起来,让用户体验身临其境欣赏数字展馆之美。此外,系统还将富媒体技术与虚拟现实技术相融合,利用多媒体手段,通过加载声像资料、口承传统资料等,展示城市记忆历史文化,促进张謇学特色地域文化的历史传承。
图7 张謇学濒危稀见文献虚拟博物馆
2.3.1 文化遗产资源跨平台服务模式创新
文化数字化战略目标是实现各类文化资源的数字化成果全民共享,文化遗产资源数字化保护和利用需要进行跨领域跨部门协作,图书馆、博物馆、档案馆等城市记忆机构通过项目驱动模式,实现不同机构服务功能的兼容与整合。需要整合多个元数据方案,通过复用现有元数据标准,构建文化遗产元数据规范核心元素集。然后再基于元数据规范,标注图书、档案、文物遗产等资源,细粒度组织碎片化、结构化的张謇文化遗产资源,通过同类聚合将张謇学研究相同或相近学科、领域的文献资料进行集成式分类整理,开发成专题数据库,利用文本标注和关系抽取将文献中的知识进行分解与整序,通过概念层次关系和对象属性关系寻求知识之间的潜在关联,探索张謇文献中的城市记忆知识。还可将本体词表嵌入关系数据库系统,实现跨平台语义检索,如当搜索一个实体如“大生纱厂”时,通过设计好的本体属性自动链接到该词的关联实体,计算机会根据结构化查询语言进行匹配查找,自动搜索有关“大生纱厂”的辅助产业,如“通海垦牧公司”“大达外江轮船公司”“复兴面粉厂”“资生铁厂”等等实体企业,相关产业如“同仁泰盐业公司”“广生油厂”“大隆皂厂”“大昌纸厂”等等企业的档案文献、研究文献、文物文献。还可将文献中相关实体企业的创建时间、创办历程、事件、地点、相关人物、相关档案、相关图片、音视频等等历史记忆抽取出来,以可视化的图谱形式呈现给读者。再将张謇学文献与外部资源如中国历代人物传记资料库(CBDB)、上海图书馆盛宣怀档案知识库等进行人物实体关联,发现更多的人物和历史档案证据。学者利用张謇知识图谱和行迹地图将南通城市记忆的发展轨迹与现代城市发展连接起来,对清末最大的民营企业大生纱厂及其附属企业创立的社会因素进行梳理与总结,可以较完整地把握南通近代实业产生的历史背景与发展的社会推动力。再与现代实体企业研究进行比较分析,发现新问题,提出新观点,借古通今,探索数字经济时代的城市实体经济发展的强国之路。
2.3.2 文化遗产资源跨媒介传播方式创新
跨媒介传播的内涵在于不同媒体之间的交叉与融合,合作与共生,可以促使信息资源在不同媒体之间交叉传播与整合,综合利用各种媒介资源,提高信息传播效率,最大限度地扩大信息资源的受众覆盖面[29]。在地域文化传播方面,跨媒介传播表现出地域文献文化遗产的多元载体创作及数字化赋能、注重拟人化及地域特色传达等创意特点,呈现出传播主体多元化、传播方式多样化、传播手段智能化、传播内容的文化价值与产业价值并重等趋势。移动互联环境下的跨媒介传播可通过众包参与、人机交互等方式,采用全方位、多角度、多层次、多时空的展示手段,丰富沉浸式体验、互动式体验等活态传播形式。还可以利用VR、AR等技术实现城市记忆文化遗产场景和实物的数字化重现,利用计算机3D模型生成逼真的三维视、听、触等感觉,使读者通过移动终端进行沉浸式场景感受和虚实互动的体验。如利用张謇行迹地图结合增强现实、虚拟原生、镜像孪生等技术,虚拟复原张謇在南通创办的企业、学校、医院、史迹场所、影剧院、博物馆、档案馆、图书馆、街道、公园、景点等等近代城市场景,打造“中国近代第一城”的元宇宙空间。读者利用传感设备或移动网络设备,以虚实互动的方式徒步或骑行穿越近代南通城市街区和史迹景点,获得极具真实感的旅行体验。系统还能与张謇知识库关联,读者在行走的过程中接收到语音提示及所到场所的实时解说,通过图像叙事手段,读者在行走的过程中实时了解到更多张謇兴办企业、规划城市建设、发展教育、创办公益等多项全国第一的功绩,一方面使读者了解张謇和近代南通历史人物、城市面貌、社会生活、艺术人文等方面知识,另一方面使读者在对城市记忆文化遗产身临其境的感知中,激发认同地域文化,传承南通文化遗产的意愿,同时也让读者在虚拟体验和游戏中受到了乡土教育、人格教育、民族精神教育和多元文化教育,增强了文化自觉、文化自信和民族自豪感。系统平台还支持多语种标签切换的中、英、日、韩文张謇文献资源的语义聚类搜索和可视化呈现,既方便张謇学专家学者的多维度数字人文研究需要,也方便外国留学生和其他读者参与互动,以图文声像多媒体方式体验和了解以南通为代表的中华优秀特色地域文化,增强中国在周边国家及其他国家中的影响力,增强民族自豪感,厚植文化自信。
特色鲜明的地域文化,是源远流长的中华文化的有机组成部分,是中华民族的宝贵财富。本研究以极具地域特色的南通城市记忆文化遗产“张謇学濒危稀见文献”为对象,面向国家文化数字化战略需求和特色地域文化资源的数字化保护传承和利用的实际需要,探索图书馆数字化转型、技术路径创新和智慧化服务的实践。提出了以项目驱动跨学科跨机构合作、图书馆业务数字化转型、嵌入式馆员数字素养培养等创新举措。研究并初步构建了城市记忆文献文化遗产数字化保护和数字人文研究平台。该平台由信息资源层、整合支撑层、服务层三层架构组成。信息资源层包括文献文化遗产数字化采集加工和知识仓储系统;整合支撑层集成多种元数据规范、国际图像互操作框架、语义技术规范,以及文本标注、自然语言处理、文本分析等数字人文研究工具,支持文化遗产资源语义聚合、智能检索和知识发现;应用层包括构建张謇知识图谱、张謇行迹地图、张謇虚拟博物馆等应用场景。最后探讨了文化遗产跨平台数字化服务的新模式和跨媒介数字化传播的新方式。
随着国家文化数字化战略的推进实施,新技术应用的不断发展,项目将在四个方面持续进行拓展研究:一是以项目驱动图书馆数字化转型的深入进行,不断调研和学习国内外图书馆数字化转型的先进管理经验,探索项目制管理与图书馆业务工作的无缝连接,建立基于服务的绩效考核机制,提升馆员数字素养,提高图书馆数字化服务质量;二是对张謇学濒危稀见文献的持续发掘、整理和数字化处理,重点是对张謇著述、档案、濒危遗迹文献及域外汉籍中张謇与友人交往的尺牍、序跋、唱酬诗等稀见文献进行数字化发掘、保护和利用;三是对张謇学文献细粒度语义知识的组织,以《张謇辞典》语义知识图谱和《张謇全集》文本标注为基础,选择重点张謇学文献,如张謇档案、手稿、日记等进行基于不同主题、不同维度的语义标注,补遗和完善知识图谱和行迹地图,构建张謇学谱;四是不断丰富跨学科数字人文研究的手段和方法,将人工智能、自然语言处理、虚拟复原、场景重构等新技术应用于文化遗产资源数字化保护和利用,不断将文化遗产资源中的实物、文字、图画、声音、影像、遗迹等对象元素转换为不同主题内容的数字化形态,让收藏在博物馆里的文物、陈列在广阔大地上的遗产、书写在古籍里的文字都活起来,再借助于多种数字化媒介,在互通、互融的过程中逐渐形成特色地域文化遗产资源的全球共享,进而推动中华优秀地域文化成果在世界的广泛传播利用。