庞蔚淇 何沁霖 敖艺菲 刘 星 徐景阳 徐晨飞
(1.南通大学经济与管理学院,江苏 南通 226019;2.贵州师范大学教育学院,贵州 贵阳 550025;3.杭州电子科技大学计算机学院,浙江 杭州 310018;4.南通大学信息科学技术学院,江苏 南通 226019)
张謇(1853—1926),字季直,晚号啬庵,江苏南通人,清末状元,是中国近代著名的爱国政治家、实业家、教育家和慈善家。他秉持“父教育、母实业”的理念,在家乡创办了中国第一个民营资本集团、第一家农业股份制企业、第一所师范学校、第一所纺织高等院校、第一所聋哑学校、第一所戏剧学校、第一座公共博物馆、第一座气象台等。由于张謇的卓越贡献,南通后来也被誉为“中国近代第一城”。
2020年11月12日,习近平总书记在江苏考察调研时参观南通博物苑,对张謇兴办实业、发展教育、从事社会公益事业的成就作了很高的评价,称其是“中国民营企业家的先贤和楷模”,并号召大家学习张謇的事迹[1]。此后,掀起全国范围的“张謇热”,南通博物苑成为相关企事业单位及个人来到南通的“打卡胜地”,与张謇相关的一系列文化旅游景点也成为热门资源。
“十四五”规划中提出,要加快建设数字社会,适应数字技术全面融入社会交往和日常生活,需要“扩大优质文化产品供给,推动文化和旅游融合发展,深化文化体制改革”。2022年5月,中共中央办公厅、国务院办公厅印发《关于推进实施国家文化数字化战略的意见》,明确了“提升公共文化服务数字化水平”是国家文化数字化战略的重要任务。目前,我国有关文旅资源的开发工作大多停留在对资源的收集、整理、分类与展示阶段,缺乏对资源潜在知识的加工、组织及挖掘,利用率不高。随着数智赋能时代的到来,文旅资源数据逐渐成为我国文化与旅游发展的核心资产,深度开发与利用这些数据也成为新时代我国文旅事业发展的重要任务[2]。近年来,作为一种创新的跨学科研究方法论,全球数字人文研究正迅速崛起,它不仅为人文研究提供了更为宽阔的研究视角,也成为文化产业传播与发展的有效媒介[3],因此也为众多文旅资源的开发与利用提供了一种新的可能范式。
笔者尝试探索以地方历史名贤为中心的文旅资源开发与利用新模式。通过网络与实地调研搜集张謇文旅资源相关资料,运用知识组织、软件工程等方法,针对张謇文旅资源进行领域知识本体构建、关联数据发布以及微信小程序设计,实现张謇文旅资源的知识聚合、知识图谱展示等相关知识服务应用,以期在新时代更好地传承与发扬张謇精神,同时进一步加快中华优秀传统文化的创造性转化、创新性发展,扩展我国数字人文应用场景。
数字人文这一概念由20世纪40年代的人文计算衍生而来。1949年,Roberto Busa与IBM创始人Thomas J.Watson合作创建了Thomas Aquinas著作索引,被认为是数字人文学科的起源[4]。2004年,Unsworth、Siemens和Schreibman等人提出“数字人文”(Digital Humanities)一词,认为数字人文是解决跨学科问题最基本的研究范式,通过与计算机互动,利用计算机辅助分析和编码处理解决跨学科研究中的核心问题[5]。数字人文研究理论与方法的不断发展也催生出许多文化旅游类典型应用案例。如,1993年美国弗吉尼亚大学数字历史研究中心启动的“影谷”项目(Valley of the Shadow),基于时间和空间节点呈现了1860年至1870年美国南北战争期间的信件、日记、报表、公告、报纸、演讲稿等各类档案文献,向读者展示出特定时空下历史生活的真实场景[6];2012年,洛桑联邦理工学院和威尼斯卡福斯卡里大学推出“威尼斯时光机”项目,旨在建立一个涵盖威尼斯一千多年历史文化遗产的数字档案馆,利用数字化手段再现威尼斯的历史与文化,不仅为公众提供了一种新的历史学习和研究的方法,还有利于实现对数字化文化遗产的长期保存[7]。
在国内,中国人民大学2012年启动“北京记忆”项目,以真实详尽的历史内容和丰富的表现形式向大众宣传、展示和传播北京悠久的历史文化,与群众双向互动,共建北京记忆,成为北京人文历史宣传的有效途径[8]。上海图书馆开发的“上海年华”子项目“上海记忆——从武康路出发”首次尝试从城市记忆的整体性构建出发,将馆藏历史文献资源融入市民旅游文化生活,动态展示武康路的建筑、人物和历史事件,为地方文化传播及文旅融合提供了新的发展范式[9]。敦煌研究院的“数字敦煌”项目运用数字人文技术,将传统的档案研究与数字人文紧密结合,创作出影像动画,把档案研究成果以可视化的形式展现,将敦煌莫高窟的精美和辉煌传播到世界各地,再现了悠久、璀璨的丝路文明,开创了我国文化遗产档案数字化开发的先河,具有示范性和普遍意义[10]。
文化旅游资源开发是指对不同旅游资源文化内涵的挖掘及对散点化的文化旅游资源的概括、提炼、升华和整合的过程[11],对历史文化旅游资源的开发与利用是目前学界关注的热点。有学者认为文化旅游资源除具有自身个性外,还应包含所有旅游资源的共性,不同特性的文化旅游资源开发方向、功能价值是不同的[12];有学者认为游客会受到名人遗址遗迹等旅游目的地、旅行市场行为等影响,产生文化旅游的动机,同时政府的政策支持对于文旅资源开发会起到积极的促进作用[13];还有学者认为有效的文旅资源开发需要将地方的文化旅游潜力发挥出来,以点面结合的方式,从文化旅游的总体发展出发,实现文化保护,推进社会发展[14]。
目前,国内外针对特定历史人物相关文旅资源开发与利用的研究尚不多见,相关研究着重于揭示历史领域中人物和历史事件的关联关系。例如,“南昌起义”数字档案资源以“抗日战争与近代中日关系文献数据平台”作为数据来源,以时间、地点、人物、组织、资源和事件6个领域核心概念为基础构建本体,从语义深层揭示和发现“周恩来”在南昌起义中的细粒化知识[15]。国外研究侧重于以系统性的思路、数字化的手段和数据技术来构建城市记忆。例如,斯坦福大学的“Forma Urbis Romae”项目使用了10%~15%被保存下来的碎片地图,基于地理信息系统技术将罗马帕西斯圣殿内的罗马古城大理石地图进行数字化整合,试图重建不完整的地图,并建立起古代与现代建筑之间的关联性[16]。
张謇是南通不可多得的重要地方文化标志,南通许多旅游景点几乎和张謇密不可分,如张謇事业遗址与濠河风光带的珠联璧合,已形成别具特色的复合型景观[17]。笔者通过调研发现,当前相关部门已开始着手对张謇文旅资源进行统一规划与协同开发,但相关文旅资源的数字化开发与组织整理工作还有待加强。张謇文旅资源不仅自身包含大量知识属性,且与其他各类资源如张謇文献史料、网络多媒体资料等均有知识关联,将这些显性或隐性的知识进行深度挖掘,是为各类领域用户提供知识服务的前提。因此,笔者采用本体工程方法及关联数据技术,对张謇文旅资源进行语义化知识组织,基于微信小程序为相关学术研究、公众科普宣传及文旅产业发展提供移动化的知识服务平台,有助于在全国范围内进一步扩大张謇的影响力。
通常来说,文旅资源应兼具文化与旅游产业属性,南通本地关于张謇的景点、景区众多,理应归为张謇文旅资源范畴;但此外还有一大批与张謇相关的旧址、遗址以及非旅游景点单位,如工厂、学校、剧院等,其自身也具备一定的历史文化底蕴,也应纳入文旅资源范畴。因此,笔者提出的张謇文旅资源主要包括张謇所创实业、城市基础设施、教育机构等旧址以及后世为纪念张謇所创办的文旅机构等,同时将与之相关的各类文献资源也归入其中。张謇文旅资源开发与利用框架设计如图1所示,主要分为数字化整理与加工、语义化知识组织、知识服务平台构建以及文旅资源深度利用等4个部分。
图1 张謇文旅资源开发与利用框架设计
第一,数字化整理与加工是基础性工作,即通过实地考察与网络调研等方式,广泛采集、收集与张謇文旅资源相关的资料,再将这些不同来源的资料进行数字化整理与数据化加工,在此基础上制定元数据描述规则,将相关文本、图片、音频、视频资料存储为基本素材库,为后续张謇文旅资源知识组织奠定数据基础。第二,对转为数据形态的张謇文旅资源进行语义层面的知识组织是较为关键的步骤,在对张謇文旅资源外部特征与内容特征梳理的基础上,设计并构建张謇文旅资源领域知识本体,可深度揭示相关资源中所蕴含的“人、时、地、物、事”等各类知识实体及其之间的关系;基于本体模型对素材库进行知识实体语义标注并转换为RDF数据格式,采用三元组的结构形式进行规范化描述与存储;然后基于关联数据技术实现张謇文旅资源数据的开放、互联及共享。第三,构建张謇文旅资源知识服务平台,主要包括两部分:一是作为数据基础设施载体的张謇文旅资源知识库;二是以微信小程序为主要媒介,向各类用户群体提供移动化的知识服务。第四,利用知识服务平台可进一步深度挖掘张謇文旅资源的应用场景。如,面向领域学者的数字人文研究,面向公众的文旅资源导览与研学路线设计,面向特定学生群体的大学生思政教育等。
与张謇文旅资源相关的参考文献资料较多,笔者选取《张謇全集》[18]以及《张謇辞典》[19]作为主要纸本资料来源。《张謇全集》包含大量张謇先生留存至今的诗集、书稿、讲稿、日记、与各界人士往来信件等宝贵原始资料,是研究张謇文旅资源的重要素材。笔者针对这些资料中提及的部分张謇文旅资源展开了实地调查,对相关机构的时空变迁信息进行了详细记录,以确保资料的时效性与准确性。此外,还选取南通大学自主研发的“张謇研究特色数据库”①作为相关数字化资料来源,该数据库收录了大量国内外各类张謇研究文献资料,如图书、期刊论文及网络资源等。将以上资料进行数字化整合,可为研究提供坚实的史料基础。
通过光学字符识别技术(OCR)对多方面搜集而来的纸本资料进行数字化整理,将识别结果进行输出保存;在对数字化资源的外部特征与内容特征的分析、选择、标引、处理后,进一步对其进行规范化、有序化加工与处理。最终共整理、加工得到张謇文旅实体162例,相关参考文献信息1391条以及通过实地拍摄采集的170个图像和音视频等多媒体素材;采用国际通用的元数据规范标准对这些资料进行描述,并采用关系型数据库进行存储与管理,形成张謇文旅资源基本素材库。
本体作为重要的知识组织方法论,近年来被广泛运用于图档博领域知识的描述。笔者在已有本体理论与国内外相关本体模型及词表基础上,按照领域本体设计思路与构建步骤,尝试构建张謇文旅资源知识本体。
结合张謇文旅资源的特点以及数字人文环境下知识服务的需要,梳理、提炼并列举相关概念和重要术语,将其中具有综合性和概念性的核心概念作为本体的类,如文旅资源实体、地理位置、事件、人物、时间等。张謇文旅资源知识本体参考借鉴了GeoNames[20]、FOAF[21]等本体词表以及都柏林核心元数据标准,设置了7个核心类:文旅资源(Resources)、相关人物(People)、事件(Event)、地理位置(Geographical Location)、时间(Time)、资源类型(Resources-Type)、文献资源(Document Resource)等。每一类中包含相应的数据属性,实体之间的关系通过对象属性来描述,共计有80个属性,张謇文旅资源知识本体模型如图2所示。前缀“zjwl”为该知识本体的命名空间(Namespace)。
图2 张謇文旅资源本体模型
4.3.1 文旅资源类
为更加详细地表示张謇文旅资源实体信息,笔者在复用已有词表的基础上同时自建了若干属性,包括曾用名、现用名、分类名称、简介、相关人物、地理位置、资源类型、事件等,从多个角度对张謇文旅资源实体进行详细描述。文旅资源类及其属性如图3所示。
图3 文旅资源类及其属性
4.3.2 相关人物类
在对历史人物进行研究时,其社会网络关系必不可少,将人物之间的关系进行关联与展示,能够较为直观地理解相关人物之间的关系,挖掘其背后的历史故事。张謇作为中国近代历史的重要人物,曾与清末民初各领域的著名人物有过交集,如翁同龢、盛宣怀、蔡元培、梅兰芳等。结合FOAF本体模型建立的相关人物类(People)及其属性如图4所示。
图4 相关人物类及其属性
4.3.3 事件类
事件类包括时间、人物、后一事件、前一事件、参考文献、事件概述等属性,以便更直观、清晰地揭示张謇文旅资源实体的相关历史事件。通过构建发生的前一事件以及后一事件的关联性,可反映某一文旅资源随时间的发展而变化的情况。事件类及其属性如图5所示。
图5 事件类及其属性
4.3.4 其他类及关联关系
此外,张謇文旅资源本体还包括地理位置类、时间类、资源类型类以及文献资源类。地理位置类包含张謇文旅资源具体的地理位置信息,如经度、纬度等,该类的属性构建参考了GeoNames本体词表。时间类用来描述某一事件,复用了上海图书馆Temporal[22]本体词表(中国历史纪年)以及Time[23]本体词表中的Year(公元纪年)属性。资源类型类包含文本、图片、视频及音频4个子类,便于对张謇文旅资源进行多角度描述。文献资源类是指与张謇文旅资源相关的各类书目文献,包括书目的题名、描述、来源等属性。
在本体模型中主要通过定义对象属性,对实体间的关联关系进行描述与表示。如表1所示,定义的42个对象属性及其定义域与值域中有24个对象属性用于描述相关实体之间的联系,可将相关文旅资源进行知识关联,进而形成知识网络框架。
表1 实体联系
最终,将素材库中的文旅资源实体“南通博物苑”代入此本体模型中进行验证,检验该模型对于张謇文旅资源领域知识组织的合理性与有效性(见图6)。
图6 张謇文旅资源知识本体模型验证——“南通博物苑”
在对张謇文旅资源进行语义化知识组织后,可通过关联数据技术实现张謇文旅资源数据集的构建与发布,进而实现该领域数据的开放与共享;在此基础上,可进一步构建涵盖知识库、微信小程序的张謇文旅资源知识服务平台。该平台不仅可为相关领域学者提供知识检索以及知识图谱服务,还可为大众提供文旅资源导览信息、在线思政课程、线下研学、文创产品销售等一系列公共数字文化服务。
4.4.1 张謇文旅资源关联数据发布与可视化
关联数据作为语义网的轻量级解决方案,有助于将张謇文旅资源中的显性及隐性知识激活,并能与其他开放数据集进行关联,形成可被人与机器理解与处理的结构化资料。首先,采用RDB2RDF映射的方法[24]将基本素材库中的数据转换为RDF数据模型,具体方法为通过Java程序读取素材库中的数据,采用32位内部唯一标识符UUID来进行标识,再根据本体模型的映射关系将其转换成关联数据,并生成相应的RDF/XML文件,存储于OpenLink Virtuoso②这一典型Triple Store数据库中。其次,遵循关联数据发布四原则[25],基于Virtuoso数据库通过配置服务器对外进行张謇文旅资源关联数据的发布。最后,可以根据不同应用场景为用户进行可视化展示。如图7所示,以“颐生酒厂”为例,采用Lodlive③工具对关联数据进行知识图谱展示,描绘出所记载的颐生酒厂的简介、发展历程、相关人物等信息,并结合地名关联数据中的经纬度信息在地图上显示出分布情况。
图7 张謇相关文旅资源可视化展示——以颐生酒厂为例
4.4.2 “张謇印迹”微信小程序设计与实现
“张謇印迹”微信小程序基于Spring-Boot④框架进行后台开发,以控制层、业务逻辑层和持久层3层架构模型为基础,整合持久层框架MyBatis⑤、安全认证框架Shiro⑥和JWT⑦、缓存Redis⑧以及接口文档工具Swagger⑨等多种技术框架,以实现各类数据的接口需求;前端使用微信开发者工具,利用WXSS、WXML和JavaScript等技术,通过UI设计,实现文旅资源知识可视化、地图导览、用户研学打卡、在线课程、文创产品销售等功能模块页面。通过该小程序,用户可以方便快捷地寻找周边的张謇文旅资源,并通过地图导航前往;在文旅资源详情界面上,用户还可了解到相关景点的简介及发展历程,并通过预先录制的语音信息进行在线导览,获取与景点相关的历史文献资料信息、历史人物信息以及具有关联性的其他景点信息;此外,用户还可以进行在线评论或观赏相关思政课程视频。
基于张謇文旅资源知识服务平台,从数字人文研究、文旅资源导览、思政教育推广等方面,探讨张謇文旅资源的深度利用场景。
在数字人文研究方面,张謇文旅资源相关文献资料的搜集整理、数字化以及数据化,将进一步夯实张謇研究的数字史料基础;基于本体与关联数据技术实现资源的语义化知识组织,将激活蕴含在传统文献中的隐性知识,有助于在更大范围内对领域资源进行知识聚合;张謇文旅资源知识服务平台也将成为国内相关领域数字人文研究基础设施的重要组成部分,为学者提供研究平台与工具支撑。
在文旅资源导览方面,“张謇印迹”微信小程序具备“用完即走,无需下载”的特点,将数字技术融入文旅资源展示、用户互动等环节中,满足用户精准化与智能化的服务体验需求。如,采用原创图标对不同类型的景点进行标识,使用户可以直观地了解各类景点分布;通过设计自定义地图样式,可直接在地图页面预览景点图像,方便用户快捷获取相关景点信息,进一步提升地图展示效果及用户体验;用户还可通过线上讲解音频实现足不出户的“云游览”。
习近平总书记参观南通博物苑时指出:“张謇的事迹很有教育意义,要把这里作为爱国主义教育基地,让更多人特别是广大青少年受到教育,坚定‘四个自信’[1]。”张謇文旅资源作为重要的地方特色文化资源也为青少年思政教育的开展提供了有力支撑。在此方面,可基于张謇文旅资源知识服务平台,以张謇数字化史料为基础,充分挖掘张謇先生的生平逸事与爱国事迹,推出大学生思政教育线上课程以及原创短剧视频;还可定期发布张謇研究名家访谈视频;或是结合微信小程序开展线下张謇文旅机构研学活动等。未来还可进一步将知识库、小程序以及思政教育进行有机整合,构建大学生思政教育文旅云基地,帮助其在实践活动中学习张謇事迹,传承与弘扬张謇精神。
总之,张謇文旅资源的开发及利用是一个循环迭代的过程,张謇文旅资源知识服务平台的构建也并非一蹴而就,在构建过程中还应注意收集用户的使用反馈,相关功能与内容也需要持续升级更新,以满足各类用户的知识服务需求。
我国历史文化悠久,地方名贤辈出,与之相关的文旅资源也数不胜数,对这些文旅资源进行深度开发将有助于深化文旅融合,推动文旅产业转型升级,同时也可进一步提升相关机构的公共数字文化服务能力。笔者基于数字人文视角,针对张謇文旅资源进行广泛搜集整理与数字化加工,在此基础上展开语义化知识组织,并构建张謇文旅知识服务平台,不仅可以深入挖掘异构多源的张謇文旅资源,彰显其当代价值,还可以此为例探讨以历史名贤为核心的文旅资源开发与利用新模式。未来,应不断发掘新的资源,将线上线下资源有机融合,对张謇文旅资源进行数字叙事,引入AR、VR以及数字人等最新技术,以开发张謇文旅元宇宙为目标,探索更加多元化、智慧化的文旅融合发展之道。
注释:
① http://zjyj.ntu.edu.cn/.
② https://www.openlinksw.com.
③ http://lodview.it.
④ https://spring.io/projects/spring-boot/.
⑤ https://mybatis.org/mybatis-3/.
⑥ https://shiro.apache.org/.
⑦ https://jwt.io/.
⑧ https://redis.io/.
⑨ http://swagger.io/.