基于数字人文的城市记忆资源整合与服务研究

2021-08-11 17:53王光华裴阳常金玲
档案管理 2021年4期
关键词:数字人文资源整合数据挖掘

王光华 裴阳 常金玲

摘 要:本文以档案记忆观、数字人文等为理论基础,分析了现阶段城市记忆资源整合与城市记忆服务等方面的不足,对城市记忆资源搜集、存储、整合主体等进行了探讨;以城市记忆服务原则为基础,提出专业化、普及化、定制化三种城市记忆服务类型。

关键词:城市记忆;数字人文;资源整合;城市记忆服务;数据挖掘

1 理论基础

1.1 档案记忆观。1997年冯惠玲在博士论文《拥有新记忆——电子文件管理研究》中首次提出了社会记忆。2004年召开的第十五届国际档案大会针对档案、记忆与知识之间的关系进行了讨论,从而进一步促进了档案记忆观的形成。[1]

档案记忆观兴起的原因主要包含以下几个方面:其一,“世界记忆工程”的开展,[2]提出档案是文化遗产的重要组成部分,档案馆是人类记忆的重要保存场所。其二,电子文件的发展。无论什么类型的记忆载体,纸质、实物、电子等,都不可避免地与城市记忆建设有关系。其三,社会记忆理论的发展。社会记忆作为一种客观存在的集体记忆,不仅存在于档案、图书等中,也存在于公众的个体记忆中。

1.2 数字人文。数字人文主要包括以下几种技术方法:①数字化技术,如扫描、拍摄、采样、图形设计、3D建模等;②数据处理技术,如文本编码、数据库技术、语义检索等;③数据分析技术,如聚类分析、相关主题分析、数据挖掘、社会网络分析等;④VR/AR技术,如人机交互、互动测量、游戏化学习等;⑤机器学习技术,如图像、音视频识别、个性化推荐、深度学习等。

数字人文经过十几年的发展,我国已在文学、历史、地理、艺术等学科领域开始多个数字人文实践并取得一定的成果。[3]在数字人文应用研究方面,目前在GIS、数字考古、可视化展示、数据挖掘等领域有着较为丰富的研究成果。[4]

2 基于数字人文的城市记忆资源整合研究

2.1 聚类分析确定城市记忆主题整合方向。通过利用主体目的分析、获取数据源信息、数据清洗处理、聚类及判别分析效果等步骤加以实现。[5]2.2 数据挖掘助力资源深层整合2.2.1 实现城市记忆资源的多重脉络解读。一方面,数字人文环境下可对城市记忆资源从多角度进行多重路径分析,从而实现从多维度对目标进行多重脉络解读,增强目标的立体感。另一方面,能对人物、时间、地点、事件等信息进行社会关系揭示。依据一定的关联规则,以人物关键词为中心,形成人——事——物之间的社会网络,能够从宏观上把握人物生平信息。

2.2.2 创新资料编研工作。首先,城市记忆工程中的资料编研工作的起点应该是用户需求,数据挖掘技术善于从海量数据中挖掘得到有意义数据模式的特征。

其次,针对城市记忆编研主题,运用数据挖掘技术得到关于不同层次用户的群体画像,基于此对城市记忆资源进行整合,可以实现资源与用户之间的有效连接,提升城市记忆工程服务的精准度。

然后,针对资料的深层挖掘工作,针对某个时期的专题分析,可从经济、历史、环境等方面进行综合分析,从而构建有意义的社会网络,实现相关资料从浅层到深层的挖掘,充分发挥资料的作用。

2.2.3 关联数据优化信息融合。用户需求并不限于资源本身,还追求数据之间的联系,这就要求城市记忆服务能提供给用户全面、多类型的资源。

关联数据技术可以实现在多数据库之间的数据关联,因此需要构建包括资源主题、人物、时间、地点等语义内容信息,实现信息的深度挖掘,提升城市记忆工程的服务水平。[6]

2.3 数字技术促进城市记忆资源建设。城市记忆整合工作的目标在于进行城市记忆资源建设,从而得到相应的专题数据库,数字人文相关技术针对城市记忆资源可以实现资源从收集、存储、分析、挖掘到整合等工作的一体化。从城市记忆资源来源渠道分析,档案馆、图书馆、博物馆等机构拥有着不同种类、数量、层面的记忆资源,这些机构是城市记忆工程的建设主体,实现这些机构、组织、个人之间的城市记忆资源共享,对城市记忆资源搜集与整合等工作具有重要作用。

3 基于数字人文的城市记忆服务研究

3.1 基于数字人文的城市记忆服务类型

3.1.1 專业化服务。专业化城市记忆服务从用户需求出发,匹配度较高、权威性较强。提供的服务成果主要包括:城市记忆资源原始资料,政府相关机构可以运用这些资料对城市的发展找到定位点;建立专门库,定向服务用户,确保与用户之间的密切联系。

3.1.2 普及化服务。普及化服务是一种针对普通公众的服务方式,可通过线下和线上两种路径来实现城市记忆服务。线下服务一方面可以使用电视、图书等进行编研成果展示,另一方面可采用展览、讲座、影片播放等形式传播城市记忆。

3.1.3 定制化服务。定制化服务也以需求为导向进行城市记忆资源开发,但是它的服务对象主要针对在校学生,其目标在于为学生上课提供专业化的服务。首先,需要确定课堂对城市记忆需求的方向。其次,需要相关师生参与。然后进行成果展示。最后是数据反馈,以便进行调整。

3.2 基于数字人文技术的城市记忆服务优化途径

3.2.1 数据关联技术优化检索性能。数据关联技术具有建立数据关系的功能,其特点天然与检索服务相近。城市记忆工程为公众提供服务的时候,需要考虑到公众的检索需求,除了提供大众化的主题检索外,还应该提供高级检索功能,支持关键词、语义检索等功能,数据关联技术在实现数据库资源关联的基础上,能实现以上功能,比如关键词检索,通过数据关联技术以人名为关键词,将时间、事件进行关联,构建网络,当用户以关键词进行检索,无论是键入人名还是事件均可以得到相近结果,能提高检索系统的查全率。

同时,数据关联技术不仅能实现文本信息的关联,也能支撑图片、音视频等非结构化数据的检索,并将各种数据类型关联在一起。例如,用户在查询曹操时,可以将三国历史、相关人物、主要事件等相关信息通过文本、图片、音视频等形式一起呈现给用户,为用户提供多类型的信息,不仅提高了检索系统的查准率,也能较好地降低由此带来的查全率降低问题,既提高了相关服务效率,也能提升公众的检索体验。

3.2.2 VR/AR创新服务方式。VR/AR技术可以用于线上、线下服务的结合。

一是创新线下服务方式。AR技术通过虚拟图像建模,并利用物理设备采集图像,从而实现在现实世界中看到虚拟物体。二是沉浸式体验的线上服务方式。VR技术通过计算机虚拟一个全新视角,通过专门设备(头盔、眼镜等)进行虚拟环境体验,通过检测用户头及行动方位的改变,将其反映到虚拟内容中,提供沉浸式体验。在城市记忆服务过程中,无论是线上或是线下城市记忆展示,都可以结合AR/VR技术,创新服务方式增强用户身临其境之感,提升服务质量。

3.2.3 可视化技术助力成果展示。可视化手段在具体城市记忆服务方面,运用可视化技术,可以实现展示发展变化和挖掘新信息两种场景。

展示多年来城市发展变化。利用可视化手段,可以将城市每一年的发展变化通过图形、表格或者动画等形式进行立体展示,通过标记每一年城市的数据节点,准确为用户提供城市发展中的关键节点,可以为人们感受城市变迁带来新的体验。

挖掘新的信息。数据可视化可以为用户展示城市记忆发展变化,从得到的图表、动画中,可以挖掘出新的信息,从大量数据中得到的具有规律的某些数据能够体现出当前城市在某些方面的发展前景,比如从“城市人口”历年变化曲线中,可以分析出目前城市人口的增长率、劳动力现状,从而分析出城市在社会中的竞争活力等信息。

4 结论

城市记忆服务过程中需要以用户需求为导向,进而为城市记忆资源整合提供方向。在资源整合过程中,利用数据库技术对海量的异构数据进行保存,为资源开发打下基础。运用数据挖掘技术可以有效地对数据中的人、物、事等构建社会网络,理清人物与社会的关系,通过挖掘用户之間的联系,可将用户与资源密切关联,可重点关注高频使用资源与人物信息,从而实现城市记忆资源的多重关系解读。利用关联技术可以优化城市记忆资源检索服务,打破传统依靠关键词、词组等字段检索方式,引入全文检索、跨库检索等技术,通过添加高级检索方式,允许用户自定义检索式,优化检索服务,提升检索查全率与查准率。利用VR/AR、可视化等技术可以有效地创新城市记忆服务方式。

城市记忆资源整合工作是城市记忆服务的基础,但服务工作也引导着城市记忆资源的整合方向,通过对服务对象需求进行分析,能引导资源整合方向,有效提升资源整合效率,从而为人们提供更好的服务。

*本文系2019年度河南省哲学社会科学规划项目——基于数字人文的新中国工业遗产档案保护与开发研究(2019BZH006)资助成果。

猜你喜欢
数字人文资源整合数据挖掘
少先队活动与校外资源整合的实践与探索
探讨人工智能与数据挖掘发展趋势
“五育并举”下家校社资源整合的价值意义
海外并购中的人力资源整合之道
智慧高速资源整合方式实践
基于并行计算的大数据挖掘在电网中的应用
数字学术与公众科学:数字图书馆新生态
跨界与融合:全球视野下的数字人文
跨界与融合:全球视野下的数字人文
大规模古籍文本在中国史定量研究中的应用探索