图档博融合服务中数字资源整合策略研究

2019-01-09 22:26吉林大学档案馆
浙江档案 2019年11期
关键词:资源整合数字融合

王 静 李 烁/吉林大学档案馆

图书馆、档案馆和博物馆(以下简称图档博)是国家公众文化服务体系的重要组成部分,三者虽然彼此独立,但在文化遗产数字化加工保存、政府信息管理与服务、民主社会与公民信息获取权保障、终身学习推动等方面有共同的愿景与职责[1],在业务模式、资源属性以及服务对象上有着极大的趋同性。开展三馆间的深层次合作,在一个更加宽泛的框架内配置资源, 为用户提供全方位、一体化的信息资源服务,已成为学术界和实际工作者的关注热点。笔者通过文献研究方法对国内外图档博融合服务中的数字资源整合现状进行了对比研究,分析总结了国外图档博数字资源整合特色优势,并以此为基础探讨了符合我国国情的图档博数字资源整合策略。

1 国内外图档博数字资源整合的研究分析

为全面掌握国内外相关研究现状,笔者在中国知网上以“图档博/图书档案博物+数字资源整合”为关键词进行了精确检索,共检索到相关论文156篇,其中2013年前并没有相关论著产生,2014年后论著数量呈波动增长趋势。从论著引用频次、相关知识点的图谱分析来看,国内研究偏重于讨论数字文化资源整合的概念、意义、趋势,分析面临的问题,以及介绍国外数字资源整合的项目实践状况,并提出了其中可供借鉴的地方。如,朱学芳在介绍国内外三馆信息资源服务融合研究成果情况基础上,针对我国三馆信息资源特征,提出需要加强档案、博物资源的共建共享以及资源融合服务的理论和实践的研究工作[2];肖希明对国外图档博数字资源整合研究和实践探索的最新进展进行了综述,内容涉及数字资源整合的背景、政策、平台建设、发展趋势等方面[3];戴艳清通过深度访谈和网上调查等方式,对湖南当地的公益性数字文化资源整合情况进行了实例分析,指出存在资源共建机构单一、可获取性不强,整合欠深入等问题[4]。以上研究工作为国内图档博数字资源整合奠定了基础并指明了发展方向,然而对于资源整合技术标准、资源整合平台建设等方面的研究稍显不足,也尚未提出较多切实可行的数字资源整合策略,用以指导三馆融合服务项目的开展。

相比而言,欧美发达国家图档博三者间的资源共建共享和服务融合方面的研究与实践成果较为丰富。自1998年Boyd Rayward教授发表首篇图档博数字资源整合的论文开始,有关三馆数字资源整合的讨论就逐渐兴起[5]。2002年至今,每年都有以图档博数字资源整合为主题召开的学术会议[6],讨论范围涉及数字资源的融合及相关技术的发展、对历史文化遗产的数字化和保存、图档博教育的变革以及数字资源整合平台建设等方面。与此同时,在实践领域也产生了一系列代表性项目,如世界数字图书馆(WDL)[7]、欧洲虚拟博物馆(Europeana)[8]、美国联机图书馆中心(OCLC)[9]、德国图书馆、档案馆和博物馆门户(BAMP)[10]等,其中部分实践项目开放了开发指南网站供研究人员使用。这些项目资料以及相关研究论文也为指导国外数字资源整合理论以及实际工作的可持续发展提供了帮助。

2 国外图档博数字资源整合的特色与优势

一是基于广泛合作的模式开展资源建设与服务。资源共建单位既包括图档博三馆,也可根据项目需求扩展至其他文化部门乃至其他领域。相关项目具有资源内容丰富多样、载体形式多变等特点,因而项目的资源内容覆盖面全、资源分类方式多样化。以WDL为例,该项目的资源来源机构包括图书馆、档案馆、基金会、协会、个体公司等多个单位,资源包括手稿、地图、珍本书籍、乐谱、录音、电影、印刷品、照片、建筑图等多种类型。

二是资源组织标准化与关联化。由于原始数据资源存在海量、分散与异构等特征,国外相关项目均采用了与将要开展的服务模式相适应的元数据标准来规范这些数据信息。同时为保证资源间的延续性及互操作性,还在不同程度上构建了资源间的关联关系。此外不同项目的实现细节不尽相同,如WDL和BAMP自建元数据标准并采用较为简单的超链接形式实现资源间的互联,而Europeana基于较为成熟的DC元数据标准扩展了自己的元数据标准,在此基础上又基于关联数据RDF及元数据及其封装标准METS,设计了开放、跨领域的EDM数据模型,实现资源间的语义关联。

三是建立了完备的资源融合与服务平台。图档博数字资源整合的最终目标就是满足用户的信息需求,而这一过程需要搭载一个功能稳定、完备的平台来实现。国外相关项目在平台建设之初即充分考虑资源的采集方式、资源整合后的呈现方式、资源的分类体系设置以及专家智慧与技术应用的融合等方面,由此带给用户较好的交互体验。以Europeana为例,截至2015年底已有37个国家的3500个机构参与进来,用户可直接存取超过4800万条的数据信息;该项目还充分利用图像、视频、音频、地图、动画等,设计出具有高度亲和力和很强互动性的用户界面,并支持欧盟官方语言中的24种语言查询,为用户提供基于资源内容、时间表等多种形式的浏览模式[11]。Europeana平台构建及运营模式较为成熟,平台的功能齐全完备,值得深入研究与推广。

3 符合国情的图档博资源整合策略

3.1 规划资源整合内容及范围

三馆的数字资源包含着各种形式的结构化信息、半结构化信息和非结构化信息,工作人员首先应对这些数据进行甄选和优化。此外,数字资源的特征以及组织方式对后期融合服务开展的模式起到决定性作用,因此在融合工作开展的初期就要进行规划。初期的工作可分为:(1)建立周密的资源建设计划,数字化的书籍、原始档案、期刊、编研产品、多媒体资源、史料、藏品等都应纳入资源建设范围,以扩大资源覆盖面、优化资源结构;(2)三馆协商并明确待整合的资源类型及范畴,该范畴的划定既要遵守相关法律法规,也要尊重三馆原有传统;(3)根据预计开展的服务模式定义采集分类标准,可按照资源的外在特征如题名、时间、作者、格式、来源、载体等,也可按照内在特征如主题、类别等。

3.2 实现元数据标准的本土化

都柏林核心集DC是一种跨领域的信息资源描述标准,其以简便高效的特性获得了广泛的认可。很多大型的数字资源建设项目如Europeana、CALIMERA、我国的“数字图书馆推广工程”等,都基于这一标准构建了自己的元数据标准。新标准开发也可以DC为基础,融合机构类型、资源类型以及预期开展的服务模式等,制定核心元素集。实现过程可按照资源属性,分为归纳与提炼、扩展与个性化两个环节,第一个环节应提取每类资源的最基本的核心字段以及最能体现该类资源特质的个性字段,并对同语义、近语义字段进行归并与凝炼;第二个环节应根据具体资源类型的特征,通过横向扩展(增加元素)或纵向扩展(增加修饰词)建立各资源类型特有的元数据[12]。由于数字资源的来源、形式、载体各异,因此制定核心元素集时可参考其他国际通用标准,如图书馆广泛应用的机读目录格式MARC、档案国际编码著录标准EAD、艺术作品描述类目CDWA、视觉资源协会核心类目VRACore等。

3.3 实现数据资源的关联化

资源间关联度的不同在很大程度上决定了平台后续开展服务形式的差异。国外WDL和BAMP项目的主要服务模式为提供较为简单的文化资源的检索和浏览,因此仅需实现资源外在特征上的整合即可;而Europeana项目可以为用户提供基于资源内容深度整合的服务,因此在资源组织过程中引入了RDF技术来建立资源间的内外部关联。鉴于互联网时代用户对信息资源的需求趋于个性化、知识化和精准化,故建议采集而来的数据资源在元数据转换完毕后,通过统一资源标识符(URI)以及资源描述框架(RDF)进行资源重构。

3.4 构建资源整合与服务平台

整合图档博数字资源,需要根据用户需求构建融合三馆资源的“一站式”服务平台。应当注意到,这个平台不应只是用简易的接口技术实现三者之间的系统互联,也不应只是将不同类目的资源进行简单罗列,或将不同的搜索引擎进行简单聚合;平台应当保障资源得到标准化、关联化、知识化的深度加工,能将信息资源组打造成为贴近用户需求的数字文化产品,并能按照用户的个性化需求展示检索结果。因此平台在开发时就应将门户网站的需求分析、功能设计、搜索引擎以及导航菜单的设计、资源的分类采集模式和存储模式、移动服务模式的开发与应用、集成服务的实现机制等进行全面规划,并充分利用多语言技术、可视化技术、WEB3.0技术、云存储等现代化信息技术提升资源的利用效率。数据的相似度分析、聚类分析、数据挖掘等数据处理技术也可引入进来,进一步分析与挖掘资源间的潜在联系,从而提升资源质量。

猜你喜欢
资源整合数字融合
少先队活动与校外资源整合的实践与探索
村企党建联建融合共赢
融合菜
浅谈资源整合在博物馆教育工作中的应用
从创新出发,与高考数列相遇、融合
“五育并举”下家校社资源整合的价值意义
《融合》
海外并购中的人力资源整合之道
答数字
数字看G20