国内外档案信息资源共享平台研究综述

2020-11-30 04:33静,方
关键词:资源共享信息研究

杨 静,方 路

(1.盐城师范学院 公共管理学院,江苏 盐城 224007;2.郑州大学 信息管理学院,河南 郑州 450001)

2000年全国档案工作会议通过的《全国档案事业发展“十五”计划》首次明确提出了档案信息化建设概念。2011年国家档案局颁布《全国档案事业发展“十二五”规划》,提出打造“一站式”档案信息资源共享和服务平台的构想,为社会提供全方位的档案信息服务[1]。2012年,杨冬权在全国档案局馆长会议上提出当年将搭建“全国开放档案信息资源共享平台”。自此掀起了档案信息资源共享平台的研究热潮,各地档案部门和业务部门纷纷建设共享平台项目,“长三角民生档案区域共享”等各地区民生档案资源共享政策逐步实施。档案信息资源共享是信息化时代理论和实践领域都十分关注的重点话题。大数据时代档案信息资源共享平台的科学构建已经成为档案资源共享顺利实现的重要一环。笔者试对国内外关于档案信息资源共享平台相关代表性研究主题进行研究与分析,以期收获一二。

一、数据来源与文献分布

本文选取的中文文献数据来自中国知网期刊全文数据库(CNKI)及博硕士论文数据库,篇名检索式为“档案”+“共享平台”。为进一步考察大数据背景下档案信息资源共享平台构建的状况,本文还选取了篇名为:“大数据”+“档案”+“共享”/“共享平台”,并增加了主题检索式为“大数据”+“档案”+“共享平台”的代表性文献进行了统计,检索结果详见表1。从检索结果可见:国内关于档案共享研究较多,其中关于档案信息资源共享平台的研究已有一定成果。外文文献来自Web of Science数据库,为保证检全率,笔者分别用四种检索式进行数据搜集:以直接相关的检索式Ti=(archiv*OR record OR document)AND(share OR sharing OR shared)AND platform进行检索,仅得到14篇文献,最终检索结果详见表2。从检索结果可以看出:国外关于档案信息资源共享有较为丰富的研究成果,但关于档案信息资源共享平台的研究还较缺乏,尚未有关于大数据背景下档案信息资源共享性平台构建的成果,而关于信息资源共享平台的研究成果较为丰富。利用ENDNOTE、Excel等软件对搜索到的文献进行数据清理和辅助分析后,最终选取与档案信息资源共享平台研究最相关的中文67篇、英文36篇文献进行主题分析。

表1 国内相关文献初步检索结果

表2 国外相关文献初步检索结果

二、国内档案信息资源共享平台研究主题分布

信息时代,档案信息资源共享平台的建立,为电子政务建设、信息公开和便民服务提供了有力支撑。通过对已有文献梳理,笔者发现,学者们对档案信息资源共享平台的相关研究主要围绕档案信息资源共享平台的内涵、平台的模型构建、平台的技术框架及体系结构、各实践领域档案信息资源共享平台构建设想、平台服务模式的转变、平台的安全管理、大数据时代的档案信息资源共享平台构建等7个主题展开。

(一)档案信息资源共享平台的内涵

目前在政府、医疗、高校等领域,以及针对某一省、市档案信息资源共享平台的研究成果中,皆有关于档案信息资源共享平台内涵的解读。如蒋月红[2]认为,医疗档案信息资源共享平台是能够对医疗档案数据进行全面采集、汇总、保存并提供实时利用,实现医疗档案资源互联共享的信息平台,这一平台一般由多个相关系统组成。王伟华[3]认为,农村档案信息资源共享平台,就是通过采用信息化技术,建立和完善农村档案信息资源整合的应用机制,推进档案资源社会共享步伐的平台。此外,还有学者结合信息技术手段从更微观的视角进行内涵探讨,如张文元[4]在分析社交媒体特点的基础上提出社交媒体档案信息资源共享平台服务的概念,即将各类档案资源有机链接成一个整体,通过优化聚合、体系重构等多种功能动态集成,以满足社交媒体用户的特定需求,这是一种全过程、全方位的新型服务模式。

学者们依据各类档案信息资源共享平台的属性进行相应的概念界定,基本确定档案信息资源共享平台是一种基于互联网技术,整合了采集、审核、存储、发布、共享利用功能的软、硬件集合[5],实现档案信息资源的集中管理,满足用户“一站式”利用需求的平台。平台自身并不产生信息,平台具有技术依赖性、客体(即供给档案信息资源共享平台的数据库、软件系统、档案网站、数字档案馆)来源多样性、信息资源共享性、服务主体社会性等内涵特征。总体来看,学者们对档案信息资源共享平台的概念界定虽存在一定差异,但对其内涵认知基本一致。

(二)档案信息资源共享平台的模型构建

目前关于该主题的研究主要表现为以下两个方面:第一,从宏观设计视角出发,围绕档案信息资源共享平台的功能模块展开模型设计;第二,立足微观视角,从档案信息资源共享平台设计的某一个功能模块进行探讨。向泽红[6]提出应用面向服务的体系结构(Service Oriented Architecture, SOA)模型设计高校档案信息资源共享平台,通过层次清晰的结构划分,实现数据层、服务层、展示层的松耦合。在数据层建立高校的宝贵资源库;服务层内嵌和集成先进的组件,以确保系统在展示层可以实现高校数据资源的收集、管理以及服务利用。林萌山[7]针对福建省数据的存储、管理方式,建议福建省公共档案信息资源共享平台采用四层架构,即数据层、业务层、Web层、客户层四层来设计共享平台模型结构。就微观层面研究而言,卞咸杰[8]就档案信息资源共享平台数据处理流程进行模型设计,提出按照确保平台设计的可扩展性、充分重视数据的采集与存储等原则来进行档案信息资源共享平台数据处理流程总体架构设计。

整体来看,无论是从宏观视角出发构建一个完整的档案信息资源共享平台模型,还是立足微观视角试图对某一功能层面展开模型设计,档案信息资源共享平台的模型构建始终离不开各种技术手段的支撑,而基于某项技术构建的平台模型必然涉及软件兼容性、信息安全、运营管理等多种问题。因此,学者们在研究的过程中不能只看到该项技术的优势,还应科学分析该技术的不足,以保证理念模型能合理地运用到实践领域中去。

(三)档案信息资源共享平台的技术框架及体系结构

现有关于档案信息资源共享平台的技术框架的研究主要集中于对共享平台功能实现支撑技术的描述。福建省公共档案信息共享平台应用多层体系架构的J2EE技术、智能搜索技术、基于TRS搜索引擎技术基础的智能全文检索技术、数据迁移技术、数字签名技术、身份认定及数据加密技术、可信Web Service技术以及异构资源的整合等技术手段,实现了公共档案信息的管理与查询[9]。芜湖市档案信息互联共享管理平台的实现依托ASO.NET 2.0技术框架[10]。卞咸杰提出用WCF(Windows Communication Foundation)技术构建具有跨平台功能的档案信息资源共享平台[11],采用Hadoop技术,从数据采集、数据清洗与预处理、数据存储及管理、数据展现等方面设计出平台数据处理流程的模型[8]。

如果说上文关于档案信息资源共享平台模型构建描述了平台的宏观框架,那么关于档案信息资源共享体系结构的研究则更侧重于描述平台的微观功能。学者们主要依据各平台项目需求及要实现的共享目标进行各应用系统体系结构的设计。林萌山[7]将福建省公共档案信息共享平台项目分为统一门户系统、馆藏公共档案信息管理系统、馆藏公共档案信息发布系统等。林慕婵、梁鸣以华南农业大学为例,设计了资源平台建设、管理平台建设、服务平台建设、安全平台建设四个层次的体系结构。在医学领域,衢州市第三医院积极开展医疗档案信息资源共享平台建设,建成了临床信息系统(Hospital Information System, HIS)、图像储存传输系统(Picture Archiving and Communication Systems, PACS)、电子病历系统(Electronic Medical Record, EMR)[2]。福建泉州市农村档案信息资源共享平台规划设计了馆藏介绍、政务信息公开、档案检索、网上展厅、档案知识、查档咨询台、档案管理软件7大模块,内含21项功能应用。

(四)各实践领域档案信息资源共享平台的构建设想

2011年国家档案局中央档案馆发布的《全国档案事业发发展“十二五”规划》为各地各类档案信息资源共享平台建设提供了政策支持,加之早期信息化基础建设成果初见成效,丰富的数字化资源为信息服务平台提供了坚实的资源保障,社会和公众对档案利用需求已由对本馆的档案资源需求升级为跨馆、跨区域的利用需求[12],这些条件皆为各地各领域档案信息共享平台构建的实践探索提供了可行性与必要性条件。有学者依据档案信息资源共享现实需求状况提出诸如医疗档案、健康档案、高校毕业生信用档案、农村档案、照片档案、高校科研档案、海洋档案资源、历史档案等不同领域档案资源以及档案教育资源共享平台的构建需求及实现设想。如重庆市农村档案信息资源共享平台上载有关于“三农”方面的公开信息和已开放档案信息,供互联网远程教育终端使用,实现包括档案信息和知识在内的远程教育,确保重庆市农村档案信息资源共享工程获得稳定、可靠、覆盖面广的共享渠道,为实现农村档案信息资源共享奠定了坚实基础[13]。也有学者依据各地现实状况进行地区档案信息资源共享平台构建的研究设计,如刘雯雯[14]在分析构建区域性档案信息资源共享平台必要性和可行性的基础上,提出整合当前区域内各级档案馆及相关部门信息化建设成果,建设一个统一的、标准化的数字化档案应用平台的策略;也有关于某个地区档案信息资源共享平台的专门性研究,如黑龙江省、福建省、辽宁省、芜湖市、南京市、重庆市、文登市等地区皆有学者进行了专门性探讨。

(五)档案信息资源共享平台服务模式的转变

传统档案信息化过程中,档案部门往往重技术轻服务,导致档案信息资源利用效果不佳。党的十八大之后,全国各级档案部门根据“新四化”要求,提出档案信息化应该从过去以技术为主导转变以服务为主导,从注重应用技术向注重档案内容信息化转变,建设以服务为主导的档案信息化体系[15]。档案信息共享平台在建设过程中也需不断“反思”,从注重为管理部门内部服务向社会外部服务转变,由注重单向技术研究向注重技术与内容并重转变。学者们对这一主题的探讨多从用户视角出发,统筹考虑用户个性化、多样化的信息需求,实现资源共享最大化。如徐桂珍[16]等认为,在社交媒体背景下,档案信息资源共享平台模式应从以往被动服务向主动服务转变,档案信息资源共享平台服务应切实以用户为服务目标,用多样化的社交媒体让信息流通起来。任民锋、张银娜[17]提出建立以用户需求为动力源的图书档案创新资源开放和深入服务平台。还有学者提出档案部门在换位思考的基础上,可以鼓励用户主动参与信息平台的构建,真正想用户之所想,保证提供的服务质量更高、效率更快,如姚乐野、丁琳玲[18]认为,历史档案信息共享平台构建模式可以由档案馆单独构建向用户参与式构建转变,信息服务目标更加精准,进而满足用户特定需求。由此可见,档案信息资源共享平台构建中对于用户的关注度日益凸显,内容为王、用户主导将是当前及未来信息共享平台服务的主要方向。档案信息资源共享平台的未来研究可借鉴其他相关学科经验,如心理学、社会学、管理学等学科的理论、方法,加大对用户在档案信息资源共享平台实现目标方面的需求和行为等问题的探讨,创新研究思路,逐步提升档案信息资源共享平台的服务效能。

(六)档案信息资源共享平台的安全管理

国家档案局在《关于进一步加强档案安全工作的意见》中指出,各部门各单位要在环境设备安全、网络安全、系统安全、数据安全和数据载体安全等方面制定完善信息安全策略并贯彻执行,保障档案信息数据真实、完整、可用和安全[19]。据此,加强档案信息资源共享平台的安全管理引起学者的广泛关注,相关主题研究围绕各领域档案信息共享平台实践中出现的数据泄露、数据篡改、黑客攻击等安全问题展开论述,并从制度、技术、人员三个层面提出相应的解决方案。在制度层面,向阳、果越[20]通过分析院士档案资源共享平台的构建,提出强化安防措施可在制度层面上加强信息安全的知识宣传和普及,建立突发事件应急预案;周美玲[21]提出,制定平台稳定维护机制、安全防护机制、业务能力培养提高机制。在技术层面,李洪湖等人[22]认为,运用统一门户管理技术,统一用户管理、身份认证、单点登录、授权管理,统一标准规范,统一安全审计,做好系统的权限控制,可以为档案数据安全提供有力保障;王薇等人[23]认为,可以在毕业生信用档案系统平台中引入用户身份验证、数据传输加密等技术,从而维护信用共享平台数据安全。在人员安全意识层面,向阳、果越[20]认为,需要提高档案人员的安全责任意识,定期进行档案人员信息安全培训。此外,还有学者认为在平台建设、运行管理过程中应建立健全档案信息安全管理和利用的法规政策,档案行政部门应依法向社会公布档案,确保共享平台档案信息在利用工作中的安全[24]。概言之,档案信息资源平台安全管理的研究成果涉及面较广,包括对人、网络、载体、系统、技术等多方面因素的探析,相关策略多是实践基础上的经验总结,应用性较强。安全问题应贯穿信息共享平台构建全过程,但目前的研究成果侧重于对平台建设或管理过程安全问题与对策分析,前端控制思想不突出,必须将有关平台构建前的安全规划纳入整个安全体系。

(七)大数据时代档案信息资源共享平台的研究

大数据时代,要实现档案信息资源在更广的范围内共享,必须依靠规范化的共享平台作为承载和支撑[5]。相关研究主要围绕大数据背景下档案信息资源共享平台的支撑技术、平台功能模块、平台架构设计、政府和医疗领域共享平台设计、平台安全性等方面展开。关于档案信息资源共享平台的支撑技术,卞咸杰认为平台前端框架宜采用Bootstrap设计,可以在不同的移动设备上显示平台的内容,从而自动适应手机、平板、PC等主流终端设备及浏览器[25];在数据交互服务方面,卞咸杰建议采用Web API技术,以解决档案信息资源共享平台在不同设备之间的实时数据交互问题[26]。关于档案信息资源共享平台实现的各功能模块,王烁[5]认为,档案信息资源共享平台应实现信息采集、信息审核、数据发布、档案共享、信息安全等5项核心功能;就档案信息资源共享平台的数据网络传输层面、数据库层面、平台服务架构层面的功能模块,卞咸杰[27]提出了性能优化方案,以满足大数据时代系统流畅性要求,最大限度满足用户在使用平台过程中的体验。关于平台的架构设计研究,大部分学者认可采用较为常见的Browser/Server基础架构,整个平台由数据层、业务层、网络层、用户层4个层次构成[5]。关于档案信息资源共享平台的实践应用,已有研究主要聚焦在政府、医疗领域。伍颜以湖南省XT市为例,对政府档案信息资源共享平台的建设现状进行调研,指出XT市档案信息资源共享平台建设方面存在的问题,并提出优化策略[28]。关于档案信息资源共享平台的安全性问题,大部分学者认为在大数据时代更应善用技术措施维护系统安全。徐薇薇[30]认为将云计算技术应用到档案信息资源共享平台建设中,云计算后台会通过云计算的网络应用模式向用户端及时提供最新病毒和木马信息及安全免费的病毒库升级服务,防止病毒和木马对用户电脑的入侵;潘建华[31]提出监控信息资源共享平台开放端口,提高涉密人员安全意识,增设数据安全管理机构,实现储存容灾备份等策略,提高共享平台的安全性。从总体上来看,目前关于大数据背景下的档案信息资源共享平台的相关研究与大数据的实质结合度还比较欠缺,大数据特征并不明显。

三、国外档案信息资源共享平台相关研究主题分布

从已检索出的文献可以看出,目前国外还没有针对大数据环境下的档案共享研究,档案信息资源共享及档案信息共享平台的相关研究也表现出与具体某一特定实践领域有较强的关联性的特征。在信息资源共享平台方面,有相对较多的研究成果。鉴于此,笔者主要对国外档案信息资源共享平台的相关研究成果进行综述。基于文献分析,我们发现国外关于档案信息资源共享研究主题主要包括档案共享的意义、元数据方案、档案知识共享的语义描述、共享的实现途径与性能优化等内容。

(一)档案信息资源共享平台的构建意义研究

国外关于档案信息资源共享平台构建意义的研究主要表现为:通过档案数据库的建立搭建共享平台,可以纵向推动知识的传承,横向推进资源共享与合作关系构建,为实践工作提供参考和数据支撑。D. Isakeit等三人认为,尽可能多地将关于人类航天局实验档案的信息汇集到一个单一的存储库中进行共享,可以激发新的研究成果与整个科学和工业界分享所获得的全部知识,突破实验研究的长时间间隔对知识积累和传播造成的障碍,实现跨代传递知识的目标[32]。爱丁堡皇家委员会(RCAHMS)的空中侦察档案(TARA)提供了从20世纪40年代到1995年横跨欧洲大陆的人类活动记录,促进了欧洲资源的共享和伙伴关系的建立[32]。共享病理学信息网络(SPIN)为多机构检索医学信息和研究人员获取足够数量的有价值的相关电子数据提供了平台,以更好地支持医学研究人员的工作[33]。Vitalink是一个在初级保健专业人员之间共享保健病人数据的数字平台,将药物图表、电子健康记录和疫苗接种数据上载到平台上,有利于改善保健专业人员及其协会之间的协作和沟通[34]。PubChem是一个开放的化学数据档案馆,由三个主要的公共数据库(生物分析、化合物和物质)组成,能为用户提供科研支撑[35],Bolton和Evan[36]在第247届美国化学学会春季会议上就PubChem作为存档和分享科学信息平台的重要意义进行过探讨。

(二)档案信息共享平台的元数据和语义描述研究

关于档案信息资源共享平台的元数据研究,N. Ferro等二人提出了一种将编码档案描述(EAD)元数据映射到都柏林核心(DC)元数据记录而不丢失信息的方法。该方法利用数字图书馆系统(DLS)技术来加强档案元数据共享的可能性,同时考虑到相关档案需求;而且可以将档案馆所掌握的有价值的信息资源,在不同的文化遗产之间及在跨领域互动的大背景下进行开放共享[37]。M. Agosti等三人提出了一个解决跨地理区域的不同档案之间共享元数据问题的解决方案,提出一个针对区域档案提供先进服务的方案。其目的是整合不同的档案数据,以便为公众查阅提供独特的档案信息[38]。E. Mitchell探讨了支持数字数据源共享的可用元数据,包括验证级别、保管期限、利用级别(开放、灰度和保密)和社区定位(将归档分为内部构建、协作和外包)等[40]。此外,有学者指出,通过元数据的相关嵌入研究可以有效节约成本,提升搜索效率。如:使用数据共享平台可以辅助文档注释,人们可以在界面提示的创建过程中添加有价值的元数据,如果文档有适当的注释,可以在一定程度上提高搜索的质量[41]。

关于档案信息资源共享的语义描述研究,Chi Yu-Liang等提出了档案信息共享平台的本体构建的思想,研究集中在利用形式概念分析(FCA)获得概念结构的设计过程,以及描述逻辑(DL)来表示逻辑表达式中的概念关系[41]。此后,Chi Yu-liang等人进一步提出构建本体知识库来重建现有数字系统的框架,该本体知识库的开发技术包括:形式概念分析(FCA)可以作为概念提取,本体Web语言(OWL)呈现知识,描述逻辑用于定义知识公理,本体论技术为内容持有者提供了与他们的社区分享和重复使用知识的潜在方法[42]。Y. Y. Ou等人提出使用DAML为UDDL添加语义,实现一个跨政府、企业和公民代理的电子公文交换和信息共享平台的原型[43]。

(三)档案信息共享平台的实现途径与性能优化研究

第一,档案信息资源共享平台数据库的存储问题。COPPUL提供一种云保存服务,使用Archivematica数字保存系统,该服务提供给COPPUL成员机构,这些机构希望使用托管服务来安装和管理本单位数据库系统,以实现数字财产的保存[44]。D. Nikolow等人根据在美国国家数据存储2(NDS2)项目中已经完成的分布式环境中有关QoS的存储性能管理方法的研究,提出了一种新的存储服务质量管理模型,并对其在NDS2中的实现进行了描述[45]。

第二,档案信息资源共享系统的构筑。Juergen Enge等人提出了OASIS档案共享系统,该系统旨在建立一个独立于地理位置的媒体艺术作品的通用展示系统和用户友好的搜索系统,以确保媒体艺术领域文化遗产的保存和可用性(可持续性)。所有参与机构的元数据系统互联数据库可以由个人用户(研究人员和普通公众)通过在分布式系统内进行交换的多媒体档案服务器以及各种播出媒体访问[46]。

第三,档案信息资源共享平台的共建共享,即合作问题。COPPUL提供的基于云的保存服务,该服务是COPPUL、Artefacts Systems(Archivematica的主要开发人员)和英属哥伦比亚大学(UBC)图书馆(云存储提供商)共同努力的结果,COPPUL负责推广这项服务并与新机构签约,以及支付一次性设立费用;Artefacts系统提供帐户管理、安装、服务器管理和用户技术支持;UBC图书馆提供收费的服务器托管和数字对象存储服务[47]。

(四)档案信息资源共享平台的安全问题研究

R. W. Moore等人对数字网格、数字图书馆和档案馆的持续性保存以及支持数据共享、发布和存档的整合方法进行了具体的研究,研究这些数据管理系统之间如何在确保安全的前提下协同作用[48]。M. Hyun研究了描述性信息如何参与到档案网络的私人档案中,提出组织私人和社区档案网络的方向,并在其对韩国小型私人档案馆描述性信息状况调研的基础上,提出了韩国私人和社区档案网络共享描述性信息的建议[49]。K. Wouters等调查了共享数字多媒体档案受到相关威胁的问题,并描述了一个多媒体档案共享的安全模型以扩大安全措施范围[50]。

四、结论

通过国内外关于大数据时代档案信息资源共享平台构建的相关研究主题分布可以看出:

(一)国内外相关研究路径存在差异

关于档案信息资源共享平台的相关研究,国内更加侧重先从理论层面进行探索,研究与实践领域的关联较国外相比不够紧密;国外研究较国内研究相比实践性更突出,相关研究成果大多来自于档案信息资源共享实践领域的经验总结,理论与实践的关联程度较高。如何将理论层面的相关技术研究成果应用到实践中,是国内未来相关研究需要关注的重要问题。

(二)国内外相关研究成果的差异

从研究成果的数量来看,国内研究的理论成果比国外多;就成果形式来看,国内研究成果主要发表于期刊文献,国外研究成果更多表现为会议论文;从研究内容来看,国内以档案信息资源共享平台理论构建研究为主,侧重研究档案信息资源共享平台的技术性问题,国外则更侧重对各个领域档案信息资源共享平台的实践经验分享,重点关注医疗、高校、科技、科研等领域档案信息资源共享实践应用现状。此外,国内虽有一定数量的基于大数据背景下的档案信息资源共享平台的研究成果,但现有研究与大数据结合度并不明显,还需加强,未来关于大数据时代档案信息资源共享平台的实现和应用问题应成为研究重点。

(三)国内外相关研究在平台构建的目的、支撑技术和安全性保障等方面表现出一致性

国内外档案信息共享平台构建的初衷皆是为了达到节约成本、提高效率的目标,皆强调了档案信息资源共享支撑技术以及共享过程中的安全性等问题。国内外普遍认识到档案信息资源共享的支撑技术在档案信息资源共享平台构建中的重要作用,档案信息资源共享平台的安全性需要相应技术手段来解决,档案信息资源共享的安全性是档案信息资源共享平台必须首先解决的基础性问题。

(四)国内外相关研究在作者分布及合作度上存在差异

国内外在作者分布上呈现较大差别,国内学者的跨界合作度有待提升。国内关于该主题研究的作者大多为档案学专业背景,与信息技术领域的专家学者缺乏合作,国外关于该主题的研究则体现出较强的合作倾向,也未见有发表于国外档案学期刊的直接相关性的文章。档案信息资源共享平台的构建体现出较强的实践性与技术性,因此,在未来的相关研究中国内学者应加强与实践领域及其他技术领域相关专家学者的合作。

猜你喜欢
资源共享信息研究
FMS与YBT相关性的实证研究
交通运输数据资源共享交换体系探究与实现
辽代千人邑研究述论
福建省交通运输信息资源共享平台
视错觉在平面设计中的应用与研究
EMA伺服控制系统研究
卫康与九天绿资源共享
订阅信息
测量学精品资源共享课建设的探索
展会信息