宋雪宁
摘 要:随着我国智慧档案馆建设纵深发展,数字化背景下档案服务和档案利用已经形成了大量数据积淀,为实现档案数据化管理奠定了基础。本文从大数据下档案数据化管理转型的基础出发,从档案服务管理、资源开发和资源利用三个层面论述了大数据下档案数据化管理转型的策略。
关键词:大数据;档案数据化管理;升级转型;人工智能
随着信息技术的不断进步,依托信息技术的各种智能终端的普及,数字化已经在人们的生活中逐渐普及,人们的生活已经全面进入了数据时代。2017年12月27日国家档案局局长李明华在全国档案局长馆长会议中,明确指出了网络和信息技术快速发展背景下,我国档案工作应抓好战略转型机遇,逐步实现以信息化为核心的档案管理现代化。在2019年全国档案局长馆长相关会议中,对于加大档案科技攻关、加强档案信息化建设、促进档案管理现代化发展[1]。随着数字时代的到来,档案传统的技术、记忆功能被数字化记忆打破,信息技术不断冲击这档案传统载体模式,数字化存储逐渐被应用在档案管理与档案记忆实践过程中,促进了档案资源数据化发展。
一、大数据下档案数据化管理转型的基础
当前我们正处在大数据时代,档案信息形式和档案存储资料主要以数字化为主, 档案管理人员依托多媒体方式和文本形式来实现数字化管理。档案管理数字化发展为档案数据化管理转型奠定了基础。在当前的分类和整理过程中档案管理人员主要利用智能技术来进行检索,比如,自然语言处理等,然而受影响检索效率的因素是非常多。随着时代的发展,这种搜索和检索信息的方式随着档案信息数据和形式的日益增多,无法满足档案管理的需求。基于此,档案管理人员可以利用智能化图片和语言识别方式进行档案信息搜索,还可以利用机器学习管理模式,对海量的档案信息资料进行智能化的分類,具体操作为档案管理人员根据预先设定的方式,对档案进行分类,并利用人工智能技术收集整理信息。在信息检索方面,可充分利用人工智能技术的中的检索功能、普通话处理技术、模式分辨等,筛选档案信息,确保档案信息的精准度,同时还可以输入关键词,借助人工智能技术自动化对一些无利用物价值的信息和数据进行过滤,全面提升档案管理信息检索准确性和工作效率的提升[2]。所有的档案管理和档案利用数据在数字技术下都将产生对应的“标签”,为档案数据化管理转型奠定了基础。
二、大数据下档案数据化管理转型的策略
(一)档案服务管理转型:基础用户数据与用户画像
利用智能平台采集档案用户数据是实现档案馆精准服务的基础,把握数据的多维性是做好数据采集工作的基础。其中,用户属性、行为和情景等是档案用户数据采集与数据基础建设的主要类型。档案用户属性数据是档案用户在档案馆服务需求时注册的个人基础资料,包含了用户的基础资料和档案利用的目的;用户行为数据是用户在档案馆档案利用中产生的数据,主要表现在档案馆网站、档案馆APP后台等的档案行为。基于用户使用所产生的档案查询、登录、阅览等数据,可以通过数据分析接入档案服务系统,通过用户行为反映用户对档案的需求和选择偏好。另外,档案馆工作人员通过随访、问卷和观察等社会调研方式形成的基础数据也是用户行为数据范畴;用户情景数据主要是借助智能技术、RS技术、GPS技术等采集用户的地理、时间和社交关系等数据,帮助识别用户所处的实地情况。同时,档案馆在确保用户数据隐私和信息安全的前提下,与“多为端口”合作,借助爬虫技术和数据挖掘跟踪技术跟踪用户的数字行为,推动用户数据共享,满足档案利用和服务精准化发展需求。结合用户行为特征,关联数据需要挖掘不同用户的具体行为,做好用户标签聚类和相似度计算工作,明确受众档案需求结构,为不同用户和不同群体提供相应的档案服务,满足新时期档案受众的个性化需求。
(二)档案资源开发转型:表征性向数据信息转型
数字时代档案资源开发呈现新态势:对象数字化、工具信息化、主体多元化、过程科学化、目的多样化。因此,档案资源开发对象层次不仅局限于信息层面,必须面向多面内容,深入数据层面,获取细粒度的记忆单元,并且注重记忆数据之间的关联组织。有序组织是有效开发的前提,从档案资源开发由表征性向数据信息转型。一是档案信息资源开发不断深化。借助于先进自然语言处理、文本分析和识别、信息分析和抽取等数据分析技术,拆解碎片化的档案记忆知识内容和数据,获取出具有碎片化意义的档案记忆知识单元,“以档案内容的碎片化增加档案能量,促进档案活化,从而可以优先嵌入新的知识建构和创新活动”;二是档案关联度加强。利用本体技术,有侧重地对核心概念进行本体化处理,如人物、地点、时间、组织机构、事件等,以构建轻量、有机的档案结构,提高检索效率与开发灵活度。
(三)档案资源利用转型:智能技术助力数据咨询
毋庸置疑,人工智能集多个学科为一体,智能型公共服务机器人具有引导、讲解、人机交互以及自主行走等功能。对此,档案馆可以在馆内大厅安排智能机器人,利用机器人接待查阅的档案的用户,对其在馆藏信息、查阅档案流程的方面的问题予以解决。同时用户还可以根据自身查阅档案信息的需求,输入关键词后机器人为其快速调取库房档案并为用户提供档案副本。随着信息网络和新媒体日新月异的发展,现阶段微信公众号和官网是每个档案馆所必有的,为了提升档案服务满意度,档案馆还可以投入智能系统,充分利用系统线上实时智能功能,及时回答用户问题,为用户档案信息的利用提供方便。对于档案馆而言,同时智能线上与智能服务线下有机结合,一方面为用户解决了困惑,另一方面还促使自身服务效率的提升。
三、结语
在大数据爆棚式增长的时代,信息、数据、知识是适应时代发展的必然趋势。在推动档案数据化管理转型中,档案馆可以和计算机科学、营销等领域交流合作,在现有的档案管理数字化基础上推动档案管理数据化发展,从档案馆档案管理、档案服务和档案利用等层面综合发力,加强大数据在档案馆服务中的理论和实践探索,促使档案管理效率的全面提升。
参考文献
[1] 徐松.数字时代档案数据化管理问题研究[J].山西档案,2020(02):142-144+186.
[2] 王晓春.档案大数据研究的批判性考察[J].山西档案,2017(04):72-74.