李蓉
【摘 要】在知识服务的重要性逐渐显现的今天,利用大数据技术,将档案中的信息资源转化为知识资源,能够更好地为档案用户提供不同功能和不同类型的便捷、精准和高效的个性化知识服务,促进档案工作的可持续发展。
【关键词】大数据;档案;知识服务
大数据已成为当下热门话题,开始渗透许多领域,并深刻地影响人们的工作和生活,同时也给档案工作带来新的机遇与挑战。大数据技术横跨数据存储、虚拟化、云计算、数据库管理和数据挖掘等多个技术领域,在档案管理中引入此概念将为档案工作实现信息服务内容的丰富、信息服务手段的完善、信息服务模式的突破等提供了新的思路和解决方案,必将推进档案工作的可持续发展。
1 大数据的概念
目前为止,大数据并没有一个统一的定义,但对于大数据有着一个共识:大数据描述的不是数据量的大小,而是一种在数据种类繁多、数量庞大的多样数据中进行的快速信息获取。
另外,就大数据的特点,业界一般归纳为4V。即(大量)Volume,(速度)Velocity,(多样)Variety,(价值)Value。第一,Volume,即数据体量巨大。大数据中的数据不再以几个GB 或几个TB 来衡量,而是以PB(1 千个T)、EB(1 百万个T)或ZB(10 亿个T)为计量单位;第二,Velocity,要求处理速度快,一般要求在秒级时间范围内给出分析结果,否则就失去了大数据分析价值;第三,Variety,数据种类繁多,包括结构化数据、半结构化数据、非结构化数据等类型多样的数据;第四,Value,即价值密度低,而商用价值高。将大数据中已有的结构化与非结构化数据进行融合、分析,将从中挖掘出极高的商业价值。
作为一种数据管理新的理念和方式,大数据是伴随着互联网时代的云技术、移动互联网、物联网等技术而出现,同时也是人类社会所积累的数据迅猛增长的结果。
2 大数据与档案数据挖掘
随着数字档案馆建设的不断推进及资源整合的实现,档案数据资源总量庞大、种类繁杂、结构多样,档案领域已具备大数据特征。档案作为一种最真实、最具权威性与凭证性的信息资源,是社会数据资源中最为精华的部分,其价值与作用的日益凸显,必将使之在大数据时代占据重要地位。
长期以来,由于缺乏深度数据挖掘和整合,档案信息资源存在着重藏轻用,档案信息服务手段落后,档案利用者日益增长的信息服务需求得不到有效满足。数据本身不被有效的利用就不会带来任何价值,而大数据的价值在于分析、挖掘与应用,利用大数据的分析与挖掘技术能有效的对档案数据进行重新关联、组合,挖掘出新的价值,实现档案数据增值。
2.1 档案知识挖掘
档案学术界很早就提出知识管理与知识挖掘,档案信息中蕴涵的巨大的知识宝藏,亟待深入开发和利用。利用大数据技术将档案中的信息资源转化為知识资源可满足现今服务要求不断提高的档案用户,也是档案工作的重要目标。
随着大数据时代到来,数据分析与挖掘技术在档案工作中的应用也将进入一个新的发展时期。大数据的分析与挖掘技术可解决数据与知识之间的鸿沟,是将数据转变成知识的有效方式。有档案学研究者认为,“档案馆的传统业务将向档案资源的数据分析、数据挖掘方向转移,对大量数据的分析处理将成为档案馆的主要业务”,“档案信息服务的底层基础可能不再是检索,而是智能化的数据挖掘”。
大数据技术的核心作用就是挖掘出庞大的数据库中独有的价值。利用大数据,通过对档案资源中结构化、半结构化及非结构化数据进行深度挖掘与分析,挖掘其潜在价值,得到更能揭示事物发展本质及规律的知识。利用大数据对档案资源进行深层次的挖掘、整合和提炼,能使隐性知识显性化,充分发挥隐性知识的价值。大数据深度分析与挖掘技术的应用能够提升从海量和复杂的数据集中获得知识和洞察分析能力。
大数据能够活档案资源,促进数据资源集成创新,激展现数据价值,创造新知识,满足档案用户服务需求。
2.2 用户数据挖掘
大数据时代,随着信息环境的变化,用户对档案信息服务的需求呈现出新的变化。档案用户已从信息服务的被动接受者转换为主动选择者,他们关心的不再是信息来源,而是精准、快速的得到自己所需要的知识,同时,他们更希望获得一种为自己量身定做的个性化服务。
一直以来,档案信息服务采取的是“供给导向”的模式,仅从自身业务角度出发,有什么样的内容就提供什么样的服务,用户常常面临着“提供的服务不需要,需要的服务找不到”的尴尬局面。因此,为满足服务需求日益提高的档案用户,应构建以人为本的用户服务理念,做到以用户为中心,以需求为导向,实现档案信息服务理念从供给导向到需求导向的转变。
大数据技术可以掌握用户实时行为,寻找其隐性需求,还可以对用户未来行为进行预测分析,通过对用户搜索方式、行为轨迹、使用习惯、利用兴趣、存储行为等数据进行分析,挖掘出不同类型用户的需求特征,发现用户隐性诉求,通过对数据内在关联挖掘,促进资源集成创新。
利用大数据,实时透彻感知和预测用户需求,做到精确洞察,作出快速反应,精准服务,为用户提供精品化、多元化、个性化的档案知识服务,提升档案用户认同感,实现档案知识服务价值。
3 大数据背景下的档案知识服务
大数据时代,面对多元化的档案资源,用户对档案信息服务的需求越来越高,他们关注的不再是简单的获取信息,而是在繁杂的信息环境中获得能够直接解决实际问题的知识服务。为解决用户需求与传统信息服务之间矛盾日益突出的问题,运用大数据技术挖掘档案信息中的知识资源,通过档案的知识管理,开展档案信息资源的知识服务,满足用户精品化的信息需求与专业化的信息服务,实现用户价值,也是档案服务工作可持续发展的关键。
传统的档案服务是以信息服务为特点,在档案信息化建设的基础上开展档案信息内容发布、浏览、下载、馆藏信息资源检索等方面的服务,目的是为用户提供档案信息。知识服务则是从大量的档案信息中分析、挖掘出其潜在价值,向用户提供有针对性的、能够解决面临的问题的信息资源。档案知识服务的实现需要对档案信息进行广度和深度分析,从中挖掘更深、更多的隐藏信息和关联关系,形成新的具有独特价值的信息产品。
大数据有利于推动档案信息资源的集成与整合,提升档案管理与服务能力,实现档案知识服务。大数据挖掘技术是将信息转变成知识的有效方式,使档案服务工作由信息服务过渡到知识服务。利用大数据,通过对档案资源中结构化、半结构化及非结构化数据进行挖掘与分析,挖掘其潜在价值,得到更能揭示事物发展本质及规律的知识。同时,利用大数据对档案信息资源进行深层次的挖掘、整合和提炼,使隐性知识显性化,充分发挥隐性知识的价值。大数据技术不仅提供用户所需的信息知识,通过对用户需求分析,还将实现用户不断增长的高层次、个性化的知识服务。
大数据技术的运用将给档案信息服务注入新的活力,推动档案信息服务转型升级。基于大数据的档案知识服务能够实现档案资源的互联互通和深入挖掘,实时感知和预测用户需求,让“信息仓库”变成“知识海洋”,将为用户带来全新的档案信息服务体验。
【参考文献】
[1]王雅洁,等.大数据挖掘在食品安全预警领域的应用[J].安徽农业科学,2015(8).
[2]张芳霖,唐霜.大数据影响下档案学发展的趋势的思考[J].北京档案,2014(9).
[3]周枫.资源 技术 思维——大数据时代档案馆的三维诠释[J].档案学研究,2013(6).
[责任编辑:田吉捷]