对小数据应用于档案信息资源开发利用中的思考

2019-12-16 14:08古同日
山东档案 2019年2期
关键词:档案馆个性化精准

文·古同日

近年来随着信息技术的迅猛发展和相关领域的政策规划陆续出台,档案大数据研究越来越热,呈现出研究成果丰富、研究方向多样、研究层次参差不齐等态势,研究热点集中于大数据背景下的档案管理研究、档案馆建设研究、高校档案管理工作研究和档案数据挖掘研究。[1]档案大数据研究的逐渐成熟使得部分学者转向其他领域的研究,其中与大数据相对应的小数据技术则也成为关注的一个方面,关于小数据和档案信息资源相结合的理论和应用探讨逐渐丰富起来。但是,对于小数据在档案领域的研究还存在诸多问题,小数据在档案信息资源开发利用中的科学性、合理性有待于深入挖掘。

一、小数据概况

一般认为,第一个认识到小数据重要性的是美国的德伯哈儿·艾斯汀教授,他在自己父亲去世的生活实践中发现了个体小数据的重要作用,并将其作为一种医学依据。从概念上说,小数据是指以个人为中心的各种数据的集合,包括被采集个体的生活习惯、身体状况、喜好、行为、社交等等数据。[2]通过个体小数据资源的收集分析,能够对个人行为、需求、行为特征等实现精准预测,从而帮助机构或个人进行科学决策。与大数据相比,小数据在目的上是以个人为中心挖掘个性表征和规律;分析方法上注重于分析个人在节点的因果关系;数据本身上具有体量有限、类型单一、价值密度高等特征。[3]在应用层面,目前小数据的应用有方言普通话语音识别声学建模、科研小数据融合研究、中小型互联网金融企业中的小数据应用研究和基于小数据的图书馆个性化服务研究等方面。[4]

二、小数据在档案信息资源领域应用的理论现状

目前,尽管小数据在档案信息资源领域的应用尚处于探索阶段,但仍有相关的理论成果涌现,归纳来看,主要有三个方面的理论研究:一是对于小数据及小数据与档案领域相关联的基本概念探析,二是对于小数据应用于档案领域的可行性分析,三是对于小数据应用于档案领域的业务流程和框架模型的建构设计。

(一)基本概念分析

这个方面主要是对小数据、档案用户小数据以及档案信息资源个性化服务等相关概念进行分析。对于小数据的概念分析,档案学在这方面的研究往往都借鉴了邻近学科在这方面的研究成果,如图书馆学、情报学以及计算机科学在该领域的研究。其概念发展形成、定义、特征等均基本一致,此处便不再赘述。对于档案用户小数据和档案信息个性化服务,马双双认为档案用户小数据是指不同类型档案用户在利用档案过程中产生的思维活动、需求表达、利用行为等各种需求的集合,它不仅具有小数据的一般特征,还具有显著集中的档案利用需求特点,认为档案用户小数据可以划分为档案用户个体特征数据、档案用户行为数据和档案用户社会化及共享数据。[5]对于档案信息个性化服务方面,黄夏基认为是指两个层面的内容,一是档案馆根据档案用户的明确要求提供档案信息服务,二是通过分析发现档案用户的潜在的档案信息利用需求,主动向其提供其所需的个性化档案信息资源。[6]可以看出,档案用户小数据是小数据概念应用于档案学领域的个性化现象,其划分也与图书馆用户的划分较为类似。而对于档案信息个性化服务来说,现代的个性化服务显然更加强调后者的重要性,即发现需求主动提供的服务过程。

(二)可行性分析

对于小数据应用到档案信息个性化服务中的可行性分析,李财富、余林夕认为随着档案信息服务观念的转变、档案部门服务方式的改善和现代信息技术的支持为档案领域的小数据应用提供可能性。[7]马双双认为一方面目前我国日益增长的档案信息资源个性化服务客观需求导致需要新元素弥补当前能力不足的现状,另一方面小数据能够为档案信息资源的个性化服务提供思路和条件。这两个方面因素为档案小数据应用形成基础。[8]前者具体分析了小数据在档案信息个性化服务中的现实可能性,认为当前小数据在档案领域的应用具备了一定的条件基础;而后者从档案个性化服务需求与小数据特性之间的契合出发进行分析,二者均认同小数据在档案信息个性化服务中的作用与前景。

(三)业务流程、框架模型的建构设计

李财富、余林夕探索了精准化档案信息服务的业务流程,该业务流程从档案用户小数据的采集开始,到档案用户小数据存储、档案用户小数据分析、档案用户小数据的挖掘、再利用档案用户小数据提供个性化服务,最后进行档案用户的评价和反馈。通过该流程的设计以期提升档案部门的用户满意度、提高档案部门的服务能力。[9]吕元智设计了基于小数据的数字档案资源知识集成服务系统框架,该集成服务系统框架由“小数据管理系统” “数字档案资源管理系统”“用户知识需求分析系统”“档案资源知识集成系统”“数字档案资源知识集成服务界面”五个部分构成,该框架系统旨在建立以用户全方位个人数据分析基础上的、以用户档案知识需求为驱动的个性化档案资源集成服务。[10]从上述业务流程的设计可以看出精准化档案信息服务流程是在图书馆学等学科的经验基础上得出的,流程设计较为简洁,而数字档案资源知识集成服务框架的设计较为详尽细致,但是两者都是偏向于理论性的探讨,具体到实践上的操作还有待于证明。

三、对小数据在档案信息资源领域应用的质疑与思考

尽管学界对于小数据在档案信息资源领域的应用有了一定程度上的理论探索,但是具体到实践应用中,无论是政策指导还是技术条件上都有不完备的地方,因此,笔者认为小数据在档案信息资源领域的应用持批判态度,对档案小数据应用理论提出几点质疑。

(一)技术条件和技术成本质疑

目前,对大数据技术研究在社会中的各行各业普遍开展,大数据的作用也得到了社会的认可。但小数据技术却在实践中和理论上探讨颇少,还不能与大数据技术相提并论。一项经过实践检验的技术自然会引起社会的关注并加以推广,从这个角度来说,小数据技术探索过少跟其本身的技术基础存在一定的关联。精准化档案信息服务所需的关键技术,如用户画像技术、数据仓库、数据挖掘、智能代理技术等大多处于发展阶段,技术条件还不成熟,如果盲目地忽视客观条件而超前地理论应用,必然是架之于虚幻上的空中楼阁。同时,小数据的技术成本也是值得关注的一个地方,档案行业是一个非营利性行业组织,技术应用到实际中存在许多限制,在没有政策支撑的前提下,很多前沿技术都难以在档案行业真正得到应用乃至普及,当前大数据技术在档案行业的应用尚未真正全面地展开,大多仍停留在理论探讨的层次,所以小数据要想在档案行业实践应用甚至全面深化还有很长的路要走。对技术条件和技术成本的质疑是从技术客体角度来思考的,小数据应用到档案实践领域是一个主体与客体相互作用的过程,客体本身的特性会影响到整个作用过程,即小数据在档案信息资源服务领域的作用,在当前条件来看,结合档案行业的特殊性,小数据的技术条件本身和技术应用成本均难以达到在档案行业实践应用的条件,在档案的社会化服务中论及小数据恐怕也难以实现大规模的普遍性实施。

(二)服务效果质疑

如前所述,小数据技术因其具有的特性,研究者往往认为将小数据应用于档案信息资源个性化服务具有精准性、高效性、智慧性等优点,但是当小数据和档案行业结合的时候,未必能够产生小数据在理论上带来的诸多功能,其中既要考虑到档案行业所具有的特殊性,也要考察现阶段档案信息服务的提升空间。下面笔者就档案小数据的精准化、高效性和智慧性给出质疑。

在相当多学者眼中,档案信息服务的精准化或者说个性化是小数据技术给档案带来最为明显的特质和优势,这一点往往也是从图书馆学已有成果中借鉴而来,图书馆的服务可以实现精准化服务,所以档案馆也要实现精准化个性化的服务,看似合理的推断却忽视了档案行业的特殊性,即档案馆的社会化服务水平远低于图书馆。图书馆可以根据读者小数据为读者主动推荐书籍服务乃至个性化的定制服务,但档案馆的用户往往是有现实的利益需要才去档案馆,其用户的需求相比于图书馆具有更大的不确定性,在这种前提下的小数据的精准化服务便会失去意义。同时,小数据助力精准化服务的背后还有另外一个层面的意味,即大数据技术带来的服务是不精准的,但笔者通过研究发现,大数据技术在促进精准扶贫[11]、精准营销[12]、精准医疗[13]等方面均具有重要作用。小数据技术中的很多基础构成技术也都是来自于大数据,大数据不仅仅可以预测事物的发展趋势和运行轨迹,也能带动精准化的服务水平的提高。笔者认为,简单地将小数据和大数据对立开来去突出小数据的个性化精准化功用是欠缺全方位考量的。

高效性是所谓小数据的另一重要作用,高效无非是提高效率,在档案信息服务方面就是使利用者快速便捷地查找到所需档案信息资源。而当前随着数字档案馆和社交媒体的快速发展,档案用户的高效性的利用需求也极大地得到满足,档案信息资源的网络化、检索系统的完善均给予档案用户便捷的手段。对档案用户小数据的收集利用是对个体数据的处理分析,更加侧重于单个档案用户的差异性服务,因此对于档案用户群体的利用效率提升并无重大影响,档案信息利用服务的高效化更多的还是要依靠档案信息资源的合理配置和检索手段的现代化,小数据对于高效性档案信息资源挖掘难以有实质性突破。

智慧性是当前各行各业探讨较多的话题,人工智能时代各个领域纷纷向智慧型的生产服务方向靠拢,档案界在服务社会智能化方面主要贡献是智慧档案馆的建设,其核心是促进数字档案馆更加智慧化和档案实体管理智慧化。[14]由于档案用户的利用需求不像图书馆用户那样强烈而频繁,且多是与利用者现实利益相关,通过档案用户利用小数据进行智能化档案信息服务难以达到理想中的状态。智慧档案信息服务应该着眼于档案信息资源馆际联动、区域联动和信息共享,借助云计算、大数据、物联网技术实现宏观和中观层面上的档案智慧服务,进而推动智慧档案馆的建设。

(三)理论质疑与学术反思

在小数据应用于档案信息资源开发利用理论众多质疑的背后,必然存在学术上的一些疑问和思考,为此,笔者认为在学术理论上有两个方面可以探讨。

一是关于档案学与图书馆学情报学的理论互借。在各学科理论深入发展的今天,学科之间的理论互相借鉴已屡见不鲜,档案学作为一个小学科,与包括图情科学在内的人文科学、应用科学进行互相学习是良好的现象,也有助于突破档案学的狭隘藩篱。但是在没有充分考虑所在学科特殊性的条件下引进、转移相关的理论成果是过于急功近利的表现。就小数据信息服务理论而言,目前多数理论集中在图书馆学和情报学,研究层次目前也处于初始探索阶段,档案学对于小数据信息服务的引借应该尽量考虑到自身独特性,实事求是地为新时代档案学发展谋篇布局。

二是关于科技热点的学术追逐。当前档案学的很多理论内容都与最新的技术有关,学人不遗余力地将各种新兴科技搬进了档案学的大门:大数据、云计算、物联网、区块链等等,似乎这些科技都可以在档案学领域大有用武之地,但事实却与理论相隔甚远,除了个别的试点档案馆之外,大多数地方性档案馆、高校档案馆都维持着计算机网络技术时代的设施装备,当然这并不意味着科技手段发展相对于理论探讨的滞后性多严重,这种脱节应该是从档案行业实用主义角度出发的妥协。追逐新兴热点技术无可厚非,但这种追逐不能掩盖掉档案学本身的立学基础,而应该沉下心来在档案的本体内探寻真知。

四、总结

笔者认为,小数据技术在反映个体的特性方面具有重要的价值,在金融、媒体、情报等领域将大有可为,特别是在当今注重多元化和个性化的时代条件下,小数据技术的独特作用不可或缺。但对小数据技术在档案理论中的探讨、在档案行业中的应用,笔者持质疑态度。有关小数据在档案信息资源服务中的作用有待实践去进一步验证。

猜你喜欢
档案馆个性化精准
一种融合PageRank和PersonalRank的多层个性化推荐算法
云南省档案馆馆藏《东巴经》
精准防返贫,才能稳脱贫
坚持个性化的写作
精准的打铁
精准扶贫 齐奔小康
精准扶贫二首
上汽大通:C2B个性化定制未来
同桌宝贝
when与while档案馆