大数据环境下图书馆用户小数据的采集、分析与应用∗∗

2016-03-18 11:09陈廉芳
国家图书馆学刊 2016年3期
关键词:图书馆用户服务

陈廉芳

大数据环境下图书馆用户小数据的采集、分析与应用∗∗

陈廉芳

大数据创新了思维方式,小数据同样具有重大价值。小数据是个体用户的“全数据”,与大数据相比,小数据更具可操作性、适用性和人文关怀等特点。通过用户表达和行为感知采集的小数据,可以采用基于知识、内容、交互、协同、关联、情境、混合等的推荐算法进行分析。图书馆用户小数据的采集分析可应用于描绘个人数据报告、增强宣传推广效果、优化嵌入式服务、加强用户感受体验、提供决策决议参考等方面。参考文献9。

大数据 小数据 用户数据 个性化服务

用户是图书馆的服务对象,也是图书馆的重要资源,对用户信息资源的挖掘和整理,对用户兴趣和需求的精细化分析,影响着图书馆服务的深化和发展。随着对图书馆用户体验和个性化需求的重视,用户信息的资源化引起了广泛关注[1]。计算机网络、传感器、云计算和海量存储等技术的发展催生出大数据概念,与可以通过目前主流软件工具在合理时间内采集、存储、处理的数据集不同,大数据是无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,促成了“不是随机样本、而是所有数据,不是精确性、而是混杂性,不是因果关系、而是相关关系”的大数据时代思维变革[2]。大数据代表着人类认知过程的进步,但大范围地收集零散的、多渠道的和非结构化的用户信息并从中提取出有价值的资源具有一定挑战性,且进行大数据分析的要求高、难度大,同时也存在着一定的不足,而对用户个性化信息的追踪可作为补充。

美国康奈尔大学计算机科学教授艾斯汀指出,从用户上网和使用各种移动设备过程中产生的大量用户行为轨迹数据中提取出的个体数据,可以为揭示人类行为模式规律提供依据,这些个体数据即为大数据时代的小数据[3];同样,图书馆用户小数据关注的目标是个体用户,研究的对象是个体用户空间上全方位的、时间上全过程的、深度上精细化的所有可利用数据,旨在通过数据采集、存储、处理、整合和分析为相关决策提供高质量的服务。图书馆用户小数据包括读者在图书馆实体或者虚拟空间里产生的数据,也包括在馆外空间特别是在网络上自由表达出的信息诉求;包括有意识的表述出来的需求,也包括不经意间遗留下来的需要被挖掘感应的信息痕迹;包括专指性高的可直接参考利用的数据,也包括价值密度低需要充分整理分析才可被利用的数据资源;甚至包括其他用户产生的但却能反映某用户相关信息需求的数据。总之,它是“一个用户”与图书馆有关联的所有数据的集合。

1 小数据的价值优势

美国沃顿商学院乔纳·伯杰推测,大数据的演进方向将会是个体数据的采集量化[4]。大数据的价值在于能够通过巨量数据的堆积使事物之间的相互关系及其规律得以逐渐地清晰呈现,这种规律是小批量数据难以体现出来的。但同时,小数据也有着大数据难以企及的价值优势。与大数据相比,小数据分析更具可操作性、适用性和人文关怀等特点,更适合于围绕个人或团体的个性化、差异性需求提供服务。

1.1可操作性

单个图书馆的数据集的量有可能不足以观测出事物之间的微妙关系,因而不能算作真正的大数据分析,大数据分析需要云技术的支持,将众多图书馆的数据开放至云端,集聚起来才能成为真正的大数据。而小数据是围绕图书馆用户个人的信息采集,数据集中性高,能够较为容易地通过用户登记、阅读终端、物联网设施、传感器设备等多种方式获取。大数据是随着新的采集、预处理、存储管理、分析挖掘、展现应用等新技术和Hadoop、Hadapt、HPCC等新工具的出现而出现的,普通图书馆没有必要也没有足够能力去承担这些高尖端设备和先进技术的成本。小数据分析所需要的数据量是有限的,采集、计算和决策的成本比大数据要小,在一般图书馆可胜任的能力和范围之内。

1.2适用性

从数据分析的效率上看,大数据的分析结果虽能引发突破性的变革,但采集到的巨量数据之间并不一定存在相关关系,信息的巨量导致噪音的巨大,某些具体的相关性以现有的技术和方法有可能未能探测出,即便得出两个变量之间的相关性,这种相关性也有可能是毫无意义或是难以应用的,整个分析过程花费昂贵且回报不清晰。大数据发现的是一般的普遍规律,这些规律是否适用于特定的图书馆还需进一步地考量实践。同一类事物的内部存在着多样性,小数据不去探索数据的普遍规律和联系,而是去发现事物的特殊性,在特定图书馆内发现特定用户的特殊性对其工作本身的指导作用更强。围绕并跟踪用户的小数据,能够结合情境快速、便捷、安全、准确地推测出用户的特殊信息需求,进而灵活地推送相关文献和服务。

1.3人文关怀

大数据的服务对象是整个行业和机构,采用的是全样本分析方法,虽摆脱了用局部代替整体的局限,但却陷入了用一般化的共性来代表个性的困惑,个性化需求未受到充分重视,用户被平均化,特性被抹杀掉。大数据的经典销售案例“啤酒与尿布”为商家带来了大量的利润,但显然许多购买尿布的顾客对啤酒没有需求,并不能为这部分顾客带来方便。数字化已经渗透到生活的各个角落,大数据试图将人们的感情观念量化,将人们的活动倾向数据化,冷冰冰地通过规律来表达。而小数据静态地采集用户产生的、与其相关的方方面面的数据,动态地进行服务流程的跟踪,实时地反映用户需求,注重数据分析,也关注价值判断,重视用户交互,使得服务更深入、决策更精准。

因此,大数据分析是整个行业或区域图书馆联盟才有能力处理的,是整个行业的责任,大数据发现的规律推动着整体大局的发展;而对于单一图书馆,小数据分析更有可行性、更体现精细化,具备情境性、高效率、灵活性、易操作、实用性强等特点,且尊重用户价值观念,体现人文关怀,因而能够迅速运用到具体的服务实践中。

2 用户小数据的采集分析

用户需求的获取是图书馆提供服务的前提准备。建立起良好的用户和馆员沟通渠道是获取用户需求的一条途径,除此之外,智慧化地主动获取方式也越来越受到重视。以用户小数据为挖掘对象,通过历史行为数据收集,运用机器学习原理智能化地推测用户的兴趣和需求,构建用户需求模型,可以大范围地高效获取用户需求。将这些动态性变化的需求信息存储于图书馆开设的类似于“我的图书馆”个人虚拟空间,可为图书馆服务提供决策依据。

2.1用户小数据的采集

小数据的采集内容包括个体使用图书馆过程中产生的所有数据和其他能推测出该用户对图书馆需求的相关数据。用户的小数据种类繁多,可以通过用户表达和行为感知两种方式采集(如表1所示)。用户表达能够最为直截了当地掌握用户的兴趣需求,包括:(1)用户登记的信息,如办理借阅证、注册服务项目、参加活动等所登记的姓名、专业、联系方式、研究方向和兴趣爱好等;(2)参考咨询的信息,如用户各种文献需求的申请、课题项目检索查新的要求、各种疑难困惑的咨询问题等;(3)通过图书馆社会媒体生成的内容,如对图书馆的微博、微信、博客的评价反馈等信息。

除用户表达出的需求外,还有用户未知的、未表达的或难以清晰表达的需求,这一部分要通过对用户的行为进行感知才能获取,可分为四个层次:个体身体的姿势、动作等体感行为的感知;用于时空精准定位的一定时间维度和空间维度上的轨迹行为的感知;一定物理空间和虚拟空间中学习、科研、工作、生活行为的感知;结合用户情境状态的网络社交行为感知[5]。伴随着互联网和物联网的发展,移动技术、RFID技术、人工智能、可穿戴设备等在图书馆的逐步应用为此提供了条件。图书馆用户行为感知的内容主要有:(1)用户使用数据库的信息,如数据库登录次数、停留时间、信息收藏、文献浏览下载、文献标记转发的情况;(2)用户使用图书集成管理系统的信息,如借阅、收藏、评价、预约和推荐图书的记录;(3)用户使用各种空间、资源、设备的信息和体验感觉,如用户进出图书馆以及各阅览室、使用设施设备、翻阅各种文献等情况;(4)外围信息,如同类型用户的文献获取经历和其他用户向其转发推荐的资料信息等。

目前,图书馆用户行为数据的采集大部分是从计算机或移动设备的点击、浏览、检索等过程中获取。随着智能和传感技术设备越来越密切地与人体接触,用户行为的感知也将越来越丰富和深入,逐步实现通过全时空、多渠道的人机物三元交互技术采集的多元数据在数据层、特征层或决策层的融合,使以个体用户为中心的不同数据之间不断互补完善,增加用户行为数据采集的可靠性和可信度[6]。

2.2用户小数据的分析

多渠道的信息采集解决了数据稀疏性问题。用户小数据的分析能推算出用户的各种兴趣需求和接受图书馆服务时的舒适度,把各种资源、服务及推送方式与相应的用户相互匹配,形成高质量的个性化服务。新用户在图书馆空间中留下的使用痕迹和体验次数较少,数据量小不足以根据已有的使用记录推算用户兴趣,可以采用基于知识的推荐技术:利用学科专业知识和情报分析方法分析用户表单中的兴趣特点,挖掘用户需求的各个方面,计算资源与用户之间的距离,以便寻找出适合的推荐方案。当用户的图书馆使用数据积累到一定量的时候,可以采用基于内容的推荐技术:先根据用户的使用情况,给每个行为特征赋予一定权重,构建出用户兴趣模型,将属性相适合的资源推送给用户,并在用户使用过程中,动态性地更新用户兴趣。只要新的资源有了属性描述,基于知识或内容的推荐技术就可以将其推荐给相应用户,但是这两种分析方法只能根据过往的兴趣推测现在的兴趣,不能推测出用户喜欢但却没有表达出的兴趣。借助社交网络推荐可以将一个用户与其他用户联系起来,提取其他用户对该用户的推荐、分享和评论信息,并将提取信息作为推荐资源的参考,以便提高推荐的广度和用户获得推荐的惊喜程度。协同过滤推荐技术利用用户兴趣的相似性来进行资源推荐,该技术的关键是根据用户的历史记录找出与其兴趣相似的用户,再将相似用户所需要的信息推荐给当前用户,以期能够满足用户的潜在需求。既然利用用户的相似性可以进行推荐,那么根据资源的相关性也可以进行基于关联规则的推荐。该方法将推荐转化为挖掘资源之间的关联,当资源A和资源B频繁地被同时使用时,有理由相信两者之间存在某种关联规则,那么当用户使用了资源A时,用户有可能也需要资源B[6]。

用户的兴趣会受到多维度情境的影响,因此结合情境的推荐越来越受到重视。智能手机可以通过感应器判断用户在室内还是户外从而自动调整响铃模式以增强用户体验,类似地,基于上下文感知的推荐技术就是根据时空、任务和所处环境的不同,实时主动地推送用户感兴趣的信息服务。移动医疗可以利用可穿戴设备连续追踪和分析个人血压、心率、睡眠、饮食、锻炼等情况,集成个人健康数据,从而为医疗护理和决策提供依据。同样,根据追踪的个人生理和心理数据可以判断用户接收图书馆服务时的舒适程度,以此为依据调整服务模式,提升用户体验。显然,各种推荐算法都有各自的优势(如表2所示),组合各种推荐技术,提高算法的质量,将成为数据分析的一种趋势[7]。

3 用户小数据的应用

小数据分析可以使图书馆人摆脱主观的直觉经验,重新公正、客观地认识用户,并驱动着服务向更高效、更精准、更智慧的方向发展。用户小数据可应用于以下几个方面:

3.1制作个人数据报告

小数据能够描绘出用户个人使用图书馆的足迹、特征、趋势等全景图,以合适的方式将报告呈现给本人,可以使用户感受到关注和尊重。报告内容可以是用户使用图书馆的关键历史记录,如图书馆赋予的各种荣誉称号或者各种第一次:第一次踏入图书馆的时间、第一次使用的某一设备、借阅的第一本书、下载的第一篇论文等,勾起青春和汗水的回忆,增加用户忠诚度和粘合度;可以是用户使用图书馆的频次统计分析,如年度参加活动的清单、入馆的时间和频率、图书借阅的数量、论文下载的次数和学科兴趣偏好,并显示用户的百分比排名,根据排名给予一定的虚拟头衔。这些可以帮助用户进行自我剖析,更清晰地认识到自己使用图书馆的状态,无形中获得荣誉或受到激励。在客观记录统计的基础上,结合本馆的服务开展和馆藏资源,提供图书馆使用指南、阅读指导、活动通知和提醒,并接受读者的相应意见建议。

3.2增强宣传推广效果

图书馆宣传推广的方式有线上线下相结合的资料发放、讲座培训、专题展览、知识竞赛、主题活动等等,宣传推广要追求广泛深入,但也要考虑投资效益,盲目地向大多数用户投送,费用高且效果差。利用用户小数据的整理统计,对用户进行分类,根据宣传推广的内容,将目标用户划分为不同的层次等级,继而进行重点推介、广泛宣传,让服务更具有目标导向性。以阅读推广为例,各种读书会、大型新闻媒体、图书馆、网络书店、出版社等都定期推出热点畅销图书排名,传统的阅读推广缺乏目标用户的调查和细分,粗疏地将这些图书投送给大量的目标用户。这些图书无疑具有高品质,但却并不适合于每一位读者,有可能不符合用户的爱好,还有可能给用户带来了干扰。而基于小数据的阅读推荐,能够根据用户的知识背景层次、阅读模式方法、阅读喜好习惯、阅读观点看法、阅读社会关系、阅读历史记录等将用户进一步地细分为各种兴趣爱好小组,再利用对用户的时空位置和实时情境的跟踪,便于预测用户阅读需求信息的变化,为用户推送适合的阅读内容。

3.3优化嵌入式服务

嵌入式服务是将资源和服务无缝地推送到用户所处环境中,让用户能够随时随地随心地使用,向用户推送资源和服务的前提是要精准地掌握用户需求。与宣传推广相比,嵌入式服务对精细、准确把握用户需求的要求更高,而且要求能及时获悉用户需求的情境变化。不恰当的嵌入不仅会造成资源浪费,而且容易打扰用户。用户需求信息的准确获取,成为开展嵌入式服务的一个前提。小数据的采集分析要求对用户进行全过程的连续追踪,不仅要能计算出用户持续性的兴趣爱好,更为重要的是要能反映出用户的信息需求变化,以便适时调整服务策略和服务内容,这适合于面向学习和科研项目的嵌入式服务。例如,图书馆嵌入学习的活动要协同参与教学辅助,事先了解学习者所面临的教学目标计划、课程设计大纲、自身已有的知识储备水平等;事中要把握教学进度和掌握程度,同步嵌入学习内容和信息素养能力;事后要评测知识掌握能力和信息素养提升能力,以便进行学习内容的补充和服务的改进。

3.4提升用户感受体验

图书馆的服务除了满足有用性,还要追求良好的用户体验,要满足用户在本能层、行为层和反思层等三个层次的体验[8]。本能层主要是用户感官体验,通过可穿戴设备、移动智能设备、传感器网络等收集、整合、分析用户生理小数据来判断用户心情的愉悦程度,以此来调整设施设备的配置和空间环境的配备,如色调、通风、温度、湿度、搭配、布局等,来实现大多数用户的最佳体验。行为层主要是用户操作体验,例如,可以通过小数据分析用户对服务方式的偏好来制定服务策略,可以将用户反馈、咨询或抱怨进行记录以避免重复性沟通产生的厌烦,还可以以小数据为依据挑选特定用户参加各种资源推荐、众筹、培训等体验活动。反思层主要是用户情感体验,小数据所面向的对象是个体用户,从小数据中发现用户问题并予以解决。这种个性化的服务本身就蕴涵着注重细节、尊重个体的人文精神,使用户感受关爱,增进感情。感官体验、操作体验和情感体验之间是相互关联、相互影响的,小数据的挖掘使图书馆能够知己知彼,整体上提升用户体验。

3.5 提供决策决议参考

与大数据相比,小数据以个体用户为中心,具有采集对象单一、内容完整、挖掘层次深和价值密度高等特点,全方位、全过程的用户数据采集分析能够改变图书馆以往依靠经验、直觉或抽样数据分析的个性化服务决策支持模式,为个性化服务决策提供高效、经济和可靠的数据支持,形成全样本的小数据支持模式,确保决策的合理科学[9]。个人小数据并不是孤立存在的,连同其他用户的数据进行综合评比分析更能显示出其特征,通过横向和纵向对比为馆员评价用户和用户自我认知提供依据,可以作为图书馆辅助个人学习、科研活动的决策参考。小数据为个性化服务提供决策,小数据整合形成的较大规模的数据为图书馆整体决策提供依据,将个人小数据的某项具体特征通过有序整理形成图书馆群体用户的整体偏好和需求数据,可以为图书馆资源采购、空间布局、活动举办、规章制定等提供参考。

4 结语

大数据的热度已经渗透到图书情报行业,在肯定大数据给图书馆带来的创造性变革外,也应走出大数据的盲目崇拜误区,理智地寻找那些有价值的可以为图书馆所用的用户小数据,进行小数据的采集、计算和分析,将其应用到描绘个人数据报告、增强宣传推广效果、提高资源嵌入契合、加强用户感受体验、促进决策决议合理等方面,让服务更便捷、更精准,更温馨,不断提升图书馆服务质量。

1李爱国,等.图书馆用户信息资源化:概念解析与理论框架构建[J].图书情报工作,2015(13).

2(美)迈尔-舍恩伯格,库克耶.大数据时代:生活、工作与思维的大变革[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013.

3Estrin D..Small data,where n=me[J].Communications of the ACM,2014,57(4):32-34.

4Jonah Berger.Is Little Data The Next Big Data?[EB/OL].[2015-10-09].https://www. linkedin.com/pulse/20130908184001-5670386 -is-little-data-the-next-big-data.

5陈益强,等.多源数据融合的用户行为感知与识别[J].中国计算机学会通讯,2014(5).

6黄琼.网络图书资源个性化推荐算法研究[D].成都:西南交通大学,2014:14-15.

7宋瑞平.混合推荐算法的研究[D].兰州:兰州大学,2014:15-17.

8诺曼.情感化设计[M].付秋芳,程进三,译.北京:电子工业出版社,2005:5.

9陈臣,马晓亭.基于小数据的图书馆个性化推送服务与服务质量保证研究[J].情报理论与实践,2015(10).

(陈廉芳 馆员 福建医科大学图书馆)

Library Users'Small Data Collection,Analysis and Application in Big Data Environment

Chen Lianfang

Big data innovates ways of thinking,while small data also has a significant value,which is the“whole data”of individual users.Compared with big data,small data is more operable,available and shows humanistic care.User expression and behavior perception are two ways to collect small data.The analysis of small data is based on the recommendation algorithm of knowledge,content,interaction,collaboration,context,correlation,and combination,etc.Library users'small data can be applied to describe personal data report,enhance promotional effect,optimize embedded service,improve user experiences and provide reference for decision making.9 refs.

Big Data;Small Data;User Data;Personalized Service

∗本文系福建省中青年教师教育科研项目“大数据环境下的高校图书馆嵌入式服务”(项目编号:JAS14959)研究成果之一。

2015-12-06

猜你喜欢
图书馆用户服务
服务在身边 健康每一天
服务在身边 健康每一天
服务在身边 健康每一天
图书馆
招行30年:从“满意服务”到“感动服务”
关注用户
关注用户
关注用户
如何获取一亿海外用户
去图书馆