李 荣,王庆石,李 双,董崇文,宋 佳,王 琳
(东北财经大学图书馆,辽宁 大连 116025)
笔者利用中国知网期刊文献检索平台,以“读者行为+图书馆”为主题词进行检索,截至2017年10月,共检出250篇文献。对“读者行为”的相关研究文献分析发现:2000年之前研究者较注重“读者行为”的理论研究,其研究方法主要采取调查问卷及人工统计的方法。具有代表性的成果有:陈刚、肖力给出了“读者行为”的定义,认为在特定需求驱动下,读者在图书馆物理场所内产生的一系列活动方式就是读者行为[1];卢荣远认为探索和研究读者的有规律的阅读行为和检索行为,可以指导图书馆有目的进行相关服务[2]。21世纪以后,研究者开始偏重于读者行为的数据分析。例如:田稷依据联机技术分析图书馆Web日志,可支持图书馆门户网站建设、文献采购决策及图书馆借阅服务等业务工作[3];王伟、张征芳、王海明等认为,通过对图书馆信息管理系统中的读者借阅数据、检索数据、文献书目信息进行数据挖掘,可以揭示数据之间存在的关联关系,从而预知读者信息需求[4];张文华通过研究聚类分析的挖掘技术,可发现书籍与书籍、读者与读者之间的联系[5];赖剑菲、江舟提出可通过收集读者无线上网行为数据分析读者上网喜好,为图书馆优化服务内容和服务方式提供合理决策[6]。
近几年,图书馆界开始进行大数据的相关研究,越来越多的研究人员也认为图书馆具有了大数据的特点。在大数据环境下,图书馆所产生的数据和信息均与读者行为有着千丝万缕的关系。例如:陈臣认为图书馆应利用读者行为大数据来建立图书馆智能化的服务体系[7];王玉林、曾咏梅指出图书馆的大数据有助于图书馆辨别读者行为,并为读者提供个性化服务具有重要参考价值[8];王芙蓉研究了在大数据环境下建立了基于读者行为分析的模型,可有效提升文献资源建设效率[9];吴蛟鹏认为在大数据环境下,为更好满足读者个性化需求,图书馆应积极利用和发现读者行为的规律和特征,从而提供更加高效的服务[10]。目前,多数研究者结合图书馆自身业务,通过一个方面或一个侧面研究读者行为,缺乏对大数据环境下读者行为的概念总结。本文在给出“读者行为大数据”定义的基础上,以东北财经大学图书馆为例,总结了读者行为大数据分析可为图书馆提供哪些精准服务和管理创新内容。
2011年召开的“云计算与大数据”主题会议上,EMC World这样定义大数据:为保证及时向相关人员提供有用信息,必须通过分析和挖掘PB级数据量的潜藏价值[11]。麦肯锡全球研究所描述“大数据”是一种难以用传统软件或方法获得、存放、分析和处理的大规模数据或信息总和[12]。简单地说,大数据就是涉及大量相互连接的数据,它们在一个大数据计算平台,有相同的数据标准并能正确关联,通过大数据的相关处理技术,对数据进行有效挖掘及整理,形成智能化的大数据产品或业务,从而指导人们的活动、工业制造、社会发展等。
根据图书馆自身特点,大数据主要来源包括OPAC数据、电子资源使用数据、自动化管理系统运行数据、网络交互行为数据及科研数据等,上述来源数据均与读者的行为有关。依据大数据的相关概念,笔者认为图书馆“读者行为大数据”是指利用相关软件、工具及方法对图书馆各业务系统或资源数据库所能涉及大量相互关联的读者行为数据,进行有效挖掘及整理,形成统计或分析结果,为加强文献资源建设水平、优化业务运行流程、推行精准化服务及提高管理创新能力提供决策指导。
读者行为大数据分析目的是要实现为读者提供精准化服务。因此,读者行为大数据分析内容的设定需要遵循以下几条基本原则:(1)分析内容的制定要与读者需求相吻合,如果脱离读者需求,分析的内容就没有意义,就不能为图书馆所用,也不能为读者提供相应的服务。因此,图书馆应从资源、服务、业务三个方面出发考虑制定相关的大数据分析内容,尽可能贴近读者服务需求,从读者的思维出发考虑设计大数据的分析内容。(2)大数据分析内容应要根据图书馆读者服务工作的实际需求和变化,不断完善分析指标体系。图书馆一般会定期开展许多读者创新服务,而这些创新服务如果用定量的统计和分析却不容易实现。因此,当现有的大数据分析内容已不能满足现有的服务需求时,数据分析内容应有所调整,分析指标就应尽可能完善,这样才能体现图书馆读者服务创新的价值。(3)分析内容的数据统计口径和分析指标要保持一致。如果统计口径和分析指标缺乏一致性,很可能造成分析结果的错误,产生较大误差,这就无法为图书馆的服务和管理提供准确的指导和决策。(4)“教育部高校图书馆事实数据库系统”是教育部高校图工委用于组织各高校图书馆进行数据填报和汇总的平台,每年各高校图书馆需要向该数据库录入相关信息。另外,《教育部高校图书馆事实数据库》中的主要数据均被《年度高校图书馆发展报告》《中国图书馆年鉴》《中国图书馆事业发展报告(蓝皮书)》所采用[13]。因此,图书馆读者行为大数据的部分分析项目及指标应该参考《教育部高校图书馆事实数据库》的标准。这样图书馆在向上级部门上报数据时,既统一标准,也避免部分数据的重复收集工作。
图书馆读者行为大数据分析内容可分为入馆行为、阅览区座位使用行为、借阅行为、纸质资源利用行为、电子资源利用行为、其他行为等6个一级类目,每个一级类目又包括多个二级类目,二级类目又包含多个三级类目。三级类目为读者行为大数据分析的具体项目及重要指标。详细内容解析请参考表1(表中分析内容均来源于东北财经大学图书馆2016年大数据分析报告)。
表1 读者行为大数据分析内容
注:*表示数据暂时无法获取。
馆藏评估是对图书馆的馆藏资源文献利用情况进行的检测和评估,为制定馆藏发展政策,加强馆藏质量建设提供客观依据[14]。通过读者的文献利用情况、文献借阅比率等数据的采集和汇总,得到对图书馆馆藏评价的数据基础,图书馆通过对这些数据的分析,不仅可以有效评估现有馆藏结构及文献保障水平,同时为未来馆藏的发展策略的制定提供了科学指导,如馆藏文献结构的调整、文献的剔旧工作等,从而实现馆藏合理布局,尽可能地提高馆藏文献的利用率。
开展精准化信息服务必须掌握读者在图书馆的行为,只有了解读者行为特点,方能有的放矢地采取相应的服务策略。如在读者入馆量较高的时间段,安排资源培训课程更能发挥图书馆数字资源宣传的效益;根据阅览室座位利用读者的类型分析,开展图书馆资源定向推送服务,提高服务精准度;利用图书馆读者借阅行为数据挖掘读者的阅读兴趣与倾向、馆藏图书利用情况、读者学科背景等,将有助于图书馆采取更加科学的文献保障政策,并适时正向引导读者的阅读行为;利用读者入馆行为数据开展读者流失预测、预警,重视图书馆与读者的联系和沟通。图书馆根据读者行为大数据分析的结果,适时选择电话、邮件、微信等方式给予读者温馨问候和关怀,了解读者的学习生活情况,体现图书馆对读者的人文关怀;利用大数据分析开展读者个人数据报告展示服务,描绘读者个人使用图书馆的记录和趋势,通过网页、微信的方式展示给读者,让读者了解自己利用图书馆的情况,时刻让读者感受到图书馆的关注和尊重。
图书馆在为读者提供电子资源服务时,每年要向各大数据商支付高昂的订购费用,这也为图书馆的资源建设带来不小的压力。图书馆依据什么来确定购买或不购买某种电子资源,都必须通过科学的数据分析来决定。如:哪些电子资源的使用率高,最受读者的欢迎;用户请求访问的电子资源类型及学科种类信息都有哪些;电子资源的使用成本效益如何,哪些电子资源的使用效益好,使用成本低。这些必须通过读者使用数据进行分析后才能明确。各个电子资源利用情况的统计数据,能精确反映电子资源的利用状况、读者的使用规律和习惯、资源库的使用成本等。这为图书馆进行资源推荐、读者培训课程设置以及帮助图书馆制定有关电子资源购买和管理提供了决策依据。
图书馆要实现精准化的读者服务,必须解决和面对的问题是在整理、挖掘及分析读者行为数据后,能够精准预期和发现读者的行为及需求。利用读者行为大数据进行智能发现主要表现在:利用读者行为数据从不同侧面分析哪类服务是受读者欢迎的,同时哪类读者的个性需求没有得到满足;充分利用图书馆内外部数据的连接关系,全方位了解读者一系列相关行为间存在如何的联系;通过对所有关联数据的汇总分析,将杂乱无章的数据转化为对图书馆读者服务的决策支持,即实现读者行为大数据分析数据向特定决策方法、读者信息服务的转化。图书馆在进行读者大数据分析的过程中应始终遵循这样一个标准:无论是读者服务推广、读者服务创新,还是提升读者体验,通过行为数据间关联关系,发掘在图书馆服务与读者、读者与读者之间搭建的全新关系;依据对读者接续性需求行为的预测,为读者提供最适合、最精准的图书馆推广服务,让读者及时感受到图书馆最人性化的服务体验[15]。
图书馆数据统计涉及馆藏文献数据、流通数据、读者行为数据、资源利用数据等。以往各业务部门的数据统计工作中往往存在数据统计需求不同、数据统计指标体系不完整、数据分散且采集难度大、数据获取效率低等问题。图书馆读者行为大数据分析及未来大数据平台的建立将会克服数据统计和分析工作中的难题,为图书馆事实数据、资源利用数据、读者行为数据的采集提供了统一的平台。未来大数据分析将辅助图书馆各业务部门在线随时提取所需数据或报告,减轻各类数据的采集和分析成本,促进图书馆对各项工作进行科学规范的管理及全面细致的评估,从中发现优势与不足,进而实现各项工作的不断创新,提高图书馆各业务部门的决策效率。
大量的非结构化数据如读者与电子资源的交互数据(检索行为、检索习惯、检索热点)很难获取。由于数据商不开放相应的数据访问接口,加上缺乏专业的网络分析工具、数据采集挖掘工具,图书馆无法全面掌握读者在使用商用电子资源过程中与商用资源的各种交互行为,也就不可能分析读者的研究热点、关注的学科领域及学科研究趋势等。
在数据分析中,统计口径(时间范围、读者数量)选择及分析指标的选取较为困难,如读者借阅册次分析、借阅时间段固定。有效注册读者时间的选择不同,统计结果就会有差别。另外,图书馆许多服务如联机检索、光盘检索、参考咨询、阅读推广服务等,难以用客观准确的标准加以定量化统计和分析。因此,要根据工作的实际需要有所变化,及时增加新的分析内容,不断完善统计分析指标。
开放与隐私如何平衡,亦是一大难题。为提升读者对图书馆的信任程度,在对读者入馆行为、座位利用行为、借阅行为等个人敏感信息进行汇总、采集、处理时,必须保护读者的个人隐私和相关数据[16]。另外,图书馆还应重点考虑读者数据如何公开及开放共享的问题。如学校其他部门需要读者的相关数据时,如何合理开放,共享标准是什么,也是图书馆必须重视的问题。
随着图书馆业务的高度信息化和网络化,图书馆的工作也从原来的以“资源”为中心向以“服务”为中心转变。图书馆服务的转型与提升,需要开展精准化、智能化的服务,以满足现代读者多样化与个性化的需求。图书馆应积极开展读者行为数据的分析和挖掘,同时加强与其他部门合作开发,实现数据和技术的共享,以有效利用读者行为数据的价值,让图书馆服务更便捷、更具人性化,不断提升图书馆运营水平。
[参考文献]
[1]肖力,陈钢.读者行为论(下)[J].图书与情报,1986(4):50-54.
[2]卢荣远.读者行为规律初探[J].图书馆理论与实践,1988(1):15-19.
[3]田稷.基于OLAP的Web日志处理与读者行为分析[J].情报杂志,2002(7):42-44.
[4]王伟,张征芳,王海明.基于数据挖掘的图书馆读者行为分析[J].现代图书情报技术,2006(11):51-54.
[5]张文华.基于读者行为特征的数据挖掘实例[J].图书馆杂志,2009,28(12):55-58.
[6]赖剑菲,江舟.基于WLAN的图书馆读者行为采集分析平台框架研究[J].图书情报工作,2015,59(10):67-71.
[7]陈臣.图书馆个性化智慧服务体系的构建[J].图书馆建设,2014(11):37-40.
[8]王玉林,曾咏梅.图书馆大数据功能实现的障碍与对策研究[J].情报理论与实践,2015,38(7):48-51.
[9]王芙蓉.大数据环境下基于读者决策的图书馆文献资源采购模型研究[J].图书馆学研究,2017(12):54-59.
[10]吴蛟鹏.大数据时代图书馆读者行为分析及应用[J].图书馆研究,2017,47(2):108-111.
[11]张宏.我国高校图书馆大数据研究现状分析[J].图书馆工作与研究,2016(7):46-50
[12]百度百科:大数据[EB/OL].[2017-01-09].http://baike.baidu.com/item/大数据/1356941
[13]徐璟,陈嘉懿.图书馆数据统计和分析的优化解决方案研究[J].图书馆杂志,2014(6):54.
[14]尹秀波.基于馆藏结构分析和文献利用统计的馆藏文献资源质量评价研究[J].情报科学,2011(4):588-591.
[15]薛岩.美国图书馆用户大数据项目实践及思考[J].图书馆工作与研究,2017(1):54.
[16]陈臣.大数据时代一种基于用户行为分析的图书馆个性化智慧服务模式[J].图书馆理论与实践,2015(2):96-99.