基于数据挖掘感知读者借阅规律的智慧型图书馆建设

2016-07-16 03:02苏晓宏
大连民族大学学报 2016年4期
关键词:数据挖掘

王 雪,金 玲,苏晓宏

(1.大连民族大学 图书馆,辽宁 大连 116605; 2.大连海事大学 图书馆,辽宁 大连 116026)



基于数据挖掘感知读者借阅规律的智慧型图书馆建设

王雪1,金玲1,苏晓宏2

(1.大连民族大学 图书馆,辽宁 大连 116605; 2.大连海事大学 图书馆,辽宁 大连 116026)

摘要:以大连民族大学所有本科生读者两年借阅流通数据为研究对象,利用数据挖掘与统计分析的方法,通过天、周、年三个时间尺度深入分析了读者借阅行为的时间特性与周期特性,进而感知读者需求与目前服务的不匹配之处,最后对应优化各种业务流程使图书馆更加智慧地为读者提供服务。研究表明,通过大数据分析方式来感知读者借阅行为规律,对于提高图书馆服务水平、建设智慧型图书馆具有非常重要的意义。

关键词:借阅行为;数据挖掘;智慧型图书馆

随着科技的迅猛发展和社会环境的变迁,越来越多的图书馆开始从传统型和数字型向智慧型迈进。智慧图书馆建设已成为图书馆界既定的发展战略,国内外也掀起智慧图书馆建设和研究的热潮[1]。智慧图书馆主要利用新一代信息技术来改变用户和图书馆系统信息资源相互交互的方式,以便提高用户获取信息的明确性、灵活性和响应速度,从而实现智慧化服务[2]。智慧图书馆的核心理念是以人为本,以用户需求为主导[3-4],最终实现图书馆各项服务的智能化、全面化、人性化[5]。如何达到深度感知读者需求,以期给读者提供个性化、人性化的服务日益成为智慧型图书馆建设的灵魂。

图书借阅是图书馆为读者提供服务的传统方式和主要途径,甚至可以认为借阅行为是读者与图书馆产生关系的最重要的表现形式。考虑到图书借阅服务的重要性,对用户借阅流通数据的分析和挖掘是提高图书馆读者服务、优化工作流程的核心内容,也是进一步深入开展文献信息服务的重要基础[6]。本文以大连民族大学所有本科生读者2012年1月至2013年12月两年借阅流通数据为研究对象,分别通过天、周、年三个时间尺度对读者借还书情况加以分析,进而深入挖掘读者借阅行为的时间特性与周期特性。通过实证数据的分析与挖掘,针对智慧图书馆的建设提出了优化策略,取得了良好的服务效果。

一、以天为单位读者借阅行为的分析及优化对策

图书馆开馆时间为上午8:00至下午4:30,午间不闭馆。以天为单位,读者借还书时间规律如图1。

(a)每天借书行为时间分布图

(b)每天还书行为时间分布图

横轴代表时间,纵轴代表在此时间段内图书被借阅和归还的数量。根据图1可以挖掘出图书馆接待读者的高峰时间有两个,分别为上午10点和下午3:30分左右,借书的数量在这两个高峰点分别达到了4 754册和3 600册,而还书的数量也分别达到了4 705册和3 020册。针对该结果进行分析后发现,学生借还书行为和他们的上课时间安排息息相关。学生每天的上课时间安排为8:00-9:40,10:00-11:40,13:30-15:10以及15:20-17:00。学生一般在上午第一节课下课(9:40)以及下午第一节课下课时间(15:10)来借还书。此外,借还书行为时间规律图如图1(a)和(b),可以发现开馆有还书小高峰现象,闭馆有借书小高峰的现象。刚开馆的8:00-9:00这个时间段里,学生的还书行为很多,而借书行为很少,根据统计借书行为是还书行为的2.12倍。产生这一结果的主要原因是如果学生需要借阅书籍的话,需要进入馆内进行图书查找、浏览和比较,经过一段时间才能产生借书行为,而还书在入馆时就可以进行。在下午4:00-4:30这个时段会出现借书的小高峰,借书行为是还书行为的4.35倍,这主要是由于下午4:30借阅部门停止借书。 由图1可以看出,学生借还书行为的高峰时段虽然非常接近,但是还书高峰时间总是领先于借书高峰时间。出现这种情况有两个原因:一是大连民族大学本科生可借阅书籍的数量是有限的(普通学生借书量为5本,优秀学生借书量为8本),一般需要先归还完书籍,才有资格借阅其他书籍;另一个原因是图书馆门禁的限制致使学生会先归还图书,再进入馆内花费时间去检索和查找自己所需要的书籍,这就导致还书高峰出现在借书高峰之前。基于以天为单位对读者借阅行为的分析,本校图书馆的流通部门以人为本,以用户需求为主导,在读者出现借还书高峰的时间段适当增加了流通窗口。尤其在每天刚开馆时,一般还书会出现一个小高峰,因此流通部门灵活调配工作人员,为读者提供更加便捷更加智慧的借阅服务。

二、以周为单位读者借阅行为的分析及优化对策

图书馆每周的开馆时间为周一至周六8:00-16:30,其中周四、周六开馆时间为8:00-11:30。读者以周为单位借还书行为规律见表1。

表1 以周为单位读者借书与还书统计表

每周有两个借还书高峰期:周一和周五。其中,周一是借还书的最高峰,数量分别达到了43 948册和46 667册,分别占每周总借书量的25.3 %和总还书量的27.6 %,这主要是由于周六开馆半天和周日全天闭馆导致的。此外,周四下午闭馆导致周五出现另一个小高峰,借书和还书数量分别为36 386册和34 844册,分别占每周总借书量的21.0 %和总还书量的20.5 %。基于此分析结果,一方面,流通部门在借还书的高峰时间周一和周五适当增加流通窗口,合理安排工作人员。另一方面图书馆也逐步意识到:正是由于图书馆的工作安排(周四、周六半天闭馆,周日全天闭馆)而导致读者每周借还书比例出现了两个高峰。如果没有这三次闭馆安排,读者的借阅情况从总体看来每周应该呈现出平稳的发展态势。因此可以考虑在三次闭馆时间内,适当开放部分流通窗口,这样既满足了学生随时的借阅行为,也缓解了工作人员在某个时间段内的压力,使流通部门更好的安排和调配工作人员,同时为读者提供更加人性化的服务。

三、以年为单位读者借阅行为的分析及优化对策

本研究所使用的数据是大连民族大学本科生读者2012年1月至2013年12月两年借阅流通数据。由于这两学年寒暑假时间只差一天,时间上几乎是重合的,因此直接将两年的数据叠加到一起进行分析。此外为了平滑数据,以周为时间段统计借还书情况。以年为单位读者借阅行为的时间规律如图2,横轴代表一年中的第几周,纵轴代表在该周图书被借阅和归还的数量。

(a)每年借书行为时间分布图

(b)每年还书行为时间分布图

由于寒暑假的原因导致出现了两个学生借还书比例特别少的时间段如图2。第4-9周和30-34周。寒暑假每个周三上午的9:00-11:30流通部会开馆接待读者,所以在寒暑假会有少量的学生借阅记录。通过比较可知,暑假借还书数量明显多于寒假,原因在于暑假有很多学生会选择留在学校继续学习或者找些兼职来做继续呆在校园。而寒假由于春节的存在,绝大多数学生都会离开学校,导致读者的借阅行为很少。因此为了更好的满足留校学生的阅读需求,流通部门应适当地增加暑期的开馆次数以及开馆时间,从而更加有效的为读者服务。

学生寒暑假开始的前2周所借阅的书籍可以顺延到开学之后的一周内归还,否则将产生超期罚款,这就导致在寒暑假开始的前2周之内以及寒暑假结束之后的1周(第10周和第35周)出现了一个借还书的小高峰。但也应注意到寒暑假的影响不是完全相同的,暑假结束后由于大四学生离校而新入校的大一新生还没有开始借阅书籍,暑假结束以后1周(第35周)的小高峰明显低于寒假后的1周(第10周)。也正由于大四学生的离校(大约在第25周),导致还书的数量在暑假前出现了一个小高峰,达到了7 100册。而在新生结束为期两周的军训(大约在第37周)开始大量涌入图书馆时,此时借还书的数量出现了一个高峰,分别达到了5 900册和4 050册,已经达到甚至超过了大四学生离校前借书的平均数量。从新生开始出现借阅行为的37至52周,借还书的数量保持了比较平稳的整体态势。在此时间段内,我们应注意到借还书的数量都有个明显的低谷和高峰。产生低谷的时间是第40周左右,这个时间正好是国庆小长假,而产生高峰的时间是12月末,原因和学生的考试需求有关,另外这段时间也是寒假假期借书时间的开始。

通过以上对读者全年借还书情况每个时间段的详细分析,流通部门可以根据学校校历以及学校工作的安排比较准确的预测出学生借还书出现的高峰和低谷,以此为依据合理安排流通窗口以及工作人员数量,保证在任何时间都能根据读者需求给读者提供方便快捷的服务。

四、单本图书借阅时间分布的数据挖掘及优化对策

单本图书借阅时间的分布,即每本书籍在读者手中滞留的时间如图3,横轴代表读者持有某书籍的天数,纵轴代表在此天数有多少本书籍被读者持有。由于本科生单本图书的可借阅时间是一个月,否则将产生超期罚款,这就导致读者对书籍的持有时间集中在1至30天,同时在这个时间段内出现周期性的高峰(均为7的倍数天),这与之前章节中所分析出周一是每周借还书的最高峰一致。学生对书籍持有天数在31至36天之间的数量是非常大的如图3。这部分有可能是用户超期未还书造成的,也可能是用户续借造成的。但不论哪种原因,都说明目前给本科生设定的一个月的借阅时间偏短,造成一些读者要缴纳超期罚款的现象。因此流通部门适当增加单本图书的可借阅时间,使流通制度的设置更加符合读者实际的阅读需要。

图3 读者持有书籍时间分布图

在图书被借阅36天之后的整体态势是趋于下降,但在50-70天又出现了一个小高峰。产生这种情况的原因一是读者对所续借书籍会在这个时间段归还,因为第一次借书外加续借时间的最大期限是60天。二是读者对所借书籍的持有时间也可能会跨越寒暑假,经过实证数据验证发现主要是后者这种情况,因此目前图书馆针对跨越寒暑假借阅行为的处理是合理的,顺延还书的措施满足了读者需要长时间借书的需求。

五、结语

通过对读者借阅数据的分析与挖掘来感知读者借阅行为的时间特性与周期特性,根据读者需求和图书馆目前服务之间的矛盾进行有针对性的改进,从而更加智慧地为读者提供借阅服务。通过本文研究可以发现:智慧型图书馆建设不但要基于物联网、云计算、移动网络等高新技术,基于数据挖掘的用户信息感知技术也是其中的一个重要环节[7]。因此今后在智慧型图书馆建设过程中,既要能在分析用户需求的基础上保证其服务的先进性与全面性,也要能全面把握现有用户资源,对用户各种行为数据进行智能感知。只有将基于大数据分析的用户行为感知和以人为本的业务流程再造有机融合起来,才能使图书馆更加智慧地为读者提供服务。

参考文献:

[1] 李显志,邵波. 国内智慧图书馆理论研究现状分析与对策[J]. 图书馆杂志,2013(8):12-17.

[2] 严栋. 基于物联网的智慧图书馆[J]. 图书馆学刊,2010(7):8-10.

[3] 刘丽斌. 智慧图书馆探析[J]. 图书馆建设,2013(3):87-89.

[4] 乌恩. 智慧图书馆及其服务模式的构建[J]. 情报资料工作,2012(5):102-104.

[5] 梁转琴. 智慧图书馆实现的条件探析[J]. 图书馆学研究,2013,14:6-9.

[6] 樊超,郭进利,纪雅莉,等.基于图书借阅的人类行为标度律分析[J].图书情报工作,2010,15:35-39.

[7] 刘宇初.基于定量判别方法在高校图书借阅信息群中行为数据挖掘的应用[J].科技传播,2012,14:181-182.

(责任编辑王楠楠)

SmartLibraryConstructionbyPerceivingReaders’BorrowingRegularityBasedonDataMining

WANGXue1,JINLing1,SUXiao-hong2

(1.LibraryofDalianMinzuUniversity,DalianLiaoning116605,China; 2.LibraryofDalianMaritimeUniversity,DalianLiaoning116026,China)

Abstract:Inthisstudy,wefocusonalltheundergraduatereaders’circulationdatawithintwoyearsinDalianMinzuUniversity,andthoroughlyanalyzethetimeregularityandperiodicityofreaders’borrowingbehavioratday,weekandyeartimescalesbyutilizingthemethodsofdataminingandstatisticanalysis.Andwecanperceivethatourcurrentservicedoesnotmatchreaders′demand.Finallybycorrespondinglyoptimizingvariousworkflow,thelibrarycanprovidesmarterserviceforreaders.Thisstudyillustratesthatperceivingthetimeregularityofreaders’borrowingbehaviorbybigdataanalysisissignificantforimprovingtheserviceandconstructionofsmartlibraries.

Keywords:borrowingbehavior;datamining;smartlibrary

收稿日期:2015-07-24;最后修回日期:2015-10-20

基金项目:国家自然科学基金项目(61374170);辽宁省高等学校杰出青年学者成长计划(LJQ2013125)。

作者简介:王雪(1979-),女,辽宁铁岭人,馆员,主要从事数据挖掘及智慧型图书馆建设研究。

文章编号:2096-1383(2016)04-0433-04

中图分类号:G250

文献标志码:A

猜你喜欢
数据挖掘
改进支持向量机在特征数据挖掘中的智能应用
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于数据挖掘的学业预警模型构建
软件工程领域中的异常数据挖掘算法
人工智能推理引擎在微博数据挖掘中的应用
一种基于Hadoop的大数据挖掘云服务及应用
高速公路联网大数据挖掘应用探析
数据挖掘在高校图书馆中的应用