读者借阅行为的统计分析

2017-08-31 06:15谭杨
中文信息 2017年8期
关键词:统计分析

谭杨

摘 要:用借阅数据对读者借阅行为进行统计描述及分析,从两个视角探索读者的借阅行为特征,一是从图书借阅的时间角度展现整体读者在图书借阅过程中的时段、周时间及月时间等方面的特征,最终找出读者借阅行为的时间特点;二是以读者所在院系和借阅图书的中类为重点,根据不同院系读者用户的借阅特征,最终挖掘出读者借阅的群体性特征。

关键词:借阅量 统计分析 时间特征 群体性特征 异常值

中图分类号:G25 文献标识码:A 文章编号:1003-9082(2017)08-0020-02

一、引言

随着现代图书馆数字化和系统化程度的不断提高,图书馆信息技术部门需要处理和提供更为广泛和复杂的数据信息。高职院校图书馆借阅系统的数据库可以导出大量的读者用户借阅数据,从这些看似杂乱无章的数据信息中提取其内在联系和大量有价值的知识信息能够为图书馆管理者及学校提供决策支持。本文利用铜仁职业技术学院图书馆从2012年2月到2017年2月的读者借阅数据进行统计描述及分析,探索读者的借阅行为特征。

二、数据分析

本节的统计分析主要从时间和院系两个角度进行,

1.读者借阅图书的时间分析

1.1 一天内按小时的读者借阅情况

铜仁职业技术学院图书馆的开放时间是从早上8点半到晚上10点,读者可以在此期间借阅图书。我们以每小时为一个间隔,借阅时间可分为14个时段。把每一个小时段内图书的借阅量进行汇总统计,得到图1。从图中可以看出,该校每天在16点到21点为第一借阅高峰期,10点到15点为第二高峰期。通过查询该校作息时间可知,读者很少一大早借阅图书。上午第二节课下课之后时9点40分,距离第三节课上课时间10点10分有半个小时,一部分读者会去图书馆借阅图书,包括后面没有课程的读者。上午第四节课结束的时间为11点50分,可以看出,12点到13点之间的借阅量达到极大值,一方面显示读者的积极性,另一方面表明图书馆各书库的工作人员在吃饭时间仍有较大的工作量。然后13点到16点,是午休及下午上课时间,但仍有部分读者借阅图书,部分下午无课读者也在借阅图书,午休及下午上课时间(13点到16点)的借阅量占到总量的30%左右,可以说,相当很多读者经常牺牲部分午休及吃饭时间到图书馆借阅图书馆,比较刻苦努力。下午第二节课下课时间为16点10分,大部分学生下午没有第三、四节课,则在16点到17点之间,图书借阅量达到一天当中的最大值,这一个小时的借阅量占总借阅量的15%以上。17点开始是晚餐时间,借阅量开始下滑,但18点开始借阅量又有上升。最后,21点到22点的最后一个小时,读者借阅量很小了,读者开始离开图书馆,图书馆工作人员开始整理图书上架,准备闭馆了。

1.2 一周内按天的借阅情况

高校图书馆除了要了解每一天当中的图书借阅情况的变化规律之外,还应该了解每一周当中的变化情况,才能充分做好准备,更好的为广大师生服务,适当的调整资源配置。这里我们以周为单位,汇总统计了一周当中的借阅量变化情况,如图2所示。从图中可以看出,周二到周六的图书借阅量比较平均,这五天的总借阅量占到总量的90%以上。周一和周日的借阅量很小。其中,图书馆在周日的开放时间较其他时间有所减少,因此相应的图书借阅量自然很小。而周一,是正常开放,相应的借阅量也是很小,通过调查得知,大部分读者由于前日星期日休息的原因,周一还处于一个调整期,因此图书借阅欲望不强。

1.2按月份的借阅情况

从图3可以看出,一年中的图书借阅了起伏很大,一般是2月到3月及8月到9月为开学时间,大部分学生还处于假期调整期,图书借阅欲望不强,特别是寒假的春节过后的开学初期。然后随着学期的进行,借阅量逐步上升,并且在期中的5月和11月达到极大值。另外,从期中到期末的时间内,借阅量逐步下降,期末的6月和12月也有较高的借阅量。而通过观察,期末时间段的图书馆人流量是最大的时间,而借阅量却不是最大。调查访谈之后了解到,期末人流量大的原因是大部分入馆读者是在复习准备期末考试,并没有借阅行为。最后,寒、暑假期间,绝大部分学生离校,借阅量自然很小。根据相关的月份信息图书馆管理者可以做好资源配置及读者服务工作。

2.从读者所在院系分析

从整体的数据情况可以看出,文学(I)的借阅量最大,达到了总借阅量的34.3%,期受欢迎程度很高。其次是医药卫生(R),这也从侧面印证了铜仁职业技术学院是一所在医药卫生类专业非常突出的这一特征,且该校护理学院、医学院、药学院三个学院的总人数占到整个学校九个学院总人数的58.9%。,因此读者借阅医药卫生(R类)图书的量较大。排在第三位的为语言、文字类(H)图书。其他图书借阅量如图4所示。

大学校园里,由于读者用户所在的院系和专业的不同,其所学的知识由较大的差异性,这也的差异性在读者借阅图书的过程中也会有一些较为明显的院系特征。下面我们根据图4所示,排除了借阅量普遍小的图书类,选取了排序在前十二类(借阅百分比超过1.5%)的图书借阅数据 。如下的表1表示不同学院读者每类图书的借阅量。

为了能够迅速的找到不同院系图书借阅量的特征,我们通过寻找特征值的方法找出数据的异常值。我们的选取标准是距离均值一倍标准差以外的数据均认为是异常值。其中“1”称为“正异常”,表示大于均值超过一倍标准差;“-1”称为“负异常”,表示小于均值超过一倍标准差;“0”表示正常值。其结果如表2所示。

从表2可以看出:

(1)工学院学生读者在图书借阅过程中,哲学宗教(B类)、社会科学总论(C类)、政治法律(D类)、艺术(J类)、歷史地理(K类)、自动化和计算机(TP类)、建筑科学(TU类)等图书的借阅量为正异常值。TP类与TU类与工学院开设的专业非常相关,因此该两类图书借阅量非常高也不足为奇。另外,该学院学生对哲学宗教(B类)、社会科学总论(C类)、政治法律(D类)、艺术(J类)、历史地理(K类)等其他领域都有很高的借阅量,说明工学院学生爱好广泛,并不局限于工科类本专业知识,具有全面发展的特点。

(2)国际教育学院学生读者在哲学宗教(B类)、社会科学总论(C类)、政治法律(D类)、语言文字(H类)、文学(I类)、艺术(J类)、历史地理(K类)等图书的借阅量均为负异常值,即这几类图书的借阅量非常少。一方面由于该学院有部分外国留学生,学生总数也很少,仅占全校学生总数的1.1%;另一方面,哲学宗教(B类)、社会科学总论(C类)、政治法律(D类)文学(I类)、艺术(J类)、历史地理(K类)等图书借阅量很少是由于与该学院专业的相关度很小。但是,语言文字(H类)与该学院专业的相关度很高,其借阅量反而非常小,说明了该学院学生的学习积极性很差,既不注重本专业的学习,也忽略了很多其他方面的知识。

(3)护理学院只是在经济(F类)出现正异常值,这说明该学院学生对各类图书的借阅量较为平均,特征不太明显。但护理学院学生对经济(F类)知识非常有兴趣,这是一个很有趣的现象,以后我们将会深入研究。

(4)经管学院在各类书籍的借阅上都是正常水平,包括与其专业相关的经济(F类),也没有突出的表现,说明该学院学生对经济(F类)图书的需求与其他学院学生一样,并没有因为专业的关系而有更大的兴趣。

(5)农学院、人文学院和医学院,都是在与其专业相关的农业科学(S类)、艺术(J类)和医药卫生(S类)的借阅量上出现正异常值不足为奇,在其他类图书的借阅上处于全校平均的正常水平,说明该学院学生只注重本专业的学习,比较忽略全面发展。

(6)信息工程学院学生读者借阅量在与其专业相关的自动化和计算机(TP类)出现很高的借阅量,而在哲学宗教(B类)、语言文字(H类)、文学(I)、历史地理(K类)的借阅量出现负异常,说明该学院学生非常不注重专业外知识的获取,非常严重的忽略全面发展,尤其是全校借阅量最高的文学(I类)。

(7)药学院学生读者借阅量在与其专业相关的医药卫生(S类)出现很高的借阅量不足为奇,并且该学院学生在学宗教(B类)、社会科学总论(C类)、语言文字(H类)、文学(I)、历史地理(K类)的借阅量也是非常的高,说明该学院学生非常注重本专业知识的获取,而且和工学院一样都非常关注自身的全面发展。

我们从时间和院系这两个角度对铜仁职业技术学院学生读者借阅量数据进行统计描述及简单分析,一方面有助于该校图书馆管理者了解读者借阅的时间特征,可以更好的优化人力资源配置;另一方面,由于能够了解到学生读者图书借阅了的院系特征,图书馆管理人员可以将相关信息反馈到学校的教学工作和学生管理部门作为一定的指导和建议,更好的为“全民阅读”活动服务。

参考文献

[1]吳红艳.高校图书馆购书计划的趋势研究—基于读者借阅量的元分析[J].科技情报开发与经济,2007,17(30):58-59.

[2]高巨山.数字图书馆构建中的数据挖掘应用研究[J].图书馆工作与研究,2009,4:20-21.

[3]张小峰.广州大学图书馆学生结束分类统计分析[J].云南档案,2010,3:59-60.

[4]冯军.大学生图书借阅统计分析—以新疆农业大学图书馆为例[J].农业网络信息,2016,2:76-79.

[5]陈胜可.刘荣. SPSS统计分析从入门到精通(第三版)[M]. 清华大学出版社,2015.

[6]张宪录.基于数据挖掘的图书馆借阅行为分析[D]. 河北经贸大学,2016.

猜你喜欢
统计分析
多元统计分析在企业经济效益评价中的应用
近年退役士兵培训研究内容的数据统计与评析
如何发挥新时期统计工作的作用之我见
以统计分析为基础的房地产税收优化分析