数据挖掘在高校图书馆藏书管理中的应用

2015-07-12 17:38巫红霞
镇江高专学报 2015年2期
关键词:镇江书架馆藏

巫红霞

(镇江高等专科学校 装备制造学院,江苏 镇江 212003)

数据挖掘在高校图书馆藏书管理中的应用

巫红霞

(镇江高等专科学校 装备制造学院,江苏 镇江 212003)

利用数据挖掘技术分析图书借阅数据,可以科学地剔除旧图书,同时为最新的图书在书架中预留空间,减少馆藏图书倒架次数,合理布局馆藏书架,优化馆藏资源和空间。

图书馆;数据挖掘;书架;藏书管理

高校图书馆依托丰富的馆藏资源为广大师生服务[1]。图书馆资源以纸质图书为主。纸质图书主要存放在馆藏书架中。图书馆藏书品种和数量逐渐增加,与有限的馆藏书架之间的矛盾日益凸显。这就要求图书管理人员能够合理利用有限的馆藏书架存放更具价值的图书,完成这项工作的关键是预测图书的变化趋势,利用数据挖掘技术可以很好地解决这一问题。

1 数据挖掘技术概述

数据挖掘(Data Mining,DM)[2]最早出现于1989年,就是从大量的、不完全的、有噪声的、模糊的、随机的数据库中提取隐性信息并且加工成可理解的信息和知识的过程。数据挖掘常用的方法有关联规则、决策树及统计分析等。数据挖掘的任务主要是能分类、回归、时间序列分析、预测、聚类、汇总、关联规则、序列发现等。

2 数据挖掘应用于合理剔除旧图书

剔除旧图书[3]一般指对破旧、过时的或者失去价值的图书进行清理。比如因年代久远变得陈旧或内容滞后而失去参考价值的图书、有新版或修订版的图书、残缺破损不利于阅读的图书、复本过多[4]的图书、在规定时间内未流通的图书、借阅率低的图书,都可以作为剔旧图书而入藏旧书库。

在实际工作中,对于残缺破损的或有新版、修订版的图书,剔除工作相对简单,复本过多的图书和借阅率低的图书的剔旧工作相对困难。利用数据挖掘技术可以科学地分析图书的复本数,统计图书在一定周期内的借阅次数,从而得出借阅率。但单从借阅率低、复本数多等方面考虑剔除旧图书是不科学的。有些优秀的图书往往会被反复续借,并长期在某一特定用户手中,其借阅次数不一定很多,但借阅时间很长。这些图书并不一定能在借阅次数上体现其优势,因此,还需要统计图书的平均借阅时间,并依此设定平均借阅阈值,去掉未达到阈值的图书,找到馆藏中借阅时间较长的图书。

以镇江高等专科学校图书馆为例,统计中文图书的借阅率,并进行分析。设定借阅时间为2013年1月至2014年6月,借阅率小于0.3。通过数据挖掘得到如图1所示的统计结果。

在图1中,我们可以看到,《晨读十分钟》复本数为12,借阅次数为2,借阅率低,可以适当降低复本数。同样,《语文学科知识与教学能力》复本数为6,借阅次数为1,借阅率也比较低,可以降低复本数。

3 数据挖掘应用于合理布局馆藏书架

图书排架[5]就是将已经加工整理的图书按照某种标准和次序陈放在书架上的过程。镇江高等专科学校图书馆是根据图书分类号来排架的,其优点是, 读者能够比较方便准确地找到所需要的图书,并在查找自己所要的图书的同时关注相似的图书。缺点:1) 读者需要准确知道欲借图书的索书号。2) 图书馆必须为各类新进图书预留合理的书架空间,否则会导致图书的重新整架甚至倒架,增加图书管理人员的工作量。3) 读者进入图书馆借书,很可能就在某类自己感兴趣的图书中查阅,很少同时关注其他类别的图书。

图1 图书借阅率统计分析

因此,需要对图书馆系统中的数据进行挖掘分析,了解各类图书的利用率[6]和更新指数,统计各类图书借阅情况。可以根据图书的利用率合理排架,即将利用率高的图书陈放在容易查找的书架上。可以根据图书的更新指数预留书架空间。可以根据某一时期图书借阅次数排行榜找出最受欢迎的图书,开设《好书介绍》栏目,甚至可以针对特定群体进行好书介绍和推荐。设立专门的书架为图书展读处,最好设立在读者进入图书馆的必经之地,吸引读者注意。图书馆也可以主办各类读书节活动吸引读者。

以镇江高等专科学校图书馆为例,图书利用率统计结果详见图2。从图2可以看出,B类(哲学类)、H类(语言、文字类)、I类(文学类)、K类(历史、地理类)、Q类(生物科学类)等图书的利用率高,可以将放置这几类图书的书架放在容易查找、方便上架的地方。

图2 图书利用率分析

在图3中,《哈佛家训大全集》《谁还在背单词,大学英语四级词汇》《你好,旧时光(全3册)》《Q版漫画技法从入门到精通》等借阅次数较多,可以将它们作为热门图书推荐放在最受欢迎图书的书架上。

在图4中,B类(哲学类)、D类(政治法律类)、F类(经济类)、G类(文化、科学、教育、体育类)、H类(语言、文字类)、I类(文学类)、J类(艺术类)、K类(历史、地理类)、T类(工业技术类)等图书的更新指数较高,因此要增加这几类图书的书架预留空间。

4 结束语

高校图书馆馆藏图书多且更新快。合理布局馆藏书架是图书馆工作的重要部分。合理布局馆藏书架、优化馆藏图书不仅可以减少图书馆工作人员的劳动量, 方便读者借阅,而且可以提高图书馆的服务质量和图书的利用率。

图3 图书借阅次数排行榜

图4 图书更新指数分析

本文只是简单地介绍了数据挖掘技术在高校图书馆藏书管理工作中的应用。随着数据挖掘技术的不断深入研究,其在图书馆工作中的应用也会越来越广,比如进行图书采购、读者个性化服务、领导的决策分析等。

[1] 方小苏.图书馆馆藏资源配置的效率分析[J].图书情报工作,2005(7):91-93.

[2] 巫红霞.基于数据仓库和数据挖掘的高校教学管理决策支持系统[D].南京:南京航空航天大学,2009:5.

[3] 王忠,刘惠琴.谈谈馆藏中文图书剔旧工作[J].图书馆论坛,1995(3):41-42.

[4] 梅国华.分类排架研究综述[J].图书情报工作,2004(3):102-104.

[5] 刘新文.图书馆图书复本量的定量分析[J].西南师范大学学报:自然科学版,2007(4):87-89.

[6] 胡振华,蔡新.基于解释结构模型的高校图书馆纸质资源利用率影响因素分析[J].图书情报工作,2010(4):46-50.

〔责任编辑: 卢 蕊〕

Applicationofdatamininginmanagementofuniversitylibrarycollections

WUHong-xia

(School of Equipment Manufacturing, Zhenjiang College, Zhenjiang 212300, China)

Using data mining techniques to analyze the data of library borrowing can help to remove the old literature in a scientific and rational way and reserve space for the latest literature on the bookshelf, reduce the number of book collections on the shelves and optimize the resources and space for collection with reasonable layout of library shelves.

library; data mining; bookshelf; library collection management

2014-09-28

巫红霞(1977—),男,江苏句容人,讲师,硕士,主要从事计算机数据库、数据挖掘研究。

G253.5

: C

:1008-8148(2015)02-0046-03

猜你喜欢
镇江书架馆藏
馆藏几件残损《佚目》书画琐记
赛珍珠:我在镇江有个家
我的镇江寻根之旅
博物馆的生存之道:馆藏能否变卖?
知还印馆藏印选——古印篇
镇江是这样调价的
新书架
新书架
新书架
介绍两件馆藏青铜器