张宏伟,史惠媛
黑龙江中医药大学,黑龙江 哈尔滨 150040
数据挖掘在高校图书馆文献采购决策中的应用——以黑龙江中医药大学图书馆为例
张宏伟,史惠媛
黑龙江中医药大学,黑龙江 哈尔滨 150040
摘要:在高校图书馆文献采购过程中,应用数据挖掘技术对读者利用图书馆历史数据进行分析,可以预测出图书采购经费分配比例,按照读者阅读需求采购热点图书,补充缺漏图书及复本量不足图书,进而为文献采购工作提供科学、合理的决策依据。
关键词:高校图书馆;文献采购;数据挖掘
【引文格式】张宏伟,史惠媛.数据挖掘在高校图书馆文献采购决策中的应用——以黑龙江中医药大学图书馆为例[J].中国中医药图书情报杂志,2016,40(2):22-24.DOI:10.3969/j.issn.2095-5707.2016.02.006
程焕文先生认为资源是图书馆绝对的至高无上的王[1]。文献采购是高校图书馆文献资源建设的第一站,是决定文献资源建设质量的最重要的关键环节。随着图书价格持续上涨,高校图书馆文献购置费相对有限,在图书采购过程中如何保证馆藏结构科学性的同时,提高纸质文献资源利用率,是图书馆亟待解决的问题。
数据挖掘(date mining)是从大量的、随机的数据中,提取隐含在其中的、潜在有用的信息和知识的过程。图书馆自动化管理系统每天会产生大量流通、检索、查询等数据,对这些数据进行挖掘,可以获知读者个性化需求、文献利用率等信息。利用这些信息对已有馆藏进行评估,可以为文献采购工作提供科学、合理的决策依据。
目前,高校图书馆纸质文献传统采购决策过程中,决策主观性较强,客观依据不足[2]。文献采购多以现场采购和书目采购为主,采购人员少,对各专业、学科所需文献资源把握不到位、订购精确度不高。一方面受采购人员的知识结构、专业背景、业务素质及工作经验等因素的限制,图书馆文献采购决策长期以来停留在凭经验和靠感觉的水平上,文献采购时主观判断成分过多。另一方面读者参与文献采购的热情不高,使得文献采购的采全率和采准率不高,导致学校投入的有限购书经费所购文献资源利用率不高,读者文献需求得不到满足和保障[3]。
为了使文献采购工作更客观、科学、合理,有必要应用数据挖掘技术对读者借阅流通、检索查询、预约借书、博硕学位论文引文等历史数据进行定性和定量分析,获知读者个性化阅读需求,为图书馆文献采购决策提供数据参考,进而提高文献资源采选质量和馆藏资源利用率。
2.1 依据借阅流通数据指导采购资金分配
利用金盘图书管理系统集成统计模块对每年各大类图书借阅流通情况进行统计,得到读者借阅量趋势变化情况,进而预测读者需求量,指导下一年采购经费在各大类文献中的投入增减情况[4]。遵循文献利用率最大效应原则,对于零借阅的图书应减少或停止采购,保证各大类图书的借阅流通数量和采购经费所占比重相一致,有针对性地补充馆藏文献资源,从而达到资源优化配置。
黑龙江中医药大学图书馆2013、2014、2015年图书采购经费分别为166.1万、155.9万、143.2万元人民币,借阅量分别为71 112、87 278、80 538册。表1中列出这3年各类借出图书所占采购经费及借阅量的百分比,据此可以指导2016年制定文献资源采购计划,合理分配各类图书采购经费,使采购决策更加科学合理,最大限度地提升馆藏资源利用率。
表1 2013-2015年黑龙江中医药大学图书馆图书采购经费分配与图书借阅量统计(%)
2.2 依据检索查询数据获知读者亟需文献
利用数据挖掘的关联规则对读者每个月图书检索查询数据进行自动捕捉、采集和整理,过滤冗余信息。将读者关注度较高的检索词按使用次数降序排列(见图1)。对照2014年热门图书检索词排行榜,取检索次数≥50次的图书作为热点图书,这些是读者迫切亟需的文献资源,图书馆应对照馆藏规划,优先采购人气热点图书。
2.3 依据图书预约借书数据补充馆藏复本量
预约借书是指读者预约登记某种借出状态的图书,该图书归还后,预约读者优先得到此书的借阅权,馆藏复本量不足是读者预约借书的原因。图书预约信息真实反映了读者对某类图书的实际需求。首先,采购人员基于金盘管理系统,对预约数据进行统计。其次,根据读者预约次数,形成预约热点图书的书目表。最后,通过与馆藏书目数据比较,制定符合读者需求的采购计划,确定复本采购数量。及时补充馆藏复本量不足的图书,提升图书馆的服务质量和服务效果,使高校图书馆文献资源保障能力得到加强。
图1 黑龙江中医药大学图书馆热门检索词排行榜
2.4 依据博硕士论文引文量补充缺漏图书
博硕士学位论文的引文真实地反映出作者在撰写过程中对专业文献的需求特点和规律,其引文具有数量大、范围广和学术质量高的特点。博硕士学位论文是对以前成果的借鉴、利用和创新,参考文献具有精选性,对文献的学术价值具有评测功能。因此,对博硕士学位论文引文进行数据挖掘,可以发现博硕士所在学科信息需求的一般规律和特点,有利于指导图书馆文献信息资源的馆藏建设。基于博硕士学位论文在线提交系统,对博硕论文引文量进行统计分析,对照馆藏将文献引用频次≥3的缺漏图书,列为预采购图书。并根据文献购置经费的许可程度,最终有重点、有层次对缺漏图书进行补充。
2.5 依据科技查新参考文献获知教学科研文献需求
科技查新,是为避免科研课题重复立项和客观正确地判别科研成果的创新性而设立的一项工作。通过科技查新工作,能为科研立项,科技成果的鉴定、评估、验收、奖励,专利申请等提供客观依据,为科研人员提供快捷、可靠、丰富的文献支持。
黑龙江中医药大学图书馆检索中心(中国中医药文献检索中心黑龙江分中心),是国家中医管理局于1995年批准成立的,为首批国家级定点查新分中心,也是我省中医药领域唯一的国家级查新单位。由于科研人员研究方向多,文献需求广,因此不易从个体角度来分析其文献需求,但可以从群体角度来研究高校教研室、重点实验室所需文献需求。基于我馆科技查新系统,对科研人员申报的科技查新参考文献进行数据挖掘,可以对我校重点实验室所关注的研究领域、研究热点和发展方向进行分类和预测。通过专家咨询、建立模型与数据可视化等动态结合方式,生成重点实验室所需科研文献采购报告,为满足该重点实验室文献需求提供客观准确的采购依据。
2015年,我馆采购原则是“保证中医药学科,兼顾医学相关门类,关注学校新增专业,满足医、理、文、工、管多学科发展需求”。通过对上述5类数据综合分析,形成科学、合理的客观采购依据,辅助管理层作出及时有效的决策,进而制定2016年的图书采购原则,即“中医类求精、西医类求新、关注新增专业、满足医、理、文、工、管多学科发展要求”。
3 小结
应用数据挖掘技术从海量的借阅流通数据中预测采购经费比例,对照年度采购原则和计划,将读者亟需的图书进行分类,按需求频度进行排序,频度相同、资金有限或数量已达上限的情况下,以优先满足教学和科研图书为采购原则。需要指出的是,采购决策应以实际数据为参考,同时也要避免唯数据论,对时效性强、借阅量大的教材、辅导类等图书要控制其采购的种数和复本量,可通过购买电子书形式予以解决。在经费有限的情况下使投入产出收益达到最大化,真正做到“每位读者有其书”和“每本书有其读者”。
参考文献
[1]程焕文.图书馆的价值与使命[J].图书馆杂志,2013(3):4-8.
[2]王春生.我国图书馆实施读者主导式采购的策略[J].图书情报工作,2013,57(5):71-75.
[3]杜友桃,伍晓光,宋宇.图书馆文献采访中读者荐购工作探讨[J].中国中医药图书情报杂志,2014,38(2):51-54.
[4]袁芳.大数据环境下图书馆文献资源建设模式的变革[J].图书情报工作,2015,59(18):91-94.
(修回日期:2016-01-23;编辑:魏民)
Applicatin of Data Mining in the Literature Purchasing Decisions of Libraries of the Colleges and Universities - Taking Library of Heilongjiang University of Chinese Medicine as an Example
ZHANG Hong-wei,SHI Hui-yuan
(Heilongjiang University of Chinese Medicine,Harbin Heilongjiang 150040,China)
Abstract:In the literature purchasing process of libraries of the colleges and universities,applying data mining technology in the analysis of library historical data can predict the allocation proportion of book purchasing budget,purchase hotspot books according to readers’ reading demands,and supplement missing books and books with insufficient duplications,with a purpose to provide scientific and reasonable decision basis for literature purchasing.
Key words:libraries of the colleges and universities; literature purchasing; data mining
收稿日期:(2016-01-11)
基金项目:2015年度黑龙江省艺术科学规划课题省级共建项目(2015D002)
中图分类号:G253.1
文献标识码:A
文章编号:2095-5707(2016)02-0022-03
第一作者:张宏伟,馆员,研究方向为数据挖掘、数据仓储、数字图书馆建设。E-mail:dbt5@163.com