文/山东夏津县图书馆 时海燕
数据挖掘在公共图书馆管理工作中的作用分析
文/山东夏津县图书馆 时海燕
本文主要研究数据挖掘在公共图书馆管理工作中的作用,对数据挖掘的基本流程和主要功能进行了分析,并讨论了数据挖掘在公共图书馆管理工作中的作用。
数据挖掘;公共图书馆;管理工作
信息技术与计算机网络技术快速发展,改变了公共图书馆的管理工作形式,基于计算机技术的图书馆文献信息编辑整理以及流通管理工作能够为读者保存并提供更加丰富全面的个人信息与文献信息,数据完整性、规范性、结构性更强。分析数据挖掘技术在公共图书馆管理工作中的作用,对图书馆管理决策有着重要意义。
(一)概述。数据挖掘技术是在大量不完全、模糊、随机数据中提取隐藏有价值信息的技术过程,传统的线性数据报表工具、统计工具不能满足数据价值信息提取的需求,数据挖掘技术随着需求的增长而快速进步。数据挖掘技术能够方便分类管理各种统计信息,充分挖掘、揭示数据模式、数据规律,从而更加准确地预测未来数据发展,是一种有较强交叉性的学科,涉及多方面知识,善于从海量看似随机而没有关联的数据信息中提取关键数据信息,获取知识。和传统报表信息处理方法相比,数据挖掘能够更加深刻的揭示事件发生原因,并为决策提供可靠依据。现阶段,数据挖掘技术有WEB数据挖掘技术、数据挖掘技术以及文本数据挖掘技术三个主要方向。WEB数据挖掘研究对象为WEB页面内容和不同页面间的结构规律,数据挖掘则主要研究各类数据,并对数据价值进行进一步的聚类分析、关联分析和偏差分析。文本数据挖掘主要用于文本信息的获取,主要功能有提出文本特征信息、文本分类以及数据的探索性处理等。
(二)数据挖掘基本流程。数据挖掘主要有数据准备、数据挖掘和结果表述三个方面。数据挖掘的准备阶段主要有数据集成、选择和预处理三个步骤,将多文件和多个数据库中的数据进行整合合并,清理数据遗漏项目,清理脏数据,提高数据质量。数据挖掘阶段,首先建立挖掘目标,确定数据挖掘假设,用户可以自己建立假设,或者由系统自动提出假设,之后选择合适的数据处理工具进行数据处理,确定数据分析工具之后,分析工具能够自动在海量数据中找寻合适的模型,从底部逐级向上搜索,找寻原始事实之间的联系,也可以添加人机交互,工作人员发问,验证假设的正确性。之后进行结果表述与解释,根据用户决策目标需求,分析提取的信息,区分有价值信息,使用决策工具将数据提供给决策者。
(三)数据挖掘基本功能。数据挖掘能够通过预测来提供前瞻性的决策依据,从数据库数据中找寻隐含的高价值知识。数据挖掘还能够对趋势和行为进行自动预测,从海量数据中找寻预测性信息,省掉大量传统手工分析过程,从数据中快速得到结论。市场预测就是最成功的应用,通过过去的促销数据就能够快速找出投资回报最大的用户,在各种商业行为的预测中,数据挖掘都有着广阔的应用空间。关联分析是数据挖掘另一个重要功能,通过大量数据的分析处理,数据挖掘能够找出大量数据中有关联的若干变量,生成可信度较高的规则。数据库也可以视作有意义的系列子集,聚类是偏差分析和概念描述的前提基础,划分对象不仅要重视距离,还应该涵盖类聚内涵描述。除此之外,数据挖掘还有概念描述、偏差检测等功能,都是传统数据分析技术所不擅长的。
(一)提供更加有效的教育功能。知识经济时代,人才教育不只是知识教育,还应该侧重于人的创造性思维和创新能力的培养,确保人才能够适应时代变化。经济建设和国家发展需要大批掌握扎实基础知识同时具有创造性思维和创造能力的复合型人才,教育工作也应该逐渐从应试教育逐渐转变为素质教育和创新性教育。对于读者来说,学习为目的的阅读有取证学习、学历学习、职业学习和素质学习等不同形式,不同的人生阶段有不同的学习重点,例如学生阶段学习以获取专业知识为主,就业之后热衷于职业资格证考试。公共图书馆是获取参考书籍最好的方式,也是学习的理想场所,如何为读者提供相关书目,满足读者阅读需求,是公共图书馆工作人员需要考虑的问题。使用数据挖掘技术,图书馆则能够准确预测读者的书目需求以及社会职业知识发展方向,该预测结果能够对图书馆书目采购、期刊报纸订阅起到指导作用,同时还能够为人事劳动教育部门提供对应的数据,帮助相关工作人员提供研究数据。通过数据挖掘,能够帮助确定不同行业、不同年龄、不同学历背景读者的书目差别,了解不同读者对图书的需求程度。分析用户信息表和借阅历史表,就能够制定一个和实际情况非常符合的书目决策表,对公共图书馆优化馆藏结构有着重要意义。
(二)优化公共图书馆信息服务功能。公共图书馆信息服务功能有公共公益性信息服务和产业公益性信息服务两方面内容,其中公共公益性信息服务面向社会成员,公益性信息服务面向社会组织。公共公益性信息服务是图书馆、文献信息服务机构、重要媒体提供的信息服务,公益性信息服务是国有企业、行业信息机构和行业协会提供的垄断性信息服务。使用聚类数据挖掘方法,能够对公共图书馆信息服务功能进行进一步优化。聚类分析使用了动态归类标准,并进行定量描述,选择多种不同相似性标准,能够将数据划分为多种不同层次类别,从而多层次文献聚类。公共图书馆使用聚类方法,无须预先进
行信息分类,可以根据图书馆的实际需要,选择合适的文献情报门槛值,符合门槛值要求的信息就化归为一类,上交给有关部门进行处理,多种不同的问题和门槛值将不同的信息划分为多个类别,信息的类聚所有文献情报都要参与,从而突破了当前情报分类方法的局限性。
(三)图书文献采购管理。公共图书馆地方文献管理通常都选择符合馆藏地方文献特点的分类方法,编制科学合理的馆藏地方文献分类细则,集中或者分散处理。分散处理方法不区别地方文献和非地方文献,不强调地方文献特征,根据学科属性分类,散布在多个学科不同的类目中,而集中处理方法首先突出地方特征,将地方文献集中起来统一使用、管理。近些年,公共图书馆逐渐意识到自己在地方文化弘扬推广中的重要作用,逐渐加大了对地方文献数据馆藏的建设与管理力度,但是实际工作中,仍然会出现地方文献书籍采购经费不足的问题,需要采取一定的策略进行取舍。常规的采购策略是优先选择热门领域书籍,即便书籍可能并不很重要,而非热门书订购则比较困难,这样的采购策略会导致热门书目过多,非热门书过少,图书馆馆藏结构不健康。而数据挖掘遗传算法能够很好地解决这个问题,该技术能够利用种群进化来主动寻优,根据不同领域热度,给出不同的权重,为采购策略制定提供指导。
公共图书馆是一种社会化的实体馆藏,在公共图书馆管理工作中应用数据挖掘技术,能够充分利用其数据组织分析、知识发现和信息深层挖掘功能,为读者提供更加人性化的阅读服务,有利于公共图书馆的进一步发展。
[1]黄红.图书馆绩效指标数据挖掘方法研究[J].图书馆学研究,2014(15).
[2]陈海军.数据挖掘在公共图书馆管理工作中的应用[J].中国管理信息化,2016(02).
[3]李仁玲,王建岭.数据挖掘技术在中医院校图书馆读者的行为及研究[J].当代教育实践与教学研究,2016(07).
[4]初景利,易飞,杜杏叶,等.持续推动图书情报理论创新与实践探索——《图书情报工作》2014年发文评述[J].图书情报工作,2015(01).
[5]俞锦梅.数据挖掘在国内图书馆应用领域研究综述[J].图书与情报,2015(02).