◎ 晁阳
数据挖掘在高校图书馆的运用
◎ 晁阳
作为一种全新的信息分析辅助技术,数据挖掘在高校图书馆日常管理运营中有着十分广泛的应用,不仅能够有效提高图书馆的工作效率,还能为读者用户提供高品质的服务。本文简单介绍了数据挖掘技术的相关概念,重点分析了在高校图书馆中运用数据挖掘的可行性,并进一步详细地介绍了具体的应用,希望能够为相关研究提供有价值的参考建议。
随着网络信息技术的迅速发展,涌现出了一大批新媒体技术,给人们传统的阅读方式带来了巨大的变化。新形势背景下,高校图书馆有必要及时改变自身的管理和服务理念,积极采用先进的工作方式为广大读者用户提供更为便捷高效的服务,满足不同用户个性化的阅读需求。就目前来看,我国高校图书馆在数据挖掘、信息分析、加工等各方面的能力还有所欠缺,要想适应当今信息市场的激烈竞争,必须通过数据挖掘来对图书馆数据间的关联性进行深层次的归纳分析,从而准确得出不同读者用户的兴趣爱好、阅读习惯、借阅规律等信息,以便图书馆针对不同读者需求提供多种人性化的服务,及时调整相应的管理和运营策略,不断提升高校图书馆服务的质量水平。
所谓的数据挖掘是指一种从大量数据中获取有价值的、新颖的、有用的、潜在性信息的数据分析技术。在海量数据库中应用数据挖掘技术,能够在查询内容的同时总结出相应的搜索规律,帮助决策者快速分析历史数据,并对未来状况作出准确、科学的预测。因此,在高校图书馆中应用数据挖掘技术,对于图书馆自身的发展而言具有十分积极的意义。首先,我们可以通过数据挖掘技术对图书馆数据库中的大量原始数据进行全方位的归纳整理,清除一些错误、冗长的数据,提炼出绝大多数读者感兴趣的阅读数据,从而为下一步的数据挖掘工作做好准备;其次,基于图书馆数据库对现有的服务模式和关联规则进行评估分析,开展数据挖掘工作;最后,在用户界面中呈现出最终的数据挖掘结果。
经济层面分析。从经济角度分析,数据挖掘技术的应用必然会增加相应的运行成本,包括购买功能软件、硬件、升级系统或者购买第三方服务项目等费用,这些对于高校图书馆而言都是一笔不小的费用支出。然而,从长远角度和全局利益来看,尽管数据挖掘导致图书馆的经济成本上升,但同时也带来了巨大的收益。例如,通过数据挖掘对图书馆的用户群进行分类,根据不同读者用户的需求选择采购纸质图书或者电子资源,从而有效避免了采购图书资源后却无人问津的局面,有效降低了高校图书馆的采购成本。因此,在高校图书馆中应用数据挖掘,尽管短期内会导致图书馆成本增加,但是却能够有效提升图书馆的长期运营效益,故从经济层面上来分析,应用数据挖掘技术是可行的。
技术层面分析。现阶段,数据挖掘技术的应用已经遍布金融、零售、制造、通信等各个领域当中,取得了十分显著的应用成果,并且从目前已有的宏观数据来看,尚未出现因这门技术自身缺陷原因而给企业带来损失的现象。因此,我们有理由相信,目前数据挖掘的技术研究已经处于较为成熟的阶段,在高校图书馆的实际应用中存在的风险较小。此外,在当今社会大数据时代背景下,社会各界对于数据挖掘技术的发展都普遍较为重视,许多企业都能够提供关于数据挖掘的服务项目,高校图书馆可以根据自身发展的实际情况选择对外承包数据挖掘工作,从而有效规避技术层面上的风险。
运行层面分析。在高校图书馆中应用数据挖掘技术,能够更加准确清晰地获取读者用户的相关信息,以便图书馆制定出科学的决策信息。从本质上来看,数据挖掘对图书馆运行的影响主要体现在,在原有决策的基础上增加了一些更加具有说服性和科学性的辅助材料,并不会对整个决策的宏观局面和最终发展方向产生影响。为进一步保证数据挖掘的实施成果,高校图书馆有必要定期组织馆员们参加培训活动,学习最新的理论知识,同时,还应训练他们掌握基本的操作技能,使其能够迅速适应全新的图书馆管理和运营环境,灵活运用数据挖掘来开展日常工作,为读者用户们提供更高品质的服务。客观而言,这些培训活动的难度较小,在具体实施过程中,实际遇到的阻力较小,图书馆工作人员也相对地,都十分配合,所以在高校图书馆中应用数据挖掘技术是完全可行的。
数据挖掘准备阶段
图书馆工作人员在平时的工作过程中利用数据挖掘技术能够很轻松地获取到广大师生读者的基本信息,具体包括用户的年龄、性别、专业等,从而为图书馆管理层制定各项决策提供重要的参考依据。
记录图书的书目信息。在高校图书馆中,书目信息主要是指图书的主题名称、专业类别、作者、出版设、日期、排架号等综合数据的集合体,是图书馆数据库中的核心内容,也是我们利用数据挖掘技术促进图书馆高效管理运行的必要前提条件之一。
记录图书的借阅信息。图书借阅信息是图书馆管理层制定图书采购计划的基本依据,内容主要包括图书的书名、编号、排架号、借出时间、归还时间、借出次数等,运用数据挖掘技术能够系统化地对教师和学生借阅图书的情况进行科学全面的统计分析,从而得出每本图书的使用情况,并且对其将来的借阅状况进行预测,制定相应的采购计划,及时补充热门图书的馆藏资源,以满足师生们教学科研和工作学习的需求,从而有效实现图书馆借阅服务的集中化管理。
记录图书的检索信息。根据大数据结果和实证研究表明,通过记录各类图书的历史检索信息,能够较为客观地分析得出读者对这些图书的需求情况,从而有利于管理者作出更加合理的政策调整。为此,高校图书馆有必要进一步规范和完善现有的图书检索机制,尽可能地保证检索关键字、时间、读者编号等信息的完整性。鉴于在图书馆检索系统中,绝大多数情况下读者用户个人的标识信息都是以匿名方式出现,故在数据挖掘中可以用编号或地址来代替用户。如果检索关键字是较为规范的字段,则系统记录下相应的检索项、符号等数据信息,如果是一些短语或者句词,系统还需对检索信息先进行分词处理,然后再进行统计分析,以保证最终得出结果的真实性和可靠性。
数据挖掘的分析阶段
通过聚类分析法对图书馆信息管理系统中大量的借阅数据进行分析,能够准确获取读者用户们的借阅频率和阅读习惯,从而将不同层次水平的用户区分开来,为其提供个性化的服务项目,以满足广大师生群体多样化的借阅需求。具体地,高校图书馆在应用数据挖掘技术时可以按照以下步骤来有序进行:
数据清理。在高校图书馆中运用数据挖掘技术,首先需要对系统原有的数据信息进行清理,具体内容包括:清除已被注销图书的检索信息和借阅信息、清除指定书籍在某一年限前的所有相关数据信息等、清除一些重复、冗长、多余的数据信息等。通过清理,可以使高校图书馆数据库中的信息更加简明清晰,有利于数据挖掘和分析工作的顺利展开。
聚类分析。经过数据准备阶段后,可以得出各类图书被读者用户借阅的次数,在此基础上对所获得数据信息进行聚类分析,根据图书借阅频次的高低将读者用户群分为三个等级,分别为:不活跃读者、一般读者和活跃读者,然而再根据不同类别读者的阅读习惯和兴趣爱好,制定个性化的服务方案,以充分满足他们的工作学习需求,同时最大程度地激发他们的阅读兴趣,培养教师和学生们对高校图书馆的忠诚度,进而有效促进图书馆自身的可持续发展。
结果分析。通过对数据挖掘结果的客观分析,我们可以从图书借阅次数间接分析得出读者用户的阅读需求情况,衡量图书馆的服务质量,并进一步体现出教师和学生在某一方面的阅读行为特征。针对活跃程度不同的读者,图书馆可以制定不同的服务标准,以充分激发他们的阅读兴趣,例如,对于活跃群体,可以适当地增大他们借阅次数较多图书的册书,满足这部分读者大量的阅读需求,主动为他们提供人性化的服务,从而有效提升高校图书馆的管理运营水平。
综上所述,数据挖掘技术在高校图书馆中有着十分广泛的应用,除了本研究中所提到的内容,还包括在资源建设、学科管理、信息咨询、图书采购等多个方面的运用,对于促进高校图书馆的现代化管理建设具有十分积极的意义。尤其是在未来数字化图书馆发展进程中,数据挖掘起着关键性的作用,图书馆应灵活运用数据挖掘对海量的数据信息进行分析、归纳,从中总结出有价值、有潜在性的信息,为读者用户提供高品质的个性化服务。此外,高校图书馆还应不断完善和规范现有的管理工作,以进一步拓宽信息服务的内容,充分发挥数据挖掘在高校图书馆中的应用价值,从而有效促进高等教育事业的稳定发展。
陕西学前师范学院2016年度校级科研基金项目“数据挖掘在高校图书馆个性化推介服务中的应用研究”(项目编号:2016ZDKJ017)
陕西学前师范学院图书馆)