金 梅
(安徽农业大学图书馆,安徽 合肥 230036)
随着网络技术和信息科学的飞速发展,图书馆参考咨询的形式和内容都发生了根本性的改变,虚拟参考咨询应运而生。现代高校图书馆既有书籍典藏,也存储了庞大的数字资源,同时学科之间交叉重叠的关系日益复杂。因此,如何提供高质量的虚拟参考咨询服务是所有图书馆面临的一个棘手问题。数据挖掘作为一种新兴的数据处理技术,能有效的处理和分析海量的数据,使参考咨询提供的信息服务更加实时、动态、高效,有效地解决了当前图书馆“信息丰富而知识贫乏”的问题。
参考咨询工作是图书馆传统核心服务之一,它的服务质量和水平是现代图书馆核心竞争力的一个重要指标。在现代通信技术与网络技术普遍应用的条件下,虚拟参考咨询(virtual reference)逐渐显示出它独特的风格和魅力。虚拟参考咨询打破了传统参考咨询在时间和空间上的限制,即咨询员不受地域、时间的限制,实时解答读者提出的问题,从而使读者能够及时得到问题的答案,内容涉及馆藏资源及其利用、文献查找途径及查找中遇到的问题、图书馆的各项服务与规则等等。
数据挖掘(Data Mining,DM)又称数据库中的知识发现(Knowledge Discover in Database,KDD),是目前人工智能和数据库领域研究的热点问题。数据挖掘有很多的定义,比较普遍的一种是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者做出正确的决策。
数据挖掘的流程在应用于不同领域时会有所变化,因此要结合具体领域和知识、根据不同数据挖掘技术、针对不同问题的要求确定具体流程。比较普适的数据挖掘流程如下:理解数据和数据的来源;获取相关知识与技术;整合与检查数据;去除错误或不一致的数据;建立模型和假设;实际数据挖掘工作;测试和验证挖掘结果;解释和应用。
数据挖掘的方法研究融合了若干不同学科领域的技术与成果,从而表现出来非富多彩的形式。
图书馆为了给读者提供更多、更新的信息资源,大量引进中外文数据库。如中外文期刊数据库、学位论文数据库、引文统计分析库、学术会议论文数据库等。但是不同的数据库的标准很难完全统一,从而给读者查询、阅读和利用带来了一定的困难,也使图书馆参考咨询服务人员的服务质量不高,工作效率低下。
传统的参考咨询只能从表层提供一些比较单一、无关联的结果。而数据挖掘技术利用统计学中的抽样、估计和假设检验,人工智能、模式识别和机器学习的搜索算法、建模技术和学习理论,以及最优化、进化计算、信息论、信号处理、可视化和信息检索等思想和方法,有效地组织和检索信息,从而提高图书馆虚拟咨询服务的质量。
现代的数字资源和文献资源非常丰富、内容涉及各个互相交叉的学科,面对诸多媒体、各种形式和格式的大量无序的信息资源,要检索、分析、优化组合出用户满意的咨询结果比较困难,这时就可以利用数字挖掘技术对资源进行准确的描述、自动采集、整理组织、归类,实现对查询问题的全面深层解答。
由于各数字资源相互独立、有自己独特的表现和存储标准,因此需要采用统一的数据结构和组织形式,将各种数据库、电子资源库、网络信息等异构的数字化信息资源进行规范和储存。这种整合的和统一的资源能够更快速、更高效的对用户的检索进行反应。
图书馆的建设趋于数字化、虚拟化,参考咨询服务不再仅是简单让用户自己访问放在数据库中的数字化信息资源,而是要根据用户需求及
对信息资源访问的习惯和历史,能动的为用户提供服务。数据挖掘技术可以对用户访问信息、使用信息进行挖掘,在数字对象和用户、对象分类和主题之间进行模式匹配,采用不同挖掘技术从而确定个性化服务内容,提高为用户参考咨询服务的自动化水平。同时结合用户对资源的需求方向、类别的不同和需求量的大小,有针对性、合理的配置图书馆信息资源,满足用户的需求。
图书馆信息资源中,有陈旧冗杂的,也有新兴有用的。但在图书馆的粗放服务模式下,往往图书馆对数字资源存储和利用情况无法精确地的了解。利用数据挖掘技术,通过分析图书馆的资源引进和使用情况和用户的信息行为,从不同的角度反映资源的需求及资源使用的规律,可以为图书馆的管理层提供决策支持,为图书馆信息资源采集的改进和图书馆资源结构的改善提供科学依据。
图书馆的信息资源浩如烟海,用户在虚拟参考咨询服务中提出的信息需求也越来越不局限于信息线索或参考数据的获取,而更追求获取浓缩专深的全面深层解答。数据挖掘在数据组织、分析和知识发现及信息深层挖掘等方面有强大优势。因此,将数据挖掘应用于虚拟参考咨询工作,使图书馆在数字资源的组织和管理、服务质量的提升和服务方式的拓展上有了质的飞跃,有效地解决了当前图书馆“信息丰富而知识贫乏”的问题。在信息技术飞速发展的当今社会,我们有理由相信,数据挖掘技术、方法和工具也会不断发展和进步。
[1]孙达辰.时态数据挖掘在图书馆参考咨询工作中的应用[J].科技情报开发与经济,2011年第21卷第25期.
[2]林晓霞.网络知识挖掘在数字参考咨询中的实现[J].情报资料工作,2006年第2期.
[3]曹占伟,王桂平.数据挖掘技术在数字参考咨询中的应用浅析[J].科技信息,2008年第24期
[4]谢含,谢漫.数据挖掘—未来图书馆参考咨询工作的新方法[J].高校图书馆工作,2006年第1期
[5]饶媛.基于数据挖掘技术的高校图书馆参考咨询服务[J].计算机与网络.