基于聚类优化的数字图书馆协同过滤个性化推荐服务研究

2019-07-01 04:03盛先锋
中国中医药图书情报 2019年3期
关键词:数字图书馆数据挖掘

盛先锋

摘要:随着近年来计算机技术快速发展,数字图书馆有必要基于聚类优化对多种文献数据资源协同过滤,面向用户提供个性化推荐服务,以提高服务效率。文章在介绍聚类优化概念及含义的基础上,分析了数字图书馆协同过滤个性化推荐服务的优势,包括优化图书馆数字信息服务机制、为用户提供优质文献资源、提高数字资源利用率等。探究了协同过滤个性化推荐服务模式,包括个性化定制服务、个性化推送服务、数据挖掘与决策服务。最后归纳出数字图书馆协同过滤个性化推荐服务构建策略,即利用智能搜索技术、精确搜索资源,应用数据挖掘技术、挖掘数字信息价值,优化聚类算法、制定精准服务方案,完善系统平台、构建资源过滤服务机制。

关键词:聚类优化;数字图书馆;个性化推荐服务;数据挖掘

DOI: 10.3969/j.issn.2095-5707.2019.03.009

中图分类号:G250.7;G258.6    文献标识码:A    文章编号:2095-5707(2019)03-0037-04

Abstract: With the rapid development of computer technology in recent years, it is necessary for digital libraries to collaboratively filter a variety of literature and data resources based on clustering optimization and provide personalized recommendation services for users in order to improve service efficiency. On the basis of introducing the concept and meaning of clustering optimization, this article analyzed the advantages of collaborative filtering personalized recommendation services in digital libraries, including optimizing the mechanism of digital information services in libraries, providing high-quality literature resources for users, and improving the utilization rate of resources, explored the personalized recommendation service mode, including personalized customization services, personalized push services, and data mining and decision making services, and finally concluded the construction strategies of collaborative filtering personalized recommendation services in digital libraries, that is to use intelligent search technology to accurately search resources, apply data mining technology to mining digital information value, optimize clustering algorithms to develop precise service plans, and improve system platform to construct resource filtering service mechanism.

Key words: clustering optimization; digital libraries; personalized recommendation services; data mining

随着数字工具、计算机技术的广泛应用,以数字网络为核心,智能搜索技术、数据挖掘技术为辅助的数字图书馆个性化推荐服务成为我国图书情报界研究的重点课题。我国许多高等院校、科研院所、信息服务机构都构建了符合自身发展及用户个性化需求的数据资源推荐服务,并在增强数字图书馆数据处理能力的同时,不断促进其功能拓展,实现基于聚类优化数字图书馆协同过滤个性化推荐服务。但从目前的实践情况来看,很多数字图书馆的个性化推荐服务还处在初步验证阶段,面向用户提供的服务存在服务质量不高,服务效能低等问题[1]。因此,在数字信息情景中,数字图书馆个性化推荐服务还有许多需要改进的地方。基于聚类优化的数字图书馆个性化推荐服务能解决数字图书馆在数字信息管理、用户信息认证、数据资源协同过滤、知识共享方面存在的问题,完善与发展面向用户的个性化推荐服务,为构建集成化、模块化、高效率的个性化推荐服务模式提供方法指导。

1  聚类优化概述

1.1  概念

在科学情景中,对物理或是抽象对象的集合根据其特征与相似的性质分成类的过程称为聚类,由多个聚类生成的簇是一组或多组数据的集合,针对其存在的性质有目的选择、清洗、定向使用称为聚类优化。在信息科学领域,针对海量的数据资源存在著大量分类问题,聚类优化又称为群优化,主要研究各种相似数据资源或关联数据的优化问题,是一种基于统计学概念的数据优化方法。聚类优化起源于分类学,针对目标群体的有效聚类不等于分类,聚类与分类的不同之处在于进行聚类的目标群体划分的类是未知的。聚类优化有多种方法,有系统聚类优化、样品聚类优化、动态聚类优化及模糊聚类优化等,在数字图书馆数据挖掘与资源存储中得到了广泛应用[2]。

1.2  含义

目前,基于聚类优化概念产生了聚类优化算法与聚类优化工具,在数字信息处理、数据挖掘、资源存储与利用方面得到最广泛的应用。在面对海量信息资源及大量结构化、半结构化的数据时,传统的数据分类方法及数据归类工具很难在短时间内做出针对性的处理,对数据资源深度挖掘,提取有价值的信息片段,而聚类优化能有效地弥补这一点。面对大量结构化、异构化的数据信息,基于特定的分类主题或根据数据资源共有的某些特性组成的集合分成类,并根据这些类进行数据挖掘,提取有价值的信息数据并进行有效存储,供使用者定向提取[3]。这种基于聚类的数据优化方法适用于多种信息情景,数据挖掘过程中提取的各种高价值信息能被有效利用,适用于数字图书馆开展用户个性化服务。

2  基于聚类优化的数字图书馆协同过滤个性化推荐服务的优势

2.1  优化图书馆数字信息服务机制

在知识经济时代,阻碍数字图书馆文献资源高效率利用、传输及获取的主要障碍在于信息服务渠道及管理问题。数字图书馆面向用户的个性化服务并不完善,只适用于少部分用户的个性化需求,面向群体用户及特定需求用户缺乏有效的个性化推荐服务。当前数字图书馆海量的数据资源及与之对应的数据资源管理、个性化推荐及个性化获取缺乏必要的技术支持,所提供的个性化服务不尽如人意。基于聚类优化的数字图书馆协同过滤个性化推荐服务成为解决数字图书馆用户服务问题的有效方法[4]。依靠聚类优化及对海量数据资源的深度挖掘和协同过滤,能在满足数字资源集中处理需求的基础上实现与不同需求用户的对接及个性化推荐,根据用户需求自动匹配数据资源,使用户获取数据资源的渠道更加畅通,数字图书馆信息服务机制得到优化。

2.2  为用户提供优质文献资源

在知识服务情景中,用户的信息需求更加多元,从传统的书籍借阅、文献检索、资源获取转向个性化的知识需求。数字图书馆传统的用户服务模式已难以适应用户的个性化知识需求。这就迫切需要一种新的个性化知识服务以满足用户的需求。基于聚类优化的数字图书馆协同过滤个性化推荐服务能适应用户的个性化获取知识资源的意愿。对海量知识资源进行深度挖掘、聚类优化并有效过滤,根据用户需求进行资源共享,为用户直接提供知识服务,使用户获取知识更为便捷[5]。同时,基于聚类优化的数字图书馆个性化推荐服务改变了数字图书馆传统以知识共享、资源输出为主的信息服务模式,不仅提高了数字图书馆的服务效率,更深入满足了用户的信息需求,垂直为用户提供优质的文献资源。

2.3  提高数字图书馆数字资源利用率

基于聚类优化的数字图书馆协同过滤个性化推荐服务应是数字图书馆信息服务功能的延伸,是以聚类优化为核心、协同过滤为辅助,面向用户提供个性化知识服务的服务模式。但目前很多数字图书馆基于用户个性化需求的知识服务尚不能满足用户高效率资源获取的需要,无法根据用户需求匹配数据资源。基于聚类优化的数字图书馆协同过滤个性化推荐服务针对数字图书馆各种信息数据深度挖掘、聚类优化,针对数据资源类型进行整理和存储,根据用户需要垂直提供个性化服务,避免了数字图书馆数据资源浪费,实现数据资源高效利用。

3  基于聚类优化的数字图书馆协同过滤个性化推荐服务模式

根据服务需求和服务类别,可以分成3种服务模式:个性化定制服务、个性化推送服务、数据挖掘及决策服务。可以真正发挥出以用户为核心的服务理念,结合用户需求与个人偏好,实现个性化推荐服务,依靠数据挖掘为用户提供决策服务,最大化满足用户文献资源获取的需要。

3.1  个性化定制服务

個性化定制服务是一种针对用户需求分析,或是分析以往用户服务记录,针对用户需求提前做好知识产品,提供给用户的服务模式,也就是根据用户的个性化需求量身定制产品。该项服务需要以用户的自动性选择为基础。数字图书馆作为产品供应方,首先要针对用户的兴趣与行为偏好进行大量的数据搜集,以搜集过来的数据信息作为初始数据,并有针对性地进行分析,依据用户需求定制个性化网页,推送相关的数据信息,将个性化的知识导航推荐给目标用户。用户可自主选择这种个性化信息推送方式,服务具有较强的针对性[6]。但由于用户对数字图书馆资源内容不了解,图书馆很难将用户抽象化的需求转化为能提供具体服务的方式,服务形式相对较单一,是一种浅层的服务模式。

3.2  个性化推送服务

与上述依据用户需求进行产品定制开发服务模式不同的是,个性化推送服务属于围绕用户需求的主动化的服务模式,主要以智能技术为核心,通过智能系统大量收集用户信息,包括用户的行为习惯、个人兴趣、行为偏好等,通过对这些初始数据深度挖掘,在数据结果的支撑下为用户主动推送信息。数字图书馆这种面向用户的个性化推送服务模式是相对全面的信息推送,操作简单,服务效果较强,以用户的初始数据为基础为用户提供服务,属于深层次的个性化推荐服务模式[7]。

3.3  数据挖掘及决策服务

这种服务模式与上述的个性化推送服务模式有着相似之处,都是在全面搜集与分析用户基础数据前提下进行的信息推送。但这种服务模式使用的技术及工具更加先进,大量采用了大数据挖掘技术、语义网技术等智能化技术与手段。通过对用户初始数据深度挖掘与分析后,进一步延伸用户的基础信息数据价值,为用户自行进行文献检索和资源获取提供决策支持。这种全智能化的个性化推荐服务模式要应用到较多的先进技术,不仅其服务的精准性和有效性更高,服务的时效性也更强,属于最高层次的个性化推荐服务。

4  基于聚类优化的数字图书馆协同过滤个性化推荐服务构建策略

4.1  利用智能搜索技术,精确搜索资源

基于聚类优化的数字图书馆协同过滤个性化推荐服务的实现要以智能搜索技术为核心,对信息资源实现精确查询。数字时代每天产生海量的信息数据,为了方便人们快速查询和获取信息,发明了搜索引擎供人们快速查询数据。搜索引擎技术多种多样,有的用于定向搜索,有的用于数据搜索,以可供识别的方式将人们搜索的信息呈现出来。智能搜索引擎技术是兼容多种技术与数据格式的搜索技术,以人工智能技术为基础,对不同种类的信息精准定位、快速识别,在应用过程中要实现6种功能,包括语音识别、搜索提示、服务导航、文献检索、智能推送、数据查询,根据用户的行为偏好自动呈现信息数据,使用户获取数据资源更为便捷。

将智能搜索技术运用到数字图书馆的个性化推荐服务中,能为用户提供更加精准高效的信息服务,能够提高数字图书馆个性化推荐服务的整体效率,使数字图书馆资源利用能全面满足用户的个性化需求。智能搜索技术是基于聚类优化的数字图书馆协同过滤个性化推荐服务的核心,全面利用该项技术并使其发挥出效能,能实现对数据库资源的优化提取,提高数据资源搜索的精准性。

4.2  应用数据挖掘技术,挖掘数字信息价值

基于聚类优化的数字图书馆协同过滤个性推荐服务的实现要全面利用数据挖掘技术,对有价值的信息资源进行深度挖掘,发挥其特有的作用。数字图书馆个性化推荐服务作为新的服务模式,离不开数据挖掘技术的支持。数据挖掘是从大量信息中找到有价值的数据,利用多学科技术,并借助算法工具、统计学、数据库系统实现。基于聚类优化的数字图书馆协同过滤个性化推荐服务可针对数据库滞留的数据进行深度挖掘、聚合、提取,筛选出有价值的数据资源进行二次开发,并通过个性化推荐服务直接与用户匹配,满足不同用户的资源检索、查询的需要。

4.3  优化聚类算法,制定精准服务方案

基于聚类优化的数字图书馆协同过滤个性化推荐服务的实现,要利用聚类优化算法工具为用户提供精准的个性化推荐服务。在数字信息情景中,为了确保个性化推荐服务的高效率和精准性,数字图书馆要从数据资源搜集、管理、综合利用等方面全面利用聚类优化算法工具,对数据库中的资源数据深度挖掘、聚类优化。相较于传统的个性化推荐服务,采用聚类优化算法工具的个性化推荐服务的精准性更高,给予用户的个性化选择空间更大,能有效避免数据资源流失、浪费等问题,满足用户个性化资源获取需求。

4.4  完善系统平台,构建资源过滤服务机制

要实现基于聚类优化的数字图书馆协同过滤个性化推荐服务,需完善系统架构,创设资源过滤服务机制。数字图书馆在长期的信息服务过程中会产生各种各样的数据信息,对这些数据资源聚类优化是数字图书馆首先要完成的任务。这也就决定了数字图书馆要利用一系列算法工具针对用户的个性化需求,有目的、有选择地对不同数据资源聚类优化,筛选出有价值的数据资源供用户使用。一方面,数字图书馆要在综合不同数据资源种类的前提下,着重于价值性数据资源的选取和利用;另一方面,数字圖书馆要针对用户个性化需求及时匹配资源,方便用户连续获取资源。

5  小结

基于聚类优化的数字图书馆协同过滤个性化推荐服务的实现,符合图书馆数字化转型的需要,利用一系列先进的技术工具对数字图书馆的数字资源聚合优化、挖掘,能解决数字图书馆面对用户个性化需求服务效能不足的问题,可有效提高数字图书馆信息服务效率,为用户提供高质量、高效率、人性化的个性化推荐服务。

参考文献

[1] 陈臣.大数据时代一种基于用户行为分析的图书馆个性化智慧服务模式[J].图书馆理论与实践,2015(2):96-99.

[2] 姚钱,温嵘生.人工智能技术在图书馆中的应用[J].科技资讯, 2017(24):222,224.

[3] 陆婷婷.从智慧图书馆到智能图书馆:人工智能时代图书馆发展的转向[J].图书与情报,2017(3):98-101,140.

[4] 张兴旺.以信息推荐为例探讨图书馆人工智能体系的基本运作模式[J].情报理论与实践,2017,40(12):69-74.

[5] 韦美峰,王亚民.基于后缀树聚类的主题搜索引擎研究[J].情报理论与实践,2017,40(12):123-127,62.

[6] 赵蓉英,陈必坤.基于Nutch的图情博客搜索引擎的设计与实现[J].情报科学,2012,30(4):486-491.

[7] 胡秀云.云计算环境下数字图书馆个性化信息服务研究[D].武汉:湖北工业大学,2014.

(收稿日期:2018-11-05)

(修回日期:2018-11-23;编辑:魏民)

猜你喜欢
数字图书馆数据挖掘
数据挖掘技术在内河航道维护管理中的应用研究
数据挖掘综述
软件工程领域中的异常数据挖掘算法
高校图书馆的未来发展模式刍议
浅析“互联网+”时代的图书馆管理
基于云计算的数字图书馆建设与服务模式研究
基于R的医学大数据挖掘系统研究
刍议数字图书馆计算机网络的安全技术及其防护策略
一本面向中高级读者的数据挖掘好书