基于用户行为数据挖掘的数字图书馆电子资源推荐服务研究

2018-02-13 01:37江波
河南图书馆学刊 2018年12期
关键词:用户行为数字图书馆数据挖掘

江波

摘 要:随着数据挖掘技术的不断发展,信息数据的挖掘水平得到快速提高。为了提高数字图书馆电子资源推荐服务的水平,有效避免“数据孤岛”,文章从基于用户行为数据挖掘的数字图书馆电子资源推荐服务模型的构建策略及构建方案着手,分析了数据挖掘技术在数字图书馆电子资源推荐服务中的作用,为数字图书馆提高用户的信息采用率提供了参考。

中图分类号:G250文献标识码:A文章编号:1003-1588(2018)12-0059-03

关键词:用户行为;数据挖掘;数字图书馆;电子资源推荐服务

随着互联网技术的不断发展,图书信息资源的电子化进程也得到快速推进,数字图书馆的电子资源推荐服务是信息资源电子化推进过程中的一个重要环节,应该引起图书馆界的重视。为了满足用户的实际需求,数字图书馆在开展电子资源推荐服务前,应了解用户的个性化特征和使用习惯。从这个角度看,用户行为特征的提取能力决定数字图书馆电子资源推荐服务的水平。随着科技的发展,数据挖掘技术水平得到快速提高,在应用领域也得到迅速推广,数字图书馆采用数据挖掘技术对用户的行为特征进行提取,可避免“知识迷航”“信息过载”等情况的发生。

1 用户行为的类型

互联网技术的发展不仅给图书馆带来了大量的信息资源,在很大程度上还拓宽了用户获取信息资源的渠道,改变了用户获取信息的习惯和方式。为了帮助人们从互联网海量的信息资源中获取他们所需的信息,数字图书馆在提高信息资源检索能力的同时,也应不断提高对用户行为特征的挖掘能力。用户行为指图书馆用户为了解决自身在日常生产生活中遇到的问题,或者为了达到某种目的,对一定时期的相关事件数据进行查询、检索和信息加工等。图书馆只有掌握用户的这些行为特征,才能整理和分析用户的使用特点及信息需求,才能充分发挥自身优势为用户提供更贴合实际的服务。常见的用户行为主要有两种:一是用户在图书馆内的直接使用行为,即用户进入图书馆,在不同区域进行信息资源的查阅和咨询行为。二是用户通过图书馆网站进行的检索行为,即用户带着问题在图书馆网站进行检索、浏览、交流互动及下载资源信息等行为。

2 数字图书馆挖掘用户行为数据的必要性

随着图书馆数字化进程的不断推进,数字图书馆拥有的数据量呈几何倍数增长,这些数据极大地丰富了馆藏资源,给用户的信息获取带来了便利。数字图书馆的数据资源主要包括馆藏书刊资源信息、电子期刊资源信息、视频音频信息、用户借阅信息,以及用户的留言信息、分享信息和相关的硬件设备信息等,这些数据是数字图书馆正常运转的基础。但是,受技术水平和经费的限制,部分数字图书馆还不能很好地利用先进技术对馆藏数据进行合理优化和融合。在这种情况下,大量数据不能进行有效连接与贯通,不能得到有效利用,形成了“数据孤岛”。然而,这些冗余、孤立存在的数据往往含有大量有价值的信息,如果这些信息不能被及时发现和有效利用,就会造成资源浪费,同时也削弱了数字图书馆的服务能力。

针对上述情况,数字图书馆应重视馆藏数据的冗余问题,尤其是用户行为数据的冗余、孤立等问题,并采取有效手段进行解决。一方面,数字图书馆可以采取有效的管理手段,对馆藏数据进行分类管理,避免出现叠加或盲区等现象,方便用户快速获取数据;另一方面,数字图书馆可以采用先进的技术,如数据挖掘技术,对馆藏数据进行挖掘和整理。随着数据挖掘技术的逐渐成熟,该技术的数据特征挖掘效果良好,可以帮助使用单位实现数据的有效利用。因此,数字图书馆应引入数据挖掘技术对用户行为数据进行挖掘,及时分析用户的行为特征,掌握用户的使用习惯,为个性化推荐服务打下基础。

3 基于用户行为数据挖掘的数字图书馆电子资源推荐服务模型构建

数字图书馆通过对用户行为数据进行挖掘的方式,掌握用户的行为习惯和行为特征,提高服务水平。笔者结合数字图书馆的资源情况,构建了基于用户行为数据挖掘的数字图书馆电子资源推荐服务模型。

3.1 电子资源推荐服务模型的构建策略

电子资源推荐服务在数字图书馆各种功能中占主要地位,它是数字图书馆与用户联系的中间纽带,可以完整展现数字图书馆的服务能力和水平。电子资源推荐服务主要有交互性、人性化、即时性等特征。即时性和交互性特征的作用是通过大量数据即时链接、即时交互,解决用户在海量数据包围中可能出现的“知识信息迷航”问题;个性化特征的作用是在用户被动接受无用数据时,帮助用户过滤掉主观上不需要的信息,解决“知识信息过载”的问题。具体的构建策略如图1所示。

3.1.1 利用关联技术应对“知识信息迷航”的问题。关联技术是一个统称,包括本体、云平台等,具有规范化、可共享等特点。在本体、云平台的基础上,关联技术可以对多种类型的知识库(包括异构知识库)进行有机连接,各类知识库通过关联技术进行连接,最终形成庞大的数据集群库。一方面,用戶可以通过数据集群库对相关的信息资源进行精确匹配查询,提高检索数据的准确率和查全率;另一方面,各类信息数据管理平台通过该数据集群库缩小数据资源的检索范围,提高用户检索数据资源的效率,进而解决“知识信息迷航”的问题。

3.1.2 利用关联技术应对“知识信息过载”的问题。数字图书馆在提供电子资源推荐服务的过程中,“知识信息过载”的问题尤为凸显。数字图书馆如果没有掌握用户的行为特征,就会向用户推荐过多不需要的信息,给用户带来一定的困扰。数字图书馆通过关联技术,可以将用户的行为数据进行有机连接,挖掘用户的行为特征,对用户进行有效推荐,提高用户的满意度。

3.2 电子资源推荐服务模型的构建方案

基于用户行为数据挖掘的数字图书馆电子资源推荐服务方案主要由用户行为特征数据本体库、用户需求与喜好挖掘本体库和馆藏资源信息库三部分构成,具体的构建方案如图2所示。

3.2.1 用户行为特征数据本体库的构建方案。数字图书馆可利用本体技术,对获取的用户行为特征信息进行再处理,提取与用户行为特征数据库相关的字段。同时,数字图书馆也应分析整理馆藏资源信息库的信息,提取与用户行为特征相关联的服务日志信息等内容,进而构建用户行为特征数据本体库。该本体库构建的一个难点是用户实际需求与馆藏资源的匹配问题,在整个本体库构建的过程中应引起数字图书馆的重视。

3.2.2 用户需求与喜好挖掘本体库的构建方案。数字图书馆积累了大量用户需求及喜好的信息,如何利用这些信息提高电子资源推荐服务的效率是其亟须解决的问题。在构建用户需求与喜好挖掘本体库的过程中,数字图书馆要详细统计和分析用户的行为日志,对用户的显性需求和隐性需求进行分类,用特定的本体术语进行描述,方便相关功能模块的调用。

3.2.3 电子资源推荐服务流程设计。当用户登录数字图书馆后,系统会根据用户的登录信息,在用户行为特征数据本体库和用户需求与喜好挖掘本体库中进行检索,将用户的需求与馆藏资源进行信息匹配,得出用户可能需要的图书、期刊、专利等方面的信息,并以小窗口的形式向用户进行推送。当用户在操作界面检索需要的信息时,系统会将用户输入的检索信息与用户的特征数据信息进行融合,找出关联信息,并在馆藏资源信息库中进行检索。基于用户行为数据挖掘的数字图书馆电子资源推荐服务是一个实时的过程,主要通过系统后台运行,避免影响用户的实际操作,同时又能向用户推送符合其要求的信息。

4 基于用户行为数据挖掘的数字图书馆电子资源推荐服务的优势分析

4.1 推荐服务更加精准

基于用户行为数据挖掘的数字图书馆从用户的实际需求出发,对用户行为特征进行挖掘,并对获取的用户行为特征信息进行详细比对和关联分析,找出其中的隐性信息,更好地掌握用户的行为习惯、需求和喜好等内容,进而为用户提供精准的电子资源推荐服务。数字图书馆利用数据挖掘技术不仅提高了电子资源推荐服务的准确性,还满足了用户的个性化信息需求,提高了用户的信息采用率。

4.2 用户使用更加便捷

基于用户行为数据挖掘的数字图书馆电子资源推荐服务的操作系统是自动运行的,系统后台能自动根据用户的登录信息获取用户的行为特征信息,并与馆藏资源数据库中的资源进行比对,找出用户可能需要的资源信息并进行推荐。在推荐信息时,数字图书馆通过小窗口显示的方式,避免对用户的操作界面产生影响,进而提高用户的检索效率。因此,用户在输入检索信息关键词时,可以快速浏览系统的推荐信息,如果推荐信息包括用户需要查找的信息,用户就不需要再重新查找。

4.3 数字图书馆管理更加高效

基于用户行为數据挖掘的数字图书馆电子资源推荐服务主要是通过运行计算机程序实现的,不需要专门人员负责实施。该推荐服务主要是通过增设系统模块实现的,也就是说在系统升级过程中数字图书馆只要将模块融入管理系统,就不需要再派专门人员负责分析用户行为,从而降低了经费开支,提高了管理效率。

5 结语

随着科技的不断发展,数据挖掘技术已经渗透到各行各业,并在多个领域发挥着积极的作用。基于用户行为数据挖掘的数字图书馆电子资源推荐服务提高了用户的信息采用率,为数字图书馆电子资源推荐服务智能化发展打下了坚实的基础。

参考文献:

[1] 张宏.我国高校图书馆大数据研究现状分析[J].图书馆工作与研究,2016(7):46-50.

[2] 王捷.大数据时代下图书馆开展信息服务的对策[J].现代情报,2013(3):81-83.

[3] 张卫群.图书馆用户信息行为研究综述[J].图书馆学研究,2006(8):87-90.

[4] 朱立红.高校图书馆的数据挖掘技术应用与用户研究[J].图书馆杂志,2008(6):39-42.

[5] 应璇,孙济庆.面向大数据的用户检索行为研究[J].情报杂志,2014(2):140-143.

(编校:孙新梅)

猜你喜欢
用户行为数字图书馆数据挖掘
数据挖掘综述
软件工程领域中的异常数据挖掘算法
电力高校图书馆转型智库服务的研究
社会化媒体用户使用动机与行为探析
基于云计算的数字图书馆建设与服务模式研究
基于R的医学大数据挖掘系统研究
刍议数字图书馆计算机网络的安全技术及其防护策略
基于用户行为分析的智能家居系统的研究与设计
一本面向中高级读者的数据挖掘好书