聂飞霞
(西北大学图书馆,陕西 西安 710127)
基于数据挖掘技术的移动图书馆个性化图书推荐服务*
聂飞霞
(西北大学图书馆,陕西 西安 710127)
随着信息技术和移动网络的发展,移动图书馆已经成为图书馆的延伸服务之一。通过分析国内外移动图书馆现有的服务模式及种类,提出了两种基于数据挖掘技术的移动图书馆个性化图书推荐服务。
移动图书馆 数据挖掘 个性化图书推荐服务
随着手机的普及以及移动网络的发展,移动图书馆(Mobile Library)开始进入人们的生活。工信部统计数据显示,到2013年3月底,我国共有11.46亿移动通信服务用户,越来越多的人利用移动设备浏览网页、观看视频、进行GPS地图导航等。传统媒体的数字化成为大趋势,数字期刊、数字报纸、数字图书、数字视频等不断涌现,手机作为“第五媒体”的载体[1],已经成为人们不可缺少的“日常用品”。自“移动图书馆”这一概念2000年被提出以来,其在国内外图书馆界迅速发展,目前已经成功应用于国内外的众多图书馆。近几年随着4G移动通信技术的到来,移动图书馆也面临着新的机遇和挑战。4G移动通信技术是3G技术与WLAN技术结合的新通信技术,其数据传输速率更快,而且可以高效率传输高清视频图像等数据[2]。如何更好地利用4G移动通信技术,使移动图书馆更加人性化,是近年来的一个研究热点。
目前国内外图书馆开展的无线业务,从服务模式来看,主要采取的是WAP站点服务、SMS短信服务以及APP应用3种方式[3]。其中WAP站点服务是一种被动拉取模式,短信服务是一种主动推送模式,而APP应用是近几年发展起来的安装于移动客户端的软件。随着Apple Store的发展,使得APP应用开发炙手可热,APP应用服务将是移动图书馆的发展趋势。但是由于APP应用需要大量的人力物力来支持,增加了图书馆的建设成本,因此目前国内提供APP应用的图书馆还不多。在国内的移动图书馆领域,移动图书馆的服务方式并不是单一的以某种模式出现,经常是两种或者3种模式结合起来为读者提供服务。而国外尤其是欧美国家,移动图书馆在2000年就已开始拉开帷幕[4]。2007年11月召开的“世界移动图书馆会议”,以及2009年11月召开的“手持图书馆联机会议”为国外图书馆界的学者们提供了交流的平台[5]。美国的斯科基市公共图书馆设计的移动图书馆是欧美移动图书馆界的先河。近几年欧美移动图书馆的WAP站点服务已经趋于成熟,而在国内图书馆还为数不多的APP应用服务在欧美图书馆界也逐步趋于潮流[6]。以下是移动图书馆的3种服务模式。
1.1 SMS短信服务
SMS即Short Message Service。目前国内外图书馆的SMS短信服务主要有两种服务模式:一种是主动推送型,如图书馆向读者发送的到期提醒、欠款通知、讲座通知、新书快送等;另一种则是读者定制型,如对新书通报的定制、对书目查询的定制等[7]。SMS短信服务目前是3种服务模式当中最易实现的服务,因为只要有手机就有收发短信的功能,不需要开通上网业务。
1.2 WAP站点服务
WAP即Wireless Application Protocol。是指一种无线应用协议,该协议具有开放通用的特性。只要我们的移动终端支持这一协议,即可通过移动终端访问图书馆的WAP站点。因此,随着智能手机的普及,WAP站点服务已经逐步超越了SMS短信服务模式。WAP站点服务提供的主要服务内容包括图书查询、我的图书馆、公告新闻、新书通报等。从E线图情和谷歌深度检索的调查结果可以看出,截至2012年底,我国10余家公共图书馆包括上海图书馆、东莞图书馆等,以及大量的“211”高校图书馆包括清华大学图书馆、北京大学图书馆、南京师范大学图书馆、同济大学图书馆等开始提供手机WAP网站服务[8]。
1.3 APP应用服务
APP即Application的缩写。国内图书馆界开展APP应用服务较晚,从2000年到现在,移动图书馆主要提供的服务还是基于SMS短信服务以及WAP站点服务。2005年才开始尝试开发利用APP应用服务[9]。国内首度推出移动图书馆APP应用服务的是上海图书馆的“手机图书馆”,其手机图书馆APP应用服务有专门的移动客户端,读者可以通过扫描二维码或者检索移动图书馆名称来安装APP移动客户端。上海图书馆的APP应用服务主要包括馆藏目录查询、读者借阅查询、展览讲座、读者服务、上图信息等[10]。而国家图书馆在移动图书馆APP服务方面做得也很出色,在推出“掌上国图”APP应用后,又将其馆藏电子书资源做成了系列的APP应用服务。从目前国内图书馆APP应用服务现状来看,国内图书馆开展APP应用服务还处于起步阶段,提供的服务类型也仅仅是传统服务的“APP化”,也就是将原来传统的图书馆服务做成APP软件。移动图书馆的APP应用服务在个性化服务方面还有很大的发展空间。
移动图书馆的3种服务模式从时间上来看是依次开展的,从最初的SMS短信服务到SMS短信服务与WAP站点服务相结合,再到现在的WAP站点服务与APP应用服务并存的服务模式。而从服务内容来看是逐步深入,从最初的SMS短信服务的单一服务到WAP站点服务与APP应用服务的深层次多方面的服务模式。移动图书馆的开发逐步向方便快捷、高效全面的方向发展。表1是移动图书馆3种服务模式的优缺点比较。
近几年,国内的移动图书馆服务基本都是传统服务的延伸,也就是将传统桌面转移到移动介质上,服务内容特色化道路还很漫长[11]。有的学者提出在移动图书馆客户端设计用户个性化定制服务,也就是用户可以添加自己所需资源,还可以根据自己的使用习惯来布置系统界面。还有的学者提出将二维码以及RFID技术与移动图书馆技术相结合,更科学有效地实现图书定位服务。笔者将提出基于数据挖掘技术的移动图书馆特色推荐服务,并对此展开记述。
2.1 数据挖掘
数据挖掘是指寻找隐藏在数据中的信息如趋势、特征及相关性的过程。数据挖掘的一个重要过程就是从数据中挖掘知识的过程,也称为数据库中知识发现的过程和知识提取、数据采掘的过程等,并且可以在这一过程中用于发现概念、分类、关联、预测、聚类、趋势分析、偏差分析和相似性分析及结果的可视化[12]。笔者所提供的移动图书馆个性化推荐服务,主要运用了数据挖掘中的聚类分析和关联规则两种算法。聚类分析(cluster analysis)的主要目的是将数据分成不同类或者簇的过程,笔者主要应用了k-means算法。关联规则(association rules)是找出既定事件或数据中能同时出现的频繁数据(即高频项目组)的一种方法,笔者采用了经典的Apriori算法。
2.2 基于数据挖掘技术的移动图书馆个性化图书推荐服务
基于数据挖掘技术的图书推荐服务主要有两个工作方面。一个是利用登录移动图书馆的读者所留下来的历史数据来预测用户潜在的喜好和兴趣,另一个是将挖掘出来的预测数据展示给读者。移动图书馆读者访问所产生的数据主要包括浏览数据、书目查询数据、借阅数据等,这些海量数据将成为个性化图书推荐的数据源。
基于数据挖掘技术的移动图书馆个性化图书推荐流程如图1所示,当读者用户成功登录系统后,系统将从读者聚类推荐和读者关联推荐两个方面进行个性化推荐处理。
图1 移动图书馆个性化图书推荐流程
2.2.1 读者聚类个性化图书推荐——您所在类别的读者都借了什么书
移动图书馆个性化推荐流程如图1所示,第一种个性化图书推荐方式是读者的聚类推荐。读者成功登录以后,系统首先利用k-means聚类算法对系统内所有读者进行聚类处理。k-means算法是给定一个k值,然后将所需要聚类的数据对象分为k个聚类。这些聚类的特点就是同在一个聚类的特性较相似,而不在同一个聚类的特性相似度较低。而这里的相似度是通过一个“中心对象”来计算的,“中心对象”是聚类中对象的均值。表2为读者信息表,登录后系统会识别用户的名称、证号、类型等信息,根据这些属性对登录读者与聚类结果进行比对。得到当前读者所属分类中所有读者所借阅的图书,然后根据这些图书的借阅量进行排序并且排除当前读者已经借阅过的图书,最终得到一个根据读者分类的推荐图书清单。
表2 读者信息
2.2.2 读者关联个性化图书推荐——选择该书的读者还借了什么书
第二种个性化图书推荐方法是对读者的关联推荐,也就是只要读者有借阅记录,系统就会根据借阅记录进行关联分析,从而告诉读者借过这本书的其他人还借了哪些书。表3为图书信息结构表,Apriori关联规则算法提取的图书特征值主要是BookIndex项,即索取号项。如图1所示,读者成功登录系统以后,系统首先判断当前读者是否有借阅记录,如果没有借阅记录,那么无法提供关联推荐图书,流程结束;如果有借阅记录,那么找出所有借阅图书并且利用Apriori关联规则算法对所有借阅事务进行关联规则分析,得到当前读者关联的图书,然后根据置信度以及图书的借阅量对图书进行排序并排除读者已经借阅过的图书,最终得到一个基于关联规则的兴趣推荐图书清单。
表3 图书信息结构
个性化推荐服务在很多网站都开展的很有特色,而且受到了广大网民的青睐。例如当当网推出的“买过本商品的还买了什么”、淘宝网推出的“同类热销宝贝”、卓越网推出的“为我推荐”等都是基于关联规则的个性化推荐服务。而淘宝网的用户分类是对会员购买物品进行离散分析,然后对会员进行聚类挖掘。未来在移动图书馆领域,我们希望读者在登录图书馆的APP应用后既能够享受到传统的服务也能够体验到个性化推荐服务。笔者所提出的移动图书馆个性化推荐服务,只要读者成功登录到APP应用,就能为读者提供读者聚类个性化图书推荐;而只要存在借阅记录的读者就能得到读者关联个性化图书推荐清单。随着4G网络的启用与成熟,移动图书馆的发展也会日趋完善,个性化服务将成为移动图书馆的评价标准之一。
[1]甘建伟.手机图书馆发展现状与服务功能拓展研究[J].图书馆学研究,2011(6).
[2]李蔷.基于4G的移动图书馆服务平台构建[D].哈尔滨:黑龙江大学,2012.
[3]夏南强,殷克涛,赵富红.论手机图书馆的信息服务[J].情报科学,2009(11).
[4]张文彦,刘钟美,张瑞贤.美国手机图书馆的发展概况[J].图书馆建设,2009(11).
[5]覃起琼.近年来国内外移动图书馆研究述评[J].图书与情报,2013(3).
[6]高春玲.中美移动图书馆服务PK[J].图书情报工作,2011(9).
[7]陈桂菊.我国手机图书馆信息服务研究[D].合肥:安徽大学,2012.
[8]田蕊,陈朝晖,杨琳.基于手持终端的图书馆APP移动服务研究[J].图书馆建设,2012(7).
[9]陈新昕,黄丽霞.浅析我国图书馆APP类型、现状及对策[J].科技资讯,2013(10).
[10]罗晓涛.探索移动图书馆服务新模式——以上海图书馆“手机图书馆”为例[J].图书馆论坛,2013(2).
[11]陈丽冰.移动互联网时代的图书馆服务[J].图书馆,2013(2).
[12]Han Jiawei,Kamber Micheline.数据挖掘概念与技术[M].北京:机械工业出版社,2005.
聂飞霞女,1979年生。硕士,馆员。研究方向:数字图书馆。
G250.78
2014-01-04;责编:王天泥。)
*本文系2013陕西社科信息学会科研培植项目“手机知识服务模式及效果研究”(项目编号shshx201303)成果之一。