杨 斌 王伟赟
图书馆个性化推荐服务的信息窄化问题研究
杨 斌 王伟赟
图书馆的个性化推荐服务可以使读者不需搜索即可得到符合个人需求的知识资源,但这种精准的推荐服务也容易造成读者对多元信息获取的窄化问题,导致非密切相关性知识资源的流失,这在一定程度上会影响科学研究的发展与突破,应及时跟踪并了解图书馆个性化推荐服务的信息窄化问题的产生机制,并制定相应的对策。
高校图书馆;个性化信息服务;信息窄化
[作 者]杨 斌,湖北工业大学经济与管理学院教授;王伟赟,湖北工业大学经济与管理学院工程硕士研究生。
个性化推荐服务最早使用在电子商务平台,目前已经大量应用在搜索引擎、社交网络、博客微信、新闻客户端等领域。20世纪90年代开始,图书馆也逐渐开展个性化推荐服务。1998年美国康奈尔大学于在查询分析的基础上开发了基于定制的方式的My Library@Cornell系统,用户可以借助该系统将自己喜欢的信息组织在一起,方便进行统一管理,并获得系统为自己推荐的符合自身需要的新书、期刊和其他加入图书馆目录中的媒体通告,这样就大大节省了为查找最新信息而耗费的时间和精力。此后,美国华盛顿大学图书馆的My Gateway系统、北卡州立大学图书馆的My Library@LANL系统、加利福尼亚大学洛杉矶分院的My UCLA系统、明尼苏达大学图书馆的TdchLens系统、斯坦福大学图书馆的Fab混合推荐系统、俄勒冈州大学图书馆的SERF系统、加州大学图书馆的Movy系统等也相继研发成功。其后,英、法、日、德、意等国家也开始了这方面的研究,如罗彻斯特大学图书馆的Course Resources系统、德国卡尔斯鲁厄大学图书馆基于用户行为的BIbTIP系统、ExLibris公司的ExLibris bX系统。这些个性化推荐系统为读者提供多种个性化服务,如定制图书馆资源及其他WEB资源、个人图书馆管理、查询图书馆目录及借阅记录、个性化页面及资源显示、图书馆选择资源的自动更新下载等。与此同时,国内图书馆也从20世纪90年代的热门检索、新书通报、书籍链接等非个性化推荐服务,逐渐演变为借阅排行、主题推荐、RSS个性化订阅等个性化信息主动推送服务,同时有部分高校图书馆采用了专业化程度相对较高的独立推荐系统,如厦门大学图书馆的“我的图书馆”,国家科学数字图书馆的“My Library”系统、南京大学图书馆和中央财经大学图书馆采用的“Book+”系统、上海交通大学图书馆“思源荐书”模块、清华大学的Open Book网站等,这些推荐系统采用协同过滤推荐和基于内容的推荐这两种推荐算法,允许用户定制其感兴趣的学科,并依据用户这些个人行为信息,向读者推荐与其检索主题类似的信息资源。
在开展个性化推荐服务的过程中,相关领域的专家学者逐渐意识到个性化推荐服务可能会引发信息窄化问题。2001年,Patricia Wallace认为,在互联网交往过程中,个体最初可能是带着相对中立的观点看某个问题的,但与别人就此在网络中讨论后,他可能从中间的地段向边缘移动[1]。美国学者凯斯•桑斯坦提到,网络让人们更容易获得的是自己喜欢的信息,而拒绝接受自己不喜欢的信息,事实上人们得到的是窄化的信息[2]。Gripsrud提出,社交网络的兴起、信息的碎片化和移动端的私人化,或许正逐步导致个人信息获取的窄化[3]。Gossart认为社会化媒体中的信息窄化问题正逐渐受到关注,但它的危害仍有被低估的风险[4]。孙瑞英将信息窄化的概念细化出来并阐明了网络信息窄化的严重后果,从群体心理与个体心理的角度分析了网络信息窄化的心理成因,提出了控制网络信息窄化的措施和办法[5]。刘明认为,高校图书馆对大学生造成的信息异化包括信息焦虑症、信息依赖症、网络暴力、信息窄化、信息污染[6]。邓倩提出新媒体下由于机器推荐消息造成用户视野狭隘、个人判断力与认知能力丧失[7]。喻国明提出通过提升用户洞察技术以及提升自身的媒介素养、网络素养,避免信息窄化等问题的发生[8]。
上述研究中我们发现,信息窄化问题在传播学、心理学、社会学等领域得到了一定程度的重视,但国内图书馆的个性化推荐服务仍处于新兴服务,属于一种创新服务模式,因此图书情报领域的专家学者更关注于个性化推荐服务的理论、技术及推广研究,研究的主要方向集中在智能化图书馆的个性化信息推荐服务、手机等移动设备的推荐应用、网络环境下的个性化推荐服务的实现等方面。实际上,与新媒体的个性化推荐服务对象不同的是,图书馆的个性化推荐服务对象经常是一些科研工作者,精准的个性化推荐在方便用户获得其特定需求的资源的同时,也很容易让用户只能获得与自己专业知识相关的信息,形成人被信息所用的尴尬境地,这在一定程度上会影响科学研究的发展与突破。
(一)图书馆资源的特性
图书馆文献资源主要包括图书、期刊、报纸、多媒体等传统资源以及图书馆外购的电子资源数据库,这些资源的保存和利用多以学科分类的形式存在,具体的体现就是纸本图书基本按照中图法或者科图法进行分类,数据库资源基本按照学科体系进行分类。这种资源的分类体系使得图书馆的资源整合和检索技术一般都比较关注显性的学科知识,但随着科学技术的发展,学科被不断细分,专业化程度越来越深,这种过度专业化导致各学科知识容易出现了“分裂”的现象,单纯的按照学科分类体系进行资源揭示就不容易揭示各学科知识之间的隐性知识关联,在这种资源揭示程度下的图书馆个性化推荐服务,基本只能按照读者感兴趣的学科领域进行资源和信息推荐,这就容易造成推荐结果缺乏多层次、多角度,不能完整展现各种科学研究在其他学科或交叉学科的研究动态和进展。
(二)个性化推荐系统的缺陷
图书馆个性化推荐服务的核心目标就是千人千面,为每个读者推荐其个人所感兴趣的知识。因此,现在图书馆或机构知识库普遍使用的个性化推荐系统一般都是先由用户根据自己的专业领域、兴趣喜好进行定制,通过基于内容的推荐和基于协同过滤的推荐算法得到用户所需的信息并机器推荐给用户,在信息推荐过程中再由用户不断选择和过滤,推荐系统会根据用户的使用情况不断改进推荐策略和推荐内容,这种情况周而复始会使用户得到更符合其要求的精准内容,但也无形中会导致用户接收到的知识领域越来越窄化,甚至只能接受到符合自己观点的内容,长此以往容易滋生信息窄化问题。
(一)利用元数据仓储全面揭示图书馆资源
图书馆的资源来源不同、介质不同、获取方式不同、数据结构不同,这些资源保存在数据库、管理系统、资料文档甚至专家学者的大脑中,而Internet上的知识资源更是不计其数。高校图书馆个性化信息推荐服务要避免信息窄化问题,首要重点是在知识资源揭示时要能全面获取各种显性知识、隐性知识及非相关性知识的隐性关联。要在资源整合及检索系统中充分利用元数据仓储技术,对资源深层次的聚合、筛选、挖掘、分析,基于一定的元数据规范构建不同学科领域及相关学科、交叉学科的元数据库集合,利用采集适配器对相应数据源数据经过过滤、去重、降噪后按规范保存成统一的格式,统一排序和分面功能,实现图书馆资源一站式检索能准确揭示非相关性知识资源,为图书馆个性化推荐服务提供满足用户特定需求的全方位、全学科的资源保障。
(二)充分利用大数据分析工具
要利用大数据分析工具对图书馆的资源(学科、关键词、主题词、元数据)及用户的基础数据(性别、年龄、专业、借阅记录等)和行为数据(搜索行为、阅读喜好等)进行深度挖掘、分析。建立资源模型及用户模型,资源模型可通过标签树方式对内容主题等提取分类,用户模型可利用其兴趣图谱进行设定,根据模型推荐易出现标签树雷同导致推荐内容同质化、机器推荐对用户兴趣的变化反应滞后等现象,因此要充分利用大数据分析和元数据仓储技术挖掘资源内容的标签树深度,利用用户小数据、情境感知技术,分类和聚类等方法对用户群体进行细分,挖掘读者行为特征和个体需求,得到每个用户全方位的精准画像,全面掌握用户知识兴趣,为读者推荐符合其需求的全方位知识内容。
(三)提高个性化推荐系统的智能性
目前图书馆主流的个性化推荐系统大多采用协同过滤+基于内容推荐,协同过滤存在冷启动和稀疏性问题,基于内容推荐存在很难为用户发现新的感兴趣项目,易产生信息窄化问题。因此需要引入基于知识的推荐方法、基于关联规则分析的推荐方法等多种混合推荐算法,基于知识的推荐方法和基于关联规则分析的推荐方法需要大量的领域知识及知识关联规则并形成相应的知识库,这个知识库的搭建完全可以借用资源揭示中建立的元数据仓储。提高个性化推荐系统的智能化,需要在提高用户洞察技术的同时,实时响应用户的推荐请求,综合各种维度的分析挖掘结果呈现给用户,增加用户自贴标签、频道分类定制、机器推荐和人工编辑相结合等方法对机器推荐进行补充,对推荐效果持续优化。从而完整准确地测度到用户信息需求的全貌和重点,力求避免信息窄化问题。
图书馆个性化推荐服务的研究与实践正在国内图书馆届蓬勃兴起,图书情报领域的专家学者在进行理论和应用研究的同时应该要有忧患意识,要充分重视个性化推荐服务可能带来的信息窄化问题,在制定个性化推荐服务策略和推广个性化推荐系统的过程中要充分利用新技术、新思路来规避信息窄化问题。
[1]Patricia Wallace.互联网心理学[M].谢影,苟建新,译.北京:中国轻工业出版社,2001.
[2]凯斯·桑斯坦.网络共和国——网络社会中的民主问题[M].黄维明译.上海:上海人民出版社,2003.
[3]J Gripsrud,H Moe,S Splichal.Digital Public Sphere:Challenges from Media Policy[J].European Journal of Communication,2013,28(1):94-95.
[4]Gossart C.Can Digital Technologies Threaten Democracy by Creating Information Cocoons?[J].Trans-forming Politics and Policy in the Digital Age,2014(10):145.
[5]孙瑞英.网络信息窄化的心理学解析[J].情报科学,2010(11):1625-1629.
[6]刘明.网络环境下信息异化的心理学视角研究[D].哈尔滨:黑龙江大学,2011.
[6]邓倩.新媒体的“信息茧房”现象研究[J].视听,2016(8):96-97.
[7]贾瑞.新媒体时代“信息茧房”现象的思考[J].新闻研究导刊,2016(7):214-215.
[8]喻国明.“信息茧房”禁锢了我们的双眼[J].领导科学,2016(36):20.