牛翠屏
关键词:数字图书馆;个性化服务;资源推荐模式
摘要:文章简述了数字图书馆个性化资源推荐服务,探讨了数字图书馆的读者兴趣模型及推荐资源对象模型的建立,并分析了资源推荐模式,同时指出了数字图书馆的资源推荐服务应用存在的问题。
中图分类号:G250.76文献标识码:A文章编号:1003-1588(2017)08-0119-03
数字图书馆是当前社会信息基础设施建设的重要组成部分,它以知识资源和信息资源为支撑,为读者建立集知识服务与信息服务为一体的图书馆环境,为读者提供优质的知识与信息服务。数字图书馆服务质量和资源利用效率的有效提高以个性化服务为主要途径,将读者作为服务的中心,一切工作的展开都是为了满足读者的个性化需求,有很强的主动性和针对性,是当前我国数字图书馆主要应用的服务模式。但随着数字资源的不断丰富,读者个性化的需求受到了挤压,图书馆越来越难以满足读者对图书资源的个性化需求,如何为读者提供更好的个性化服务成为各图书馆迫切需要解决的问题[1]。为了解决这一问题,图书馆对推荐技术进行了研究和应用,认为以推荐技术为依据建立的个性化服务资源推荐模式能够更好地适应当前数字图书馆的业务发展需求,具有较高的利用价值。
1 个性化服务资源推荐简述
数字图书馆个性化服务资源推荐是指图书馆对读者的阅读特点、爱好及明显的个人资源访问行为进行分析和挖掘,掌握读者的阅读兴趣与爱好,以及和图书资源、读者群之间的关联,以便为他们提供更好的信息服务。图书馆在提供服务的过程中会过滤掉与该读者无关的信息与资源,只提供和推荐那些与其兴趣相关的信息与资源[2]。读者兴趣模型、资源推荐对象、推荐算法及读者四大板块共同构成了数字图书馆个性化资源推荐服务系统(见图1)。
从图1可以看出,个性化资源推荐服务系统能够基于资源推荐对象的特征信息及读者兴趣模型,判定读者的需求信息并进行相关性匹配;应用推荐算法能计算和筛选与读者兴趣相关的知识资源,并向其推荐;而读者兴趣的获取则是通过掌握读者的资源访问行为得到的。
2 读者兴趣模型的建立
为了保证推荐信息的准确率、有效性和个性化,个性化资源推荐服务系统从读者那里獲取的信息应该是动态和多方面的,并根据掌握的信息建立兴趣模型,以便及时更新模型中读者的兴趣爱好(见图2)。兴趣模型以从读者那里获取的信息为数据基础,即个性化资源推荐服务系统对读者的信息进行获取与记录,同时根据读者的兴趣爱好做出分类,及时掌握读者的需求,进而生成具有描述功能的文件。
数字图书馆有三种数据类型对读者的兴趣爱好做出反映:①读者属性。该数据类型反映的是读者的一些基本信息,主要是读者的姓名、年龄、性别、专业、年级、院系、兴趣等[3]。读者兴趣模型的初始构建就是以这些基本信息为依据的。②业务管理系统。数字图书馆的业务管理系统对读者的相关信息进行记录,有读者的借阅信息、咨询信息、学术成果信息等,这些信息在读者的阅读过程中被记录下来,具有较高的准确性。③历史访问信息。读者在数字图书馆的搜索与访问记录反映了其阅读兴趣与爱好,数字图书馆对读者的阅读、下载、浏览、检索等行为进行记录,可以实时掌握读者的行为信息。
显式、隐式、启发式是读者兴趣模型中的三种输入信息获取模式,分别是:读者主动提供信息行为、系统跟踪信息获取行为、咨询启发读者兴趣并提供相关资源行为。读者对资源的兴趣会随着时间的推移而发生变化,因此兴趣模型分短期兴趣、长期兴趣及储存记忆[4]。模型建立的对象既可以是个体读者,也可以是群体读者,即读者群,是具有相同兴趣爱好的读者所组建的群体性组织。
3 推荐资源对象模型的建立
在资源推荐服务系统中会存在一些基于内容和分类的方式对资源对象做出描述。非结构化是网络资源的一个特性,这一特性无法对标准做出统一的描述,因而描述的方式会采取以内容为依据的从对象本身抽取信息的方式。资源对象文本信息的描述和提取是比较完善的,但是描述的对象常常会存在文本描述不足或者不具有文本特征现象。数字图书馆的文献资源主要有期刊、学术论文、学位论文、专利、报刊、会议论文等。这些资源的分类与描述相对于网络资源是比较成型的,著录和描述的方式一般以MARC或者DC标准为基础,《科图法》和《中图法》是其主要使用的分类方法[5]。因此,推荐资源模型的建立可以对学科分类的方式进行应用,使每一个资源都能够找到与其对应的学科分类,并对应读者兴趣模型中的兴趣描述。
4 资源推荐模式分析
4.1 内容资源推荐模式分析
资源对象内容与读者兴趣相似性的推荐及读者检索结果相似性的推荐是内容资源推荐模式的两个组成部分。具体来说,是系统自动提取并分析与资源对象相关的数据信息或文档,并对读者兴趣模型中的读者兴趣爱好进行计算匹配,然后根据匹配度的高低将资源向读者推荐。读者在数字图书馆进行文献搜索时输入关键词,会出现相关的文献资源列表,资源推荐系统根据检索词相关程度从高到低依次排列,为读者呈现直观的文献信息。
4.2 协同过滤推荐模式分析
个性化资源推荐服务系统中使用最广泛的推荐方法是协同过滤推荐,这种方法以假设为前提,即假设具有相同兴趣爱好的读者会更容易相遇。协同过滤推荐模式由读者的协同推荐、项目的协同推荐、模型的协同推荐三部分构成:①读者的协同推荐,即一个读者选择的内容是基于其他读者的推荐,而这种推荐需要找到与其有相同兴趣爱好的其他读者,然后对具有共同兴趣的资源进行推荐。②项目的协同推荐,即通过内容相似性计算来取代读者之间的相似性[6]。个性化资源推荐服务系统以所有读者的资源访问信息为依据,发现读者之间存在的相似点,并对读者的历史搜索与偏好数据信息进行分析,向读者推荐相似的信息。③模型的协同推荐,即以读者在数字图书馆的资源访问信息为数据基础,为读者建立一个有针对性的读者兴趣爱好模型,对读者资源需求的预测建立模型,根据读者的兴趣相似性及资源内容向读者推荐资源信息。这种推荐模式的核心是读者的访问行为,统计模型、线性回归模型、机器学习等是其常用的方法。