凌耀银
(广州工商学院 广东 广州 510850)
现代图书馆借助信息化手段和互联网技术,达成了图书资源和文献数据的“云”储存、信息的实时共享、信息资源的快速流通等目标,相较于传统图书馆,可以为读者提供便捷、高效的图书资源获取途径[1]。 技术的革新促使传统图书馆向数字化、信息化转变,数字化技术在图书馆管理中的应用变得广泛,并通过整合形成数字化图书资源,完善了传统图书馆的文化传播和数据储存功能,建立起以读者为核心、以图书检索为主要功能、以提供图书借阅服务为基础的现代数字图书馆[2]。
在数字图书馆中,推荐系统可以有效地应对信息超载、信息丢失等问题,并满足用户的个性化需求[3]。 个性化推荐技术是高校数字图书馆实现个性化推荐系统的重要技术手段,它可以被用来寻找读者所关心的资料,积极地向读者展示网上或线下的信息内容,并且提供高质量的个人服务。
数字图书馆是指以数字化形式存储、管理和提供文献资源的图书馆。 它将传统的实体图书馆数字化,将图书、期刊、报纸、音像资料等电子化,并且使用现代信息技术手段进行组织、存储、检索和利用[4]。
现代数字图书馆在信息储存空间、运营效率、智能化及数字化特征等方面具有优势[5]。 数字图书馆储存空间大,具有海量的文献资源库,能够满足不同层次、不同领域的读者需求。 数字图书馆运行效率高,通过先进的检索和分类方式,可以快速精准地定位所需的文献资源。 数字图书馆融合了AI 技术,帮助读者更好地发现和使用相关文献资源,具有智能化特征。 数字图书馆具有数字化特点,依托数字化技术,将各种文献资源转换为数字形式,实现了文献资源的数字化存储和管理。 数字图书馆无地域限制,使得读者可以任意时间、地点访问收藏于全球范围内的文献资源。
图书馆个性化服务是立足于读者需求,提供定制化、针对性的图书及其他服务。 在图书馆数字化方面,个性化服务可以通过以下方式实现。
①个性化推荐:利用大数据和人工智能技术,针对读者历史的图书馆行为痕迹,精准地向读者推荐其感兴趣图书、期刊、报纸等资源。 ②移动服务:通过App、微信公众号等移动平台,提供图书馆的移动服务,使得用户可以更加便捷地查询、预约和借阅图书,同时也可以获得个性化的服务和推荐。 ③个性化资源定制:在数字化的基础上,图书馆可以基于用户的需求,提供个性化的文献资源定制服务。 例如,为学者和研究人员提供专业领域内的最新研究进展、为儿童读者提供适龄阅读材料等。 ④跨库检索:为满足读者跨学科、多层次的信息需求,数字化图书馆可以提供跨库检索功能,使得读者可以同时检索多个数据库,并将检索结果汇总、排序、筛选,提高检索效率和准确性。
通过数字化的手段实现个性化服务,可以让读者更加便捷地获取所需信息,提高阅读体验和满意度,同时也有利于图书馆促进文献资源共享和知识创新。
1.2.1 个性化服务模式的设计模式
在数字图书馆的建设中,我的图书馆(My Library)系统采用了以B/S 为基础的体系结构,以数据采集和分析为前提,完美地融合了个性化服务理念。 具体分析不同图书馆的实际情况,确立相应的设计理念和实现目的,筛选并推出有针对性的个人服务,从基础层、数据层、服务层和应用层四个层面来设计个性化服务模式的实现架构,如图1 所示。
图1 个性化服务模式设计结构
图书推荐技术是大学数字图书馆为用户提供个性化服务的一种技术方法。 在互联网上,除了搜索引擎之外,推荐系统也成为一种新的解决方法。 为了向学生、教师和科研工作者提供优质的信息服务,需要在推荐平台展示相应的个人服务。 该系统在大数据的支持下,能迅速对不同人群进行分析、归类,为教师、学生找到各自感兴趣且有需要的推荐内容,并能对读者进行精准地推荐。 因此,选择合适的推荐算法,就成为一个高效、高精度的书籍推荐系统的关键。
个性化图书推荐系统是一种可以实现个性化推荐技术的工具模块,能收集读者的个人资料、借阅记录等,设计算法分析并展示读者可能需要的物品。 在此基础上,本文将推荐系统划分为三大模块:信息收集模块、推荐算法模块、推荐结果导出模块。
(1)信息收集模块。 信息采集是数据的基础,收集的信息应包括读者的个人情况、图书馆的个人行为、评价体系、图书信息等方面,借助一定手段对信息进行分析,能够较为精确地体现出读者的兴趣和偏好。 按照系统的设计,信息采集是一项持续的工作。
(2)推荐算法模块。 推荐系统是主要设计目标,而个性化的书籍推荐算法是实现的关键。 从高校数字图书馆的实际情况来看,书籍的数量在不断地增长,已经远远超过了读者,很明显,采用基于专题的合作筛选算法是最合适的选择。 此外,还可以利用分簇技术来减少数据的查询空间。
(3)推荐结果导出模块。 在人机交互界面现实中,当推荐算法给出一定的建议时,便会在用户终端的程序界面显示。 如图2 所示。
图2 推荐系统三大模块
以信息过滤为基础的基于内容的推荐,通常被用来推荐新闻、物品等文字类的资源,但对于音频、视频、图形等多媒体文件,其推荐时,由于缺乏对其内容信息的有效提取,难以实现。 基于此,提出了一种基于内容和协作过滤的个性化推荐方法。 协作过滤是目前最常用的一种推荐算法,在电子商务中得到了很好的应用。 以用户为基础的协同过滤方法,其核心思想是根据读者的使用记录,推断其对项目的偏好程度,并将行为相似的人群进行分析、归类,进而以类似用户的行为为基础,来对目标用户所感兴趣的资源进行预测。
在个人图书馆中,对图书进行个性化推荐是一项非常重要的工作。 为了实现快速准确的个性化书籍推荐,设计一种有效的书籍推荐算法是非常必要的。 尽管协同过滤推荐算法可以根据用户的喜好进行书籍推荐,但其在实践中还面临着搜索数据量过大、搜索时间长、效率低等问题。而以聚类为基础的协作过滤算法的设计,在某种程度上可以解决上述问题。 在此基础上,提出了一种基于聚类的协作过滤推荐算法。
2.3.1 k-means 用户聚类
首先键入读者—书目评分模式,然后获取读者—图书评分等级向量,找到相似的读者,最后使用k-means 聚类算法,根据相似性对用户进行聚类,将原矩阵数据集划分为k 个聚类中心,使得同一群组中的用户兴趣具有相似性,从而实现脱机处理。 对各个簇中心矢量进行成对的欧氏距离计算,并找出最接近的簇中心。
2.3.2 基于专案的合作筛选
将目标读者以最接近的聚类中心一簇中的读者-图书评分矩阵作为查找空间,使用基于项目的协同过滤算法,计算出书籍的相似度,预测目标读者对书籍的评分情况,之后根据评分高低,产生推荐列表。
优秀的系统设计思路和方案需要最大程度地考虑用户的偏好,以用户需求为出发点。 在此基础上,提出了一套完整的大学数字图书馆管理体系。 大学数字图书馆的需求目标可划分为三个层次:个体化的数字图书馆、前台的展示模块、后台的管理模块。 其中以个人数字图书馆为中心,实现了对用户的个性化服务,并向用户推荐图书;前台展示模块主要是对实体图书馆的资源和服务等情况进行展示,而后台管理模块主要负责对图书数据和读者数据进行批量导入。
个体数字图书馆以图书馆的具体运维状态和读者习惯、偏好作为设计的根据,以图书馆的数字化、信息化建设和推出个人服务为目的。 个体数字图书馆至少能够实现三方面的功能:图书借还功能、优质的读者个人服务、图书资源推荐功能。
个人图书馆分为三个主要模块,即基本信息模块、个性化推荐模块、个性化服务模块。 基本信息模块连接到图书馆借阅系统,使读者可以看到最基础的借阅资料;个性化服务模块为用户提供了图书收藏、评分等功能;个性化推荐模块提出了一种基于文本信息的推荐方法,并对其进行了详细的分析。
3.1.1 基本信息模块
个人数字图书馆基本信息模块是指用于展示个人数字图书馆的基本信息的板块,包括个人信息、数字图书馆名称、数字图书馆简介、 数字图书馆收藏、检索工具及搜索引擎、热门推荐等。 总之,个人数字图书馆基本信息模块是数字图书馆中不可或缺的一个板块,它可以全面展示数字图书馆的基本信息和资源情况,提高数字图书馆的可访问性和可用性。
3.1.2 个性化服务模块
个性化服务是一个主要的功能模块,可以实现个性化功能模型,为更好地向用户提供个性化服务,必须通过对用户兴趣的搜集来实现。 另外,在数字图书馆中,用户对书籍的行为也会被记录,比如推荐书籍、收集书籍、给书籍打分等。 这说明读者对书籍有不同的兴趣。
3.1.3 个性化推荐模块
个性化推荐是一种类似于电子商务系统中的推荐,比如一些网站上“猜你想要”板块。 该模块是借助推荐算法对用户的习惯和偏好进行分析,并将目标群体的潜在需求产品或者服务展示在用户终端,减少了用户的检索、操作环节,增强用户服务体验。 在个人数字图书馆中,个性化推荐技术采取相同的原理,在用户没有操作的情况下,自动推荐其需求的物品。 在个人数字图书馆的个性化推荐模块中,使用的是以聚类为基础的协同过滤算法。 一般的协同过滤算法包括两种:基于内存的协同过滤与基于模型的协同过滤,而基于内存的方法又分为两个类目:基于用户的协同过滤和基于项目的协同过滤。 在现代数字图书馆中,由于图书的数量超过用户,因此,基于项目的协同过滤算法的推荐结果更加精确,并且根据用户对项目的评分等级来聚类,减少了推荐算法中的数据稀疏性,最终增强了推荐的准确度。 个性化图书推荐流程如图3所示。
图3 个性化图书推荐流程图
数据表作为系统的数据依据,对系统的实施起到了至关重要的作用。 一般情况下,由于开放的特点,数字图书馆系统经常会与外界进行通信,以实现各种不同系统之间的互联。 所以,必须对多个子系统之间的数据结构进行统一的定义和规范。 在此基础上建立起一套规范,以便于系统的开发与维护。 在个人数字图书馆中,可以清楚地看到,系统需要保持与读者对象和图书对象有关的资讯,并依据文献,图书资讯可以参考元数据来定义。 此外,为了实现个性化地推荐,还需要对用户和书籍的交互行为等进行存储。 根据文献的介绍,资料表格可划分为两个主要类别:实体资讯表格与运作资讯表格。 如表1 所示。
表1 读者分类情况
终端显示界面是进行人机交互的最后步骤。 优秀的终端显示设计不仅为读者带来了优质的服务感受,而且体现了学校的文化特征。 现代数字图书馆的终端显示界面要兼顾使用便捷、分类明确、资源充足等要求,设计上具备实用性强、操作性简便等特点,而且一定程度上体现反映出学校的文化属性和形象特点。
综上所述,信息化技术在社会的普及,使得数字图书馆成为时下人们热议的话题,它将图书馆的线上电子资源与线下图书资源进行了整合,并运用了分布式网络、数据挖掘、推荐系统等新的技术手段,为读者提供了一种全新的信息服务。 在当前的网络环境下,如何更好地帮助用户快速、精确地查找到自己想要的信息,已经成为一个重要的课题。 为了解决这一问题,提出了面向数字图书馆的个性化推荐技术。
个性化推荐技术在数字图书馆建设中意义重大,能够通过数据分析确定读者的偏好和需求,自动生成目标用户感兴趣的产品或者服务,并展示在用户面前。 在海量的图书资源和多元化的读者需求面前,高校数字图书馆建设必须发挥个性化推荐技术的作用和功能,致力于促使“数据资源”向“读者需求”转变,通过对读者的行为进行深入的剖析,为读者提供精准、高效、优质的服务。