摘要:该文针对现有推荐方法推荐准确率过低的问题,开展智慧图书馆文献资源个性化推荐方法设计研究。先通过用户画像的应用,构建用户兴趣特征模型。然后提取文献资源特征,实现文献资源特征与用户兴趣特征的匹配,实现文献资源个性化推荐。最后应用对比实验证明所提方法的先进性。实验结果证明,新的推荐方法可有效促进文献资源推荐准确率的提升,应用效果较好。
关键词:用户画像;文献资源;推荐;个性化;智慧图书馆
doi:10.3969/J.ISSN.1672-7274.2024.07.012
中图分类号:TP 391.41 文献标志码:B 文章编码:1672-7274(2024)07-00-03
Research on Personalized Recommendation Method for Literature Resources
in Smart Libraries Based on User Profile
ZHANG Fengtao
(Taiyuan Library, Taiyuan 030024, China)
Abstract: This article focuses on the problem of low recommendation accuracy in existing recommendation methods, and conducts research on the design of personalized recommendation methods for literature resources in smart libraries. Firstly, construct a user interest feature model tSEcRyou0Bvfaf8GjXcyfwg==hrough the application of user profiling. Then extract the features of literature resources, match them with user interest features, and achieve personalized recommendation of literature resources. Finally, comparative experiments are carried out to prove the progressiveness of the proposed method. The experimental results show that the new recommendation method can effectively promote the improvement of accuracy in literature resource recommendation, and the application effect is good.
Keywords: user profile; literature resources; recommendation; personalization; smart library
随着信息技术的飞速发展,图书馆的文献资源数量和种类快速增长,这为读者提供了更多的选择,但同时增加了读者查找和筛选所需信息的时间和难度。为了解决这一问题,智慧图书馆应运而生[1]。智慧图书馆是一种利用先进的信息技术,实现图书馆的数字化、网络化、智能化服务管理模式,以更加便捷、高效的方式为广大读者提供服务的图书馆[2]。为促进智慧图书馆的建设与发展,本文结合用户画像技术,开展对智慧图书馆文献资源个性化推荐方法的设计研究。
1 基于用户画像的用户兴趣特征模型构建
先构建基于用户画像的用户兴趣特征模型,步骤如下。
第一步,数据收集。首先需要收集用户的基本信息、阅读历史、搜索记录等数据,这些数据可以来自于图书馆的借阅系统、网站日志、社交媒体等渠道。
第二步,数据预处理。对收集到的数据进行清洗、去重、标准化等预处理操作,以保证数据的质量和准确性。
第三步,用户画像构建。利用数据挖掘和机器学习等技术,对预处理后的数据进行处理和分析,提取出用户的个性化特征,形成一个较为完整的用户画像[3]。在构建用户画像时,将用户项目评分矩阵作为基础,用户兴趣特征模型可以用用户—项目评分矩阵表示,其中,为用户数量;标识线项目的数量。在该评分矩阵当中,某一用户对某一项目的评分可用表示。构建如表1所示的用户—项目评分矩阵。
基于用户画像的用户兴趣特征模型具有结构简单、易于实现、无须对数据进行预处理、直接利用已有的评价数据对用户进行推荐等优点。通过对任意两个特征向量的相似程度进行分析,得出两个用户感兴趣的相似性或两个项目的相似性[4]。与聚类等其他方法相结合,可以有效地提高搜索的效率。本文引入K-means聚类算法,将项目看作样本,使用样本距离作为划分标准。样本距离与样本相似度之间存在反比例关系。两个样本之间的距离越短,则其相似度越高。根据这一理论,通过欧氏距离计算,确定样本之间的距离:
(1)
式中,为第个样本对象;为第个聚类中心;为样本维度;为两个样本之间的欧氏距离。在聚类的过程中,每一次迭代都需要重新完成对聚类中心的计算,求得聚类中所有样本的平均值。假设某一类别的聚类中心为,则可通过式(2)计算得出:
(2)
式中,为聚类集合。根据上述公式不断迭代并重新进行类别划分,更新。在满足终止条件后,完成迭代。
第四步,用户兴趣特征提取。从用户画像中提取出与兴趣相关的特征,如阅读历史中出现的书籍类别、关键词等,这些特征可以反映出用户的兴趣爱好和阅读习惯。
2 文献资源特征与用户兴趣特征匹配
通过上述论述,结合用户画像,完成对用户兴趣特征模型的构建后,为实现文献资源特征与用户兴趣特征匹配,提取智慧图书馆文献资源特征[5]。文献资源特征提取的基本流程如图1所示。
文献的特征提取与用户的兴趣提取相似。第一步是对每一篇文献进行数据的预处理,包括数据的清洗、文本类型的变换,以便更好地实现文本的切分、删除和特征的提取[6]。第二步,对文本进行切分,获得文本的分词结果,并剔除中文文本中的“这”“否则”“而且”等,英文的“the”“a”等停顿词,这些单词对文本推荐毫无帮助。第三步,采用基于TF-IDF的特征提取方法,对文本中的特征词语进行加权处理,以体现该词语的重要性。第四步,选取具有较高权重的特征词语,作为文献资源特点的表征。
通过提取的特征词和权重,表征文献资源的特征,同样,通过提取的特征词和它们的权重来表达用户的兴趣特征。然后,通过对文本信息的相似程度进行计算,将相似程度高的文献进行排序。根据所得到的特征词和权重,再通过训练得到新的特征词和权重,对用户的兴趣和文献资源进行匹配度的计算。匹配度的数值可以通过式(3)计算得出:
(3)
式中,为匹配度值;为从文献资源中筛选出的权重较大的特征词对应权重;为从用户兴趣特征模型中筛选出的权重较大的特征词对应权重;为文献资源中筛选出的权重较大的特征词的余弦值。通过上述公式对匹配度的计算,将得到的值较高的文献推荐给相应的智慧图书馆用户,以此实现文献资源特征与用户兴趣特征匹配,最后依据匹配结果实现个性化推荐。
3 对比实验
为了进一步验证本文上述提出的基于用户画像的推荐方法的应用优势,进行以下对比实验研究:将本文提出的基于用户画像的推荐方法设置为实验组,将基于改进加权信息熵的推荐方法设置为对照A组,将基于知识图谱的推荐方法设置为对照B组,设置了8个不同领域、不同主题的文献资源,将其作为实验数据,并结合智慧图书馆的实际情况,在实验数据当中增设了125篇其他主题。在利用三种推荐方法为用户推荐文献资源时,设置不同的用户兴趣特征词数量条件,对比三种方法的推荐结果,绘制表2所示的推荐结果对比表。
从表2的实验数据可以看出,三组推荐方法的推荐结果准确率均呈现出随用户兴趣特征词数量增加而增加的变化趋势。实验组推荐结果的准确率均高于95.00%,在用户兴趣特征词数量为10个时,准确率已经能够达到95.85%的水平,而对照A组推荐结果准确率最高仅为80.25%,对照B组推荐结果准确率最高仅为86.24%。通过上述得出的实验结果可以看出,实验组推荐方法的推荐准确率最高,能够为智慧图书柜用户提供更符合其需求的文献资源。同时,用户画像在智慧图书馆中的应用,可以帮助图书馆更好地了解读者的需求和兴趣,为读者提供更加个性化、精准的文献资源推荐服务。另外,基于用户画像的推荐方法也可以提高图书馆的资源利用率和读者满意度,为图书馆的发展和公共文化服务体系建设做出贡献。
4 结束语
本文深入探讨了用户画像的概念、原理和应用,以及其在智慧图书馆文献资源个性化推荐中的作用。通过对比现有其他两种推荐方法,验证了基于用户画像的智慧图书馆文献资源个性化推荐方法的可行性和有效性。在未来的研究中,将进一步优化基于用户画像的智慧图书馆文献资源个性化推荐方法,提高推荐的准确度和效率,加强数据分析和挖掘能力,以更好地满足读者的需求。
参考文献
[1] 王丽丽,田燕妮,欧阳静.基于深度学习的高校移动图书馆资源推荐研究[J].长春理工大学学报(社会科学版),2023,36(5):77-81.
[2] 李婷.大数据背景下公共图书馆传统文化资源推荐策略研究[J].河南图书馆学刊,2021,41(12):45-47,52.
[3] 吴冬梅.基于人工智能的图书馆信息资源推荐检索平台设计[J].信息与电脑(理论版),2021,33(13):159-161.
[4] 翟小乐,蒋丽铭,任云鹏.基于协同过滤的高校图书馆数字资源个性化推荐方法[J].信息与电脑(理论版),2023,35(9):96-98.
[5] 陈安琪,金昆,陶兴华,等.基于知识图谱的图书馆智能化资源推荐系统架构与优化策略[J].图书馆界,2023(2):21-25.
[6] 于非.基于情境要素适配的高校数字图书馆资源情境化推荐路径研究[J].图书馆工作与研究,2021(6):74-81.