基于用户历史行为的图书馆图书采访推荐方法

2022-11-18 03:45
河南图书馆学刊 2022年10期
关键词:图书模块图书馆

唐 书

(国家图书馆,北京 100080)

随着信息技术的高速发展,人们对知识的渴求日益增加。国家越来越重视全民阅读,相继颁布了一系列阅读政策[1]。图书馆作为重要的文化传播机构,对于全民阅读具有重要的推动作用[2]。图书采访工作一直是图书馆信息资源建设的重要一环,对于图书馆的发展具有重要影响,传统的图书采访工作主要依赖人力,无法保证采访的准确性和科学性[3],影响了图书采访效果,因此,图书馆亟须设计新的图书推荐模型,以有效解决采访工作面临的问题。信息技术的发展推动了移动终端的普及,庞大的数据量影响了图书馆图书采访推荐的效果,用户历史行为推荐法应运而生。受用户数据平台的限制,传统的数据源主要由数据库与用户行为日志组成,图书馆只要高效地完成用户信息的采集,就能解决信息数据量过大造成的采访困难等问题。因此,笔者基于用户历史行为设计了新的图书推荐方法,以期为后续的图书采访工作提供参考。

1 图书馆图书采访业务流程分析

图书采访是图书推荐的关键环节,科学的图书采访业务流程能提升图书推荐效果[4]。目前,图书馆采用的图书采访模式包括一些影响图书采访质量的不稳定因素,如:图书出版发行、馆配商、图书采购经费、采访人员素质、采访工作流程等。因此,图书馆要制作符合馆藏建设要求的采访清单[5],收集图书采访信息,判断图书的价值,进一步优化图书采访业务流程。具体的流程如下:一是采访人员要注重图书采访信息的收集。二是采访人员要对图书价值进行综合判断。三是采访人员要把价值高的图书编入图书推荐单。四是采访人员要对图书进行验收,对不符合要求的图书进行标记反馈[6]。图书采访推荐需要进行线上统一管理,增加推荐流程的规范性,因此,图书馆可筛选现有图书的关键词,构建相关的图书数据库,为图书信息的查询利用提供保障。

2 基于用户历史行为的图书馆图书采访推荐方法设计

2.1 基于用户历史行为构建图书采访推荐模型

用户历史行为与图书馆实际推荐数据的形成有重要联系,因此,图书馆可基于用户历史行为,构建图书采访推荐模型,以提高推荐的准确性。笔者利用卡方自动交互检测法(CHAID)进行决策树挖掘分类[7],通过提取用户历史行为的信息,设定反应变量和解释变量,对图书数据库总样本进行最优分割,根据卡方检验的显著性进行排序,以实现对图书信息的自动判断及智能化分析。在数据处理初期,图书馆可利用联机分析处理(OLAP)对现有的数据信息进行基础化处理,从图书数据库调取数据,并与挖掘分类的数据进行对比分析,从时间、位置、学科等角度观察相同卡方检验的显著性数值,留取相似度较高的对应图书信息。

用户信息处理完毕后,图书馆可利用快速自动提取关键词算法(RAKE)提取数据中的关键词,利用词项距离、词间关系频率、共现频率构建共现矩阵,通过语境值进行计算,得到候选关键词的特征,根据设定阈值选定关键词,并进行用户信息过滤,根据现有信息之间的频率关系,计算出采访关联系数,设计模型使用的关键词库,完成模型参数提取及关键词融合[8]。RAKE算法是一种结合中文语义和关键词的自动提取算法,能够根据现有的数据库结构完成信息的快速存取,设计相关的分类评价函数,并删除不符合模型构建规范的词语,提高语义数据库的数据提取效果。图书馆可结合在线分析处理程序,生成馆内用户购买关联性规则,并参照该关联性规则,进行数据比对,提高图书采访推荐效率。在图书检索的过程中,图书馆可手工添加数据化清单,以提高推荐效果。

从图1可以看出,图书的关键词提取是图书精准推荐的重点,因此,图书馆可利用卷积神经网络进行图书内核语序分析整合,将图书内核语序作为输入项,置入卷积神经网络模型中,根据设定的各层神经网络参数进行计算,提取图书中的隐含信息,以保证图书语义和关键词的关联性效果。

图书馆可通过联机公共目录检索系统(OPAC)获取用户的检索信息,把这些信息上传到采访推荐模型中,以完成图书的智能化推荐[9]。此外,该模型具备决策效率比对功能,降低了图书馆图书采访推荐的难度,提高了图书馆图书采访推荐的效果。

2.2 图书采访推荐平台设计

图书馆可把基于用户历史行为的图书采访推荐模型嵌入图书采访推荐平台,以实现图书采访的精准推荐,最大限度地满足用户的多元化需求。图书馆应分析该平台的主要使用人群及其不同的需求,设计图书采访推荐平台的功能模块。图书采访推荐平台的功能模块包括图书采购模块、图书供货模块、图书验收模块和系统管理模块。图书采购模块具备图书推荐功能,即用户以在线推荐或上传文件推荐的方式将推荐的书单提供给采访人员。图书采访人员可使用图书审核子包对推荐单中的图书进行审核,选择书目形成采购计划单,并给出审核结果。在实际使用的过程中,财务人员可通过该平台发布采购计划单,根据供应商对采购计划单的报价,对各个供应商的报价进行比较,选出合适的供应商,上传合同子包,完成整个采购任务。图书供货模块的工作流程是:图书采访工作人员把采购单发送给供应商;供应商形成供货单发货,并将物流单号等信息上传到平台;图书采访人员查询图书寄出状态,确定书目类别、数量等无误后,将验收信息上传到图书验收模块,完成图书采访工作。系统管理模块的作用是对图书推荐单类、图书推荐项、采购计划单类、采购项、报价单类、供货项、验收单、验收项、用户信息、权限信息、角色信息、部门信息、人员信息、图书分类信息、书商信息等的维护操作,保障图书馆采访推荐工作的正常运行。

3 图书馆图书采访推荐方法实例分析

为了检验基于用户历史行为的图书采访推荐方法的效果,笔者对某图书馆进行了实例分析。笔者不仅要根据该馆的图书类型及相关的图书信息进行关键词提取和关键词映射,还要根据用户的历史搜索信息进行关键词抽取,计算关键词密度,按照密度值从高到低进行排序,选取前10个关键词作为图书采访推荐关键词。此外,笔者不仅要根据关键词计算相关图书的关联性,输出推荐书目,并进行图书推荐,还要根据图书类别关键词选取精确率、关键词集召回率等指标,计算出用户满意度的数值。笔者利用相关公式,对基于用户历史行为的图书采访推荐方法和传统图书采访推荐方法的用户满意度进行了对比分析。

从表1可以看出,传统图书采访推荐方法的采访推荐效果较差,已无法满足图书馆图书采访的需求。基于用户历史行为的图书采访推荐方法的用户满意度较高,推荐效果较好,该方法具有有效性和一定的应用价值,能够为图书馆开展图书采访工作提供帮助。

表1 应用效果

猜你喜欢
图书模块图书馆
28通道收发处理模块设计
“选修3—3”模块的复习备考
图书推荐
欢迎来到图书借阅角
图书馆
班里有个图书角
必修模块相关知识过关训练
去图书馆