崔文 薄建全
摘 要: 针对当前图书馆信息生态模型中对读者重视不够、智能化程度低、可实现性差等问题,文中提出一种以读者为中心的智能图书馆信息生态模型。该系统以读者为中心,代替传统信息生态模型中以图书馆为中心构建图书馆信息生态模型的思路。在数据处理、资源管理等方面引入大数据、人工智能、数据挖掘等智能化信息数据处理手段,代替传统的信息处理方式。文中对所构建图书馆信息生态模型的每个部分给出具体实现方法,以提高该模型的可行性。实际应用测试结果表明,该算法的准确率平均在85%以上,效果良好。
关键词: 图书馆; 信息生态模型; 模型设计; 模型实现; 人工智能; 神经网络
中图分类号: TN911.23?34; TP393 文献标识码: A 文章编号: 1004?373X(2020)10?0127?03
Construction and analysis of library information ecological model
CUI Wen, BO Jianquan
(Qingdao University of Science and Technology, Qingdao 266061, China)
Abstract: In allusion to the problems in the current library information ecological model, such as the lack of attention to the readers, the low level of intelligence and the poor realization, a reader?centered intelligent library information ecological model is proposed. In this system, readers are taken as the center, which replaces the idea of building the library information ecological model with the library as the center in the traditional information ecological model. In data processing, resource management and other aspects, the big data, artificial intelligence, data mining and other intelligent information data processing means are introduced to replace the traditional way of information processing. The specific implementation methods for each part of the library information ecological model is given to improve the model′s feasibility. The actual application testing results show that the accuracy of the algorithm is more than 85% on average, and the effect is good.
Keywords: library; information ecological model; model design; model realization; artificial intelligence; neural network
0 引 言
随着信息的爆炸式增长和信息化的发展,信息生态的概念应运而生,分析信息内部相互作用中引入生态结构的概念,从而实现对信息行为的分析与解释。图书馆作为一个重要的传递信息的公共文化机构,已成为信息生态技术应用的重要领域。
文献[1?3]利用信息生态技术对图书馆的服务模式创新与服务能力影响因素进行研究。文献[4]研究信息生态视角下图书馆综合实力的评价。由此可见,当前针对图书馆信息生态的研究主要集中在服务能力、创新能力的提高与理论探讨方面。随着智能化技术的不断成熟,其在管理、识别、预测等领域被广泛应用。文献[5?6]利用物联网及人工智能技术分别进行了煤矿机电设备及企业智能管理系统的设计;文献[7?8]使用大数据及数据挖掘技术分别实现对无人机故障识别与船舶异常数据的识别;文献[9?10]通过神经网络技术实现对交通流及柱塞泵的状态预测。
使用这些物联网技术、人工智能技术、数据挖掘技术也可以较好地解决当前图书信息生态智能化程度较低、重内容而轻读者等现实问题。基于此,本文提出一种以读者为中心的智能化信息生态模型。
1 信息生态模型结构
图1为本文所设计的图书馆信息生态模型。整个信息生态模型为环状结构,信息生态模型中,以读者为中心,图书馆为主体,通过人工智能技术将两者相连接。图书馆的信息生态环境主要由读者需求构成的内部环境与图书馆外围的外部环境组成。
通过物联网技术、数据挖掘技术、人工智能技术及创新支撑实现读者与图书馆间进行双向信息交流,促进图书馆内部环境和外部环境进行信息交流。
图书馆通过各项技术满足读者的信息需求,这些需要可分为:文献需求、培训需求、研习需求和服务需求。文献需求泛指与获取各种形式知识内容相关的需求,如:资料查询、信息咨询、图书文献借阅、电子信息获取等,可通过大数据、数据挖掘技术对文献及读者进行分类,从而提高资源获取及传递效率;培训需求指读者对于各种技能提高而具有的需求,如:信息检索能力培训需求、信息处理能力培训需求等;研习需求指读者对于讨论、交流、学习等活动的需求,既有对相关活动的需求,也有对场地环境的需求;服务需求指读者对于图书馆中休闲、基础工具设施的需求,如:休息间、咖啡厅、打印、扫描等的需求。后3种需求可结合物联网技术、人工智能技术等对相关设备进行管理和分配。
随着互联网技术的发展,图书馆信息生态中外部环境及内部环境呈爆炸式增长,对图书馆的信息处理能力提出了新的要求。伴随着信息的快速增长,基于数据信息的大数据技术、数据挖掘技术及人工智能技术的发展成为解决信息爆炸的一个研究热点。本文除了构建图书馆生态模型结构,还将相关成熟的信息智能处理技术引入图书馆信息生态模型结构中。具体解决方案如图2所示。
针对读者的文献需求,在复杂、大量的资源环境中,图书馆信息生态需要完成资源筛选及资源传递的工作。本文提出运用数据挖掘及人工智能的解决方案,同时解决资源筛选与传递的问题。针对读者研习需求、培训需求及服务需求,在管理环境、空间环境及基础设施环境相互关联的复杂情形下,图书馆要根据需求完成相关资源的合理高效管理及配置。在上述理论的基础上,本文提出基于物联网及人工智能技术的环境管理配置方案。
2 模型实现
随着当前对图书馆建设的重视,图书馆信息生态系统中,资源环境数据获取,空间环境、管理环境、基础设施的硬件配套建设已相当完备。故本文只针对信息生态中缺失的智能化部分给出具体实现方案,主要为资源筛选及资源传递问题,以及空间环境、管理环境、基础设施中的硬件智能管理问题。
2.1 资源筛选及资源传递的智能化实现
对于资源的筛选及资源的传递问题,本质上为大数据下的分类问题,即:
1) 资源数据的分类:资源对应类别及该资源是否获取;
2) 读者的分类:读者的专业、层次、文献偏好等分类。
当前的主要分类算法有:支持向量机、K?means、决策树算法。决策树算法作为经典的分类算法,已相当成熟,有着分类效率高、实现过程简便且分类过程清晰、易复现等特点。基于图书馆资源筛选及资源传递任务的特点,本设计选用决策树算法实现对资源的筛选及传递。
读者分类和资源筛选分类原理相同,此处仅针对读者分类进行论述。具体实现过程如下:
1) 决策树算法利用信息熵原理不断选择分类属性,直到完成对数据的分类。信息熵代表当前样本的混乱程度,其定义为:
[S1=-i=1nliLlnliL] (1)
式中:[li]為每类人员在总读者数据集中的个数;L为数据集中读者总人数。
2) 选择信息增益最大的属性为当前节点的分类属性,具体算法如下:
[Z(T)=t∈leafPt?L(t) ΔZ=Zi,j-Zi] (2)
式中:[Pt]为表示当前分类枝的概率;[Zi]为当前待分类人员节点的信息熵;[Zi,j]为添加分割属性j后的该人员节点的信息熵。
3) 以信息增益最大的分类属性为当前的分类属性。
4) 以分割出来的新节点为根节点,重复上述过程。
由此,即可建立读者分类的决策树模型,且决策过程完全透明并可复现。最终的决策树结果示例如图3所示。
2.2 硬件设施管理的智能化实现
随着物联网及人工智能技术的发展,使硬件设施的管理效率大幅度提升。基于以读者为中心的思想,对图书馆中硬件管理及配置的问题,本文采用基于智能算法的读者需求预测及基于物联网的设备管理实现硬件设备管理的智能化。图4为硬件设施智能化实现原理框图。由于当前物联网管理系统已广泛应用,在此只对读者需求预测的实现进行阐述。
本系统采用BP神经网络算法对读者设备需求进行预测,具体实现步骤如下:
1) 根据图书馆设备数量及类别划分预识别需求类别的数目,并对每个状态进行数字化编码,通常编码方式为:
[xi=eni] (3)
式中:[xi]为第i种需求类别;n为预识别需求类别的总数目;[eni]表示只有第i个元素为1的n维单位向量,则神经网络的输出层神经元个数为n。
2) 确定读者可获取状态数目m,对m个状态分别进行编码,并进行标准化、归一化处理,作为神经网络的输入,则m即为神经网络输入层神经元数目。
3) 确定神经网络层数,收集大量数据集,利用BP学习规则,使用获取到的数据对神经网络进行训练、测试。
4) 使用训练好的BP神经网络对读者需求状态进行识别。
至此,已实现设施管理的智能化。
3 模型分析
对于本文所提出的基于决策树的读者分类方法及基于BP神经网络的读者需求预测方法,使用某高校图书馆进行测试。
对于所设计的读者分类方法,随机抽取其100名在册读者作为待分类数据集,对所设计方法进行验证。选取年级、学院、性别、成绩、学科类别5个属性作为分类指标,根据借阅文献类别不同将所有读者分为5类,分别为A~E。以前80人为训练集,后20人为测试集。使用训练好的决策树对测试集20人进行分类验证,分类结果如表1所示。
由表1可知,其分类正确率平均可达95.0%,也验证了该方法的有效性。同理,对所设计的需求预测BP神经网络进行了测试。最终在测试集中,其预测需求类别与读者实际需求类别的相符率达86.7%,较好地完成了需求预测的任务。
4 结 语
本文对图书馆信息生态模型进行了构建与分析,提出以读者为中心的信息生态模型,且在模型中引入决策树、神经网络等智能化算法,并给出实现框架,解决传统图书馆信息生态模型对读者目标对象重视不够、模型智能化程度低、实现困难等问题。在实际测试中,取得了较好的效果。但文中未能给出前期训练数据的统一获取方法,在实际运用时,还需根据实际情况进行前期数据获取。
参考文献
[1] 唐姗姗.图书馆信息生态构成要素及其作用机理研究[D].长春:东北师范大学,2019.
[2] 张旭,张向先,李中梅.信息生态视角下高校图书馆智库信息服务能力影响因素研究[J].图书馆工作与研究,2019(2):30?39.
[3] 李业根.网络文库信息生态构建及其对图书馆自建数据库的启示[J].大学图书情报学刊,2019,37(2):106?110.
[4] 郑荣,王洁.信息生态视角下高校图书馆综合实力评价与对策研究[J].情报科学,2018,36(8):39?45.
[5] 刘振华,徐绪堪.基于物联网的煤矿机电设备智能管理平台设计[J].工矿自动化,2019,45(4):101?104.
[6] 梁艳华.基于大数据的智能企业管理系统设计[J].现代电子技术,2019,42(6):158?161.
[7] 孟魁杰,董莹,赵宗涛.一种基于数据挖掘的无人飞行器故障分析方法[J].计算机技术与发展,2010,20(6):225?227.
[8] 郝建.船舶移动网络大数据异常数据优化识别研究[J].艦船科学技术,2019,41(4):133?135.
[9] 孙国道,曹帝胄,梁荣华.神经网络驱动的交通流量预测可视分析方法[J].浙江工业大学学报,2019,47(5):573?580.
[10] 张乃禄,张茹,陈雷,等.基于物联网的稠油注采柱塞泵状态监控系统[J].西安石油大学学报(自然科学版),2019,34(2):112?116.
[11] 吴小冰,王丹菲,吴文革.基于图书馆学五定律视角的智慧图书馆建设研究[J].安徽农业大学学报(社会科学版),2019(2):88?92.
[12] 肖秋红,彭坚,林志成.智慧图书馆建设实证分析与研究:以佛山科学技术学院新馆为例[J].佛山科学技术学院学报(社会科学版),2018(6):85?89.