王慧娜
摘 要: 针对传统信息挖掘系统存在响应速度慢的问题,为了加快信息挖掘系统的响应速度,提出数字图书馆个性化交互服务行为信息挖掘系统设计。先进行基于信息挖掘体系架构的改进设计和控制器设计,完成系统的硬件设计;依托信息储存过程设计和决策树算法的构建,完成系统的软件设计,从而实现个性化交互服务行为信息挖掘系统设计。测试结果表明,提出的信息挖掘系统相比于传统信息挖掘系统,整个挖掘过程的平均响应时间缩短了2.43 s,可以加快系统的响应速度。
关键词: 信息挖掘; 个性化交互服务; 数字图书馆; 系统设计; 信息储存; 测试分析
中图分类号: TN911.23?34; TP391 文献标识码: A 文章编号: 1004?373X(2020)10?0153?03
Design of information mining system of personalized interactive
service behavior for digital library
WANG Huina
(Henan University of Chinese Medicine, Zhengzhou 450046, China)
Abstract: In allusion to the problem of slow response speed existing in the traditional information mining system, the design of the information mining system personalized of interactive service behavior for digital library is proposed to accelerate the response speed of information mining system. The hardware design of the system is completed on the basis of the improved design of information mining architecture and the controller′design; the software design of the system is completed relying on the design of information storage process and the construction of decision tree algorithm, so as to realize the design of the information mining system of personalized interactive service behavior. The testing results show that, in comparison with the traditional information mining system, the average response time of the whole mining process was shortened by 2.43 s in the proposed information mining system, which can accelerate the response speed of the system.
Keywords: information mining; personalized interactive service; digital library; system design; information storage; testing analysis
0 引 言
傳统的信息挖掘系统存在响应速度慢的缺陷,很难实现信息的共享,不能满足学生通过数字图书馆的个性化服务交互行为来共享教学资源[1?3]。为此,本文设计数字图书馆个性化交互服务行为信息挖掘系统,利用数据挖掘技术对个性化交互服务行为信息进行二次处理,充分挖掘出数字图书馆个性化交互服务行为信息的潜在价值,为高校教育教学的发展提供正确的引导。测试结果表明,提出的信息挖掘系统相比于传统信息挖掘系统,具有更快的响应速度。
1 数字图书馆个性化交互服务行为信息挖掘系统硬件设计
1.1 信息挖掘体系架构的改进设计
由于受当前技术水平的限制,个性化交互服务行为信息的提取和分析仍处在半自动化水平[4],依托及时性、经济性、安全可靠性等系统设计原则[5],对常规信息挖掘体系架构进行改进,构建了个性化交互服务行为信息挖掘体系架构,如图1所示。
信息挖掘系统在设计过程中,要结合校园内部网络与互联网的建设,实现数字图书馆内部各个学科之间的信息互通,同时也增加了个性化交互服务行为信息的来源途径,并将得到的数字图书馆个性化交互服务行为信息反馈到相关部门,提高信息挖掘的质量[6]。
1.2 控制器设计
为避免数据容量大而出现系统响应速度慢的情况,在硬件端口增加控制器设计。系统的控制器采用的是意法半导体的超高密度芯片TQMA93RE7。半导体供应公司的控制器体系架构Crema?T1内核是一个32位的中央处理单元[7]。
原始半导体指令集存在两种状态:32位的半导体供应状态和16位代码宽度的Thumb 状态[8]。当控制器在半导体供应状态下时,产生的所有指令都是32位的;然而在Thumb 状态下,产生的所有指令都是16位的。Crema?T1内核使用的是Thumb?1指令集,可以兼顾代码的密度和信息处理效率,还具有使用方便的优势[9]。在掌握系统设计原则的基础上,完成信息挖掘体系架构设计。设计控制器的内部结构,提高信息挖掘系统的响应速度,实现系统的硬件设计。
2 个性化交互服务行为信息挖掘系统软件设计
2.1 信息储存过程设计
由于信息储存过程的口令存在于数据库服务器中,故信息调用不需要在网络上传输信息储存过程代码,在分类的基础上完成信息的挖掘,从而避免系统出现卡顿现象,降低系统运行的网络负载[10]。
信息储存过程设计必须建立在允许模块化程序设计的基础上,创建一次储存过程就可以在数据库服务器中调用多次[11]。信息储存过程的修改独立存在于应用程序的源代码中单独修改。信息储存流程图如图2所示。
基于信息储存流程,在数字图书馆个性化交互服务行为信息挖掘系统设计中,将一些常用的个性化交互服务行为信息封装成储存过程[12],专门存放在数据库的服务器中,从而提升系统的响应速度,实现个性化交互服务行为信息的挖掘。
2.2 构建决策树算法
从有类别号的个性化交互服务行为信息中,挖掘出有价值的信息,然后根据类标号分类。决策树的每一个节点都代表一个属性,每一个分支代表一个测试的输出情况[13]。设在节点R中存放的是C的信息分组,将选择细腻增益率最高的属性来分裂R。那么对个性化交互服务行为信息数据集中的元组分类所需的期望信息为[14]:
[InfoC=-i=1mpilog2p1] (1)
式中:[pi]表示的是C中任意信息对象属于[Ci]类别的概率,在实际应用时可以使用[Ci,DD]来做大概估计;[InfoC]表示C的熵。
如果个性化交互服务行为信息属性A具有v个不同的值,那么属性A对C中的所有元组分类所需要的期望信息为:
[InfoAC=-j=1vCjCInfoCj] (2)
式中,[InfoAC]是按照信息属性A对C的元素分类所需的期望信息,选择最小期望信息的属性[15]来分裂C。基于期望信息的计算,设计了算法的实现流程图,实现数字图书馆个性化交互服务行为信息的挖掘。决策树算法实现流程图如图3所示。
将常用的个性化交互服务行为信息专门存放在数据库的服务器中,完成信息储存过程设计;又结合期望信息构建了决策树算法,完成了信息的挖掘,从而实现系统的软件设计。
3 测试分析
3.1 系统运行环境
系统运行环境如表1所示。
3.2 系统测试步骤
数字图书馆个性化交互服务行为信息挖掘系统集成测试根据测试的规定步骤进行逐一测试,可以使每一个模块间的协调能力和数据流向被清楚的了解。测试的步骤如图4所示。
利用上述系统运行環境和测试步骤,测试次数设置成50次,分别采用传统信息挖掘系统和本文的信息挖掘系统,记录系统各个页面的响应时间,如表2所示。
从表2的结果可知,系统在不同界面的响应时间是不同的,采用传统信息挖掘系统,在登录界面的响应时间是最短的,在系统管理界面的响应时间是最长的,整个挖掘过程的平均响应时间为3.23 s;而采用本文的信息挖掘系统,在主界面的响应时间是最短的,可以加快用户进入系统的速度,整个挖掘过程的平均响应时间为0.8 s。因此可以得出本文信息挖掘系统可以加快系统的响应速度。
4 结 语
本文提出数字图书馆个性化交互服务行为信息挖掘系统设计,基于系统的硬件设计和软件设计,实现数字图书馆个性化交互服务行为信息挖掘系统的设计。测试结果表明,提出的信息挖掘系统相比于传统信息挖掘系统,具有更快的响应速度。
参考文献
[1] 刘海鸥,陈晶,孙晶晶.面向大数据的移动数字图书馆情境化推荐系统研究[J].图书馆工作与研究,2018(9):60?66.
[2] 白琳琳.大数据时代数字图书馆个性化服务研究[J].山西档案,2018(6):86?88.
[3] 赵天昀.数字图书馆个性化信息服务中用户隐私保护研究[J].图书馆理论与实践,2018(2):101?103.
[4] 赵逸智,张云峰.大数据环境下文本信息挖掘系统设计[J].现代电子技术,2018,41(1):125?128.
[5] 王茜,平金珍,张永华.星载光交换信道数据挖掘系统设计[J].激光杂志,2018,39(3):151?154.
[6] 张辉.基于关联规则的运动训练生化指标数据挖掘系统设计[J].现代电子技术,2018,41(7):183?186.
[7] 丁幼春,杨军强,舒彩霞.油菜直播机组自动对厢作业控制器设计与试验[J].华中农业大学学报,2018,37(1):101?107.
[8] 邹延生,董平.基于协同控制理论的非线性直流附加控制器设计[J].电力自动化设备,2017,37(4):210?217.
[9] 赵磊,刘天琪,李兴源.基于变结构控制理论的高压直流附加频率控制器设计[J].电力自动化设备,2017,37(11):218?223.
[10] 杜光辉,郑艳娟.物联网环境下金融大数据动态安全存储系统设计[J].现代电子技术,2017,40(23):85?88.
[11] 冉娟,任琼.关于大数据存储过程中缺失信息检测仿真[J].计算机仿真,2018,35(12):451?455.
[12] 李又玲,常致全.基于Gibbs采样与概率分布估计的移动云数据存储[J].计算机工程,2017,43(1):13?19.
[13] 周美琴,徐章艳,陈诗旭.基于相关性的类偏好敏感决策树算法[J].计算机工程与应用,2017,53(5):45?50.
[14] 夏修臣,王秀英.基于余弦相似度的改进C4.5决策树算法[J].计算机工程与设计,2018,39(1):120?125.
[15] 张翕茜,李凤莲,张雪英.基于代价敏感混合分裂策略的多决策树算法[J].电子技术应用,2017,43(10):128?131.