改进遗传神经网络在荐购高校数字资源中的应用

2014-10-21 19:57胡钦文
计算机光盘软件与应用 2014年24期
关键词:评估指标遗传算法图书馆

摘 要:针对目前图书馆数字资源采购过程中主观意识强、科学规范与量化性差的问题,本文对重庆市科技文献资源共享服务平台重庆理工大学分中心2010年4月-2014年4月(四年)提供的文献传递数据进行属性分析,并确定新的评估指标,然后采用改进的遗传神经网络算法对数据进行建模。通过文章新提出文献传递评估指标找出使用频率较多数据,从而来指导本校图书馆数字资源的采购方向。

关键词:评估指标;文献传递;数字资源采购;遗传算法;图书馆

中图分类号:TP212.9

目前,各个高校在选择数字资源采购模式上,没有一个科学的规范与量化的比对,都是以人的主观意识在采购。通常由用户的数量和使用量的需求程度确定数字资源访问级别高低并结合经费划拨情况决定是否购买。也有一些高校针对数字资源质量评价体系进行研究,对数字资源采购起到一定的参考作用,但在实际操作中还存在一些问题。

新的评估指标为解决数字资源采购问题,提供了采购参考依据,以达到对文献传递数据全面分析。不同等级用户满意度指数不同,所有用户最终加权总值能全面客观、毫无遗漏地反映评价目标综合保障能力。评估指标对于比较数字资源的学术质量有实质性效果,其评估结果能对高校数字资源库采购起到量化参考作用。[1-2]

本文对重庆市科技文献资源共享服务平台重庆理工大学分中心4年(2010年4月-2014年4月)提供的文獻传递服务进行研究,提出文献传递服务的各种属性并确定评估指标,从图书馆文献传递基本情况、文献传递的文种、类型及学科分类等方面进行统计,用于本校数字资源采购的数学模型,通过遗传神经网络挖掘文献传递服务的各种属性与是否被采购之间的潜在关系,从而实现更好地提供有效决策的预测分类。

1 遗传神经网络

BP神经网络迭代地处理训练元组数据集,将每个元组的网络预测与实际已知的目标值比较。对于每个训练样本,修改权重使网络预测和实际目标值之间的均方差最小。其具体推导过程请参考文献[3]-[5]算法流程见图1。

2 模型的建立

2.1 数据来源

重庆市科技文献资源共享服务平台整合了重庆大学、西南大学、重庆医科大学、重庆市标准化研究院、西南信息有限公司、重庆摩托车(汽车)知识产权信息中心、重庆理工大学、重庆邮电大学等八个单位的所有文献资源。平台可检索文献记录近2.6亿条,包括期刊论文4374万篇、学位论文167万篇、中外专利2400万项、中外标准27万项、会议论文594万篇。平台2010年4月至2014年4月,平台总访问量为16752285人次,本校分中心文献传递24601次,外文传递578次,标准传递236次。

2.2 改进遗传算法流程

算法中使用混合交叉产生新个体,再其使用混合变异。判断是否满足终止条件,满足则停止算法,不满足则进入计算适应度。图2表示了改进遗传算法的基本过程:

2.3 实验结果

本文用matlab7[5]建立评估模型。首先通过文献传递中形成的数据,结合相关文献[6]研究,整理完成11个图书馆的评估指标:文献传递文种、文献类型、文献年代、学科分类、关键词词频、引文次数、文献作者、传递篇数、传递方式、用户类型、满足率、评价完成难度进行评估,并将得到的评估指标值、信息服务质量值量化考核,以得出训练样本。遗传神经网络精度收敛曲线如图3。

3 结束语

本文将遗传算法的全局搜索能力和神经网络的局部搜索能力相结合,实现了对文献传递数据综合水平的有效评估,从而能为图书馆的文献传递质量提供相对有效的、科学的综合评价,最终为购建数字资源提出意见。但建立这样的数学模型,评估指标的确定的采集和准确性本身就是一个难题,如何解决这一问题也是我们下一步工作的目标。从实验结果来看,基于本文的文献传递质量评估模型基本达到目的,希望该方法能为图书馆如何购买数字资源提供新的思路。规范、准确、客观,确保样本数据真实性和科学性。

参考文献:

[1]马晓亭.大学图书馆数字资源采购评估指标体系研究[J].现代情报2010(10):92-94.

[2]Guidelines for Statistical Measures of Usage of Web—based Information Resources[EB/OL].http://www.library.yale. edu/eonsortia/state –mensanddocuments.htm1,2007-09-27:1-3.

[3]王小平,槽立.遗传算法-理论?应用与软件实现[M].西安:西安交通大学出版社,2000.

[4]唐淑香,李利.国内文献传递研究概述[J].图书馆下作与研究,20l0(10):8-l1.

[5]闻新,周露,王丹力,等.MATLAB神经网络应用设计[M].北京:科学出版社,2000.

[6]国家技术监督局,国家科学技术委员会.GB/T13745—1992学科分类与代码[s]∥新闻出版署图书管理司,中国标准出版社.作者编辑常用国家标准.北京:中国标准出版社,1997:426-513.

作者简介:胡钦文(1981-),女,重庆人,本科,馆员,研究方向:数据挖掘、图书馆资料。

作者单位:重庆理工大学图书馆,重庆 400054

基金项目:此文为重庆理工大学高等教育教学改革研究项目(编号编号:2013YB64)。

猜你喜欢
评估指标遗传算法图书馆
图书馆
基于自适应遗传算法的CSAMT一维反演
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于遗传算法和LS-SVM的财务危机预测
我国职业足球俱乐部商誉价值评估指标体系构建研究
以评估指标为依据,构建教学质量标准体系
行业型高校就业质量评估指标体系初探
基于改进的遗传算法的模糊聚类算法