高校图书馆特色自建数据库评价方法应用研究

2014-07-01 01:13乔杨
河南科技 2014年4期
关键词:向量数据库图书馆

乔杨

(郑州轻工业学院,河南郑州 45002)

高校图书馆特色自建数据库评价方法应用研究

乔杨

(郑州轻工业学院,河南郑州 45002)

本文结合郑州轻工业学院自建数据库现状,基于AHP层次分析法与模糊综合评判法,从数据库数量、数据库质量、检索方便程度、界面友好程度、查全与查准率、更新频率、满足程度和收录内容是否全面等进行了初步评价分析,为自建数据库建设项目评价体系提供一些参考性建议。

图书馆;自建数据库;AHP;综合模糊评价方法

1 前言

信息存储和呈现模式的改变,如何综合利用计算机技术、网络技术以及信息技术,结合各种丰富的馆藏资源和自建数据库,为师生提供学习和教学科研服务,已成为高校图书馆信息资源服务的目标之一。高校师生对图书馆信息资源的需求飞速增长,高校图书馆特色数据库建设已成为信息资源建设的重要内容之一。除上述获得信息资源形式外,自建数据库作为信息资源的补充完善,也加快了建设的步伐,成为高校图书馆信息资源的主要来源。自建数据库指图书馆根据本馆的特殊馆藏或特殊需要自行开发建设的数据库,也就是自建数据库。对高校而言,其主要内容包括自行开发书目、期刊目录、文摘、论文、具有学科特色的专题全文数据库等不同内容形式。高校图书馆自建特色数据库成为信息资源数字化工作的重要组成部分,很多高校图书馆投入大量的人力物力进行自建数据库建设,来积累图书馆信息资源数字化建设的经验,构建具有鲜明的专业特色、读者用户使用方便、操作简易,实用性强的专业自建数据信息资源。同时发掘有价值的、具有保护性的地域文化与特色资源,为广大师生服务。

2 国内外研究现状及趋势

有关信息资源评价指标体系建设方面研究在中国有一些成果,有关信息资源的评价方法也不断提出,这些信息资源的评价及主要评价方法包括定量评价、定性评价、定量评价和定性与定量相结合的综合评价方法。如,根据评价标准、指标体系来进行定性和半定量的主体评价方法,根据用户使用调查、数据资源利用情况统计分析、数据资源性价的比为主的定量评价方法。评价人员专业熟练程度,如何获得评价指标问题等问题,都很大程度的影响着评价质量、评价方法的选择,而评价的过程和评价参与人员影响着评价的结果。

在国外,通过在线搜索SDOS、Springer Link、Kluwer及Google搜索引擎等自建数据数据库评价相关研究可以看出,国外对自建数据数据库评价相关研究,对电子期刊数据库评价与利用统计研究相对较早,与国内相比研究内容也不尽相同,侧重点主要包括:一是侧重数据库的选择评价研究。如:电子期刊方面,国外学者认为针对电子期刊的不同特点,可以依然采用印刷型期刊的相关选择评价标准,构建出自身独特的选择评价标准,可以突出电子期刊评价的可及性和可用性;部分国外学者认为除了评价内容外还可以增加评价检索界面以及检索功能等方面。二是对电子期刊数据库的利用统计分析方面研究。在国外,图书馆很注重电子期刊的利用、统计分析工作,很多研究从不同角度对使用数据进行定量的统计分析,来研究电子期刊的使用对图书馆的对用户需求满足程度、经费分配情况、不同读者用户行为上的差异、投资效益等问题。三是对评价项目方面的研究,这方面的典型研究有:ARL New Measures Initiative(美国研究图书馆协会新测评研究计划)。

上述国内外研究综述分析说明,国内的自建数据库信息资源的评价研究偏向于理论体系,如:评价指标体系建立方法,评价方法和评价的策略等。国外研究对信息资源质量的验证多是通过绩效评价来进行的,达到增强对信息资源质量的管理的水平目的,国外评价指标研究在注重理论体系的同时注重指标体系在实践中的指导,注重指标体系在实际中的应用情况,而非只是利用某个指标体系进行定性分析或定量评价。

3 层次分析法(AHP)及综合模糊评价方法分析

3.1 层次分析法(AHP)

层次分析法——Analytic Hierarchy Process(AHP)T.L.saaty教授于20世纪70年代末提出的一种多层次权重解析法。该方法综合定性与定量分析方法来进行分析,用数量形式处理表达用户的主观判断,从而确定系统的权重值在各指标中的比重,具有可靠性、时效性、简明适用性等特点。AHP方法利用多目标综合评价和网络系统理论的方法,将决策总体进行了层次分解,包括目标、主准则、分准则等层次,根据不同的分层来聚集评价对象的多项指标信息,以从宏观整体上来认识评价对象的好坏。这种方法大大降低了评价中的不确定因素,即简化了评价过程中的系统分析与计算工作,又保持了决策者在思维决策和过程原则一致。该方法适用于不能全部量化处理的管理问题,是一种确定权重的科学方法。

3.2 综合模糊评价法的概念

模糊反映在概念形成过程中外延的不分明性,指客观事物差异的中间过渡中“不分明性”或“亦此亦彼性”。模糊综合评价方法是综合评价方法的一种,它利用模糊关系原理来定量化那些边界不清、不易定量的因素,把模糊数学作为基本点。在《信息与控制》中的论文“模糊集合”(美国加利福尼亚大学,1965,扎德A.Zadeh)中提出用“隶属函数”的概念来描述现象差异的中间过渡,由此诞生了模糊数学学科。该评价方法首先利用构造等级模糊子集的方法,量化反映被评价事物的模糊指标,再利用模糊变换的原理对各指标进行综合整理。该方法评价结果以向量的形式给出,该向量是一个模糊子集,能够较为准确地刻划了事物本身的模糊状况,提供比其它方法更详细的评价信息。综合评判方法具有较强的适用性,既适用于又可用于客观指标的综合评判又适用于主观指标的综合评价。通过模糊综合评价的过程来解决的评价指标的可综合性问题,而无需专门处理。

3.3 AHP-综合模糊评价方法

层次分析法是系统工程中对非定量事件作定量分析的一种简便方法,也是对人们主观判断做客观描述的一种有效办法,其基本思想是根据分析对象的性质和决策或评价的总目标,把总体现象中的各种影响因素通过划分相互联系的有序层次使之条理化。而模糊综合评价法利用模糊理论在处理不确定性问题上的优越性,在数据标准化处理方面取得好的效果。该综合评价法则既结合多种评价法的优点,又尽量避免了它们各自的缺点,从而取得了较好的效果。

4 基于AHP-综合模糊评价方法应用分析

本项目将把评价指标限定在自建数据库系统建设过程中考虑,首先考虑的是自建数据库的读者利用率,采用AHP-模糊综合评价模型,并结合郑州轻工业学院自建数据库项目的实际情况,提出自建数据库系统建设评价指标并对其进行初步分析。解决自建数据库评价中的评价指标的权重确定问题、评价过程中的定性问题以及模糊性现象的处理,以及其他各种因素对评价问题的影响,将定性评价与定量计算有机的结合起来。给出自建数据库评价指标并对其进行初步分析,分析目前关于自建数据库建设中存在的关键问题,并给出解决这些问题的基本策略,为自建数据库建设项目评价体系提供一些参考性建议。郑轻院图书馆所建的还不少数据库的选题还停留在教师论著成果、学生学位论文、随书光盘资源等传统数据库模式上,没有充分发挥学校的学科优势和馆藏优势。

我们以郑轻院图书馆的5个自建数据库为研究对象,采用主成分分析方法来分析评价自建数据库,分别以数据库质量、数据库数量、界面友好程度、检索方便程度、更新频率、查全率、查准率、满足程度为具体指标,对现有的建设过程中出现问题进行剖析,找出问题的解决办法,奠定了进一步开发和利用特色自建数据库基础。

4.1 AHP-综合模糊评价的数据来源

AHP-综合模糊评价调查包括了数据库质量,数据库数量、界面友好程度、检索方便程度、更新频率、查全率、查准率、满足程度等内容,AHP-综合模糊评价的数据来源于随机调查的本校教师60人,本校研究生60人,本科生300人,调查问卷共420份,其中收回395份,有效填表370份。调查对象是信息库,学位论文库等5个自建特色数据库。

4.2 AHP-综合模糊评价方法应用

4.2.1 因素论域U的确定

U={u1,u2,……,un},U:因素论域,Un:n个评价指标,该方法首先要确定评价的指标体系,解决用哪些指标Un和哪些方面去评价客观对象。

4.2.2 评价等级论域V的确定

V={v1,v2,……,vm},V:评价等级集合、决策集,被评对象对应各评价等级隶属程度并通过这个模糊向量表示出来,体现评价的模糊特性,不同的等级对应不同模糊子集。评价等级个数m一般在4和9之间,m大于9会增加语义区分时间和难度,很难得到对象的等级归属,m小于4则达不到模糊综合评价的质量要求,所以故m的选择应在4和9之间。

4.2.3 通过单因素方式评价因素,构建模糊关系矩阵R

模糊关系矩阵R表示影响因素与评价对象之间的“合理关系”,是因素集U和评价集V间的一种模糊关系。在模糊关系矩阵R中,第因素素rij代表某个被评事物从因素ui来看对vj等级模糊子集的隶属度。模糊向量(ri1,ri2,…,rim)用来刻画一个被评事物在某个因素ui方面的表现。

4.2.4 评价因素权向量确定

由于各因素的影响在总体表现的比重不同,n个评价因素对被评价事物也不是同等的重要。所以在模糊综合评价中,首先要在合成之前要确定模糊权向量:A=(a1,a2,……,an),元素ai表示因素ui对模糊子集的隶属度。权向量可以用∑ai=1,(ai≥0,i= 1,2,……,n)来表示。

4.2.5 模糊综合评价结果向量合成

利用合适的算法合成模糊权向量A与各被评事物的R,并得到各被评事物的模糊综合评价结果向量B。向量B中的bj是由A与R的第j列利用合适的算法计算得出,bj是被评事物从系统上来讲对等级模子集vj的隶属程度。

4.2.6 分析模糊综合评价结果向量

模糊综合评价结果组成了一个模糊向量,该向量给出了更丰富的信息,表示了被评对象对各等级模糊子集间的隶属程度如何。假设存在多个类型相同的被评价对象,要进一步区分处模糊综合评价的等级,那么可以利用模糊合成的结果来计算每个评价对象,得出综合得分,然后根据该得分来比较多个评价对象的好坏。

通过AHP-综合模糊评价分析得到5个自建数据库,分别是:郑州轻工业学院信息库,郑州轻工业学院学生推荐书全文阅读数据库,郑州轻工业学院学位论文库,郑州轻工业学院教师著作全文阅读和数字文库。反映了读者对数据库的真实评价,在所有指标中,评价的权重如表1所示。

表1 评价指标中评价的权重

通过表1可以看出,权重结果与抽样调查得到的整体打分评价是基本一致,因此,可以得出上述6个指标可以初步作为评价自建数据库的整体状态,达到很高的可信度。另外从调查表看出,总体评价得分值较低,也说明自建数据库存在一些问题,有待进一步完善。

4.3 自建数据库建设的思考

从前节综述分析可以看出,许多的研究内容涉及到了自建数据库方面,尤其是特色数据库建设的研究方面,出现了很多研究文献。在该项目中,在自建数据库方面(尤其是特色数据库建设)还存在一些问题。虽然说是特色数据库建设,但数据库具有特色的内容量较少,数据库内容的深层次加工不足,特色数据库内容分散,数据库即时量可以满足,但还不够全面,低级重复内容较多,数据库内容更新迟缓,实时性差等问题,这些都影响了自建数据库的建设的效益,关键问题还可以概括为:

(1)信息资源调查分析---深入调查和分析信息资源的具体来源,统计分析数据库信息资源的分布、数量、质量、出版商、版权状况等详细信息,由此得出信息资源的收集和处理实施方案。另外,数据源的收集要全面。因为数据质量从某种意义上说就是数据库的质量,数据是数据库的核心。因此,数据的全面收集也是数据库建设中重要环节之一。其目标是数据库信息资源收集的信息要完整和权威。

(2)数据库附加值分析——要注重数据库的附加值,注重对文献的深加工而形成信息资源。例如,可以进一步的图书馆自建数据库的内容数据进行进一步的组织、整理和加工,从而提高文献在质量和数量的附加价值和应用效果,形成数量与品质上的优势,从而提高数据库的附加值。

(3)功能点调查分析——编制功能需求调查表,对本校师生进行调查,通过对问卷的统计分析和挖掘,结合资源建设单位的技术力量,确定信息资源组织形式和预期实现的功能。分析数据库信息资源的具体内容,结合本高校的具体情况进行需求分析,确定系统使用群体,用户群体可以按照所学专业、性别、年级、爱好等形式来划分。

5 研究结论

本文在国内外自建数据库评价状况调查的基础上,分析了自建数据库评价指标存在的问题,根据自建数据库评价原则,确定高校图书馆自建数据库评价的基本原则及主要评价内容及方法。项目结合郑州轻工业学院自建数据库现状,基于AHP层次分析法与模糊综合评判法,从数据库数量、数据库质量、检索方便程度、界面友好程度、查全与查准率、更新频率、满足程度和收录内容是否全面等进行了初步评价分析,为自建数据库建设项目评价体系提供一些参考性建议。

由于任何评价都包含一定的主观活动,这两种方法虽然在模型的构建与方法的选择应用方面,大大减少了人为因素,但也包含了专家的选择与判断主观活动,所以,在评价过程专家的选择、判断、喜好等都不可避免的影响评价的结果,如何权衡这几个因素之间的关系,这也是下一步的研究方向。

本文系河南省教育厅科学技术研究重点项目“基于云计算的图书馆数字参考咨询创新服务模式研究”(编号:13A870370)以及河南省科技厅软科学研究计划项目“高校图书馆特色数据库建设与共享研究”(编号:132400411150)系列成果之一。

G250

A

1003-5168(2014)04-0255-03

猜你喜欢
向量数据库图书馆
向量的分解
聚焦“向量与三角”创新题
图书馆
数据库
数据库
向量垂直在解析几何中的应用
数据库
数据库
向量五种“变身” 玩转圆锥曲线
去图书馆