李 洪 伍 宪 陈大庆 稂丽萍(深圳大学图书馆 广东 深圳 518060)
数据库资源是高校图书馆资源的最重要组成部分,是高校开展教学、科研工作紧密依赖的学术性文献来源。近年来国内高校对数据库的经费投入呈逐年上升的趋势。以深圳大学为例,2006-2008年图书馆用于数据库的经费投入分别是270万元、464万元、892万元,短短3年的时间经费投入就增长了2.3倍;在同期购书总经费4 779万元中,数据库的购置经费占34%,可见高校对数据库的投资力度相当之大。国内其他高校对数据库的投资近几年同样呈快速增长的趋势,有些图书馆对数据库的投入已超过文献采购总投入的一半以上。
如此巨大的投资是否得到了合理的利用?数据库的利用情况到底如何呢?本文以深圳大学(以下简称我校)图书馆为例,从2008年订购的212个数据库中选择了5个最有代表性的中、外文数据库进行投资分析与绩效分析,以期对数据库的引进及利用情况做出总体评价,对存在的问题提出改进建议。
作为分析对象的5个数据库分别是:中国期刊全文数据库(含世纪期刊数据库,以下简称中刊库)、中国优秀硕士学位论文全文数据库(以下简称硕士论文库)、IEEE/IET Electronic Library(以下简称IEL)、ScienceDirect(以下简称SD)及Ei Compendex Web(以下简称EI)。其中,中刊库是国内最重要的全文期刊数据库,收录覆盖多个学科的8 200多种学术期刊;硕士论文库是国内主要的学位论文库,收录600多个硕士培养单位的优秀硕士学位论文全文;IEL为世界最著名的电气电子工程专业数据库,收录IEEE(Institute of Electrical and Electronics Engineers,美国电气电子工程师学会)与 IET ( Institution of Engineering and Technology,英国工程技术学会)出版的高质量的技术文献全文;SD 收录文理不同学科的1 700余种高品位的学术期刊全文;EI则是著名的美国《工程索引》的网络版,收录5 000多种工程领域的期刊及技术文献,是5个数据库中唯一的文摘索引型数据库。
深圳大学图书馆订购数据库的基本程序为:学院提出订购申请→图书馆专业人员调研→联系试用→收集用户反馈→根据经费及学科分布等情况决定是否购买→谈判价格→订购。在谈判价格环节,图书馆尽可能地加入由国家教育部或省教育厅组织的高校集团采购,以降低购买价格。五大数据库近3年的经费投入情况见表1。
从近3年五大数据库的经费投入来看,每库年均投入23.6万元。其中,EI费用最低,年均投入9.3万元;IEL费用最高,年均投入45.57万元,为前者的4.9倍(后文将分析到费用最高的数据库IEL利用率反而最低)。从经费的总体走势看,5个数据库2008年的经费投入比2006年上涨了50%,涨幅低于同期购书总经费的涨幅(53%)。
斥巨资订购数据库的目的在于使本校师生能够充分有效地使用数据库。数据库的利用程度越高,说明数据库资源的价值越大,也说明投资的收效越好。数据库的使用情况是可以用客观的量化指标来反映的,包括检索次数、全文下载篇数等。其中,“全文下载篇数”是一项重要的评价指标,因为用户只会将最重要的、真正有用的文献下载保存并用于进一步研究。全文下载篇数不仅能够反映数据库的使用数量,同时也反映数据库的检索质量。与检索次数相比,全文下载篇数能够更确切、真实地反映数据库的利用情况。
表1 2006-2008年五大数据库的经费投入情况 (单位:万元)
表2 2006-2008年五大数据库的使用情况 (单位:篇数/次)
表2为五大数据库近5年的使用情况统计,除文摘型数据库EI只能以“检索次数”为单位进行统计外,其余4个全文数据库均以用户全文下载篇数作为统计依据。
从五大数据库近3年的使用情况看,全文库每库平均下载文献83.2万篇,文摘库平均检索5.9万次。4个全文库里使用得最多的是中刊库(277.2万篇),其次为硕士论文库(26.2万篇)、SD ( 19万篇 )、IEL(10.3万篇)。尽管各数据库的使用情况有较大差距,但利用率逐年提高的总趋势是显而易见的,如2008年(147.5万篇/次)比2006年(89.8万篇/次)提高了64%。
深圳大学图书馆2006-2008年数据库的投资增长了2.3倍。投资增长的主要原因有二: 一是数据库数量的增加,由2006年的143个增加到2008年的212个,数量增长48%。即便如此,深圳大学目前订购的212个数据库与清华大学订购的319个数据库相比,仅为清华大学的2/3。深圳大学的数据库在购书总经费中所占比例为34%,与清华大学的比例接近,这说明深圳大学的数据库经费投入所占比例基本合理,但年度购书总经费远低于清华大学的年度购书总经费。二是数据库的自然涨价及部分数据库的购买方式由包库方式改为包库加本地镜像的方式。
数字化信息资源是高校教学、科研发展不可缺少的支撑,数字图书馆是图书馆的未来发展方向。与其他高校相比,深圳大学的数据库资金投入仍显不足,考虑到深圳大学学科建设快速发展的需要,未来的几年中深圳大学数据库的数量及数据库经费投入在总购书经费中的比例还会不断提高。为此,学校提高图书馆的购书经费以保证数据库经费的相应增长是非常必要的。
表2的统计数据显示,五大数据库2007年的使用量比2006年增长了13%,2008年比2007年增长了46%,3年内增长了64%。数据库使用量的快速提高反映出:深圳大学师生对数字化文献资源的依赖越来越大,学校教学、科研工作对数据库的需求越来越强。
数据库的引进与广泛利用直接作用并促进全校教学、科研的发展是显而易见的。目前深圳大学的学生普遍利用数据库资源完成毕业论文,3年来全校教师发表的专业论文被SCI等著名检索工具引用的数量快速增加,学校3年来获得的科研项目及经费的数额远超出建校头20年的总和。
表3 2006-2008年五大数据库的使用量排名与数据库投资额排名的对比
表3显示,数据库的使用量与经费投入额并不成正比,按投资额大小排名的顺序是IEL、SD、中刊库、硕士论文库、EI,按使用量大小的排名顺序却是中刊库、硕士论文库、SD、IEL、EI;投资最多的数据库IEL的使用量仅为中刊库的1/27;两个中文全文库的总投资为96.48万元,下载篇数为303.4万篇;两个外文全文库的总投资为229.57万元,下载篇数为29.2万篇。换言之,两个外文库的费用是两个中文库费用的2.4倍,而两个中文库的文献使用量却为两个外文库的10倍以上。
因此,在订购数据库时,应将高校最大的用户群——本科生的外语阅读能力作为考量的重要因素之一,适当加大对中文数据库的订购。此外,对于投资额特别大而利用情况又不太好的数据库要做进一步的考量,需思考该库使用量低的原因是什么?有无可能采取措施提高其使用量?该库是否为最权威的、不可替代的数据库?该库是否为学校学科发展所必须的数据库?能否采用本校独立订购以外的其他方式(如与其他学术单位共享)来获取该数据库的资源?
首先,表4反映出数据库的使用量不仅与文献语种有关,还与数据库文献所覆盖的学科范围有关。多学科数据库的使用量远远大于单一学科数据库的使用量。五大数据库中,3个文理工多学科的数据库的使用量占到总使用量的96%,而两个单一学科的数据库使用量只占总使用量的4%。而从经费投入看,使用量占到96%的3个多学科数据库的经费投入只占五库总投入的53%,使用量仅为4%的两个单一学科数据库的经费投入却占到五库总投入的47%。
表4 五大数据库使用量与数据库的学科、文献类型的关系
其次,数据库的文献类型同样影响使用量。全文数据库的使用量大大超过文摘索引数据库的使用量:4个全文数据库的使用量占到了总使用量的99%,而1个文摘型数据库的使用量只占到总使用量的1%(虽然其经费占到总经费的8%)。
再次,数据库的文献数量同样影响数据库的使用。在利用率高的3个文理工多学科数据库中,中刊库收录的文献量最大(8 200多种学术期刊,文献量达3 720余万篇),其使用量排名第一;硕士论文库因其语种为中文,使用量排在外文库之前,又因其文献类型局限于学位论文且文献量少(77万篇),其使用量仅为中刊库的1/10;SD则因文献语种的原因排名在后。
五大数据库投资额与使用量的排名及其对比使我们有了一个初步的概念:对各个数据库而言,并非“投资大、使用量就大”。事实上,部分数据库投资少,使用量也很大;另一部分数据库则反之。
然而,如何将投资额及使用量这两个不同的数字结合起来对数据库进行分析?如何对不同数据库的投资额及使用量进行科学的比较?为此,我们考虑引用两个更为科学、客观、准确的指标——单篇下载费、单次检索费来对数据库的投资/绩效进行深度分析。这两个指标能够将数据库的投资额与使用量这两个不相关的数据紧密地结合到一起。
单篇下载费是指数据库价格与下载全文的篇数之比,即单篇下载成本。对于不提供全文的数据库,可用单次检索费来表达。单次检索费是指数据库价格与检索次数之比,即单次检索成本。单篇下载费和单次检索费可以简化表示为“单篇/次使用费”。
表5显示平均每库每年的单篇/次使用费为0.94元。5个数据库中效益最好的为中刊库,每下载1篇论文的费用仅为0.15元,其后依次为硕士论文库(0.71元)、EI(单次检索4.70元)、SD(4.90元),IEL的单篇使用费最高(13.32元)。可见,IEL的单篇使用费为中刊库的89倍,为五库每库平均费用的14.2倍。尽管IEL是我校学科建设不可缺少的数据库,但在5个数据库中,它的投资额最大(每年平均花费45.6万元),使用效益相对最差(单篇下载费为13.32元)。这类数据库如仍需续订,则需要加强对用户的宣传与培训、设法提高其利用率。
表5 2006-2008年五大数据库的单篇下载费或单次检索费
总体来看,5个数据库的平均单篇/次使用费由2006年的1.32元减少到2008年的0.65元,数据库的使用成本降低了一倍以上,这说明我校近年来数据库的绩效有很大的提高。
与其他高校相比,深圳大学的中刊库2006-2008年的文献下载量为277.22万篇,与广东省27所高校平均每校文献下载量282.98万篇接近,为平均量的98%。与教育部CALIS(Chinese Academic Library & Information System,中国高等教育文献保障系统)集团采购的600多所高校的外文数据库相比,CALIS的600多所高校2006年文摘索引库的每次检索费平均仅2.07元,深圳大学却高达6.26元;同年,CALIS的600多所高校下载1篇外文数据库文献的平均费用为2.42元,深圳大学的下载费用为12.69元,为其他学校平均数的5.2倍。与他校的对比说明,深圳大学外文数据库的利用与其他学校有较大距离,使用成本相对较高,即利用率较低,从一个角度反映出深圳大学科研工作中存在的问题。
(1)深圳大学数据库的引进工作力度大、效果显著。为适应深圳大学向教学、科研并重型大学转型的需要,3年来深圳大学图书馆对数据库的经费投入增长了2.3倍,数据库的数量增长48%。
(2)深圳大学图书馆通过学院推荐、专业人员调研与试用等方式严格把关数据库的质量,引进的数据库均为国内外公认的主要学术数据库或权威学术数据库,内容覆盖学校主要学科或重点学科,大多能提供全文下载,检索系统功能强大。
(3)深圳大学图书馆尽可能地通过教育部或省高教厅组织的集团谈判压价的方式,低价引进数据库,节省了大笔资金。
(4)近年来数据库的总体利用率有较大的提高,使用成本(单篇/次使用费)大幅降低,数据库在深圳大学的教学和科研中发挥了重要作用。
(5)与全国其他高校相比,深圳大学中文数据库的利用率与其他高校较为接近,外文数据库的利用率则相对较低。究其原因,与深圳大学建校时间短,传统上一直以本科生、专科生教学为主,近年才开始招收博士、硕士研究生,科研力量不强有关。随着深圳大学向教学、科研并重型大学转型和科研能力的加强以及博士、硕士招生规模的扩大,深圳大学用户对外文数据库的利用率将会逐步提高。此外,数据库的利用率还取决于订购学校对该数据库学科文献的使用人数和需求。EI与IEL分别为工程与电气电子数据库,而深圳大学的工程学科不强,电气电子领域的研究课题与研究人员有限,数据库的利用也必然会受到影响。
(6)在降低数据库的投资、根据使用情况合理分配数据库投资、加强数据库的宣传培训、提高数据库的效益方面,图书馆仍有改善的空间。
尽管深圳大学图书馆数据库引进工作取得了较大进展,但在降低数据库的投资与提高数据库的效益方面,还需要不断改进与完善。
目前数据库订购主要采用的付费模式有:按学校办学规模付费,按检索次数付费,各省买断后根据各校办学规模或使用量分摊费用,按购买并发用户的数量付费,按“211高校”或“非211高校”区别付费,按是否设该学科的硕士点、博士点及其办学规模付费,与纸本期刊捆绑付费,按统一价格付费等。图书馆在谈判数据库价格时,要充分考虑到目前我校外文数据库使用量偏低的实际情况,争取按使用量或“非211高校”等有利于我校的条款谈判付费标准。
深圳大学中文数据库的利用率约占总利用率的85%-90%,投资仅占数据库总投资的10%-13%。与之对应的是占总投资87%-90%的外文数据库,其利用率仅占10%-15%。考虑到外文数据库利用率偏低的状况在短期内难以改变,数据库的投资应适当向利用率高的中文数据库倾斜。
按2007年的统计数据,深圳大学的数据库投资额按文科、理科、综合性学科3类划分,大致的百分比为7:41:52,同年,文科、理科、综合性学科3类数据库的使用量百分比为2:4:94。理科数据库占投资总额的41%,使用量只占4%,使用量百分比为投资总额百分比的1/10;综合性学科数据库占投资总额的52%,使用量却占94%。今后应根据学校学科的发展及数据库的实际使用情况调整数据库资源的学科分布, 使其结构逐步优化,以适应学校学科优势的发展。在投资额的分配上,要突出学校的学科重点,同时还要兼顾各学科的平衡。
除了经费投入、学科种类、数据库质量外,订购数据库还应多考虑影响利用率的其他因素,如数据库的语种、所覆盖的学科面、数据库收录的文献量、文献类型、是否提供全文文献等。这些因素将直接影响到数据库的使用效果。
除了保持原有的宣传和培训措施(如新生入学教育、开设多门研究生与本科生文检课、每周举办数据库培训讲座、对图书馆员工进行数据库培训)外,图书馆还可以采取其他一些措施提高数据库的利用率。例如,①增加师资,改变目前信息检索课程供不应求的状况;②信息检索课程按学科进一步细分,实行专业对口的教学,深化教学内容;③针对几个投资大、利用率低但学科发展又要求必须订购的外文数据库,重点举办培训讲座;④根据各学院、系、所的需要,上门开展有针对性的讲座;⑤落实学科馆员制度,学科馆员对相关学院提供对口的资源服务;⑥将数据库培训列入校人事处管理,要求全校教师必须参加继续教育课程。通过加强对用户的宣传培训,切实提高数据库的利用率。
此外,定期开展对数据库的评估也是非常重要的。通过评估,图书馆能够了解用户的需求,淘汰不太需要的数据库,增订学科发展最需要的数据库,优化数字化资源的结构,提高投资效益,实现印刷型资源与数字化资源的合理布局,使资源的配置更为科学、合理,促进图书馆整体文献资源保障水平和服务水平的提高。
[1]杨 毅. CALIS组团引进数据库现状和读者调查[R]. 南京:教育部CALIS高校组团引进数据库年会, 2006.
[2]杨 毅. CALIS组团引进数据库的发展和评估[R]. 成都:教育部CALIS高校组团引进数据库年会, 2007.
[3]李 洪. 高校用户对国外网络数据库的使用统计与分析[J]. 图书馆论坛, 2005(3):210-212, 166.
[4]杨浴琮, 张凯勇. 高校图书馆数据库资源评价研究[J].情报科学,2008 (11):1717-1719.
[5]张李义. 高校图书馆商业数据库评价指标体系研究[J].中国图书馆学报, 2004 (1):66-69.
[6]汪 媛, 赖茂生. 我国高校图书馆引进网络版全文数据库的综合评价模型[J]. 情报科学, 2004 (9):1061-1065.