祝红艺 罗红彬
(西北农林科技大学图书馆,陕西杨凌712100)
数字资源计量规范研究
——基于事实数据库专项数据填报的思考
祝红艺 罗红彬
(西北农林科技大学图书馆,陕西杨凌712100)
数字资源事实数据的计量是图书馆统计工作的重要组成部分。本文根据笔者多年从事馆藏数字资源计实践经验,提出了数字资源计量中存在标准不连续、含义指代不明及使用统计不规范等主要问题,分享了西北农林科技大学图书馆在具体操作中的解决办法,即人工统计、导航汇总与等同下载。在此基础上,笔者建议图工委、DRAA与各馆首先各司其职,共同致力于数字资源计量的可持续、可比较服务;其次指出国内数据库商需要根据国际计量标准的变化采取相应调整措施;针对第四版COUNTER规范标准,图工委报表填报内容需要适时改进及展开相关内容与理论知识的培训;增设高校图书馆数字资源统计系统的评估,开展COUNTER标准与国内相关数字资源统计规范的比较研究。
数字资源;计量规范;COUNTER;大学图书馆
2011年以来,教育部高等学校图书情报工作指导委员会结合以往统计中出现的问题和高校图书馆发展的实际情况,对高校图书馆事实数据库的统计项目作了修订[1]。该举措为事实数据填报得以持续开展打下了良好的基础,具有十分重要的意义。但是985和211工程院校由于数字资源类型多样,数量庞大,想要精确掌握并计量每个统计项目依然显得尤为困难。目前,2007版《高等学校图书馆数字资源计量指南》(简称《指南》)是进行该项统计工作的主要依据和纲领性文件。笔者在该项工作中主要负责西北农林科技大学图书馆数字资源当年新增量、馆藏累计量及其使用情况的计量,连续几年的统计实践促使笔者想从数字资源计量角度谈谈对该问题的一些看法和思考。
本文所阐述的数字资源计量主要包含两个方面的内容,馆藏数字资源数量及其使用计量。笔者发现此过程存在以下诸多弊端。
1.1 标准不连续
如外文期刊种、册数问题。2010-2012年度普通高校图书馆统计报表(扩展版)中“C当年新增文献量”填报细则里规定中文电子刊每种1个年份算1册,外文电子刊每种1个年份算2册,但是2013-2014年度该统计报表(扩展版)填报细则改为中、外文电子刊都是每种1个年份算1册[4]。另外,按照强自力对于《指南》的解读,学位论文、会议录、报告、标准均作为图书计量成“册”,其换算标准为学位论文1篇计1册,会议录1本计1册,报告、标准5份计1册[2],这样计算下来每年新增与馆藏总量的增值庞大,有时候又会与数据库商能提供的数据出入很大。所以统计人员对究竟采用何种标准易于产生困惑。
1.2 含义指代不明
再如Proquest学位论文全文数据库采用单馆采购,集团共享订购模式[3],按照强自力对于《指南》的解读,共建共享电子书按共享的总数每1种计1册[2];但同时报表中C1.3填报细则又规定,电子资源有永久使用权的,纳入D馆藏资源累积量的下属项目中[4]。以西北农林科技大学图书馆为例,西北农林科技大学图书馆每年购买具有永久使用权的200篇学位论文,但可以使用共享成员馆购买的上万篇论文,实际购买的具有永久使用权的量200篇与成员馆实际访问(可使用的量)存在数字上的巨大差异。这里就产生一个问题,当年新增量与馆藏总量该如何计量?是将具有永久使用权的200篇计入当年新增,共享使用资源(上万篇论文)计入馆藏总量?亦或是反之计量,再或者是二者都以共享总量计入?好像都有一定道理。另外还有工具书与年鉴的归属问题。将其归于图书并参与种、册数量的统计还是归于数值事实型数据库(其他数据库类型)只进行数据库个数的统计?
1.3 使用统计不规范
“G6电子资源下载量”是反映数字资源使用情况的极为重要的指标。填报细则里既没有具体说明电子资源包括哪些类型,也没有解释“下载量”究竟指的是下载次数,篇数亦或是下载页(面)数。显然,在进行数字资源使用计量时倘若对文献类型及计量单位不进行规范或约定,就会对统计结果造成不同程度的影响。表1反映的是国内外常用数据库使用情况的计量指标。从表1可以看出,国内外数据库使用统计存在很大差别,国内以沿袭旧有的计量指标为主,而国外以国际惯例COUNTER标准为主,尤其是期刊与图书。国内外计量指标的差异增加了统计工作的难度,如子会话(Subsession)、页面浏览量、被拒量、访问量以及全文成功下载量、搜索次数等不一而足,要从众多的计量指标中找到一个与电子资源下载相匹配的使用指标是需要一番功夫斟酌的。当然表中未列出的数据库中也有极为简单的统计个案,如新东方是按照课程明细,只有一个“使用次数”指标、爱迪科森仅有点击量、美国探索教育视频资源也只给出了浏览次数统计。
表1 国内外常用数据库使用统计报告计量指标比较
2.1 人工统计
逐一询问各出版商库存图书期刊等资源的数量,或通过数据库网站查询其资源列表,结合自己馆内实际购买情况计算期刊与图书的种册数量。
2.2 导航汇总
利用西北农林科技大学图书馆期刊导航功能汇总中文期刊题名信息,而后再借助Excel表进行手动去重处理获得最终期刊种数信息。通过搜索平台或导航聚类功能汇总外文期刊资源数量,如利用西北农林科技大学图书馆文献信息搜索平台通过全部字段“of”查询外文期刊种数;或利用CCC“馆员专栏——图书馆馆藏期刊维护”查询外文电子期刊种数。
2.3 等同下载
针对“G6电子资源下载量”,西北农林科技大学图书馆通常的做法是数据库商提供的报表中有直接下载数据的采用该数据为准,没有下载数据的则选取与下载量含义最为贴近的指标替代,并认定为等同下载。如中文图书(期刊)通常采用下载次数、外文图书(期刊)使用全文成功请求量,多媒体资源以全文内容单元请求量,文摘索引资源采用“记录浏览”、“结果点击”为等同下载指标。
综上所述,标准不连续、含义不明确以及使用统计不规范等客观存在的事实因素以及后期采用的解决办法等都会对数字资源计量结果造成不同程度的误差。
3.1 前 提
每个数据库的内容资源都在不断更新变化中,尤其是国外引进的期刊数据库——新增刊、转库刊(Transfer Titles)、新发行刊以及开放获取刊、当年不再出版刊、其他变化(如更名、卷期频次改变、仅在线(Online-only)出版、付费刊改为开放获取刊)等。即便数字资源采访人员要弄明白自己馆内究竟订了哪些刊、不同刊都具有哪些权限等都不是一件易事。因此笔者建议,图工委在事实数据库填报前应做好数字资源统计的填报指南,主要包括数据库各购买单元,如图书、期刊、标准,报告、会议录、博硕士学位论文等及其子库所对应的种、册、份、个等数量信息,尽可能涉及高校馆购买的国内外所有数据库(子库)。数据于每年年初更新一次,以正式文件形式发给各高校馆作参考,各馆以此为基础计量其数字资源。ARL每年在实施统计时专门提供一个文档作为项目填报指南,指南中除了对统计项目作出定义外,还采用举例等方式对项目进行详细说明,以此来帮助填报人员准确地理解各项目的含义[5]。其次,DRAA应要求出版商提供遵循COUNTER规范的使用统计报告,并作为条款之一写进订购合同[7],并要求向成员馆开放管理员账户,以便采购人员随时自主查询所购资源使用情况。最后,各馆也要努力完善馆内搜索平台建设,重点在于期刊和图书的导航。它的意义不仅仅在于方便读者查找资源,对馆员而言,导航的功用可能更在于对专项资源内容的清点与统计。笔者以为,以上举措都是数字资源计量的基础性工作,也是馆际间进行比较的前提。
3.2 标 准
COUNTER(Counting Online Usage of NeT-worked Electronic Resources)是集成在线期刊、数据库、在线图书及多媒体内容等电子资源的使用统计规范。尽管《COUNTER电子资源使用统计实施规范》(第四版)已经发布并规定要求电子资源销售商在2013年12月31日前应用新版实施规范,但是由国内数据库商提供使用报告的内容来看显然他们还没跟上这一新形势。因此,笔者以为在数据库商层面(尤其是国内数据库商)普及规范使用统一标准很有必要。首先需要他们明确新版COUNTER的变化与优势,以第四版COUNTER修改数据库使用报告1和3为例,原来要求提供访问次数,现在已不做要求,而要求提供“检索量”和新的数据库使用评价指标“记录浏览”、“结果点击”[8]。另外,该版本还扩展了被拒绝访问的类型,增加了因资源未获得授权访问而导致的被拒绝[8]。国内数据库商需要根据这些变化内容迅速做出相应调整。
3.3 改 进
图工委要求填报“G6电子资源下载量”,数据本身是一个含义模糊的量。笔者建议针对第四版COUNTER规范标准,图工委报表填报内容应做出适时改进。据COUNTER标准,统计内容包括全文请求成功的数量和被拒绝的全文请求数量(均按月和期刊统计)。全文请求成功的数量指浏览、下载或通过其他方式提供给用户的全文(包括HTML格式和PDF格式)数据的数量,这些全文数据是由服务器而不是浏览器所控制的。因此,下载量只是所有全文请求成功数量的一部分,并不能完全代表电子资源的使用效能。改进的具体措施为:将“电子资源下载量”进行分解,如电子资源检索量、中外文电子书刊成功全文(或Section章节)请求量,中外文文摘索引记录浏览或结果点击量,多媒体全文内容单元的成功请求量等。其次,开展报表填报培训。如组织相关馆员学习图书馆数字资源统计规范等理论,让用户明晰每个指标与专业术语的含义。以检索与登陆概念为例,检索是指一个明确的、有智力的询问,相当于将在线服务请求提交到服务器。无论是通过查询表格提交服务器或是使用菜单选项进行选择提交都作为一次检索来进行统计。一次检索指的是一次独立的查询,登录指一次在线服务的成功请求[6]。通过这种有针对性的培训有助于我们理解各种计量指标的含义,从而明确把握统计内容的内涵。
3.4 评 估
数字资源的使用效益分析是近年来各高校图书馆工作的重中之重。目前有些馆如西安交通大学、上海交通大学、复旦大学及其他机构清华同方、联图科技等都自主研发了高校图书馆数字资源统计系统。这些系统的核心旨在支持对图书馆各类型数字资源建设、服务与利用的多维度统计管理,基本能够满足国际主流标准中数字资源评估相关指标的数据需求。表2是笔者了解到的几个系统的功能比较,建议业内人士结合馆内需求做出判断。
表2 高校图书馆数字资源统计系统或平台的比较
3.5 研 究
国际上已经开展了若干关于图书馆统计相关标准规范的研究,其中产生重要影响的成果有:ISO2789:2006 Information and Documentation——International Library Statistic、ANSI/NISO Z39.7:2004 Information Services and Use:Metrics and Statistic for Libraries and Information Providers——Data Dictionary和Measure for Electric Resource(E-metrics)Complete Set等。上述成果中有关数字资源的统计规范远不能满足我国图书馆界的实际需求、国内图书馆界所采用的统计指标体系和统计方法均存在相当大的差异,降低了数据的比较、分析和决策参考价值[9]。COUNTER作为规范网络化电子资源使用统计报告数据处理、审核和提交的国际化标准与目前国内自主制定的数字资源使用标准仍有很大区别。我国数字图书馆标准规范建设项目(CDLS)于2002年10月启动,不仅包括数字资源加工、元数据、惟一标识符等数字图书馆有关标准规范的研究与制定,而且对我国数字图书馆标准规范的发展战略、建设机制进行了研究分析[10],但是涉及数字资源计量统计标准规范方面内容似乎不多。Counter标准究竟适用于哪些类型的数字文献,与国内相关数字资源统计规范有哪些相同与不同之处,应用该标准对国内数据库商将产生哪些冲击等问题已逐渐引起业内人士的重视,但这些问题都还需要在实际工作中仔细考量。
繁杂的图工委报表填报在2015年的统计工作已经结束,但是留给笔者的思考远还没有结束。毋庸置疑,在没有统一标准和规范的前提下,或者即便是有但缺乏强有力执行的情况下,数字资源报表的填报缺乏可以比较的基础。因此,业内人士应该借此工作的开展逐步推动我国数字资源的计量统计向规范化的方向改进与发展。
[1]关于审议高校图书馆事实数据库统计项目的通知[EB/OL].http:∥www.chinalibs.net/Zhaiyao.aspx?id=216277,2015-07-22.
[2]《高等学校图书馆数字资源计量指南》解读[EB/OL].http:∥wenku.baidu.com/view/432e946203d8ce2f0166230d.html?from=search,2015-07-22.
[3]Proquest学位论文全文数据库评估报告[EB/OL].http:∥www.docin.com/p-296900244.html,2015-07-22.
[4]陕西高校图工委.《2013年普通高校图书馆统计报表(扩展版)》.2014:5-6.
[5]胡秀梅,何雪梅,李睦,等.美国研究图书馆协会统计与高校图书馆事实数据库统计的对比研究[J].大学图书馆学报,2011,(6):95-98.
[6]张静,魏青山.SUSHI对电子资源规范化管理的影响[J].图书情报工作,2014,58(10):112-116.
[7]朱兵,李春明.COUNTER与电子资源的使用评估[J].图书情报工作,2006,50(1):100-102.
[8]李洪.新版COUNTER的特征及未来发展[J].中国图书馆学报,2012,(11):29-37.
[9]中华人民共和国文化部.图书馆数字资源统计规范WH/T 47-2012[M].北京:国家图书馆出版社,2013:1.
[10]林忠娜,葛丹阳.我国数字图书馆标准规范的构建[J].图书馆界,2014,(5):49-51.
(本文责任编辑:马 卓)
Research on Statistics for Digital Resource——Based on Filing and Submitting Specialized Data of Fact Database
Zhu Hongyi Luo Hongbin
(Library,Northwest A&F University,Yangling 712100,China)
Measurement for the factual datas of digital resources is one of the most important parts in library statistics.The author put forward some problems as discontinuous standards,ambiguous meaning and nonstandard statistics in measuring digital resources,based on years of work experience in measurement in digital resources of library.Then the author shared the methods of the library of Northwest A&F University to solve the problems including in manual statistics,navigation summary and equivalent download.On this basis,the author proposed:Firstly,the working committee of library,DRAA and all libraries should cooperate and focus on the sustainability of the measurement to digital resources and comparable services;Secondly,the domestic vendors on database should adjust quickly corresponding to the change of international measuring standard;Thirdly,theworking committee of library need improving report contents in time and carry out some relevant treatments,according to the COUNTER standard of the fourth edition;In the end,the digital resource system or the platform of university libraries should be studied and evaluated,the COUNTER standard and the statistics standard of domestic relevant digital resources should be compared and studied.
digital resources;measuring standard;COUNTER;university library
10.3969/j.issn.1008-0821.2016.01.020
G250.74
A
1008-0821(2016)01-0114-04
2015-10-30
祝红艺(1972-),女,副研究馆员,研究方向:信息资源建设。