史叶明
关键词:公共图书馆;数字资源;效费比
摘 要:文章论述了数字资源利用的困局与对策,以研究数字资源利用效益为契机,基于效费比的研究方法,指出了公共图书馆应建构馆藏数字资源评估系统,以期为提升公共图书馆数字资源的利用效益提供数据支撑。
中图分类号:G258.2文献标识码:A文章编号:1003-1588(2019)06-0009-03
相关统计显示,2014年我国高校图书馆数字资源购置费用已占到文献资源购置经费的66.06%,并且仍呈上升趋势。公共图书馆的读者群虽然与高校不一样,其数字资源采购经费占比相对要低,但总体趋势是一致的。2017年发布的《第十四次全国国民阅读调查成果》显示,我国国民的数字化阅读接触率达到68.2%,比2016年的数据高了4.2个百分点,数字化阅读接触率连续8年上升,表明我国国民对数字资源的需求量在不断攀升。
1 数字资源利用的困局与对策
1.1 困局
公共图书馆除为读者提供纸质文献外,还提供各类数字资源。相关统计显示,读者对公共图书馆数字资源的需求量处于上升态势,但公共图书馆在数字资源使用过程中存在以下问题:①统计数据来源不透明。用户不了解数据统计原理,因此无法判别数据的真实性。②统计数据非个性化。用户获取到的数据是既定格式的非个性化数据,无法根据自身需求进行定制。③统计数据不完整。厂商提供的数据存在缺失,造成部分数据空白。因此,公共图书馆亟须建立一套用于数字资源的独立评估系统,将数字资源纳入规范管理。2017年,第六次全国县级以上公共图书馆评估标准细则中“组织管理和运营创新”一项提到,资源采购依据第三方数据分析进行按需采购的可以加2分,这是在政策层面考察公共图书馆在组织管理和运营方面的创新性管理方法和手段。将第三方数据引入公共图书馆的管理工作,体现了一种面向未来的管理理念,具有示范效应。
1.2 对策
公共图书馆应构建数字资源效费比评估系统。数字资源已成为公共图书馆馆藏资源的重要组成部分,丰富的数字资源既能满足读者的学习和科研需求,又能促进学科建设和研究。因此,科学准确地评估公共图书馆数字资源的利用情况,对其可持续发展和优化服务功能具有十分重要的意义。数字资源评估系统是由多个维度组成的综合考量体系,包括主观评价和客观评估。公共图书馆对数字资源的访问流量进行采集与分析,以及对数字资源效用进行量化,是评估体系中客观影响因素的重要组成部分。数字资源评估系统的设计初衷是利用运算机制实现异构数字资源的横向对比分析,解决资源利用中存在的问题,为数字资源采购决策提供数据支持,帮助公共图书馆改善和提高数字资源服务质量。
2 数字资源评估系统实现原理
数字资源评估系统运行环境為Linux,基于Nginx反向代理原理,采用URL重写技术,将数字资源公网地址重写为系统私有地址,读者访问数字资源时先获取私有地址,再经过反向代理服务器转到该数字资源的目的地址,所有的读者访问流量均通过中转服务器处理,将流量智能分配到集群中的各服务器上。数字资源评估系统采用负载均衡策略,不仅能够承载更大的流量,还能降低运算延迟,避免单点故障造成服务器宕机。读者发起访问请求后,数字资源评估系统经过资源重定位,将请求地址转换为目的数据库URL,并将目的数据库数据回传至读者,完成读者的数字资源请求。在资源重定位过程中,数字资源评估系统通过技术手段采集用户数据,如ID、IP、年龄、性别、访问历史、检索信息等,通过对读者数据的挖掘,最终形成读者和数字资源的关联性数据。
目前,我国公共图书馆的数字资源评估系统已加载了155项数字资源库,实施前有馆内镜像访问和远程在线访问,实施后将中外文数字资源馆内镜像地址和远程访问地址转换为系统私有地址进行集中管理。表1显示的是地址转换逻辑关系(外文数字资源库只提供在线服务),因篇幅所限,仅列部分地址。
3 数字资源效费比研究与应用
研究数字资源效费比,需将被评估的中外文数字资源加载到分析池中,分析池是动态的,可以根据实际需求调整评估对象。效费比研究现阶段包括数据管理和数据分析。
3.1 数据管理
数据管理对象涵盖数字资源库、读者库、合同管理等,是数字资源评估分析的基础。数据管理能够实现对数字资源应用数据的采集与统计,采集相关的原始行为数据,并保存在本地数据库。数据管理经过数据挖掘后形成二次数据,包括全站流量统计、访问量统计、下载量统计、在线时长统计、检索统计、访问IP统计、读者访问轨迹、单位成本、读者偏好等。生成的二次数据会保存到另一个数据库,形成原始库和开发库两个独立的数据库。公共图书馆以往的数字资源统计数据都来源于供应商,数据管理可以实现公共图书馆对数据的自我管理,从而减少或消除对供应商的依赖。
3.2 数据分析
数据分析的基础来源于数据管理的输出,将各数字资源的采购金额导入合同管理,匹配数字资源、合同起讫时间等。数字资源评估系统将采集到的数据与各数字资源进行精确匹配,自动生成数字资源分析表。数据分析表形成的是二次数据,数据分析输出项包括数据库名称、分类、总成本(元)、单次应用成本(元/次)、单次下载成本(元/次)、单次检索成本(元/次)、每分钟访问成本(元/分钟)、每MB下载成本(元/MB)、单人访问成本(元/人)等,详见表2。
3.3 数据评估
3.3.1 效费比分析。效费比分析方法指在一定时期内取得的效益与投入费用的比值。效费比=产出效益/投入费用,产出效益表现为数字资源的单次应用量、下载次数、检索次数、访问总时长、下载量(MB)、访问人次等,投入费用为数据库的采购成本。
3.3.2 数据库访问量差异。相关分析数据显示,万方数据库与中国知网在一定时间内的访问量差异较大,中国知网的访问量明显较大。读者选择数据库时会优先考虑中国知网,主要是由于其内容更加丰富。我国读者较少选择外文数据库,因此其访问量较中文数据库有很大差距。中文数据库中中国知网的访问量最大,万方数据库次之,二者的访问量之和超过中文数据库总访问量的六成;外文数据库中ProQuest Dissertations & Theses的访问量最高,Academic Search Premier Database(For Academic Libraries)次之。
3.3.3 效费比差异。成本既定,产出效益越高效费比就越高,效费比与应用量、检索量、下载量等成正比。表2显示,中国知网虽然售价不低,但6个指标均低于其他几个数据库,因此其效费比最高。外文数据库中Academic Search Premier Database的效费比最高,Chemical Abstracts Web的效费比最低,ProQuest Dissertations & Theses略优于EI。中文数据库中中国知网在单人访问成本和单位时间访问成本方面的效费比都最高;外文数据库中Academic Search Premier Database(For Academic Libraries)的单人访问成本的效费比最高,Chemical Abstracts Web的单人访问成本效费比最低,究其原因是读者访问量造成的,由此可见读者访问量是重要的影响因子。虽然外文数据库总体访问量较低,但其作为公共图书馆丰富数字资源的重要组成部分不可或缺。
4 建议
4.1 优化资源采购模式
公共图书馆应制作基于效费比的多维度分析报表,真实反映各数字资源的使用情况,为数字资源的决策和建设提供翔实的数据,以客观需求、数字资源的产出效益为依据优化资源配置,继续或加大采购利用效率高的数字资源,停止或减少采购效费比低的数字资源,而对于效费比居中的数字资源,应视實际需求动态调整其采购数量。
4.2 资源整合与共享
对于效费比较低的数字资源,除停止采购或减少采购量外,公共图书馆还可以考虑资源整合和共享,由多家公共图书馆组成联盟,通过共享授权、按流量分摊成本、馆际资源共享等方式实行联合采购,既能保持资源的完整性,又能降低采购费用。
4.3 挖掘读者潜在需求
公共图书馆应以大数据为基础、以数据挖掘为抓手,对读者行为进行分析,挖掘读者阅读行为背后的潜在需求,倾听读者的声音,消弭读者与图书馆之间的“需求鸿沟”,进而构建采购业务新模式。
参考文献:
[1] 中国全面阅读网.第十四次全国国民阅读调查成果发布:数字化阅读率连续八年上升[EB/OL].[2019-04-26].http://www.gapp.gov.cn/ztzzd/rdztl/2017worldbook/contents/10 307/327521.shtml.
[2] 柯平,胡银霞.创新与导向:第六次全国公共图书馆评估新指标[J].图书馆杂志,2017(2):4-10.
[3] 王政军.电子资源统计分析系统的设计与实现[D].大连:大连理工大学,2012.
[4] 何征强.电子资源使用监测系统实例研究[J].大学图书情报学刊,2017(2):105-108.
[5] 韩卓然,刘婧,王代礼.高校图书馆数据库资源成本效益评价:以日本千叶大学为例[J].科技经济导刊,2017(11):256.
[6] 李洪,伍宪,陈大庆,等.高校图书馆数据库的投资与绩效分析:以深圳大学图书馆为例[J].图书馆建设,2010(1):36-39,43.
(编校:徐黎娟)