韩新月
(国家图书馆 北京 100081)
2012年,原文化部发布了规范图书馆数字资源统计工作的行业标准——《图书馆数字资源统计规范》(WH/T 47—2012,以下简称《规范》)。《规范》构建了图书馆数字资源统计指标体系,对数字资源相关术语、数字资源体系、统计指标和统计方法进行了界定,适用于图书馆数字资源馆藏、服务、设施和经费统计[1]。《规范》基于一般图书馆数字资源统计的业务需求制定,统计指标体系涵盖数字资源的基本属性,因此在图书馆范围内得到了广泛关注和切实应用,是图书馆开展统计和管理工作的重要工具。
标准是通过标准化活动,按照规定的程序经协商一致制定,为各种活动或其结果提供规则、指南或特性,供共同使用和重复使用的文件[2]。行业标准经有关方面协商一致由行业机构通过并公开发布,是在全国某个行业范围内统一的技术要求[3]。作为行业共同遵守的准则、依据和作业规范,行业标准协同环境变化与科技发展而不断更新完善,既是标准化工作发展的要求,也是行业发展的必然趋势。
《规范》自2012年发布实施至今已近八年,图书馆所建设和利用的数字资源从形态、结构、内容到建设手段、服务方式等都发生了巨大变化,对统计工作提出了新的问题和挑战。因此,适时启动《规范》更新修订工作,对增强《规范》的适用性和时效性、激发行业标准发展活力以及提升图书馆标准化工作的整体效能,都具有重要的现实意义。
准确、真实的统计数据不但能够客观反映图书馆业务工作的现状和实绩,而且能够为制定发展规划提供参考依据。数字资源是当前图书馆馆藏构成与服务的重要组成部分,图书馆相关的法律法规、统计标准、评估标准以及战略发展规划等文件,从不同角度出发提出了数字资源的统计管理要求,或明确统计对象与统计方法,或提出真实性、准确性、完整性和及时性的统计数据要求,或倡导建立统一标准规范体系[4-7]。以四年一次的全国县级以上公共图书馆评估定级为例,其针对数字资源的数十项评估指标,数据主要来源于图书馆各项业务统计[8]。
《规范》是图书馆的一项基础性业务标准,满足图书馆业务统计要求和评估数据要求是其基本功能之一。随着文化行业的发展,图书馆数字资源业务范围不断拓展,相关评估要求也逐步增加,需要对《规范》进行相应的完善性和适应性修订。
在应用实践中检验标准并对标准规范进行更新和修订,是标准化工作的一项普遍原则[9]。可用性是标准化工作的一般目的之一[10]。目前,在图书馆数字资源统计方面具有较大影响力的国内外标准规范多达十余项(见表1)。胡大琴、何青芳、慎金花等学者对相关标准规范的应用情况进行了调研和分析,结果显示,遵循《规范》提供数字资源统计数据的数字资源生产单位所占比例较低,《规范》的应用性不能完全满足当前图书馆数字资源统计工作的需要,亟待修订和改进[11-13]。
表1 图书馆数字资源统计相关标准规范
标准具有一定的有效期,国际标准化组织ISO所制定的标准一般每5年进行一次更新[14]。我国标准化法律规定了标准复审制度,即建立标准实施信息反馈和评估机制,依据标准反馈和评估情况开展复审,复审周期一般不超过5年;经评估和复审,对不适应经济社会发展需要和技术进步的标准应当及时修订或者废止[15]。
国际标准化组织(ISO)注重标准规范版本的修订,以增强其适用性和流通性[16]。以《规范》采用的两项规范性引用文件为例:ISO 2789第一版于1974年发布,先后于1991年、2003年、2006年和2013年发布了4个修订版本,我国国家标准GB/T 13191—2009《信息与文献图书馆统计》等采用了其2006年的第四版,即《规范》引用的版本;COUNTER于2002年发布第一版,2019年已经更新到第五版,而《规范》引用的是其2008年发布的第三版。从时间线来看,《规范》于2012年发布,其后ISO 2789、NISO Z39.7、ISO 11620、COUNTER进行了多次修订,《公共图书馆评估系列标准》(WH/T70.1~ 6—2015)、《信息与文献公共图书馆影响力评估的方法和流程》(WH/T 84—2019)正式发布。这些新订与修订的标准规范对数字资源类型与计量方法等进行了一定程度的调整,给《规范》带来了直接或间接影响。
《全国图书馆标准化工作“十三五”规划纲要》提出,我国将建立与图书馆事业发展同步的标准定期复审与更新修订制度,“数字化建设与服务”是“十三五”期间标准制修订的重点领域,这方面的工作进展为未来开展《规范》修订工作提供了良好的背景条件[17]。近年来,国内外图书馆统计相关标准规范的制修订速度明显加快,《规范》在内容上和方法上出现了一定程度的滞后性,修订工作势在必行。
《规范》统计指标体系较为完整,覆盖较为全面,但随着数字资源形态的创新发展,其指标内涵需要进行适当的深化和延展才能适应当前及未来一段时间的统计需要。
(1)数字馆藏统计指标细化
《规范》所统计的数字馆藏是指“图书馆本地拥有的和获得一定期限使用权的数据库和数字文献”,包括购买、许可授权、受缴、捐赠、交换、数字化、网络信息采集等方式获得使用权或保存权的数字资源。经图书馆编目、整合并纳入其数据库或数字文献中的免费网络资源单独统计,其他免费网络资源不计入数字馆藏,开放获取资源作为免费网络资源统计。该指标虽然涵盖全面,但是针对开放获取资源的统计不足,统计覆盖面和统计粒度均无法满足开放获取资源的发展形势。学术论著、科学数据和政府数据是目前开放获取资源的三个重要方面,随着开放获取运动的深入发展和《科学数据管理办法》《政务信息资源共享管理暂行办法》等政策法规的出台,各类型开放获取资源对图书馆数字馆藏的影响将越来越显著,具备分类统计意义。而《规范》“数字馆藏量”与“数字馆藏发布量”统计指标体系中,免费网络资源类数字文献并未设计二级指标,仅以“条”作为计量单位也与开放获取资源特性不符,需要及时进行调整修订。
(2)数字馆藏服务统计指标延展
《规范》对数字馆藏服务“当前用户”和“使用情况”进行统计,根据访问方式将用户细分为互联网用户、局域网用户、数字电视用户、移动通信用户、专用网络用户、光盘用户、其他用户。而近年来各类评估均要求进行用户群体的细分统计,例如:公共图书馆评估指标包含未成年人服务指标,以及包括老年人、残疾人、农民工在内的其他特殊群体服务指标,但《规范》指标体系却不能直接提供关于不同类型用户群体的统计数据,影响了《规范》的兼容性、适用性和落地实施,应考虑通过修订解决此类问题。
表2 《规范》数据库相关术语定义
《规范》将图书馆数字资源划分为“数据库”和“数字文献”两大类,又将数据库细分为全文数据库、文摘/索引数据库、数值/事实数据库、多媒体数据库、工具型数据库、复合型数据库,并给出了相应的术语定义(见表2)。《规范》各类型数据库的定义存在一定交叉,各类型数据库之间的区分不够明显,例如:数值/事实数据库与工具型数据库均指向带有数据集成与交互利用功能的数据库,多媒体数据库与复合型数据库均指向多种类型资源综合的数据库。在统计实践中,指标分类分歧可能导致数据重复、数据缺失等问题,影响数据准确性,不利于开展统计分析,建议在修订中通过精准化定义实现指标一致性。
统计工作与标准化工作在国民经济发展中具有重要作用,我国通过立法保障相关的工作制度。因此,《规范》制修订必须在法律框架下开展工作,按照《中华人民共和国统计法》《中华人民共和国统计法实施条例》规定的统计制度设计《规范》统计要求,按照《中华人民共和国标准化法》《中华人民共和国标准化法实施条例》规定的程序开展《规范》修订工作。
公共图书馆是图书馆行业标准最主要的适用对象,因此,《规范》指标体系应当充分满足文化行业统计的政策法规要求。例如:原文化部颁布的《文化统计管理办法》要求文化统计调查对象建立健全原始记录、统计台账和各项管理制度[18],但《规范》中没有体现相应的响应机制;由原文化部制定、国家统计局批准的《全国文化文物统计报表制度》要求统计公共图书馆网站数,即“有独立域名的web站点,其中包括CN和通用顶级域名(gTLD)下的web站点”,但《规范》并未统计这项指标[19]。这些问题应当在修订时考虑补充完善。
如表1所示,《规范》与多项国内外标准规范关系密切,只有从根本上理解和把握它们之间的共性与交叉问题,合理设计指标兼容与指标映射关系,才能真正实现标准的有效接轨。《规范》是对《信息与文献图书馆统计》(GB/T 13191—2009)数字资源相关统计指标和统计方法的细化,与图书馆统计的国际标准和国家标准衔接良好。相比之下,《规范》与其他标准规范指标体系的衔接则存在不同程度的问题,特别是针对COUNTER标准和公共图书馆评估系列标准(WH/T70.1~ 6—2015)。
COUNTER标准主要用于完成数字资源使用统计,在国内外商业数据库服务上得到了广泛应用,成为图书馆领域的一项事实标准,很多图书馆直接采用数据库服务商根据COUNTER标准提供的数据作为本馆服务统计数据。因此,建立与COUNTER标准之间的映射关系对确保《规范》的实用性具有重要意义。以COUNTER标准最新版本The COUNTER Code of Practice for Release 5(《COUNTER电子资源使用统计实施规范》,以下简称COUNTER R5)为例,其对资源类型、权限类型和统计维度的划分均与《规范》存在差异(见表3)。COUNTER R5将用户活动统计划分为“请求量(requests)”和“访问量(investigations)”两类,前者是指浏览或下载实际内容项,后者指所有类型用户活动,包含前者[20]。这两个概念与《规范》统计的访问量、下载量、检索量指标既有区别,又有联系[21]。公共图书馆评估系列标准(WH/T70.1~ 6—2015)要求新媒体服务评估指标包括微信公众平台与微博服务、移动图书馆、触摸媒体服务三项评估指标,基本分项包括微信公众平台与微博服务用户人数所占的比例,而《规范》统计移动通信网络的用户人次并未按照服务平台做细分统计。这些问题都需要在《规范》修订加以考虑。
解决标准规范之间的兼容和衔接问题,不能依靠完全一致的指标定义。《规范》修订时,可通过发布附录或操作指南的形式,说明与其他相关标准规范核心指标之间的映射办法,以增强《规范》数据的通用性,从而达到提高统计效能的目的。
表3 《规范》与COUNTER R5指标维度对照
确保数据质量是统计工作的基本要求,数据质量控制方法应当成为统计标准的一项必备内容。《规范》包含“数字资源统计管理”章节,简要提出了统计数据管理要求,包括建立制度、明确职责、规范流程等,但缺少提高数据质量的具体方法,修订时应考虑补充数据核验要求,强化管理措施。
图书馆数字资源形态丰富,数据格式多样,数字资源建设、存储和发布可能由不同业务部门分别承担,统计数据复杂且来源广泛,《规范》明确了每个指标的数据采集原则,并提出了去重统计要求,但仍然无法从操作上避免数出多门或一门多数的统计问题。在《规范》中确立标准化的数据核验方法有助于解决这个问题,包括同步提交完整的数据凭证和记录、增加人工审核环节、采用信息化手段检查数据平衡关系和逻辑关系等措施,从加强统计工作管理和完善统计方法两个方面确保统计数据的准确性、完整性和一致性。
修订标准的目的是促进标准持续发挥作用。修订首先是对当前版本标准的继承,保持较大程度的延续性和连续性,以维护标准文件共同使用和重复使用的功能特性。在保持《规范》稳定性的同时,修订人员应注意不能模糊修订工作目标,需要在扎实调研分析的基础上开展修订工作,切实拓展《规范》的覆盖范围,剔除其中不适应行业发展的规定,根据行业发展要求及时增补和更新统计指标及其计量方法,充分体现这项行业标准的发展性以及修订工作的必要性,切忌为了追求版本更新而进行无关痛痒的小修小补。
按照我国《标准化法》要求,制定标准应当达到“技术上先进、经济上合理”,这就要求制修订标准需要充分应用目标导向、系统分析和整体协调方法等标准化工作的方法论基础,遵循协同性工作原则[22-23]。从《规范》实施效果考虑,其修订工作需要开展三维协同:①技术协同。《规范》修订方向应基本符合数字资源生产与图书馆建设的主要趋势;②标准协同。《规范》修订过程应充分融合相关法律法规与标准规范的指标体系;③主体协同。《规范》修订成果应基本匹配图书馆行业数字资源生产、建设和服务单位的主要统计需求。
数字资源统计工作以及统计标准不可避免地与其他相关法律法规、标准规范以及业务惯例交叉运行,修订《规范》需要考虑与主要指标体系的兼容,但追求与相关指标体系的完全适配既不可能也没必要。任何标准都有其局限性,在修订过程中,应从标准规范的主要目的和应用范围出发,正确看待局限性,把握总体平衡的原则,处理好本标准与其他相关文件之间的关系[24]。数字资源统计工作涉及很多细节,但标准有抽象性和概况性的要求,对于不宜在标准中予以具体规定的实践细节,可以通过出台“操作指南”等类型文件进行细化规定,以增强标准的实用性。
数字图书馆领域急需通过制定标准来完善标准规范体系,对现有标准的修订和更新同样不容忽视。以科学分析和评估为基础,对适应性明显弱化的标准展开修订,有利于促进图书馆标准体系的成熟化发展[25]。数字资源统计是图书馆的基础性业务工作,直接影响数字图书馆资源建设、服务和管理的效率与效用,建议尽快修订《规范》,通过实践驱动落实标准化,充分发挥行业标准的规范功能和引领作用。