曾建勋
资源建设需要推进元数据战略
曾建勋
元数据是描述数据的数据,尽管元数据概念始于20世纪末,但概念所表达的内涵及所表现的作用却早已存在。从图书馆来看,传统目录、检索文摘,以及MARC数据都具备元数据特质,且对物理资源和数字资源的管理和利用发挥了举足轻重的作用。
随着数字资源的快速发展,图书馆占有的印本资源越来越少,远程访问的出版社数字资源、发现系统搜索资源,以及集成商的数据资源等越来越多;由于MARC基于印本资源进行描述,没有涵盖和整合数字资源,因此除MARC数据外,图书馆占有的元数据资源也越来越少。图书馆如何才能拥有数字资源的元数据,实现与图书馆原有以MARC为核心的馆藏元数据融合,形成统一的馆藏元数据体系,需要规划图书馆元数据战略。
依据管理对象和管理目标的不同,元数据有不同的类别和形态。既有业务元数据、技术元数据和管理元数据,又有描述元数据、语义元数据和用户元数据,还有版权元数据、保存元数据和使用元数据等;元数据的管理功能不仅在于识别、描述、定位物理资源,而且在于搜寻、评估和选择数字资源,更多地在于关联、计算和挖掘其中的知识资源。数字环境所带来的元数据种类、层级、来源、渠道、形态和格式不一,因而需要图书馆构建统一的元数据体系。
首先,需要将基于MARC的可交换机读目录及馆际间联合目录转换成XML的元数据格式,打破MARC格式的烦琐性和封闭性,增强关联性,以实现与数字出版、信息搜索等相融合的跨界互操作;其次,需要在维护实体资源的基础上,强化数字资源的描述元数据、版权元数据、保存元数据、使用元数据等采集和著录,按照统一标准格式和层次体系实现物理资源与数字资源的元数据统一管理,以推进资源一站式利用与服务;再次,需要构建统一的元数据集成整合系统,对不同渠道来源的元数据进行映射集成、整合规范,实现元数据从采集、识别、整理、组织,到规范、审计、评估、保存和服务的全生命周期管理,对书目元数据、文摘元数据、语义元数据、渠道来源及其权益元数据等进行分层次地整合处理,提升元数据的整体质量;最后,需要建立跨越图书馆,横联出版社、数据库商的元数据登记注册与对象资源提供获取的跨界联盟,革新联合编目方法,构建集多渠道资源提供途径的资源调度知识库,支持用户情景敏感的资源多途径获取。
构建图书馆新型元数据体系,需要转变资源建设理念,既重视对象资源的订购和管理,也重视元数据资源的采集和组织;既重视物理资源的编目揭示,也重视数字资源的元数据渠道管理;既重视资源本身权威性价值评估,也重视资源使用价值分析。需要改变资源建设流程,在元数据多渠道采集、整合、审计和服务利用过程中,增强物理资源和数字资源的订前需求评估和订后使用分析,优化资源订购和提供策略,提升资源投入效益。
程焕文先生提出数据库商凭什么如此狼?其根源之一在于图书馆没有构建自身的适应数字环境的元数据体系。2015年10月,大英图书馆发布2015—2018年馆藏元数据战略,我国图书馆界也需要融入大数据环境,大力提倡元数据先行战略,主张元数据权益,整合元数据资产,实现馆藏元数据资源与社会资源关联,吸纳社会元数据资源,推进馆藏元数据的开放服务,以全面释放图书馆馆藏资源价值。