付 博
(国家开放大学,北京 100039)
高校图书馆服务于教学和科研,是典型的“信息中心”,数据是其核心资产。随着大数据和信息技术的不断发展,数据治理被引入图书馆界。数据治理是以全局统筹和权责分配为核心,通过对数据及其管理过程的指导监督与评估,做出科学决策,目的是数据价值的最大化。[1][2][3]当前,高校图书馆的系统与资源建设均已发展到一定阶段,数据也有相当规模的积累,这些数据能否得到有效治理,数据资产能否被盘活使用,关系着高校图书馆数据价值的发挥,影响着图书馆的服务与应用创新。
本文梳理了目前图书馆界对数据治理的相关研究,通过分析高校图书馆数据治理困难,提出高校图书馆数据治理的参考路径。
数字与信息时代,图书馆对各种形态数据的管理,已经超过了传统图书馆员的职责与能力范围,数据馆员应运而生。左志林、李瑞萍梳理了数据馆员的发展历程、组织管理机制和服务模式,为国内数据馆员的发展和管理机制研究作出参考。[4]任亚忠指出,目前高校数据馆员的缺失,已不能使图书馆适应在大数据环境下的发展,国外已有超半数的图书馆明确了数据馆员的职责,并以康奈尔大学数据馆员参与项目为例,强调数据馆员的嵌入式服务模式已推动图书馆的数据治理活动。[5]顾立平提到,数据馆员是为科研数据管理而服务,他是职业生涯的一个发展方向,而不是具体的某个岗位,他可以是数据支持人员、数据管理顾问、项目管理专员甚至是开发人员。[6]周婷、詹庆东强调数据馆员需要持之以恒地对各类数据进行监控,因此需提升其数据敏感力、发现数据发展规律和运用数据等能力。[7]
顾立平指出应建立数据治理生态体系,包括:数据获取、数据共享、数据重用与数据加值四个部分,指出图书馆可以通过知识服务、学术研究、开展培训、开展合作等方式来推进数据治理。[6]周婷、詹庆东将数据治理引入高校图书馆联盟,从环境与文化、技术与工具和流程与活动3个方面分析其可行性,并以福建省高校数字图书馆(FULink)为例,从组织、技术、系统3个方面提出了数据治理策略。[7]包冬梅、范颖捷等针对高校图书馆的行业特点,在国际权威机构建立的框架基础上提出了CaLib数据治理框架,包括实施评估、范围促成和因素3个子框架。[3]
在科研方面,孙仙阁、弓箭从开放科学角度分析了数据治理在科研过程中的3方面应用,即辅助科研人员制定数据管理计划、辅助馆员开展信息咨询和数据管理以及进行数据治理培训,并在形成数据治理共同体、强化数据质量评价、提升数据服务能力3个方面提出了建议。[8]王舒波从科研角度出发,分析了在开放科学背景下数据治理与高校图书馆之间的关系,提出了科研数据的治理路径,依次为顶层设计、权责落实和技术助力。[9]在知识管理中,刘洁璇分析了大数据、知识管理、数据治理之间的关系,指明了数据治理是图书馆知识管理的基础和强化,论述了图书馆在MARC标准著录与DC元数据标准控制、知识发现、知识可视化、知识安全控制中的实施。[10]
任亚忠指出数据馆员的培养和发展是未来图书馆数据治理的重点之一。[2]顾立平指出在数据治理培训、制定数据治理计划、建立数据治理生态、数据治理的法律及道德问题方面均大有可为。[3]刘洁璇分析了在未来数据治理的发展中,全球合作、政府主导、多学科试点将是几大发展方向。[8]
数据治理是一种从上至下的体系性建设,上至决策层,下至基层工作人员,都需要树立数据治理的观念,进行科学决策和高效管理,在战略上对数据治理提高重视,在组织机构中给与支持,在人才方面着重培养。目前,在高校图书馆界,大多数相关人员对数据治理的认识尚且不足,没有树立数据治理的意识,对于其战略规划及相应的组织架构、相关专业人才培养都准备不足。同时,大多数研究都还处在理论探索当中,缺乏相关实践,没有形成数据治理的环境和氛围。
大数据的快速发展,已使数据成为最有价值的资产。图书馆作为各种信息的汇集地,数据海量生成,高速流转,再加上伴随信息技术发展而涌现出的多种多样的载体、格式、类型,加剧了图书馆资源数据和业务数据的复杂性。而由数据复杂性引发的信息系统零散与标准不一致、数据统计与评估难度大、引入开放资源困难多、无法进行知识管理等,已经严重影响数据价值的挖掘,数据金矿有待开发。
目前,多数高校图书馆数据治理意识尚且不足,治理工作还属起步阶段,相关实践不多且不够深入,无法提供过多的可借鉴经验。因此,高校图书馆要尽快培养“数据敏感”状态,营造数据治理环境和氛围,在顶层设计中就深刻认识到数据治理的价值所在,从思想源头上重视数据治理,强化治理意识。
图书馆数据治理是个大工程,需要各个部门统筹协调,分工合作,自上而下来进行。从体制机制建设、权力责任分配到人才储备培养,都需要一系列的政策和规则,来确保数据治理的稳步推进。通过政策上的支持,协调跨部门合作,把数据治理放在图书馆工作的核心位置。
数据标准是各方就共用的业务术语进行定义,还包括这些术语的命名、描述、数据存储、数据交换以及信息共享规则等。[11]高校图书馆在进行数据治理时,可以先参考国家某些相关标准,来制定适合自身的、科学严谨的数据治理标准,按照标准进行数据管理和系统设计,增强数据的一致性和准确性。
高校图书馆数据规模庞大,类型复杂多样,需要把重心落在整合现有数据中。基于已制定的标准,引入新技术新工具,构建数据整合平台,消除无序无效数据,减少重复闲置数据,提升检索效率,提高共享水平,积极充分发挥图书馆技术优势,营造操作便捷、高效高质的用户使用环境。
高校图书馆在满足传统服务需求的同时,也要在数字时代为师生提供个性化服务,其背后需要强大的数据支撑。通过数据治理,学校能够优化数据质量,提升数据安全,更加快速准确进行数据分析,更加精准获取师生需求,进而有效提高教学服务水平,开展更多、更广泛的创新应用。
数据治理的最终目标是深入挖掘数据潜力,发挥其最大价值。因此需要设立评估指标,建立相应的评估模型,结合自身特点,多角度多方面进行数据治理结果的评估工作。借助相关工具和技术手段,结合事先制定的规范与数据标准,通过及时评估来促进数据质量提升,提高管控能力,降低治理风险。
长久以来,数据始终是高校图书馆的生命线,数字化信息化的发展,让图书馆拥有了更多数据,也使数据成为了无比重要的资产,将其价值最大化成为了首要目标。目前高校图书馆正处于从量变到质变的变革当中,应树立数据治理理念,结合具体需求,对数据资产进行有效的优化整合,在战略目标指引下,在政策保障、技术辅助与及时评估中,稳步推进数据治理工作,确保数据的高质量和可用性,提高数据创新利用水平,为师生提供更优质的服务体验。