党洪莉 谭海兵
[摘要]随着越来越多的图书馆参与研究数据管理,评估数据管理过程以保证其持续性与有效性是图书馆工作人员的重要议题。将数据管理能力成熟度模型(DIMM)思想引入图书馆领域,构建图书馆数据管理及服务能力成熟度模型,初步形成较完整的图书馆数据评价体系。在此基础上,结合湖南省高校數字图书馆建设情况,介绍了该能力成熟度模型在湖南省高校数字教学资源中心的应用,以期对该项目及其他图书馆的数据管理能力评价具有积极的意义。
[关键词]研究数据;数据管理;成熟度模型;服务评估
随着以数据密集型计算为特征的“科学第四范式”的发展,学术图书馆需要为越来越多的科研项目和科研人员提供研究数据管理服务(research data management,RDM)。高校等研究单位拥有大量的数据资产,这些数据资产以各种类型和格式广泛的存储于各种地方。图书馆作为开展数据管理服务的重要部门之一,其关键活动就是规范管理各种数据资产,支持研究数据生命周期的学科实践和规范。除了对数据进行有效管理外,高校图书馆还需借助标准化模型对数据资产管理能力进行有效评估,找出薄弱环节;针对薄弱环节进行路径优化,从而有效提高自身的数据管理水平。本文通过对企业数据管理能力成熟度模型(DMM)的介绍,在已有研究的基础上,提出我国高校图书馆数据管理成熟度模型,帮助高校图书馆认清制约图书馆数据管理能力发展的因素,以促进图书馆提升数据管理能力。
1数据管理能力成熟度模型DMM概述
数据管理能力成熟度模型(Data Management Maturity,DMM)源于系统工程和软件工程的集成成熟度集成模型(Capability Maturity Model Integration,CMMI),目的是通过提供结构化和标准的实践框架,以促进建立和完善自己的数据管理成熟度路线图,从而评估和提升数据管理水平。
DMM包括数据管理战略、数据治理、数据架构、数据应用、数据安全、数据质量管理、数据标准、数据生命周期8个部分,其具体描述和关键过程如表1。每个部分包含该过程的目的、目标,运行过程中需考虑的核心问题,并对能力实践进行相关描述。从而将数据管理与能力成熟度评估有机的融合在一起,达到管理水平的逐步提高和持续改进过程的目的。
DMM模型采用阶段表示法,按整个过程的能力成熟度分为初始级、受管理级、已定义级、量化管理级和优化级五个等级。每个等级的成熟度能力成为下一级的基础,形成一个逐步升级的梯台,而成熟度能力的不断升级也是过程能力的积累。初始级表示数据管理在被动、非正式的临时基础上执行;受管理级表示数据管理按照已定义和文档化的流程,在业务部门层面执行;如果数据管理与业务战略保持一致,得到标准化和一致性实施,则表示在已定义级执行;在量化管理级,项目衡量、评估数据管理过程的有效性,以确保维持标准;在优化级,项目在反馈的基础上得到创新和改进,实行可持续性管理。
2图书馆数据服务能力成熟度模型的构建
DMM模型是在CMMI的基础上进一步开发的,目前国外较成熟的以能力成熟度模型(Capability Maturity Model,CMM)为基础的数据管理能力成熟度模型有英国巴斯大学的社区成熟度模型、弗吉尼亚大学的DMBitals、澳大利亚的ANDS和雪城大学的SDM-CMM[3]。以上模型在欧美国家提出后,不断得到改进并逐步完善,也引起了国内不少学者的重视和推广。相比较起来,已有的模型评估方法比较适用于国外,而我国数据管理能力还处于起步阶段。本文在综合现有能力成熟度模型框架的基础上,结合我国图书馆数据管理能力,从图书馆基础能力、数据服务能力、数据安全能力、数据技术能力和数据环境能力五个方面来衡量图书馆数据管理能力,提出适用于我国图书馆领域的数据管理能力成熟度模型框架。
1)初始级。此阶段的图书馆数据管理能力处于发展的初始阶段。数据管理特点是:基础设施齐全,但设施运作稳定性不确定;现有的技术体系能满足用户一些简单需求;提供基本的数据存储和归档服务;在数据安全问题上,仅依据特定业务需求开展数据安全,没有形成明确的工作内容定义;此外图书馆内外部对数据管理都没有重视。初始级阶段的主要因素有环境的变化、基础设施规模大小。
2)受管理级。此阶段的图书馆数据管理能力处于发展的成长阶段。数据管理特点是:在大数据环境的影响下,图书馆针对数据及数据管理出台一些相关的法律和政策;服务种类也逐渐增多,在数据安全上也比初始级进一步提高,主要依赖人工执行相关工作。在受管理级阶段,数据环境的改善、服务类型多样化发展、数据安全能力提高是关键因素。
3)已定义级。此阶段的图书馆数据管理能力处于发展的定型阶段。此时数据管理的特点是:在达到成长级要求的基础上,数据管理的内外部环境趋于稳定;基础设施趋于稳定,监测和控制体系趋于成熟,数据安全能力正式、规范。内外部环境的稳定、数据服务的类型及不断完善的技术对此阶段起着决定性作用。
4)量化管理级。此阶段的图书馆数据管理能力处于发展的规范阶段。此时数据管理的特点是在上一级的基础上,监测和控制体系趋于成熟,能实时动态处理故障;数据服务水平能很好地满足用户需求。影响此阶段的关键因素是数据安全可控、技术体系稳定及有效应对数据环境的变化。
5)优化级。此阶段的图书馆数据管理能力处于发展的优化阶段。此时数据管理的特点是:数据管理在达到规范化后,数据服务不断自我改进和优化,数据管理系统集成化程度不断提高,技术上也得以不断创新,安全过程可调整。影响此阶段的关键因素是创新技术、提高服务质量和有效预测环境变化。
在对数据管理能力进行评估时,根据数据成熟度级别对图书馆基础能力、数据服务能力、数据安全能力、数据技术能力和数据环境能力打出分值,形成数据成熟度记分卡,从而发现数据管理中的缺陷和弊端,以此为依据改进数据管理能力。而五个级别在关系上是递进式的,相邻等级具有一定的连续性。在实际使用时可根据实际情况灵活处理,根据不同的评估目标调整步骤,根据评估内容的重要程度调整评估策略、评估时间等。endprint
3应用探析
湖南省高校数字教学资源中心(http://trc.hnadl.cn)是一个面向湖南省全省高校师生提供数字教学资源的资源中心数据库,依托湖南省高校数字图书馆建设,其前期的数据来源主要有精品课程、质量工程、课堂教学、实习基地、校企合作、特色专业等12类项目。以上述12类项目建设的数字教学资源为基础,组建以教学资源为核心的资源中心库,并在省内一些高校中形成一定数量的分中心或者是分站点。该项目自2012年开始建设,但是进展不快。本文以湖南省高校数字教学资源中心的数据管理服务实践为例,根据DMM模型评估表,对该资源中心的数据保存与数据服务进行成熟度能力评估,以期有效提升和改进此项目在后期建设中所面临和需要解决的问题。具体成熟度评估详情如表3所示。
从上述表中可以看到,湖南省高校数字教学资源中心,在基础能力和服务能力方面处于受管理级,主要因素是其依托湖南省高校数字图书馆已有前期信息化建设基础及完善的建设团队。湖南省高校数字图书馆建设已有十余年,从硬件设施到应用软件的引入,其每年都有适当的投入,且长期注重专业人员的引进,其基本服务能力已得到一定的规范,管理人员对基本业务也已相当熟悉,故基础能力和服务能力足已达到受管理级;在安全能力方面还停留在初始级,制定数据备份和监护政策,监测物理设备的运转情况。目前国内绝大部分图书馆在新技术的应用上严重滞后于计算机技术的应用和发展,因受行业内传统思维的影响,图书馆的管理人员对数据安全缺乏超前的意识,普遍认为图书馆的数据重要性低,直接影响在数据安全方面的研究和投入。近些年随着图书馆的业务范围越来越广,数据越发复杂多样,对于数据的安全应受到高度重视,对安全技术利用要加强实践。湖南省高校数字教学资源中心平台应该加强应用安全、资源的版权保护和资源的存储安全。在技术能力和环境能力方面,中心还处于初始级,其根本原因在于图书馆的管理人员对于教学资源的利用方面了解得不够深入,欠缺一定的一线教学经验。与此同时,对一些的大的数据平台,没有一定的技术能力进行研究和开发,与教学资源相关的行业标准没有形成,平台虽然已经提供了相关的访问、下载和使用等功能,但是需要进一步跟进和完善整个资源平台。此外,缺少跨行业研究的精神,缺少跨部门跨行业的合作经验,更缺少如何将数字资源更好地利用于教学和服务于教学的能力,业务能力的不足直接影响新技术的引进与利用。加强专业技术知识和业务知识的学习是重中之重,中心应该加强系统架构的稳定性和可扩展性,为后期的功能拓展做好基础工作。
4结束语
研究数据管理能力成熟度模型,是图书馆如何有效管理数字资源和如何有效评价数据管理过程中所存在的问题的关键。依托此模型的有效关联和比对,可以很清晰地判断应对此类数据管理的机构和团队所面临的实际情况和问题,从而有针对性地解决这些问题,更好地为用户服务。
通过对湖南省数字教学资源中心的數据管理成熟度分析与评估,认为有必要对数字资源平台数据库建设过程进行数据管理和成熟度进行测量和评估。从而有效改进相关平台建设过程中所面临的问题,有效促进此类平台的建设和利用。为后期图书馆平台建设和发展提供良好的参考依据,不断完善高校数字图书馆建设的有效评估途径。为数字图书馆的发展建设提供良好的实践参考。endprint