国外数据治理模型比较*

2018-10-31 02:32
图书馆论坛 2018年11期
关键词:数据管理要素模型

1 数据治理模型概述

实现数据治理将提升数据管理绩效,确保数据质量,形成开放共享的新局面。数据治理是决策制定与操作实施有机组合的系统,并且治理主体应对这些数据资产承担责任[1]。构建一个数据治理模型,能为组织的数据治理工作提供直观清晰的操作指南与行动方针[2]。

通过对国内外文献及相关网站的广泛调研,本文发现国外数据治理始于2004年企业管理中的探讨[3];2005年后陆续有学者对其展开研究,讨论数据治理在企业、政府等领域的影响与作用[4-6]。国内数据治理的研究大多集中在计算机、行政学以及金融等领域。包冬梅等[7]在借鉴国外数据治理模型框架的基础上,首次提出我国高校图书馆数据治理框架CALib。此外,国内多位学者从内涵、要素、模型等角度展开述评,指出数据治理体系、模型等的设计是未来研究的重点方向,治理实践是其最终目的[8-9]。

通过在Web of Science数据库中检索“data governance”的相关论文,笔者发现国外研究集中在案例分析方面,着力于揭示行业或企业缺乏数据治理这一事实。例如,Thompson等[10]调查发现,西澳大利亚警察枪支管理系统和卫生信息系统存在很多数据问题,数据管理人员对本系统数据的准确性没有信心,无法落实数据责任;这两个案例都存在非常真实的数据管理问题,这些问题不是规则或技术造成的,而是缺乏完善的数据治理。在第五届欧洲信息管理与评估会议(European Conference on Information Management and Evaluation,ECIME)中,研究人员调查中小企业对数据治理的看法,以及数据治理模型是否适用于中小企业等问题。结果显示,尽管许多模型具有适应性和可扩展性,但缺乏可操作性,无法满足许多中小企业的要求。值得注意的是,大多数中小企业不承认数据的内在价值,没有将数据视为支持其业务流程而独立存在的系统[11]。显然,随着大数据浪潮的推进,数据治理却并未得到普及,组织中缺乏数据治理的现象依然大量存在,各级管理人员对数据治理的重视程度依然欠缺。学术界对数据治理研究的透彻与全面,并不代表组织机构愿意接受理论、使用模型。数据治理难以落实的原因可归纳为:(1)组织内部不同团体之间缺乏沟通与协调,导致数据信息滞留;(2)组织人员对数据资产无责任意识,无法确保数据质量,没有重视数据治理等。因此,构建数据治理模型是必要的。同时,模型的可操作性和实践意义也值得关注。

在国外已有数据治理模型中,提及较多的是数据治理协会(Data Governance Institute,DGI)数据治理框架(模型)[12],以及国际数据管理协会(Data Management Association, DAMA)数据治理框架(模型)[13]。DGI数据治理模型包括规则与协同工作规范、人员与组织架构、过程三大部分及十个子部分。该模型的特点是将治理流程融入模型之中,以流程箭头的形式标识治理顺序。此外,该模型条理清晰、重点突出,回归研究问题的本质,回答了5W问题(WHY、WHAT、WHO、WHEN、HOW)。DAMA数据治理模型由两个子模型构成:数据管理功能与环境要素。该模型的核心意义在于,解决数据管理功能与环境要素之间的匹配问题。上述两种模型因其全面性和逻辑清晰,被研究人员广泛借鉴和引用。但不容忽视的是,数据治理模型不能忽略行业的特征性,即组织唯一性。上文提及的CALib框架[7](模型),即基于这两种模型,以立方体的形式,多角度概述我国高校图书馆数据治理的立脚点以及评价机制。本文通过网络和文献调研,将国外较少提及但具有鲜明特征的数据治理模型进行对比研究。这四个模型分别具有全面性、简洁性、变化性与可重复性的特征,期望通过分析它们的治理特点及相关要素,为我国数据治理模型的构建提供参考。

2 国外数据治理模型调研

管控风险、降低成本、增加收益、实现价值,这是每个组织的目标和驱动因素,而数据治理的真谛也是如此。组织所有的努力最终都会落实到这些普遍价值的实现中。倘若参与者对目标、策略、过程等不清楚,则很难实现组织的最终价值。制定管理活动的规则体系,厘清复杂模糊的概念及其逻辑关系,可以确保人们的劳动得到应有的价值回报。

随着时间的推移,由于数据质量下降,数据系统支持业务运作、追求组织目标的能力随之降低,导致组织成本增加、收益减少。管理层试图在操作层面解决这些问题,添加更多数据或数据系统来修复,却只会使其更糟。因此,解决这类问题不是依靠引入更多的技术、系统或数据,而是要实现数据治理。数据治理不代表技术功能,而是由业务驱动,搭建管理人员和技术人员之间的桥梁。治理模型代表了这样一种状态,即解决当今信息资产治理问题所需的未来状态。

2.1 ISACA数据治理模型

国际信息系统审计与控制协会(Information Systems Auditand ControlAssociation,ISACA)是全球公认的信息科技管理、监控领导组织。ISACA从行政资助、文化、管理指标、培训与意识培养四个角度出发,构建了图1所示的数据治理模型(简称“ISACA模型”)[14]。由图1可知,ISACA数据治理在组织资助的前提下,根据组织的愿景和使命、组织利益以及具体目标,确定数据治理的策略或目标。经由此过程,数据治理模型的定位将会更精准,更扎根于组织本身的需求。由于治理是灵活的,可根据组织需求适当扩大或缩小治理范围,所以该模型不是“死板”的,在可控的范围内进行调整是其一大特点。该模型的另一特点是充分体现了人的能动性与主导作用,及其全程参与数据治理的过程。此外,该模型采用顶层设计、基层实施的方法,秉持简单实用的原则,只在需要的地方进行治理,不将额外的步骤纳入治理过程,确保模型的所有环节都为整个组织增值。

图1 ISACA数据治理模型

ISACA指出,倘若治理难度较高,管理层和实际操作人员都会选择绕道而行,这与治理的初衷背道而驰。如果将治理定制化,令治理模型充分体现人的主导作用,使治理各阶层的人感觉拥有所有权,将更有助于数据治理模型的执行。在数据治理合规性方面,该模型从政策、标准以及内部质量保证三方面着手。合规性设置遵循内外结合的原则,在响应各地区政府政策的前提下,紧跟行业标准,完善内部质量保证,从而提升整个模型的效能,达到数据治理的目的。

2.2 HESA数据治理模型

高等教育统计局(HigherEducation Statistics Agency,HESA)是英国收集、分析和传播高等教育定量信息的官方机构,提出如图2所示的数据治理模型(简称“HESA模型”)[15]。HESA强调数据治理模型与组织的设计和管理结构密切相关,同时指出每个组织应根据各自的侧重点,对通用模型进行适当修改,即实现“特色化”。因此在该模型中,HESA将数据治理团队与法律、安全、人力资源等团队置于并列位置,共同受数据治理委员会的指导。同时,HESA授权给数据管家、业务人员和数据用户等。HESA指出,治理模型在一定程度上体现了“为所有人公平获取数据”的概念,数据应被视为组织资产,而不是一个孤岛。因此,该模型数据治理的范围包括:(1)确保数据安全,确保组织面临的风险可控;(2)防止和纠正数据错误,从而不断完善数据治理计划;(3)衡量数据质量并提供检测和评估数据质量的改进框架;(4)制定标准记录数据及其在组织内的使用情况;(5)作为数据相关问题和具体决策的参考。由图2的主体部分可知,数据治理呈现一种层层递进的态势。在数据治理模型中,需要定义和分配一些关键角色。HESA首次提出大学数据受托人(University Data Trustee)的概念,指出大学数据受托人对数据管理的战略协调负责。实质上,大学数据受托人是一名高层数据管理人员,如学校规划处处长等。这与利益相关者理论下美国伊利诺伊大学数据银行[16]的角色分配有异曲同工之处。大学数据受托人担任治理职务,确保数据管理活动得到优化,从而配合和支持组织战略目标的达成。除此之外,从模型的整体结构可知,组织的数据治理既离不开操作层面的管理,也离不开政策层面的指导。因此,政策指引是数据治理模型中必不可少的一部分。笔者认为,政策指引包括两部分:一是基于数据生命周期的数据管理政策,该政策应嵌入治理过程中;二是贯穿治理全过程的宏观层面政策。HESA模型中的“指导”与“授权”步骤正是这种政策的具体表现。HESA指出,构建模型的同时会定义和分配一些关键角色。重要的是,分配的是角色,而不是工作,数据治理过程应是一个整体,模型将这个过程清晰化、具体化。

图2 HESA数据治理模型

2.3 Mustimuhw Information Solutions数据治理螺旋模型

Mustimuhw Information Solutions是加拿大一家计算机软件公司。该公司研究发现,随着时间的推移,人们的需求和能力不断变化和发展,治理模型也将随之而扩张和改进,不断迭代循环、发展壮大。因此,该公司认为数据治理应以螺旋模型呈现[17],以反映模型的动态和不断演变的性质(见图3)。由图3可知,Mustimuhw Information Solutions数据治理螺旋模型(简称“Mustimuhw Information Solutions螺旋模型”)始于数据治理的愿景和原则。数据治理模型根植于人们对数据治理愿景,秉承核心指导原则,这些核心指导原则为组织的数据治理提供了全面的方法论和维护方案。随着模型的螺旋形发展,该模型的第二个核心要素是数据治理结构,即治理的概念、组织结构、相关角色与责任。在这部分中,模型将数据从两个维度进行划分,首先分为国内和国外数据;然后再将数据分为四部分:企业、文化、人力、地产与资源。在组织结构中,该模型与上文提及的HESA数据治理模型有类似之处,即在数据治理委员会中,要有一名高层数据管理人员,还要有具体领域的数据管理人员;除此之外,对于不同类型的数据而言,需分不同部门进行数据治理,这也是该模型的一大特点。该模型的第三个核心要素是责任机制,强调要明确责任重点、相关要求及相关机制。并且,在责任机制中,提出决策矩阵的概念,从而与相关政策保持一致性和连贯性,如螺旋模型后端的数据治理政策和安全隐私政策等,明确界定决策当局的任务和责任。笔者认为,从此处可以看出,该公司在开发此螺旋模型时,充分考虑了数据治理模型的连贯性,使整个组织可共同参与,而不是前后断层,要素分离。

图3 Mustimuhw Information Solutions数据治理螺旋模型

基于螺旋形的结构特点,每个政策都应将数据治理模型的第一步——愿景和原则纳入考量。有别于其他模型的是,该模型认为数据治理政策的目标是通过对数据治理应用的共同理解,来预防发展中可能遇到的问题。隐私与安全政策描述了如何保护数据,并制定维护隐私和安全的措施与流程,从而防止隐私侵权和治理过程中的不当访问,该要素为数据治理成果及数据保护提供了更多的保障。该模型的最后一个核心要素是法律,例如数据管理法、数据治理协议、数据共享协议等。通过上述基于要素的模型分析,笔者认为该模型虽从直观上看是螺旋形,实则是具有纵向深度的柱体,包含着全面的数据治理及其相关延伸。

2.4 Information Builders数据治理简易模型

Information Builders是美国一家软件与咨询公司,致力于帮助组织构建信息系统,以建立巨大的竞争优势[18]。该公司强调,创建一个模型以确保数据的保密性、质量和完整性,是数据治理的核心价值,这对于满足内外部数据要求(如财务报告、合规性和隐私权等)至关重要。数据治理通过加强监督、根除风险,可有效地将政策与业务战略相结合。可重复的渐进式方法适用于任何规模的组织,满足短期或长期需求。Information Builders数据治理简易模型(简称“Information Builders简易模型”)是一个结构简单且可重复的过程[19],如图4所示。由该模型可知,对于大多数组织而言,采取渐进式方法可实现业务价值并建立数据治理可持续发展计划,从而避免过犹不及。与其他模型不同的是,Information Builders在构建模型的同时,配以七个步骤辅助实施,确保数据有效治理。(1)优先考虑业务改善领域;(2)最大化信息资产的可用性;(3)创建并分配角色、职责;(4)完善和确保信息资产的完整性;(5)建立问责制;(6)以主数据文化为基础;(7)制定流程改进反馈机制。当地一家医院基于这个模型和七个步骤,快速、经济、有效地解决了医患系统中数据的有关问题。该医院一年内收治了近6万名住院病人和约53万名门诊病人。然而,经过一系列的系统创建、更新和交换,导致约20%患者的数据不正确,数据质量问题堪忧,影响到医院的正常运营。因此,医院进行了数据治理,以确保医疗决策能得到恰当有效的信息。医院利用该数据治理模型,提高医疗质量、减少医疗错误,同时减少因低效、不完整信息造成的医疗成本。面对庞杂的患者数据,对其进行标准化和清洗是必要的。随着患者记录的匹配和合并,一部分数据被推送至图4所示的数据治理模型中,另一部分数据则先被推送至不同的患者管理系统进行转换,再被推送至Information Builders数据治理简易模型中。数据治理的应用,改善了医院日常工作的协调性,保证了患者信息的安全和准确。结合此案例分析,笔者认为Information Builders数据治理简易模型更应称为数据治理流程,而其提出的七个步骤,使其兼具全面性与实效性,是一个更为具体和全面的数据治理模型。

图4 Information Builders数据治理简易模型

3 国外数据治理模型对比分析

上述四个国外数据治理模型存在差异,其特点、优势与不足详见表1。在对比中,笔者发现数据治理模型构建需要规避之处,以期为我国数据治理模型的构建提供参考。

治理目标与原则明确是四个数据治理模型的共同点及出发点。目标与原则对数据治理既起到指导作用,也能让治理主体以及治理相关者厘清治理思路,而治理原则更是整个治理模型的行动纲领。ISACA模型和Mustimuhw Information Solutions螺旋模型均指出在构建模型之前,首先应有一套明确的界定标准,弄清数据治理对于组织的意义所在。数据治理整体的愿景和目标需清晰、准确。此外,数据治理政策是构建要素中十分重要的部分,它描述了治理数据的具体要求,用于指导数据治理模型的实施和相关角色及责任的履行,并向其他利益相关者提供治理主体对治理需求的解读。

对于治理相关者而言,模型的重要性在于能够清晰地使其掌握治理的流程与重点。因此,在上述四个模型中,ISACA模型与HESA模型具体详细地列出治理步骤或角色等,突出治理的重点。而Mustimuhw Information Solutions螺旋模型与Information Builders简易模型虽未详细列出重点,但在模型的辅助说明中都指出了各要素或治理阶段所涵盖的内容与注意事项。需要注意的是,在分析Mustimuhw InformationSolutions螺旋模型时,笔者认为治理核心要素的界定需更加清晰与明确(如第四和第五要素),数据治理政策本应包含安全与隐私政策,但实际上,安全与隐私政策却不完全包含于治理政策中。实践中,治理政策针对的是数据治理过程,而安全与隐私政策既涉及治理过程,也涉及数据治理之外的组织管理活动。

表1 国外数据治理模型对比分析

在数据治理模型构建中,应注意到“one does not fit all”,即模型不是“一成不变”的,不是一次一劳永逸的操作。因为每个行业甚至每个组织的治理模型都具有独特性与应变性,而且治理是一个动态过程,模型过于详尽,不仅不会给治理工作带来便捷,还会增加其应用的复杂程度,适得其反。恰当而灵活的模型赋予组织正确的数据治理指导方针,可配以适当的评估机制。不同利益相关者可从数据治理模型中获取决策信息,从而提高决策水平。而不恰当的治理模型既会让数据管理人员绕“道”而行,放弃治理,也会让组织的数据问题演变成组织架构问题,从而得不到根本的解决。

前述4个模型的共同之处还在于,明确指出数据治理不是游离于组织而单独存在的,数据治理模型的建立应与组织的管理指标、文化背景相融合。此外,数据治理模型特色化是不争的事实,但无论如何修改,数据治理都必须为整个组织的数据共享而服务。数据治理模型与组织的其他功能应是相互协调、共同运作的,避免单独运作。数据治理模型的最终目的是为组织的数据治理实践提供指导,同时培养各阶段数据管理人员的治理意识与治理能力。

4 启示

数据治理对组织的重要性不言而喻,构建数据治理模型也是每个组织的当务之急。我国于2015年发布《数据治理白皮书》[20],从国家层面强调了数据治理是必然趋势。对于组织而言,数据治理是一项复杂却又意义重大的工作,而数据治理模型又是治理行动的先行条件与基础。根据上述模型的对比分析,可从治理意义、职责、未来发展等角度,得出如下启示。

4.1 明确数据治理原则与目的,清晰治理意义

数据治理原则是数据治理活动所应遵循的标准或法则。在数据治理模型中列出具体的原则与目的,可使整个模型运转的边界线更加明晰,扎根于各组织的实际情况。需要说明的是,Information Builders简易模型虽未明确列出其原则与目的,但在其辅助步骤中指出,应优先考虑业务改善领域,即实现治理目标精准化,着重治理有助于业务改善的领域。不同国家或行业有关数据治理的规章法则等各有不同,因此,数据治理原则应根据各国及各行业的法律法规进行细化。毫无根据的原则,既无法满足合规性的要求,也不能从本质上满足数据治理的期望。此外,模型应体现数据治理的目的,目的是治理活动的展望,与原则缺一不可。DGI指出,数据治理模型的目的可能会带来一些“柔性”结果[21],即在治理过程中会伴随产生一些附带效应,并非为最终期望成果。笔者认为,这些“柔性”结果包括组织中人的改变,如各岗位人员的意识观念的转变、管理能力的提升以及组织向心力的凝聚。DGI认为这些结果是难以衡量的,但却是不可或缺的。至此,数据治理的意义虽未在模型中明确指出,但已渗透在原则与目的之中。模型的意义即在于帮助组织明晰数据治理流程;明确数据治理的任务,确保数据治理的价值。数据治理的意义则更偏重于数据与组织的协同发展。

4.2 建立数据治理利益相关者链条,明晰治理主体的角色与职责分配

20世纪60年代,斯坦福大学最早提出了利益相关者理论。研究人员将该理论定义为:“失去支持则无法独立生存的组织或团体”,并提出利益相关者“不仅能够借助组织实现自身的目标,而且还能对组织整体目标的实现发挥重要作用。”[22]人是数据治理的关键与主体,也是治理模型中的核心要素。数据治理活动的整个过程会有不同的主体参与进来,由于各方利益不同,不同的主体扮演着不同的角色。比如,在高校的数据治理模型中,学校高层数据管理人员、图书馆及相应的数据服务部门、各学院研究中心、教师与学生等,共同构成利益相关者链条。HESA模型中,大学数据受托人也是治理的主体之一。此时数据治理模型的作用在于分配链条中各主体的角色与职责,为各方的数据治理活动指明方向。由于治理活动是一个动态的过程,因此模型也应具有多元化与灵活性。在分配角色与职责时,由于治理活动各阶段的侧重点不同,主体的角色和职能也应随之变化。Mustimuhw Information Solutions螺旋模型指出,不同类型的数据应由不同部门来治理,即每一主体的治理侧重点都应随着数据特征的变化而变化。此外,笔者认为治理模型中的治理主体角色,是模型全面性的体现。组织所构建的模型,是面向全体人员的;各方主体职责的落实,说明模型具有较强的实践性。

4.3 发展数据治理技术与系统,理论构建回归实践

数据治理技术本质上是信息技术,在数据时代中扮演着辅助者的角色,起到推波助澜的作用。数据治理有丰富的基础理论,郑建明等[23]在谈及数字图书馆治理理论时指出,自组织理论、人本理论等对其理论建构具有指导作用。借助协同理论的思想,将组织的数据治理看作一个系统,系统内部存在若干属性不同的数据治理个体,不同数据治理个体间存在着相互影响、相互合作的关系。数据治理个体概念的提出,并非强调数据治理内部是分离的,相反,数据治理既不能脱离组织而单独存在,也不能由单独的治理单位独力完成。笔者认为,运用协同理论,可以找出影响数据治理成果的控制因素,进而发挥数据治理个体间的协同作用。理论是超前的,先于实践,可其实质就是为实践探路。现阶段的数据治理,亟需技术或软件的辅助。治理技术的创新研究,有助于数据治理实践的顺利进行。

4.4 厘清数据治理要素关系,奠定模型构建基石

将模型看作一张网,治理要素就是网中的结点。模型中各要素并非是相互独立的,而是共同存在于治理体系中。倘若治理要素尚未厘清,即盲目进行治理,治理模型就会有失偏颇,不能将治理面对的所有问题纳入其中。以上述4种模型为例,从本质上分析,笔者认为数据治理要素大致可分为人、操作、环境三方面。(1)根据上文提及的利益相关者理论,模型构建要素——人,可分为数据管理员、数据用户以及数据治理委员会等。人既是数据治理的主体,也是模型必不可少的要素。模型的构建应体现治理的主客体。(2)操作要素包括技术、管理以及政策法律等。目前国外一些机构依托计算机软件进行局部的数据治理工作,如数据清洗等,但全面的数据治理技术仍然是一个亟需探索的领域。笔者将政策法律归入操作要素的原因是,政策法律是治理的保障,虽不涉及具体的操作步骤,但却是治理活动的外部推动因素。相应地,内部推动因素是组织数据治理的原则和目的,是治理操作的内在依据。治理活动秉承治理原则,与治理目的遥相呼应。(3)环境要素是指组织数据治理活动的环境特征,如资金的资助、文化的冲击以及人的观念意识等。诚然,各模型对要素的表达不尽相同,各组织可根据实际情况,在构建模型时确定具体的治理要素。

5 结语

数据治理模型的建立是建构数据治理的重中之重和当务之急。本文通过剖析国外数据治理的四个模型,发现数据治理没有一成不变的模型。每个模型都有其适用范围、优点与缺点。但是,模型并非为终点与目的,治理也只是一种手段,是提升机构竞争力与核心价值的辅助。在大数据新形势下,许多决策是由数据支持的,政府、企业、高校等的转型与发展迫切需要数据治理的理论指引与实践探索,构建简明全面的数据治理模型,对解决现实问题具有重要意义。

猜你喜欢
数据管理要素模型
适用于BDS-3 PPP的随机模型
企业级BOM数据管理概要
定制化汽车制造的数据管理分析
海洋环境数据管理优化与实践
重要模型『一线三等角』
CTCS-2级报文数据管理需求分析和实现
掌握这6点要素,让肥水更高效
模型小览(二)
离散型随机变量分布列的两法则和三模型
也谈做人的要素