企业信息化建设之数据治理

2024-07-29 00:00:00问梁军
中国信息化 2024年6期

一、前言

2020年3月30日,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》公布,明确提出“加快培育数据要素市场,推进政府数据开放共享、提升社会数据资源价值、加强数据资源整合和安全保护”。数据作为一种新型生产要素写入文件,与传统的土地、劳动力、资本、技术等要素并列。

作为社会经营活动的基本资源,生产要素是要产生社会价值的,以及围绕着自身价值形成价值体系。而数据作为生产要素的价值体现在两个方面:一是随着数字技术的快速发展,以数字经济为基础衍生的新产业或者新业态,带来的新的发展模式普遍存在于国民经济的各个行业,对这些行业产生的数据资源进行场景化开发和利用;二是在大数据时代,对各类无序的数据进行标准化、规范化,提升数据质量,丰富数据内容,促进数据有序共享,挖掘数据价值。

2022年12月2日,《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》印发,强调要完善治理体系,加强数据分类分级管理;完善企业数据全流程合规和监管规则体系,做大做强数据要素型企业。

与传统生产要素不同,数据要素是可以无限复制和重复利用的,在价值创造上也与其他生产要素不同,具有规模效应和质量依赖,需要通过高质量供给和市场化流通发挥其价值。对企业而言,获取数据要素的价值显得更为重要,尤其是企业在完成信息化建设,步入数字化转型时期;而数据要素价值获得的前提则是企业数据治理。

二、数据治理的概念

在企业信息化建设进程中,高质量的数据对企业就是战略性资产,但是海量数据的爆发式增长对数据的管理和开发水平提出了更高的要求,如第1节所述,要充分发挥数据的价值,数据治理显得尤为重要。数据治理不同于传统的数据管理,数据管理关注数据的正确使用,而数据治理是对企业内部数据持续性、系统性地开展优化和治理。

数据治理是将数据视为企业资产的学科,数据治理是针对数据管理的质量控制规范,它将严密性和纪律性植入企业的数据管理、利用、优化和保护过程中。涉及到以企业资产的形式对数据进行优化、保护和利用的决策权利;以及到对组织内的人员、流程、技术和策略的编排,以从企业数据获取最优的价值。

百度词条解释,数据治理是指从使用零散数据变为使用统一主数据、从具有很少或没有组织和流程治理到企业范围内的数据治理、从尝试处理主数据混乱状况到主数据井井有条的一个过程,并最终使企业能将数据作为企业的核心资产来管理。

而有些学术文献的定义则是:数据治理是指在企业中进行的数据管理的决策权和相关职责的分配。

从以上定义可以看出,数据首先一定是企业资产,这与生产要素的说法是一致的,企业资产是要实现增值的,增值的过程就是治理的过程,涉及组织和流程的变更,管理的优化和持续改进,即职责的重新分配;另外,治理的概念不是暂时的,而是长期的、持久性的系统工程,需要企业持之以恒的坚持,是方法论和企业实践的结合、提升。

三、数据治理的理解

数据犹如流水一般,不是静止的存在,是在动态流转,而且在流转过程中产生价值,就是数据增值的过程。数据在平静的时候是一道风景,在惊涛骇浪时,又是一场灾难;换句话说,当企业数据量不大时,尤其是以结构化数据为主,能够快速提升效率,数据管理者也能轻松驾驭数据,当企业进入大数据时期,海量的异构数据产生,数据产生的麻烦随之而来,企业必须正面数据的治理,否则,源源不断产生的数据在存储、利用、安全方面都会遇到问题,当资产不能产生价值时,对企业的发展是没有意义,甚至要花费大量的财力和精力去“消化”,犹如现时的处置低效无效资产一般。

然而,在企业数据治理方面普遍存在若干认识的误区,可以说数据治理一项“脏活累活”,所以,有人认为数据治理是服务厂商的事,有人认为是技术部门的事,还有人认为完全是工具能够解决的问题,不需要花费人力去解决。

企业信息化建设初期,业务系统数量较少,数据量不算大,数据结构也比较单一,数据管理工作相对容易;随着信息化逐步发展,各类业务系统数量增加,数据的种类和存储量也在急剧增长,海量数据给企业信息化提出挑战,尤其是对业务数据的管理,垃圾数据、数据孤岛、数据不完整等问题凸显,数据治理的需求产生了,企业也随之成立专门的信息部门,有的甚至组建大数据公司,因为大多数企业领导层或者业务部门认为数据治理是信息化部门的事,理想地认为从技术维度单方面就能解决数据治理问题,根本没有考虑通过多方参与的组织架构变更和制度流程约束,数据治理工作才能真正落到实处。

认识到数据治理的重要性固然难能可贵,但是企业往往从成本的角度考虑,认为“项目式”的做法就能完成数据治理的任务,想在一个项目里做完。然而,数据治理工作囊括数据的整个生命周期,从数据采集、数据存储、数据加工、数据使用到数据安全,每个过程都有治理的内容,数据治理需要长期规划、分批分期实施,而且是从最核心的信息系统开始,一般来说,核心系统往往支撑企业大量的数据业务,也是最容易出现数据质量问题的系统,这也是从核心开始治理的原因。

数据治理本身是一项系统工程,包含组织架构变革、规范制度流程、应用专项工具、实施运维实践、数据安全建设等,而工具仅仅是其中的一部分,所以单纯地认为数据治理是靠软件工具完成是片面的。数据治理的核心其实还是“人治”,简单说,就是对人的行为的治理,企业的个体就是人,人的行为没有约束、没有规矩,对人没有深入的治理教育,治理工作是无法推广落地的,究其本质,数据治理是覆盖企业全员,涉及组织架构和管理流程变革的系统性工作,是融合多种要素的综合性工作,不是单靠工具能够完成的,工具仅是一种手段而已。

四、数据治理之元数据

元数据(Metadata)是描述数据的数据,核心目的就是降低用户与数据之间的沟通成本。例如我们要描述某个人的信息,需要从姓名、年龄、性别、身份证号码、地址、籍贯、血缘关系、教育履历等方面进行全面描述,所有这些信息就可以称为这个人的元数据。

元数据按照不同用途分为技术元数据、业务元数据、操作元数据、管理元数据等。与业务规则、流程相关的描述性数据称为业务元数据,包括业务主题的描述,业务数据查询、报表以及业务指标等;与存储、访问等底层技术相关的描述性数据称为技术元数据,包括数据映射、转换描述、数据清洗规则等;与数据操作相关的描述性数据称为操作元数据,包括数据抽取的警告、数据读写以及作业信息等;与数据管理、权属关系有关的描述性数据称为管理元数据,包括数据所有者、安全等级等。

当然,元数据的范围也是与管理需求有关的,一般会选择业务数据作为管理对象。元数据的输入不是通过手动录入的,在信息化时代,从原业务系统接入元数据,再进行整合。如果出现定义不规范、元数据不一致或者不完整的情况,则要尽快建立元数据管理规范,根据管理需求梳理管控流程。最后就是定义一些列的元数据维护规范,元数据使用标准等。

元数据是数据治理的核心和基础。在数据生产、数据接入、数据加工、数据服务、数据应用的各个环节,都可以产生元数据,元数据经过采集存储后,可以进行一系列分析,包括血缘关系分析、影响分析、数据资产地图等。血缘分析指的是获取数据的血缘关系,记录数据的来源和处理过程,通过血缘分析,可以追根溯源,缩短数据分析的响应时间,血缘关系多用于数据质量问题分析。影响分析是分析数据的流转方向,分析元数据的修改会影响哪些下游业务系统,减少系统升级改造带来的风险。数据资产地图一般用于宏观层面组织信息,以全局视角对信息进行归集、整理,展现数据存储情况和变化情况,为管理决策者提供参考。

五、数据治理之主数据

主数据管理是数据治理的另一个重要内容。主数据是指企业内部跨部门、跨业务、跨系统,能够被重复利用和充分共享,具有高价值且相对稳定的基础数据。中国信通院关于主数据的定义:“指满足跨部门业务协同需要的、反映核心业务实体状态属性的组织机构的基础信息。主数据相对于交易数据而言,属性更加稳定,准确度要求更高,唯一识别。”

主数据具有三个显著特征,一是唯一性,在企业内部各个应用系统和业务部门,都是可以被唯一识别的,且具有高度的一致性;二是有效性,主数据作为企业重要的数据资产,贯穿于业务对象的全生命周期,具有长期有效性;三是稳定性,主数据的状态一般是相对稳定的,不同于其他业务数据的灵活性,主数据确定后很少进行改动。

主数据作为企业的“黄金数据”,是企业最核心的数据资产,也是企业信息化、数字化的基础,主数据体系建设是提升企业业务管理水平的必经之路。主数据管理体系是一系列用于生成和维护企业主数据的规范、标准、组织、技术、实施方案和软件系统,主要是用来为企业提供准确、及时、完整、科学的主数据来源,支撑各业务系统和管理流程的正常、稳定运转。主数据管理体系的建设不仅仅是一个技术问题,更多的是企业管理行为的变革。主数据不是一次建成,然后一劳永逸的,体系建成后的运营和维护,需要系列制度和规范进行约束,还需要专门的信息系统进行支撑,随着时间推移以及业务发展,要时时保证主数据的整洁性和一致性。

主数据管理体系的建设不是某个部门能够独立完成的,从人资、财务的基础科目统一,到供应链、生产制造涉及的物料体系、供应商管理等,需要各类企业和业务部门广泛参与,建立至少由高层分管领导牵头、业务部门负责人共同组建的管理委员会是十分必要的。这个组织不是实体机构,是跨部门、跨企业、跨业务的虚拟组织,但是由企业赋予一定的权限,至少是针对主数据管理相关的权限。

主数据管理系统是企业各项主数据统一管理的工具,其核心价值是数据的集成、质量、治理、共享,且系统需要具备主数据定义、规则设置、申请、接收、分发、排重等功能。此外,在主数据系统建设过程中,还需要规划系统运行维护策略,确保在主数据系统建设完成后,保障系统可以顺利运行。

主数据存在的一个显著价值就是跨业务共享、重复使用,通过明确的数据标准、接口集成标准完成主数据共享机制的建设,实现主数据在业务系统之间高效协同,发挥数据资产作用。

主数据作为任何企业的基础数据,如地基之于高楼、血液之于身体。主数据管理体系建立了企业统一的基础数据标准体系,促进各业务领域数据资源的统一协调,实现资源共享,企业信息化建设提供坚实的基础。

六、数据治理之数据安全

安全管理是数据治理的必要因素,科学的安全管理体系建设能够推动数据治理体系持续改进。在企业已经建立了传统的网络安全体系的基础上,再提数据安全,两者之间既有联系又有区别。首先,数据安全是在网络安全提供的有效边界防御基础上保障数据安全,也即网络安全是基础,网络安全是以网络免受攻击为目的,数据安全是以安全使用数据为目的。网络安全以区域隔离、安全域划分为目标,而数据安全是以分级分类为基础,以信息合理、安全流动为目标。

数据安全管理应围绕数据的全生命周期进行安全规划,从数据采集、数据传输、数据存储、数据处理、数据交换和数据销毁,每个阶段都要明确监管要求和管理规则,通过制度、流程和技术工具进行约束,确保数据价值最大化。安全管理是一个动态过程,通过持续的行为管理、内部设计和闭环整改,推进数据安全管理体系不断优化和持续改善。

数据安全是企业稳定经营的重要因素,数据安全是“大安全”框架下的重要环节,企业在数字化转型过程中,要不断识别和整改数据安全风险,逐步完善数据权限管理和安全评估等流程,严格执行数据日志审计和安全备份等制度,建立数据管理应急机制,辅助使用一些安全技术工具,逐步构建符合企业自身的数据安全文化,不断提升企业数据生产要素的价值。

七、数据治理的意义

数据治理是管理企业数据资产的有效举措,是企业数字化转型过程的必然,对提升企业运营效率和创新企业商业模式有着重要意义。

数据治理是企业数据资产保值增值的必经之路,通过数据治理实现数据资产科学管理,驱动运营效率提升,降低运营成本,促进管理过程规范化,进而能够提升企业的资产价值。

对数据的有效治理,引领企业规范化发展和价值创新,能够促进产业转型升级;另外,数据治理也是管理变革的有效手段,通过数据的有效管控对业务进行规划和创新,在提升治理水平的同时,能够培养一批精通业务和数据的复合型人才,为企业发展提供动能。

科学的数据管理手段可以赋能治理体系和治理能力现代化,用数据说话、用数据管理、用数据决策,快速改善企业的治理水平。以数据治理驱动管理效率提升,打造真实的基于数字底座的科技型企业。