摘要 数据资产管理是推动数字化转型的关键性实践,能够高效赋能数字交通建设。高速公路全生命周期一体化管理业务数据是数字交通建设中的重要数据资产,而数据标准作为数据资产管理之基,是实现不同业务环节的数据融合分析以及跨业务领域一体化数据应用的关键性工作,开展其建设至关重要。基于此,该文旨在通过研究国内外数据标准建设方法论和实践经验,并结合高速公路投资、建设、运营全生命周期一体化管理的业务特点,探索出一套相应的数据标准建设与实践方法。
关键词 数据标准建设;高速公路全生命周期一体化管理;数据资产管理;数字化转型
中图分类号 F542 文献标识码 A 文章编号 2096-8949(2024)23-0167-04
0 引言
当前,数字中国建设如火如荼,中国能建集团积极响应数字中国建设相关部署,制定了数字化转型框架及提出了“五统”指导意见。交投公司为贯彻落实集团数字化转型相关指示,由科信事业部负责开展了一系列具体工作。但在交投公司高速公路投资-建设-运营全生命周期一体化管理的业务趋势下,相关工作面临着数据共享难以实现、数据统计口径不一、数据源头不一、沟通成本过高等问题,阻碍了数字化转型的推进;统一的数据标准作为解决以上问题,实现不同业务环节的数据融合分析以及跨业务领域一体化数据应用的关键性工作,有必要对其系统性地开展相关研究及建设实践。
1 数据标准概述
1.1 数据标准内涵
数据标准(Data Standards)是指保障数据的内外部使用和交换的一致性和准确性的规范性约束[1]。在数字化过程中,数据是业务活动在信息系统中的真实反映。由于业务对象在信息系统中以数据的形式存在,数据标准相关管理活动均需以业务为基础,并以标准的形式规范业务对象在各信息系统中的统一定义和应用,以提升企业在业务协同、监管合规、数据共享开放、数据分析应用等各方面的能力[1]。
1.2 数据标准的类型
数据可以分为基础类数据、指标类数据以及数据代码。基础类数据指业务流程中直接产生的,未经过加工和处理的基础业务信息;指标类数据是指具备统计意义的基础类数据,通常由一个或多个的基础数据根据一定的统计规则计算而得到[1];数据代码是源系统或生产系统中某个信息项数据内容的枚举集。相应地,数据标准也可以分为基础类数据标准、指标类数据标准、数据代码。在具体的实践中,可按照业务情况和业务需求进行划分,确保和业务状况相一致,如面向高速公路的全生命周期一体化管理业务,可按照投资、建设、运营等业务环节进行数据标准类型的划分。
1.3 数据标准建设的意义
数据标准是数据资产管理关键性地基工作,主要体现在数据质量管理、数据模型管理和数据安全管理等方面[5]。
在数据质量管理方面,数据标准是数据质量稽核规则的主要参考依据,通过将数据质量稽核规则与数据标准关联,一方面可以实现字段级的数据质量校验,另一方面也可以直接构建较为通用的数据质量稽核规则体系,确保规则的全面性和可用性[5]。
在数据模型管理方面,数据标准涵盖了实体、属性、关系以及这些元素之间的相关规则,这些标准不仅是定义数据结构的基础,也是确保数据一致性和准确性的关键。通过应用这些数据标准,可以有效地构建和管理数据库、数据仓库等系统的数据模型。具体来说,数据标准为数据模型的创建提供了一套规范和指导原则,从而使得数据模型的构建过程更加系统化和标准化。
在数据安全管理方面,通过明确业务中敏感数据的对象和属性,数据标准能够为数据安全提供坚实的基础。这些标准不仅包括对数据的识别和分类,还涵盖了数据访问、处理、存储和传输过程中的安全规则。
数据标准是企业数字化转型的基石,它在业务和技术两个层面发挥着至关重要的作用。在业务层面,数据标准一是能统一业务理解,数据标准明确了业务术语和概念,确保不同业务部门之间对业务含义有共同的理解;二是能促进沟通协调,通过统一的业务语言,加强了业务与技术团队之间的沟通和协作;三是能标准化统计指标,确保统计指标的一致性,为决策提供准确、可靠的数据支持。在技术层面,数据标准一是能构建规范的数据模型,数据标准指导构建符合企业需求的物理数据模型,提高数据的组织和管理效率;二是能赋能数据的敏捷交互,标准化的数据模型促进了数据在不同系统间的快速流动和交互;三是能减少数据清洗需求,通过减少数据不一致性,降低了数据清洗和整合的工作量;四是便于数据融合分析,标准化的数据更易于进行跨领域的数据融合和深入分析,为企业提供更全面的业务洞察。
2 数据标准建设方法探究
2.1 国外方法论
《DAMA数据管理知识体系指南》[2]是国际数据管理协会编著的一部全方位指导数据管理的方法论,其将数据标准建设划分为数据治理活动的范畴,将数据标准建设的基本流程提炼为发起数据标准和规程、制定业务术语表两个模块。该理论体系作为数据管理整体工作的指导性方法论,对数据标准建设的具体过程未作过多阐述,只从原则性方面开展了论述。
2.2 国内方法论
《数据管理能力成熟度评估模型》(GB/T 36073—2018)(简称“DCMM”)[3],是我国首个数据管理领域的国家标准,其把数据标准管理作为数据管理的八大能力域之一,其中明确将数据标准分为业务术语、参考数据与主数据、数据元、指标数据四个二级能力域,每个二级域都对数据标准管理工作提出了具体要求。其二级域的划分对数据标准的分类提供了有利参考,该标准的条款要求则可为数据标准的管理过程提供了权威指导。在CCSA TC601大数据技术标准推进委员会《数据资产管理实践白皮书》(6.0版)[1]中指出,数据标准管理是数据资产管理十大活动职能域之一,其将数据标准管理的过程定义为计划、执行、检查、改进四个关键活动。《华为数据之道》[4]是华为公司对自身数据治理实践工作的全面性总结,该方法论将数据标准划分在信息架构建设域中,认为数据标准建设应该覆盖业务视角、技术视角和管理视角,该理论可作为数据标准梳理定义的原则性参考。
3 高速公路全生命周期一体化管理的数据标准建设思路
基于高速公路投资、建设、运营一体化管理,文章通过对业务形态进行分析及对数据标准建设相关方法论进行研究对比,将面向高速公路全生命周期一体化管理的数据标准建设的过程总结为数据梳理归并、数据类目划分、数据标准制定、数据标准发布、数据标准应用及数据标准维护六个阶段。此外,为了数据标准建设工作顺利开展,需建立相应的工作保障机制。
3.1 数据梳理归并
在数据梳理归并阶段,需要调研交投公司投资、建设、运营三大主营业务部门数据需求以及对智能养护、计量支付、电子档案、OA系统等系统进行调研,全面梳理数据情况,形成相应调研报告和数据资源清单;后续还需持续对其他已建、在建、拟建系统数据进行滚动梳理、整合。
对不同表单内相似字段进行分析,对于含义完全相同但名称不同的字段进行归并工作。开展跨部门沟通工作,统一字段名称,确保相同名称字段的对应含义的唯一性。
3.2 数据类目划分
在此阶段,依据数据调研梳理结果,大面积开展跨部门沟通,深入了解业务需求。结合调研和沟通结果,开展类目划分工作,形成类目划分思维导图,为数据标准做好规划;并与业务部门进一步沟通确认,确保类目划分和系统、数据、业务的实际情况相贴合。
3.3 数据标准制定
标准制定是指在完成数据类目划分的基础上,定义数据标准及相关规则,需要对数据元及其属性进行确定,并遵循权威性、简明性、稳定性、扩展性的要求。
权威性:参照标准优先级为本行业标准gt;国标gt;地标gt;其他行业行标。业务数据标准依据本行业行标、国标对比结果,标准化代码;如无对应行标或国标,则参考地标、其他行业行标,标准化代码;无标准参考情况,则以业务系统原字典定义为准。
简明性:为快速定位信息资源,为了确保信息资源的快速定位,应注重以下几点。(1)简化分类层级,将信息资源的分类层级控制在两级以内,最多不超过三级,以减少检索的复杂性;(2)增强名称可辨识性,确保每个分类类目的名称直观、明确,以便用户仅通过名称就能大致了解该分类下包含的数据类型;(3)提供清晰的导航标识,使用户能够快速地通过分类导航找到所需信息。
稳定性:应尽可能保持数据分类的相对稳定性,保证数据分类能实现最大化采集,容纳现有能采集到的各类业务数据信息,同时一级、二级数据分类不会频繁地发生分类的变化。
扩展性:须考虑业务的不断发展,根据需要预留适当空位,以便适应内容不断扩充的需要。
3.4 数据标准发布
数据标准的评审发布工作是确保其在组织中具有高度可用性和易用性的核心环节。在数据标准制定的初步阶段完成后,关键的下一步是广泛征询科信事业部以及所有相关业务部门的意见和建议,这一步骤对于汇集多元化视角至关重要,有助于识别和解决标准可能存在的不足。随后,将对收集到的意见进行深入分析,并据此对数据标准进行细致的修订,以确保其能够满足跨部门的需求并适应不断变化的业务环境。修订完成后,数据标准将进入审议阶段,这一过程确保了标准的质量和适用性。最终,经过审议的数据标准将被正式发布,供组织内部和外部的广泛使用。发布之后,持续监控数据标准的应用效果,并根据用户反馈进行必要的调整和优化,以实现数据标准的持续改进和完善。
3.5 数据标准应用
数据标准的应用是一个全面而系统的过程,它涉及将已发布的数据标准融入信息建设中,以消除数据不一致性。这个过程要求不仅要将数据标准培训和宣贯深入地融入对于业务人员的培养过程中,以确保业务人员能够最大限度上熟悉并理解数据的业务含义并能够准确应用,还需要对信息系统进行及时且必要的建设和改造以适应这些数据标准。
3.6 数据标准维护
数据标准是一个动态发展的体系,它随着业务需求的演变和实施效果的反馈而不断进行优化和调整。整个数据标准的维护过程可以分为初期、中期和后期三个阶段。
在初期阶段,工作重点既要关注对于需求的收集、评审、变更和发布,同时也要对所有修订进行严格的版本管理,这极大地保证了数据标准的可追溯性,并能够为数据标准体系的维护和保证框架的一致性夯实基础。此外,还需制定数据标准运营维护的方案路线图,明确组织结构和策略流程,确保各部门能够有效协同,共同助力数据标准的运营和维护工作。
在中期阶段,工作的核心任务是针对数据标准执行的日常维护以及定期维护事宜,这包括监控数据标准的应用情况,评估其效果,并根据业务发展和技术进步进行必要的调整。
进入后期阶段,要对数据标准有进一步的思考,这就需要重新审视并制定数据标准在各业务部门和系统中的应用方案,并跟随制定相应的可行性落地计划。对于因业务拓展或数据标准分类变更而新增的数据标准,必须遵循既定的编制、审核和发布流程,以确保数据标准体系的持续更新和完善。
通过这三个阶段的持续努力,数据标准能够适应不断变化的业务环境,保持其活力和有效性,支持组织的数据管理和决策制定。
3.7 保障措施
3.7.1 数据标准管理组织架构
数据标准管理组织是为确保数据标准化工作顺利进行而设立的关键机构,其核心职责是执行和管理数据标准相关的各项工作。该组织的结构和形式不是一成不变的,而是应根据企业自身的数据资产管理规定和行业实践来确定。
在组织架构上,数据标准管理组织通常被划分为三个主要层次:
数据标准决策层:决策层处于组织架构中的最高层,负责制定数据标准管理的策略和方向,以及做出关键决策。
数据标准管理层:位于决策层之下,负责监督数据标准的实施,确保各项标准得到有效管理和维护。
数据标准执行层:是最基层的执行单位,直接负责数据标准的落地执行,包括标准的推广、应用和日常监控。
结合交投公司的数据资产管理相关规定,数据标准管理组织应确保每个层级都有明确的职责和工作流程,以促进数据标准化工作的顺利进行。通过这种分层管理,组织能够更有效地协调不同部门和团队的工作,确保数据标准在整个企业中的一致性和连贯性。
3.7.2 数据标准管理制度体系
数据标准管理制度体系是一个全面而系统的框架,专门设计来指导和规范数据标准管理工作的各个方面。这个体系确保了数据标准的制定、实施和维护都遵循一套明确的原则和流程。
在交投公司,数据标准管理制度体系遵循公司的数据资产管理规定和原则,确保数据管理工作的一致性和合规性。这一制度体系主要包括以下几个关键组成部分:
数据标准管理办法,是整个体系的基础,概述了数据标准管理的总体目标、原则和策略。
数据标准规范,详细规定了数据标准的技术要求和业务规则,确保数据的质量和一致性。
数据标准管理细则,提供了具体的操作指导和步骤,包括数据标准的制定、审批、发布、修订和废止等流程。
以上三个组成部分相互衔接,构成了一个有机的整体,确保数据标准管理工作的有序进行。通过这个制度体系,交投公司能够建立一个稳定、可靠且易于维护的数据环境,支持公司的业务发展和决策制定。
数据标准管理制度体系的建立和执行,不仅有助于提升数据的可用性和易用性,还有助于加强数据安全和隐私保护,满足法律法规的要求。
4 总结和展望
数据需要和业务充分结合,才能发挥其“乘数”的效应。数据标准的建设是数据和业务融合的过程,是数据资源化向资产化转变的基础性和关键性工作。具备统一的数据标准,才能形成交投公司内部统一的业务话语体系,从根本上推动数据质量、数据共享、数据融合分析、数据安全等各类问题的解决。
当前阶段,交投公司在推进数据标准化过程中仍然面临更多问题与挑战,这些问题严重地阻碍了数据标准管理工作的顺利推进,并在一定程度上阻碍了数据标准化的效果呈现。这些挑战主要体现在以下几点:(1)业务部门参与度不高,(2)技术实施不彻底,三是数据标准管理周期长、见效慢。该文所提出的数据标准建设思路,对于交通行业数据标准的建设、数据资产的管理、数字化转型的推动具有一定参考借鉴意义。在未来,还应持续开展相应研究,结合智能化数据治理工具、大模型等技术,持续提升数据标准的制定效率、数据标准和业务的耦合度、数据标准执行力度,有力助推交投公司数字化转型,打造“四新能建”,助力数字中国建设。
参考文献
[1]中国信息通信研究院.数据资产管理实践白皮书(6.0版)[E].CCSA TC601大数据技术标准推进委员会,2023.
[2][美]DAMA国际.DAMA数据管理知识体系指南[M].北京:机械工业出版社, 2020.
[3]数据管理能力成熟度评估模型:GB/T 36073—2018[S].北京:中国标准出版社, 2018.
[4]华为公司数据管理部.华为数据之道[M].北京:机械工业出版社, 2020.
[5]中国信息通信研究院云计算与大数据研究所.数据标准管理实践白皮书[E].2019.