李欣悦、胡杨、徐莲花、耿丽娜、张豫 /中国航天系统科学与工程研究院
近年来,全球进入数字时代,世界各国把数字化发展作为推动经济增长的重要途径,发达国家加快大数据战略布局抢占发展先机。数据在我国国家发展中的战略地位也显著提升,2022 年中国数字经济规模达到50.2 万亿元,占GDP 比重的41.5%,成为稳定经济增长的关键动力。随着经济发展和科技进步,大型企业集团经营管理数据价值链的重要性日益凸显。2020 年6 月,为加快培育具有全球竞争力的世界一流企业,国有资产监督管理委员会印发了《关于开展对标世界一流管理提升行动的通知》,强调打通信息“孤岛”,统一基础数据标准,实现企业内部业务数据互联互通,促进以数字化为支撑的管理变革。因此,面向数据资源管理及业务应用需求开展大型企业集团经营管理数据价值链研究,以中国航天科技集团有限公司为例,分析航天科集团数据资源建设现状及问题,有针对性地提取、组织并利用数据,从而盘活数据资产、发挥数据价值,通过科学直观的视觉变现形式传达数据分析结论,实现数据向信息、知识、智慧的逐步升华。
航天科技集团在实施差异化的战略管控、科研生产体系转型升级、产业化公司市场转型等过程中,对于数据的需求日益迫切,对其数据资源的综合利用能力提出了更高要求。与要求相比,航天科技集团当前的数据资源建设与应用水平还存在一定差距,主要表现在以下几个方面。
目前,航天科技集团经营管理相关的各类数据分散在不同的业务部门,由于管理目的和关注点不同,加之各业务部门之间的数据共享机制尚未建立,各业务部门在收集数据时,存在“大而全”的倾向,重复调查数据现象比较普遍。
从所需数据的广度上看,一些反映航天科集团经营管理情况的数据在各业务部门中还未涉及或数据有缺失;从所需数据的深度看,一些需要进行二次加工计算、分析建模的数据,由于基础数据的标准不一致、口径不一致、频度不一致、颗粒度不一致,多源数据的集成融合工作过程复杂且难度较大,对数据综合分析应用造成较大影响。
目前,航天科技集团统一的数据管理制度、标准、流程等还未完全建立,支撑领导决策数据的真实性、完整性、及时性没有制度保证,缺乏技术和管理手段对数据质量进行监督管理,导致数据应用过程中出现“数出多门、数据打架”的现象。同时,由于数据碎片化,支撑业务建模的数据有缺项,数据口径标准不一致,难以满足数据深入挖掘分析的需要。
数据价值链是数字经济时代下,在企业价值创造活动中产生的新理论,最早由国外相关学者于2013 年提出,将数据价值链划分为数据发现、数据集成和数据探索三大过程。此后国内外其他学者也开展了一系列相关研究。有国内学者对数据价值链的概念和内涵进行了深入探讨,提出数据价值链是沿着企业生产链条数据流动与价值创造相伴而动的过程。通过这些研究分析得出数据价值链主要包括数据获取、数据存储、数据分析及应用等内容,其贯穿数据产生到知识创造的全生命周期,可以帮助企业更好地管理和利用数据,提高数据质量和准确性,从而更好地支持企业的决策制定和资源配置。同时,可以加强企业内部数据的共享和整合,消除数据孤岛现象,提高企业的运营效率和管理水平,推动企业的数字化转型和创新发展,提高企业的竞争力和可持续发展能力。
针对大型企业集团组织复杂性、管控差异性等特点,面向数据资源建设与数据价值创造的需求,提出了以数据产生、数据治理、数据汇聚、数据联接、数据服务为核心的大型企业集团经营管理数据价值链模型,贯穿从数据产生到数据服务的价值创造全过程。首先通过数据资产梳理、数据标准制定、数据模型设计、数据分布情况梳理、数据质量管理等数据治理步骤将企业各领域业务系统产生的数据进行盘点和标准化,保证数据的规范性和准确性,然后将治理后的数据汇聚到统一的大数据平台,面向不同分析应用需求,通过多维分析模型、指标模型、图模型、标签模型、算法模型等进行数据联接,为企业经营管理中的业务分析和管理决策等提供数据服务,支撑企业经营管理水平提升和数字化转型。大型企业集团数据价值链模型如图1 所示。
图1 大型企业集团数据价值链模型
以大型企业集团数据价值链模型为基础,面向航天科技集团数据资源建设及应用需求,以盘清家底为根基,梳理分类、规范管理、根治问题、持续应用为目标,以战略管理、财务金融、科研生产、资产经营、协同办公、人力资源、综合管理等业务域为核心建立数据价值链模型,包括业务数据产生情况调研方案、经营管理数据治理方法、全业务数据采集入库工具、基于数仓建模的跨业务数据联接分析方法、“一站式”决策支持的智能决策驾驶舱。
(1)业务数据产生情况调研方案
数据产生包括战略管理、财务金融、科研生产、资产经营、协同办公、人力资源、综合管理等业务域建设的业务系统运行中产生的数据,开展业务系统调研,梳理各业务域信息化情况,明确信息化覆盖业务。
(2)经营管理数据治理方法
为打破数据孤岛、确保数据源头质量、促进数据共享、保障数据隐私与安全,围绕战略管理、财务金融、科研生产、资产经营、协同办公、人力资源、综合管理等业务域开展数据治理工作,包括数据资产梳理、数据标准制定、数据模型设计、数据分布情况梳理、数据质量管理、数据安全保密等内容。
一是数据资产梳理。梳理航天科技集团数据资产清单,从主题域分组、主题域、业务对象、逻辑数据实体和属性分层结构表达对数据的分类和定义,识别作业环节中产生的所有需要管理的数据,厘清和描述航天科技集团的数据资产。其中,主题域分组是对企业顶层信息的分类,体现了企业集团最高层面领导关注的业务领域,包括战略管理、财务金融、科研生产、资产经营、协同办公、人力资源、综合管理。主题域是在主题域分组的基础上根据业务部门职能或业务领域进一步的划分,以财务金融为例,包括核算、报账、报表、资金等。业务对象承载了业务运行过程中重要的人、事、物信息,在业务流程输入、输出信息的基础上,依据业务对象特征进行判断,形成业务对象列表。逻辑数据实体描述了业务对象某种业务特征属性的集合。属性描述了所属业务对象的性质和特征。
二是数据模型设计。数据模型是使用结构化的语言将收集到的组织业务经营、管理和决策中使用的数据需求进行综合分析,按照模型设计规范将需求重新组织在一起,包括概念模型、逻辑模型和物理模型。其中,概念模型是在业务流程中识别业务对象,根据流程的输入、输出构建业务对象之间的关系而形成的业务层面的数据模型,承载了业务运作与管理信息。逻辑模型是描述逻辑数据实体之间关系的数据模型。物理模型是开发人员面向开发需求建立的物理表和字段。
三是数据标准制定。数据标准是企业内统一的数据含义和业务规则标准,是沟通企业内部流程间、流程及应用的共同语言,需在企业内部共同遵守。数据标准包括了业务标准、技术标准和管控标准三个重要组成部分。业务标准是作为业务人员对此数据项的相关业务的定义,以提升管理规范性、业务准确性和数据共享度,而技术标准则是IT 人员在数据库环境下对于该数据项的相关技术定义,对提升数据质量、开发规范性和实施效率具有重要作用,管控标准是明确该项数据的管理责任人,支撑精细化管理、数据安全和管理决策。
四是数据分布情况梳理。数据分布是针对企业级数据模型中数据的定义,明确数据在系统、组织和流程等方面的分布关系,定义数据类型,明确权威数据源,为数据相关工作提供参考和规范。基于航天科技集团的数据资产目录,梳理关键业务数据的分布概况,认证关键业务数据的可信数据源,掌握与分析航天科技关键业务数据在不同IT 系统间的流转情况。
五是数据质量管理。数据质量是指数据满足应用的可信程度,主要包括完整性、及时性、准确性、一致性、唯一性、有效性。从设计、执行两个方面开展,通过设计明确责任及标准,通过执行反映其质量结果,并通过PDCA 持续改进的方法,建立规划、控制、度量和改进的闭环机制,促进航天科技集团数据质量的提升,让数据真实反映业务实质。
(3)全业务数据采集入库工具
将航天科技集团战略管理、财务金融、科研生产、资产经营、协同办公、人力资源、综合管理等业务域的原始数据采集入库,实现业务数据在大数据平台的汇聚,并利用航天科技集团大数据平台承接数据资产梳理、数据标准制定、数据模型设计、数据分布情况梳理、数据质量管理等数据治理工作落地,实现业务数据在数据库平台的汇聚,形成数据仓库的贴源层数据。以业务对象为中心,进行数据整合,构建星型/雪花结构的数据模型,形成数据仓库的明细层数据。
(4)基于数仓建模的跨业务数据联接分析方法
在数据仓库明细层基础上,面向管理决策需求,利用多维分析模型、图模型、算法模型等方式对明细层数据进一步分析挖掘,为航天科技集团业务分析和管理决策提供数据服务。
(5)“一站式”决策支持的智能决策驾驶舱
在数据联接的基础上,面向航天科技集团业务分析和管理决策需求,建立智能决策驾驶舱,以数据仓库为基础,通过综合决策支持与业务主题分析指标体系构建方法、基于多模型和算法的数据分析挖掘工具、多用户多终端可视化数据卡片、基于用户需求敏捷响应的智能应用等工具和技术,实现航天科技集团各级领导与业务部门用户的经营管理全要素信息获取以及差异化管控的智能辅助决策支持。
面向数据价值创造需求,组建航天科技集团数据价值链建设工作团队,主要任务是组织经营管理数据治理及应用总体规划、数据资产梳理、数据标准制定、数据模型设计、数据质量控制、数据分析应用、支撑平台开发、人员培训等方面工作。从航天科技集团业务部门及二级单位抽调相关人员组成经营管理数据治理及应用工作组,主要包括总体组、数据治理组、数据应用组、系统支持组和运行维护组。其中,总体组负责制定经营管理数据治理的总体目标,审批项目的阶段目标或里程碑,听取工作汇报,讨论并决策较大问题的解决策略,协调安排资源;数据治理组负责梳理数据资产,进行数据标准的维护、更新,构建数据概念模型、逻辑模型和物理模型,管控数据质量等工作;数据应用组负责面向业务需求的数据专题分析应用;系统支持组负责承担相关财务信息系统的研发及运维工作,负责经营管理数据抽取和整理,为其他工作组提供环境、工具和基础数据,重在建设和实施;运行维护组负责经营管理数据平台及工具的运行维护,并在系统上线后针对相关业务人员开展相关培训工作。
加强与业务部门、信息中心、各级单位等沟通,规划建立问题管理、沟通反馈机制。建立畅通的沟通渠道,加强团队内外沟通和协同,确保航天科技集团领导及各利益相关方对方案的认可,与各业务部门加强沟通,牵头调研各业务流程、问题等内容,为数据价值链建设提供支撑。促进各分项工作组之间及时互通,实现资料、数据及知识的共享。
按月召开团队工作例会,负责数据价值链建设工作的整体管控、工作总体推进、阶段成果检查和解决问题协调;各工作组建立日、周工作例会制度,进行总结归纳,确保按计划完成各项工作任务。同时建立周报制度,各工作组每周向总体协调工作组提交工作进展。
为组建专业化数据价值链建设工作团队,支撑数据价值链研究与设计实施,组织开展数据价值链建设方法和工具相关的培训工作,为后续工作实施打下基础。培训方式主要由会议授课、在线培训、自学教程、线下研讨等多种方式结合进行。培训过程邀请先进的厂商和内部资深专家共同组成培训团队,在数据价值链建设过程中给予经验分享和专业指导。培训内容包含数据价值链建设方法培训、大数据平台等工具操作和案例实践操作等内容。
通过构建航天科技集团数据价值链模型,形成了一套从数据产生到服务的价值创造体系,为航天科技集团数字化转型提供了有力支撑。但为了紧跟信息技术发展步伐,为航天科技集团经营管理提供更加高效、高质量的服务,还需要从以下两个方面完善数据价值链:
一是构建经营管理数据全景,支持智能化数据应用。梳理内部各系统数据资源及外部数据的关联性,基于关联技术手段,建设关联资源库。构建具有全链路的知识管理与服务能力,覆盖知识的高效生产、灵活组织支撑智能应用。以数据为基础,通过管理构建经营管理知识体系,整合各知识主体的关联信息,挖掘海量互联网非结构化、半结构化及结构化数据,生成全方位经营知识图谱,在智能应用场景的人机互动中主动推荐知识,帮助高效、精准、智能地制定决策,提升经营效率与业务创新能力。
二是实现数据综合分析能力,助力数据价值创造。梳理各系统数据资源相关性,研究设计跨业务综合分析模型,通过“知识图谱+机器学习”的模式,利用其灵活的扩展性以及网状关系穿透检索的能力,从海量数据中识别、发现和推断数据间的复杂关系,利用知识推理、挖掘、发现、关联,从显性关系中获取更多的隐性数据关联,结合业务经验在知识图谱关系网络的基础上对经营管理风险提前预判,使数据产生更多价值。