■ 中国软件评测中心 高雪峰 王芳
数据是推进企业数字化转型、践行企业信息化战略的基础,作为一种新型生产要素,已经成为企业的重要资产。然而,由于数据的整个生存周期涉及到多个环节,许多企业未能兼顾好所有环节的数据管理,导致数据存在分散杂乱、质量参差不齐、死数据冷数据较多、不够安全等问题,数据价值难以充分释放。
为了帮助和指导企业加强数据管理能力、提升数据资产价值,在工信部信息技术发展司的指导下,《数据管理能力成熟度评估模型》(以下简称“DCMM”)国家标准正式发布,中国电子信息行业联合会大力推进标准宣贯与应用。其中,数据生命周期作为DCMM中的一个重要能力域,对完善数据资源体系、提升数据质量、构建成熟的数据管理能力起着重要的作用。以下,笔者依据《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》《数据管理能力成熟度评估模型》等政策标准,结合过去工作经验,简要谈几点对数据生命周期的认识。
根据DCMM,数据生命周期(Data Lifecycle)是将原始数据转化为可用于行动的知识的一组过程。通俗来讲,数据生命周期涵盖数据从因被需要而创建到其失去商业价值或按规定要求被删除的整个过程。在DCMM中,数据生命周期能力域由四个能力项组成:数据需求、数据设计和开发、数据运维、数据退役。
数据需求源于企业的生产经营活动,是指企业对业务运营、经营分析和战略决策过程中产生和使用数据的分类、含义、分布和流转的描述。有价值的数据通常是在企业的生产经营活动中根据切实需要而产生的。以餐饮企业为例,每天各类食材的进货量、客流量、翻台率等,都是企业日常运营所需的数据,这些数据有助于管理者在控制成本、管理时间、增加收益等方面做出合理化决策;而顾客的姓名、血型等数据,对于餐饮企业来讲,当前并不是所需的核心数据,在这个场景中的应用价值不高。因此,结合业务实际,挖掘好生产经营中的数据需求,明确哪些数据是切实所需,对于企业筛选和利用有价值的数据至关重要。
数据设计和开发是指设计和实施数据解决方案,提供数据应用,持续满足数据需求的过程。数据设计和开发的过程离不开数据解决方案。目前许多企业对数据开发和设计的认识和重视程度还不够,未能站在企业治理的全局视角对数据解决方案进行统筹设计和实施,以至于无法满足日益增长的数据应用需求。企业在数据设计和开发的过程中,要运用系统思维和全局思维,加强对数据整合、交换、迁移等方面的事前规划、事中复核和事后检查,保障数据的完整性和安全性,减少数据解决方案中潜在的问题和缺陷,从而最大化地满足数据的应用需求。
数据运维是指围绕数据采集、处理、存储等日常运行及维护的过程,为数据应用提供持续可用的数据内容。在数据生命周期的不同阶段,数据运维的要求、侧重点和方式等有所不同。通常,在数据生命周期初期,数据的使用频率较高,需要各技术工具的充分支撑来确保数据内容的可用性;随着数据的使用频率因其重要性的下降而逐渐降低,数据运维重在为各类数据提供不同级别的、适当的可用性支持;当数据将不再被使用时,需对数据进行清理、归档。
基于此,数据运维应因时制宜,在数据生命周期的不同阶段各有侧重,才能保障数据的持续、有效、安全应用。
数据退役是对历史数据的管理,主要包括历史数据的归档、迁移和销毁等。企业在面对日益庞大的数据量时,需要投入包括机房、软硬件、人力、物力和时间在内的巨大成本。在企业所拥有的数据中,历史数据占据着一定的比例。如果将历史数据进行退役管理,则可以有效减少系统资源浪费,从而降低企业的拥有成本。多数情况下,为了符合外部监管和内部业务的要求和需求,需要采用归档、迁移的方式来保留历史数据,从而平衡数据可用性和数据存储成本。在归档时间达到一定期限,当数据不再被需要且不再要求被保留时,应根据规范的流程、采用安全的方法,对数据进行清除和销毁,从而直接降低企业的数据拥有成本。
企业数据能力管理是一项综合性的工作。数据生命周期是整个数据能力的根基,更是制度体系与技术应用相结合的系统性工作。企业既要建立健全围绕数据需求、数据开发和设计、数据运维、数据退役四个方面的制度体系,保证数据在整个生存周期的价值释放;又要加强技术应用与创新,保障数据的安全、质量、鲜活度和应用成效。做好数据生命周期管理,为提升企业数据管理能力、赋能综合竞争优势奠定扎实基础。