冯志军 郭光超 刘宇昕 苗春林 赵鹏 李坤远 杜俊鹏
(中国运载火箭技术研究院, 北京, 100076)
伴随信息化时代的发展以及数据技术的提升, 数据越来越得到各行各业的重视。 然而由于数据标准建设相对滞后, 导致数据通用性与可用性不强, 难以开展数据的多维应用及交换共享。为提高数据使用效率、 深挖数据潜在价值, 各行业纷纷加大了对数据标准的重视程度。 航天科技集团有限公司也提出建立完善的基础设施、 信息安全、 数据治理和标准规范保障体系要求, 在“一个CASC, 一套标准” 的原则下, 建设了航天卓越标准体系[1], 通过数字化与信息化标准子体系建设, 基本涵盖了数据相关领域的标准范畴。
航天企业建立了各种标准子体系, 如产品标准体系[1]、 信息化标准体系[2]等, 但是尚未形成数据标准体系。 本文以中国运载火箭技术研究院实践经验为基础, 从航天总体院角度, 围绕航天企业信息化和现代化建设需求, 研究数据标准体系框架建设, 形成一整套 “研以致用” 的适用于企业业务场景的数据标准体系[3-4]。
a) 数字化形式。目前科研生产及经营管控工作过程中产生的数据大部分以数字化形式进行管理, 涉及结构化和非结构化2 种类型。 其中结构化多以dat、 txt、 excel、 数据模型以及数据库等形式进行保存, 非结构化多以doc、 ppt、 pdf等文本文件形式进行保存。
b) 非数字化形式。航天企业档案部门的归档文件多以纸质文件、 磁带或磁盘等形式存在。以某单位档案收藏为例, 收纳了单位科研和经营管理活动的各种原始记录, 现存的有纸质档案、声像档案 (照片、 录像带、 电影胶片等), 这些历史资料均需经数字化转化后, 方可进行后续的加工、 存储和管理等工作。
a) 数据分散管理, 难以实现统一管控
虽然当前建设了较多的信息系统, 但整体上还未能覆盖所有业务领域, 大部分数据仍以文本文件形式分散保存; 同时各业务领域尚未构建数据标准, 数据难以实现统一集中管控, 导致数据查找困难, 不利于开展数据的交换共享。
b) 数据说明缺失, 难以实现数据应用
当前缺乏与数据分类、 采集、 存储、 管理、共享等相关的顶层规章制度及标准, 导致数据采集后数据命名、 数据结构、 数据格式不统一, 难以理解数据真正含义; 另外, 当前数据采集大部分仅保留结果信息, 其他信息如量纲信息、 状态信息、 环境条件信息等尚未与数据共同保存, 导致数据可读性不够, 使用性不高。
c) 数据管理标准不统一, 难以形成有效管理机制
各类数据采集后数据结构、 数据格式不统一,难以实现以统一的方法或工具来使用; 另外, 各业务领域结合自身业务需求开展各自信息系统建设, 建设标准和系统接口不统一, 未形成有效的管理机制, 为后续数据的采集和存储管理、 关联挖掘、 交换共享和分析应用带来了挑战。
a) 全面覆盖性原则。建设的数据标准体系应能覆盖全院各项业务领域、 业务活动, 能支撑全院各项数据工作的开展。
b) 先进适用性原则。结合院各项业务场景的数据需要, 吸收采纳自主编制的数据标准应以前沿技术为依据, 避免出现不适应业务需求、 技术发展的现象。
c) 协调匹配性原则。国家上级标准与企业各级技术标准之间要相互协调、 逻辑一致, 避免相互矛盾。
d) 开放兼容性原则。应吸收采纳现有与数据相关的国标、 国军标、 行业标, 确保院数据标准在满足院数据管理、 应用现状的基础上能够与上级标准及行业标准进行对接。
全国信息技术标准化技术委员会大数据标准工作组和中国电子技术标准化研究院联合发布了的《大数据标准化白皮书 (2020 版)》 及 《工业大数据白皮书 (2019 版)》[5-6], 从国家层面迭代完善形成了行业通用的大数据标准体系和工业领域的大数据标准体系。 航天企业应结合国家大数据体系,结合企业现状和建设思路, 形成树状层次结构的航天企业数据标准体系初步框架, 如图1 所示。
图1 航天企业数据标准体系
“基础共性类标准” 中, “数据基础标准” 主要用于统一数据相关概念, 统一对数据的理解,支撑开展数据工作; “数据安全标准” 贯穿于数据生存周期的各个阶段, 用于确保数据在各个环节安全可控。
“数据资产类标准” 中, “数据资产建设标准”用于对数据资源进行开发和利用, 形成有价值的数据资产的建设过程; “业务数据标准” 涵盖数据资产建设过程所梳理出的相关业务领域数据标准。
“数据治理类标准” 中, “数据治理体系建设标准” 贯穿于数据生存周期的各个阶段, 用于规范建设全院统一的数据治理体系; “数据质量与评估标准” 贯穿于数据生存周期的各个阶段, 是数据实现高效分析、 应用、 服务的重要支撑。
“应用服务类标准” 中, “数据产品标准”围绕数据产品开发, 从构建数据产品的生命周期入手进行规范; “数据平台工具标准” 支撑数据应用, 对大数据平台、 信息系统、 工具的开发过程进行规范。
针对航天企业科研生产、 经营管控业务, 充分结合现有的设计、 试验、 制造、 人力、 财务、物资、 质量、 保障等数据管理、 应用的特点及现状, 围绕数据全生命周期质量提升、 数据综合管理能力提升、 数据多维应用水平提升, 建立自顶至下的数据标准体系框架, 形成一整套 “研以致用” 的数据标准规范体系。
以数据标准体系为规划指导, 全面开展企业亟需的数据标准的制修订工作, 填补数据核心技术和管理标准, 统一企业的数据标准链路; 通过首次开展数据标准体系建设并实施, 推动企业科研生产数据管理有标可依, 推动企业数据综合管理能力提升, 最终推动实现航天企业科研生产和经营管控的现代化转型。
数据与科研生产、 经营管控的业务融合已成为当前数据专业发展的重要趋势, 在驱动数据技术不断创新的同时, 也必将对数据标准化工作提出新的要求。 面对新业态、 新模式下的新需求,需要紧密结合国内外数据技术、 产业发展动态,持续提炼梳理各应用领域数据标准需求, 并在现有标准体系的基础上迭代更新, 保障数据标准对数据技术、 产业创新发展的持续推动作用。