屈洪兵
(航空工业第一飞机设计研究院,陕西 西安 710089)
随着世界从IT时代进入到DT时代,数据价值理念逐渐深入人心,未来世界将由数据驱动。大数据具有数据总量大、产生与传播速度快、数据种类繁多等特点,是高价值的海量复杂数据的集合[1]。开展数据管控工作已成为大数据时代科研院所和企事业单位的一项重要工作。
面对大数据浪潮的来袭,航空科研院所也开始重视并开展数据管控工作。作为国家高新技术产业,航空科研院所具备开展数据管控工作的软硬件条件。但是,就笔者个人工作感受而言,由于对数据管控工作经验不足,航空科研院所的数据管控工作存在诸多痛点和问题,其中最根本的原因就在于缺乏完善有效的数据管控机制。海量复杂数据的管控工作是一项系统工程,并非仅是档案部门或信息化部门的职责,需要从航空科研院所战略层面进行规划和组织实施。
目前,航空科研院所正在积极探索数据管控方式,试图将其内部未得到充分利用的数据资产进行深度开发和整合,实现数据资产价值的最大化。但在具体实施过程中面临以下问题。
(1)数据管控工作缺乏统一领导。大部分航空科研院所在开展数据管控工作时并没有设立专业的数据管控组织或专门机构。由于缺乏统一领导,数据管控工作在实施过程中就会出现数据管理职责分散、权责不明等问题,数据管控工作无法有效开展。在缺乏统一领导的情况下,开展跨部门的数据收集与管控工作就会变得较为困难,其工作效率和工作质量难以得到保证。
(2)数据开放与共享程度有待提高。随着企事业单位信息化的不断推进,航空科研院所内部的信息系统建设也在不断完善,形成了如OA办公平台、档案管理平台、产品数据平台、财务管理系统等信息管理平台,但信息孤岛的问题也会随之出现。由于各部门都专注于本部门业务数据的管理,部门间数据缺乏有效的沟通渠道,数据开放与共享水平较低,影响了科研院所数据的统一组织和管控[2]。
(3)数据管控意识与能力不足。目前航空科研院所对数据管控工作的认知主要集中于对结构化数据的收集、处理、挖掘和利用,并未涉及非结构化数据与实时数据,而非结构化数据与实时数据在科研院所内部所占比例高于结构化数据,并且非结构化数据和实时数据反映其生产、经营情况,也是航空科研院所实现科学管理的重要数据支撑。
在数据管控能力方面,部分航空科研院所尚未建立覆盖数据全生命周期的管理规范和流程,数据重复和数据失效的情况时有发生,缺乏完善的数据质量管控方案和跨专业、跨部门的数据沟通途径,其数据管控现状与科研院所信息化发展趋势不匹配,从而导致数据在内部无法有效流通和共享,无法为科研院所发展提供数据支持。
(4)缺乏统一有效的数据管控标准与规范。目前航空科研院所尚未形成统一有效的数据管控相关标准与规范。在航空科研院所内部,各职能部门主要关注与本部门业务内容相关的标准建设,并未建立统一的数据编码规则,这就使得各部门、各专业的数据编码规则不一致甚至产生冲突,严重阻碍了数据在科研院所内部的流动和作用的发挥。
(5)数据管控在科研院所管理层面未发挥有效作用。数据管控的最终目的就是要为企事业单位发展提供数据支撑和应用引领,数据是否全面反映了航空科研院所开展数据管控工作的效果。在大数据时代,数据已成为企事业单位发展的重要资产,数据管控就是对数据资产的开发与挖掘。因此,数据管控要满足航空科研院所决策精准化需求,能够推动其业务流程优化和业务能力提升,从而让科研院所认识到数据管控工作的价值所在。
大数据具有模态繁多、体量巨大、生成快速的特点,因此,构建数据管控体系势在必行。航空科研院所开展数据管控工作,首先应设立数据管控组织机构,同时成立技术实施项目小组,从管理和技术两个方面配置相应的资源,确保此项工作顺利完成。技术团队应对数据从开发全生命周期管控策略,到元数据管理、数据质量管控、数据安全管控、数据管控平台建设及数据管控工作效果综合评价等关键环节进行全面的策划和设计,从而提升数据管控工作的效果与质量。
组织机构的设立是数据管控工作成败的关键。在航空科研院所内部,数据管控工作的开展主要由档案部门负责。首先要成立数据管控工作团队:在企业决策层成立由企业高层领导、档案部门负责人和其他业务部门负责人组成的数据管控委员会,负责数据管控目标的制定;管理层成立数据管控工作组,主要由档案业务专家、信息技术专家、数据库管理专家等组成,负责业务指导和技术支持;执行层成立数据管控实施组,主要由各信息系统项目组成员组成,负责数据管控工作的具体落实。其组织结构见图1。
图1 数据管控组织机构
航空工业作为国家战略性产业,产品研制和技术攻关是航空科研院所的中心工作。航空科研院所的日常业务较为繁忙,员工通常处于加班加点的工作状态,所以需要加强数据全生命周期管控策略的设计,加强数据从收集、处理、存储到应用的全过程管理,建立以数据为中心的长效管控机制,为数据管控工作提供可靠而持续的保障。
1.数据生产阶段
数据在生产阶段就要开始进行管控,这样从源头上保证数据的规范性和高质量。在数据生产阶段,各航空科研院所要关注同类数据的模板,构建本单位数据模板库,实现内部数据格式统一,为后续开展数据管控工作奠定基础。
2.数据收集阶段
数据采集是数据管控的前提和基础。当前科研院所数据管控以非结构化数据为主,由于结构化数据已形成较为成熟的管理模式,所以数据采集的关键就在于对非结构化数据的全面获取。在数据收集阶段,要开展航空科研院所内部的数据普查工作,构建科研院所数据图谱,充分了解内部数据的分布、管控状况,从而制定相应的数据采集策略,为下一步数据管控奠定基础。
3.数据处理阶段
在数据处理阶段,首先要对收集到的数据开展数据清洗工作,及时处理异常数据、垃圾数据和失效数据,进行数据的补充、检验、查重和排重操作。要对处理后的数据实施严格的元数据管理,设计合理的数据模型与交换接口,从而提升异构系统的数据集成能力,实现科研院所数据的规范管控。
4.数据存储阶段
数据存储是数据管控工作的重要环节。惟有管好数据,才能够利用好数据,对于注重保密工作的航空科研院所更是如此。为实现科研院所数据的安全和高效存储,应结合业务工作需求和数据类型特征设计妥善的数据存储机制和备份方案,做好数据存储加密和异地、异质数据的备份工作,充分实现数据存储的安全可靠。
5.数据应用阶段
数据应用是指对整合处理后的数据进行深层次的分析,并使用各种方法展现数据价值的过程。数据应用的效果,直接反映了航空科研院所数据管控的成效。航空科研院所开展数据应用工作,可通过数据建模、异构数据实时查询、多维报表分析、数据深度挖掘等方式对数据进行深度开发,挖掘出数据资源的附加价值,实现数据资产管理和品牌价值的提升。
元数据是定义数据的数据,是描述数据特征的信息集合和准确表达[3]。如果没有元数据,数据管控工作也就无从谈起。对元数据的管理和应用是航空科研院所数据管控工作成功与否的关键所在。
航空科研院所开展元数据管理,应根据业务内容特点建立统一、可扩展的元数据模型,将技术元数据、业务元数据和管理元数据均纳入管理,形成本单位元数据指标库,并从指标库中调取元数据字段形成不同类型数据的元数据模板,从而实现对科研院所元数据的统一管理。此外,也要注重元数据管理方法与流程的优化,切实落实元数据管理策略,让元数据成为航空科研院所数据管控机制的技术支撑,实现元数据管理、利用的高效和流畅。
数据质量的高低对于数据管控工作至关重要。惟有可靠、高质量的数据才能够产生数据价值。数据质量管控是对数据在全生命周期中的每个阶段可能产生的质量问题的管理活动[4]。这些管理活动包括数据的识别、分析、监控和清洗等。
针对数据质量问题,各航空科研院所应制定全面、系统的本单位数据质量管控方案,全方位开展数据质量管控工作。数据质量管控方案应以数据质量为目标,通过制定严格的元数据标准和业务工作规范,利用数据管控平台对数据开展全流程的数据质量检查工作,同时以软硬件环境维护、团队建设、数据质量考核为补充手段,从而实现高质量的数据管控工作。具体内容见图2。
图2 数据质量管控方案
由数据质量管控方案内容可知,数据管控的关键要素为:
(1)元数据标准。元数据是数据交换、存储和利用的依据所在。航空科研院所应制定严格规范的元数据使用标准,通过对元数据使用流程的规范来保证数据质量。
(2)工作规范。航空科研院所应制定全面而严格的业务标准和工作规范,针对数据的上传、元数据著录、数据查询交换和使用的各个业务环节进行合规管理,确保工作人员和数据用户的行为合法、合规,保证数据的高质量运行。
(3)全流程数据检查。数据检查工作是保证数据质量的核心环节。开展数据质量管控需要针对数据开展采集前、采集中和采集后的数据检查工作。采集前主要关注数据特征和背景环境,采集中主要关注元数据著录情况,采集后主要关注数据及软件的使用日志情况等。
(4)半自动化质量检查。数据质量检查是一件烦琐但又不得不做的事情。为节省人力、物力,可利用数据管控平台的系统功能开展数据质量检查工作,如用户行为全过程审计、报表日志可视化、敏感操作预警、运维、安全与业务分析等。
(5)软硬件环境维护。数据管控依赖一定的软硬件环境,做好软硬件维护工作也是数据质量管控的一环。要严格落实数据管控服务器、信息系统运维的管控工作,制定管控标准并按照相关标准开展软硬件环境维护工作。
(6)团队建设。数据质量管控也要通过人工完成,需要针对数据质量管控工作设置数据质量员,依据数据质量管控方案,加强对质量控制员的信息技术能力、逻辑思维能力的培训,保证其能够胜任质量控制工作。
(7)数据质量考核。为严格落实数据质量管控工作,需要充分明确职能部门数据质量责任,制定相应的考核办法对各职能部门的数据管控工作进行考核,并对存在质量问题的部门进行相应的处罚,从而确保数据质量。
数据管控工作以数据为中心,那么数据安全就是其中的重点。航空科研院所的业务内容涉及军品研制和武器开发,事关国防建设和人民群众的生命财产安全,安全问题是重中之重。解决好数据安全问题是航空科研院所开展数据管控工作的前提。
为充分保证数据在使用过程中的安全,各航空科研院所应制订本单位数据安全管控方案,从访问控制、权限控制、数据保护、网络安全、存储安全、事件监控六个方面全方位保护数据的安全,数据安全方案见图3。
图3 数据安全管控方案
访问控制是数据安全的首要关卡,主要通过身份认证技术对数据实行分类分级管理,数据使用者只有通过身份认证才能够访问数据,从而实现对数据的精细化管理。数据保护主要是通过信息技术手段实现对数据的保护,主要有数据脱敏、数据加密、数据失真、CDP数据保护等技术手段。网络安全主要是保证数据在网络环境下的通信、传输安全,针对不同的数据传输方式可以采用不同的加密手段,如RPC加密、SSL传输加密、HTTP通信加密等。存储安全是指数据保存安全,存储好数据是利用数据的前提,可以通过数据备份、多副本存储、自我恢复等方式实现数据存储安全。事件监控是指对数据操作行为进行审计和监控,主要通过日志审计、系统运维安全分析等方式实现。
数据管控平台建设是数据管控机制的具体实现。数据管控工作离不开数据技术的支持,航空科研院所需要通过对信息技术的利用来完成对内部数据的有效控制和管理,以元数据采集、管理和应用为核心,充分发挥其技术支撑功能,从而驱动数据生命周期、数据质量、数据应用、数据标准的实现。数据管控平台建设应充分结合航空科研院所自身特点,有针对性地开展系统平台规划与开发工作。首先,科研院所都有较为丰富的产品数据管理经验和业务系统开发经验,并且作为人才密集型、技术密集型产业也具备相应的人才、技术条件,可以满足系统平台设计、元数据管理模式设计、数据质量提升技术和数据安全强化技术等方面的工作要求。其次,科研院所的业务工作多为涉密内容,为确保数据安全和符合国家保密要求,科研院所应依据自身能力开展数据管控平台建设工作,即使需要外部企业协助,也要建立项目责任人制度,严格遵守企业保密规定,切实保护企业数据安全。最后,航空科研院所可将数据管控平台建设与现有信息化建设工作相结合,在已有工作的基础上开展数据管控平台设计,实现企业数据资源的有效整合,使科研院所数据服务和数据管控工作平台一体化,从而为航空科研院所发展提供有力的数据支持。
数据管控效果评价是数据管控工作的重要环节。为检验航空科研院所数据管控工作是否达到预期目标,数据管控工作的具体成效如何,就需要开展数据管控效果评价,这样才能发现其中存在的问题,进行针对性的改进,确保数据管控的效果和质量。
开展数据管控效果评价,首先要建立评价模型。可借鉴主流数据管理成熟的评价模型(DMM),结合航空科研院所信息化建设实际,制定具有针对性的数据管控效果评价方案,其内容应包括评价指标、评价标准、评价实施手段等[5]。在评估方案建设的过程中,要充分考虑评价指标的全面性、科学性和可行性,评价指标应涵盖数据管控工作的各个方面,符合航空科研院所数据管控工作的实际情况,具有可操作性。评价方案的设计要能准确反映航空科研院所数据管控水平,解决其存在的问题,并为其数据管控能力的提升指明方向。
标准体系建设是数据管控的基础性工作,应将数据管控工作的业务流程标准化和规范化,从而建立统一的数据定义和标准口径,为数据交换与管理提供依据。标准体系的建设要与数据管控工作同时规划和起步,即在开展数据管控工作的同时,要从顶层设计的角度开展标准体系的编制工作。同时从数据管控工作中总结经验来推进标准体系建设,而标准编制的同时也能提升数据管控工作的科学性、系统性和规范性。二者同时起步,相互促进,共同发展。
航空科研院所在开展标准编制工作时,要根据本单位数据管控工作的业务内容与特点制定本单位数据管控标准体系,从而实现对数据管控工作业务内容的全指导和管理职责明确化。数据管控标准体系如图4所示。
图4 数据管控标准体系
数据管控标准体系主要分为业务工作、数据管控和质量安全与评价三个方面。业务工作标准建设是针对档案人员在业务工作中需要协调统一的业务问题所制定的标准,涵盖了对工作岗位职责、工作内容和工作方法的相关规定。主要包括以下标准内容:一是组织结构文件,针对数据管控组织机构所制定的工作规范。二是数据管理人员工作规范,包括系统“三员”及针对数据工作人员所制定的工作规范,如数据库管理员、平台开发人员等。三是数据用户管理规范。四是数据管控平台系统管理标准,属于软件管理规范。五是服务器管理标准,属于硬件管理规范。六是部门数据质量考核标准,是针对各职能部门数据管控参与程度和参与质量的考核,也属于数据质量管控的一部分。
数据管控标准建设主要是针对数据全生命周期管理过程中需要协调统一的问题所制定的标准。主要包括以下内容:一是数据生产标准。二是数据收集标准,主要包括数据分类标准和档案数字化处理标准。三是数据处理标准,主要包括元数据标准和数据集成接口标准。四是数据存储标准。五是数据利用标准。
数据质量安全与评价标准主要针对数据的质量问题、安全问题和数据管控效果评价问题所制定的相关标准。主要包括以下内容:一是数据质量管控标准,为解决数据质量问题提供工作依据。二是数据安全管控标准,为解决数据安全问题提供工作依据。三是数据管控效果评价标准,针对数据管控工作的实施效果所制定的标准,为数据管控工作的改进、提升提供依据。
此外,在开展标准体系建设的同时,也要注重标准执行、维护和监控工作。标准执行是指航空科研院所要按照所制定的数据管控标准体系开展工作,实现标准落地。标准维护是指航空科研院所要根据数据管控工作的业务需求变化和外部环境变化,对标准体系进行内容更新和版本管理。标准监控是指航空科研院所对标准体系的执行、效果和问题进行监督和管理,为标准更新与维护提供依据。
在大数据时代,数据被视为与物质资产、人力资本相提并论的企事业单位的重要生产要素,管理好、利用好数据资源已成为推动航空科研院所高质量发展的新动力。开展航空科研院所数据管控机制研究,从组织机构的统一领导,到数据全生命周期管理、数据质量管控、数据安全管控、数据管控平台建设和数据管控效果评价,再到数据管控标准体系的建设,其目的都是为了提升航空科研院所的数据管控能力与利用能力,实现对数据资产的有效管理和充分利用,不断推动我国航空科研院所向航空强国的战略目标迈进。