何薇、李宇、贾东海、魏杰 /首都航天机械有限公司
王立军 /中国运载火箭技术研究院物流中心
档案资源综合管理是航天制造企业管理必不可少的重要组成部分,是航天型号产品制造过程中的重要环节之一。目前,随着运载火箭发射任务日益繁重,科研生产管理模式的持续改进,产品数据管理系统、制造执行系统、质量系统建设不断完善,型号产品生产过程中产生的各种二维图纸、三维模型、设计、工艺、质量等电子文件逐年增多,这些电子文件形成的多维数据量大且离散,难以高效和直接地为档案提供利用服务。因此,如何采用信息化手段与大数据技术从中挖掘价值数据、可视化大数据档案资源,以辅助企业决策,提高工作效率,提升档案管理质量,成为目前航天制造企业生产过程中需要解决的一个重要问题。
大数据这个术语,最早应用于著名开源软件社区Apache 的Nutch 项目中,大数据基本涵盖了数据体量大、数据服务开放、数据结构复杂3 个特征,具有数据可视化、数据挖掘、数据清洗、数据存储、数据采集5 个核心部分技术。大数据与航天制造档案数据密切相关,应用大数据技术发展档案工作、建立档案数据中心尤其重要,能够更好地为各级决策者提供知识或洞察力。
为此,笔者首先梳理了十一门类馆藏档案数据和档案工作中形成的过程数据,通过大数据技术建立各类角色关注的信息数据仓库,根据档案的特点进行数据的分类、分析及数据整合和语义挖掘,形成了不同业务领域需要的分析图,并在此基础上形成档案数据中心系统,促进 “数据自下而上,决策自上而下”的协调运作机制。
航天制造企业的档案工作主要分为五大类,分别是图纸与型号技术文件的管理工作、综合档案管理工作、档案编研工作、档案加工工作、声像档案工作。其中,图纸与型号技术文件的管理工作是航天制造企业档案业务的重点,其在科研生产过程中是数据的源头,负责二维图纸、三维模型的接收、分发及管理,生产现场加工、装配的型号产品是以档案部门下发的图纸、模型为依据,组织开展工艺、生产、质量等工作。
航天制造企业档案工作的业务流程主要涉及现行技术文件分发流程与综合档案归档流程两大类。现行技术文件分发流程包括分发人员接收、登记和分发、更改、补发和换发、调拨和配套、销毁;综合档案归档流程包括各单位兼职档案人员形成十二门类预归档文件、档案人员立卷归档、档案人员编目著录、借阅者借阅档案等过程
航天制造企业档案工作过程通过多年努力建立了档案管理系统,基本覆盖了档案工作的两大类业务流程,涉及领导、工艺、调度、工装设计等角色,有着较复杂的业务功能以及大量的数据量。档案管理系统解决了电子图纸分发、工艺文件在线归档、底图取消晒蓝、异地浏览图纸、科研产品在线归档等问题,积累了可用于指导生产的工艺数据,实现了档案资源的动态管理,应用效果良好。
基于航天制造企业档案工作的2 个主要业务流程,档案数据可分为现行文件数据、十二门类档案数据、标准资料数据。现行文件数据分为3 类:第一类包含二维图纸、三维模型“两单”等产品设计文件,是科研生产的数据源与生产依据;第二类包含工艺路线、材料定额、工艺规程、质疑单、质控卡等工艺设计文件和质量设计文件,是科研生产过程的重要保障;第三类包含工装二维图纸信息等辅助产品设计文件,是科研生产进度的重要信息。十二门类档案数据包含文书、经营、航天产品工艺档案、科研、质量、设备、基建等信息,是科研生产的基础。标准资料数据包含国家标准、行业标准、上级标准、企业技术标准和管理标准,是科研生产的基准。
现行文件是生产的依据,也是元数据的开始,其产生的数据分别保存在各自的业务数据库中,通过集成的关系将其进行数据关联。系统中一般只能进行同类数据的查询,不能多类数据统计显示。例如,展示“王二在2018 年3 月1 日―4 月15 日之间作为操作工人签署的工种为铣工的工序内容、操作结果、检验人员姓名”,该类信息是领导者在实际生产中迫切需要的信息,但是由于数据类型较复杂,使用SQL 语句关联数据库的表,降低了科研数据的利用效率。再者,科研生产元数据是原始基础维度数据,没有经过处理,意义不明,不能使用。此时,要将科研生产或者经营管理的元数据经过分类、统计、分析,形成各类决策指标数据,如能力数据、成本数据、竞争力数据、资源数据等。科研生产档案工作数据分析如图1 所示。
图1 科研生产档案工作数据分析图
航天制造企业档案数据中心应用大数据技术,对科研生产档案信息进行收集、整理和分析,将数据仓库、Hadoop 和流计算等结合起来应用。具体过程为:先从科研生产档案的现行文件数据源和重点档案数据源采集数据,如质量档案,如果数据是结构化数据,需经过提取、整理、转换和加载进入数据仓库;如果数据是非结构化数据,需经提取相关数据特征、特征相似度匹配,信息返回给使用者。然后,使用检索、分析工具对信息进行有效的组织和管理,将信息转变为辅助决策的指标报表、图表等。
航天制造企业档案数据中心系统是一个庞大的系统工程,由于档案数据是一个异构数据,包括关系型数据库产生的结构化数据,如工艺规程信息、质控卡信息等,还包括非结构化数据,如图纸、报告等,而这些异构的档案数据在档案数据中心系统进行流转和使用需要先进的信息技术进行支撑,如大数据处理技术、存储技术、表达技术、计算平台技术等,通过这些技术的融合,构建航天制造企业档案数据中心。航天制造企业档案数据平台和应用框架如图2 所示。
图2 档案数据平台和应用框架
航天制造企业档案数据中心系统的建设是系统性工程,需要业务部门、档案部门、技术部门开展联合课题攻关,建设周期可分为3 期。第一期开展的工作是基础数据的采集,工作重点是档案人员精准梳理工作流程、融合业务部门工作流程、建立档案系统等;第二期开展的工作是数据组织与管理,工作重点是数据分析、数据治理、技术与业务融合等;第三期开展的工作是数据应用,工作重点是数据挖掘、分类展示、数据决策等。目前,系统建设已经完成第一期工作,正在开展第二期、第三期工作的研究和典型实践。
航天制造企业档案数据中心系统如同人的身体一般,海量的档案数据就像人体的细胞,随着大数据技术的发展,大量的档案数据信息给档案工作带来巨大的挑战,是企业决策的重要数据来源,档案数据中心系统的建设迫在眉睫。因此,及时开展档案数据中心建设的筹划工作,是保证档案工作在新形势下“不落伍、不掉队”的重要举措,即便现在由于条件所限不能深入地开展建设工作,也应统筹规划,统一建设标准,积累经验,为将来企业决策打好基础。