/中国运载火箭技术研究院
质量问题归零管理是我国航天企业进行产品质量改进的一项复杂流程,涉及产品设计、制造、运输等方方面面,加之航天企业产品的复杂性,在归零过程中会产生海量信息,因此将航天企业质量问题归零管理过程中产生的大量信息进行行之有效的管理,对航天企业产品设计生产制造以及归零业务都有重要意义。该过程的本质就是围绕质量问题实例来规范整理信息,凝练知识,进而构建“经验—案例”知识库,通过知识共享与复用,达到对质量问题信息和工程经验知识综合利用的目的,真正做到“质量问题变财富”,其核心在于知识管理。
目前,知识管理已在质量与可靠性领域得到了初步应用。中国运载火箭技术研究院的质量与可靠性信息管理系统是一个依托AVIDM框架建立的面向全员、全过程、全系统的质量信息管理系统,涉及到研究院型号研制“设计—生产—试验—产品交付”的各个业务环节,为航天可靠性知识管理的开展提供了数据基础。
当前,航天型号研制过程仍然存在不少质量问题,有些问题还是重复性问题,究其原因是现有的质量与可靠性工作模式尚未从“救火型”向“预防型”转变。截至目前,研究院尚未形成一种有效的可靠性知识管理方法,未能从知识管理的角度系统地对经验教训中隐藏的知识进行再提炼,经验教训中的知识没有回到可靠性设计分析等质量控制的源头中。因此,笔者针对航天型号质量问题归零信息,梳理了通用的可靠性知识管理方法,旨在规范航天型号可靠性知识管理流程,实现由质量问题数据到知识体系的构建与应用,进而为运载火箭和导弹武器可靠性设计、分析提供数据支持与知识支撑,实现质量问题数据的闭环应用,规范航天产品研制过程质量风险控制。
可靠性知识是从产品质量问题数据中逐层演化、提炼出来并得到验证的规律,产品质量问题数据、质量问题信息与可靠性知识之间具有如图1所示的关系。
图1 质量问题数据、信息与可靠性知识的概念及演化关系
当前,质量管理活动在产品过程维度向着制造、工艺乃至设计端延伸,在产品结构维度从单一零部件向零件族中的类似零件延伸,在组织维度向供应链两端延伸。随着举一反三工作的开展,产品可靠性知识内涵得到了极大丰富,形成了以质量问题案例为核心,案例知识与材料知识、工艺知识、产品设计知识等广泛关联的多学科融合知识体系。为此,提出基于质量问题归零信息的航天可靠性知识管理框架,如图2所示。
根据图2所示,可靠性知识管理起源于质量问题归零,其是一个隐性知识显性化的过程:技术人员根据经验对质量问题进行分析,通过反复试验实现质量问题复现,并提出最优解决方案,该过程将技术人员对质量问题处理的隐性经验转化成了显性的数据信息。质量问题归零主要包括故障相关信息、原因相关信息、措施相关信息3类信息。综合这3类信息,可形成2类质量问题归零知识:一个是由故障信息与原因信息组合得到的故障分析经验知识;另一个是由故障信息、原因信息以及措施信息组合得到的故障处理经验知识。
图2 基于质量问题的航天可靠性知识管理框架
基于故障分析经验和故障处理经验开展可靠性知识提炼,建立故障模式库与可靠性技术准则库,并使知识进入共享状态。知识检索引擎通过语义扩展、语义关联等技术实现质量问题描述信息的相似度匹配,设计人员通过知识检索获取想要的知识。知识检索引擎通过语义关联技术实现质量问题描述信息的相似度匹配检索,技术人员通过知识检索引擎可以获得其想要的知识。
质量问题归零业务既是可靠性知识库的支撑对象,也是可靠性知识库的依托对象。在这个闭环过程中,知识库自身也处于不断更新的过程,从而保证质量问题知识库的价值。
航天可靠性知识管理主要表现在对航天产品故障模式与可靠性技术准则的提炼,而其提炼过程是将隐匿在质量问题归零报告中的知识显性化的过程中,根据可靠性知识管理框架,并结合研究院提出的新“五条”归零原则,确定开展的可靠性知识管理活动包括知识分类与采集、知识挖掘与提炼、知识共享与应用。
质量问题知识既包括现有的以文档形式存在的显性知识,也包含操作者、维修人员、领域专家等知识拥有者头脑中的隐性知识,其包括排查故障方面的非正式的技能、技巧、经验以及主观洞察力等,往往与特定的情境相关。
产品质量问题归零信息庞大而复杂,笔者从质量问题归零过程出发,将产品质量问题显性知识主要集中于故障案例的描述,案例内容主要包括:产品基本信息,问题的描述(故障描述、模式识别、原因分析),解决方案(措施制定),反馈结果(措施评价、举一反三),如图3所示。
问题的处理与解决通常是一个反复迭代的过程,始于对问题情境和已知初始状态的描述,其中情境包括质量问题发生的时间、地点、对象等要素;初始状态包括可直接观测或检测到的现象。产品质量问题分析的本质是揭示各要素间的内在联系性和彼此制约关系,使不同阶段的知识相互作用,在这个过程中蕴含着经验和人为判断,以内在认知机理和实践情境为主要输出的隐性知识就蕴含在这个复杂关系之中。
通过进一步分析,质量问题的分析处理过程中至少包含2个层面的隐性知识:一是表层的隐性知识,这些知识是与具体质量问题相关的,包括问题细节、故障特征等;二是深层的隐性知识,这些知识具有通用意义,如问题解决过程中所包含的基本原理、规则与约束等。
由于航天型号产品的复杂性,如何从海量质量问题归零数据中挖掘出潜在有用信息和知识,是知识发现过程中的关键和核心步骤,知识挖掘是以人工智能、机器学习以及统计学为技术基础,发掘提取隐藏的预测性信息的有效途径,知识挖掘提炼的知识类型可以是总结性知识、关联规则知识、分类模型等。
图3 质量问题归零信息分类与采集示意图
知识挖掘主要是针对质量问题数据,分为数据准备、关联规则挖掘以及准则解释与表达3个步骤,如图4所示。
数据准备。针对采集到的质量问题归零信息存在大量噪声及不完整等情况,对数据进行预处理,使之符合算法规范要求。该过程主要包括3个方面的工作:一是数据清理,针对原始质量问题记录中存在的一些数据缺失情况,通过一定方法进行数据填充;二是数据集成,针对多个属性描述同一情境的数据冗余问题,如对机械断裂的描述“断裂”“开裂”“破裂”等,通过相关性分析进行数据集成,降低冗余对挖掘结果带来的严重误导;三是数据变换,将数据转换成适合挖掘的形式,如采用分词方法,在长中文信息中提取有用信息。
关联规则挖掘阶段。关联关系是用于描述不同质量问题记录之间存在的相互依存、相互联系,这种关系在很大程度上具有某些内在含义,而这些含义有些具有直接联系,有些是间接联系,对这些内在联系进行分析,形成一种判断标准,这个标准便是关联规则。通过充分识别质量问题与状态信息之间的关联规则,才能逐步建立正确完备的知识库。
图4 知识的挖掘与提炼
准则提炼和表达阶段。基于识别的关联规则,完善质量问题描述特征参数,建立质量问题、故障模式、故障原因、纠正与改进措施的链接关系,进而对故障知识库进行再分析,提炼出可靠性技术准则与禁忌,并从设计、试验和现场操作等方面对每一项技术禁忌与准则按技术进行分类归纳。对与产品层次和类型关联紧密的准则,还需要实现产品类型与技术类准则的组合,以确定适用于某类产品的可靠性准则。
知识管理最重要的目的是实现知识共享与应用,其核心是围绕知识建模,以信息化手段实现知识的快速共享,辅助需要知识的人员及时利用知识解决问题。
具体来说,基于质量问题归零信息的可靠性知识管理,对航天装备全生命周期涉及故障的相关工作,尤其是设计、制造、保障工作起到辅助决策作用。可靠性知识的共享与应用如图5所示。
首先,根据物理存储层需要存储的属性集合及属性间的基本关联关系,利用知识建模技术实现知识表达,进而根据知识应用需求提取知识应用技术要求;然后,进行初步的技术选定,开发相应的知识管理接口;最后,实现知识的共享和应用。
图5 知识的共享与应用示意图
产品设计改进、为可靠性设计提供依据与支撑。知识的共享与应用中最为根本的应用就是为产品的设计、加工、操作等改进提供依据。通过将质量问题知识库中积累的故障知识向设计、制造、试验等部门进行反馈,可以提供产品持续改进的依据;对经过验证的可靠性(故障)知识进行提炼,可以形成可靠性设计准则,基于设计准则进行产品的防差错设计,实现产品可靠性不断提升,可有效避免和预防故障的发生,进而提高使用方的满意度。
维修保障业务管理。在航天型号产品的维修保障工作中,故障知识的共享应用可以辅助维修保障决策,对维修保障的计划制定和业务操作提供支持作用。同时,质量问题知识的表达组织模型可提供标准的故障及相关信息的结构化数据规范,每一次的维修保障业务处理过程都是质量问题知识积累的来源。
故障诊断与排故引导。知识的共享与应用中最为核心和直接的应用就是对故障的检测、诊断、分析和处理,基于建立的故障知识库,通过应用故障案例知识提供对相似历史案例、故障模式的检索和展示,应用故障诊断知识提供故障发生机理和传播规律的分析与解释,提供故障的参考解决方案,对现场和返厂排故进行辅助和引导。
保障资源优化配置。通过对知识库中的故障知识依据各种标杆进行统计分析和逻辑推理等技术方法,可以挖掘出不同环境中装备及其配套产品的故障规律等隐性知识,针对这些分析结果合理配置维修保障资源,可以有效提高质量问题处理效率,同时降低保障资源成本。
笔者针对航天产品“常见病、多发病”共性质量问题频发的现象,并结合目前质量问题数据再分析、再利用不足的问题,从质量问题归零信息的再利用角度提出了航天可靠性知识管理新模式。相关研究成果可面向航天型号研制过程,提升质量问题数据的再分析、再利用,促进全院可靠性知识识别、提炼与表达,进一步提高研究院知识管理水平,构建知识共享机制,为科学开展型号可靠性设计、分析提供支撑,促进质量与可靠性工作模式从“救火型”向“预防型”转变。