栗仕强,臧阳阳,梁昭磊,汪启华
(中国航空综合技术研究所,北京 100028)
产品质量已经成为产品核心竞争力的重要体现,产品质量的波动由制造过程多种因素共同影响,使得人们对制造过程质量影响因素的监控、分析有极大需求[1,2]。因此,通过对制造过程质量影响因素的数据采集、整理和存储,构建合理、高效的制造质量数据集,为数据驱动的质量分析方法提供数据基础,对于提升产品质量具有重要作用[3]。
本文中制造质量数据集指产品制造过程中与产品质量特性形成相关的过程因素数据和检验检测数据,包含人、机、料、法、环和测等。目前,制造质量数据集的构建具有以下关键共性难题:一是质量数据收集的完整性较差,传统制造过程数据面向生产任务收集,而非以质量分析为目的,部分质量因素没有受到关注;二是存在“数据孤岛”现象,难以集成和共享[4],制造质量数据一般存储在不同业务部门,可能采用不同的分类编目方法,造成了数据定义的不一致;由于不同的业务需要和信息化建设水平,普遍存在纸质文档、电子文档、数据库系统等共存的现象,造成了存储形式的不一致[5]。三是制造质量数据的可利用性较低,数据的整理分析工作存在欠缺,不同的数据采集方式使得数据整理方法不同,需要系统的开展质量数据的分类及关联性分析工作。
近年来,质量数据集构建引起了工业界和学术界广泛关注。各领域制造企业开始规划布局工业互联网、物联网、5G基建等基础设施,为制造过程数据的采集、融合、存储及互联互通提供了资源基础[6];西门子、阿里巴巴、华为、航天云网等企业也一直致力于构建工业领域大数据集的云平台,为基于数据服务的故障分析、质量监控、反馈优化等提供了平台基础[7]。目前针对质量数据集构建研究已有部分进展,唐晓青等[8]建立了以产品物料清单(BOM)为组织管理形式的面向产品全寿命周期的质量数据模型,实现了产品全寿命周期质量数据的初步集成。温明川等[9]采用了基于制造执行系统(MES)的装配质量数据管理系统,实现了质量数据的初步集成。刘明周等[10]提出了以品质物料清单为基础的质量数据管理方法,较好实现了质量数据有效、有序的组织。总体来说,大多数方法仅针对特定应用场景,对质量数据的整理分析不够系统,对影响制造过程产品质量的因素关联性和完整性考虑不足。
因此,本文提出用于质量分析建模为目的的制造过程质量数据集构建流程和方法,为复杂产品制造过程质量分析和管控提供数据基础。
制造过程质量数据不仅来源于产品的制造阶段,还应包括前期论证、设计、研制、实验和运维等质量信息,这些数据通常分布于不同的信息系统和部门,如图1所示。
图1 不同过程制造质量数据来源
前期论证及设计阶段的质量信息在构建质量数据集时需要适时考虑。如在前期论证以及设计阶段已经明确的关键质量特性信息。
制造阶段是质量数据的主要来源,结合复杂产品制造过程划分阶段,主要包括原材料数据、生产工艺过程数据、试验检测数据以及包装与交付数据等。
产品使用阶段暴露出的质量问题通常需要反馈到产品设计与制造过程中,促进产品的改进和优化,这些质量信息同样需要收集和整理,它们能够为产品质量的深度分析提供有效的数据支撑。
另外,部分经验数据、历史质量数据分析结果以及实验设计数据等对产品质量产生重要影响,这些数据同样不可忽略。
结合制造过程质量数据的来源,以生产过程为主线,借助“5M1E”方法,分别从过程维度、质量影响因素维度、数据存储维度展开梳理制造过程质量影响因素和质量特性指标,并通过过程因素的实例化,形成具体产品的制造过程质量数据要素集合,如图2所示。
图2 制造过程质量数据集组成要素
1)过程维度。结合产品论证、设计和使用过程信息,对产品制造过程各类信息进行梳理,形成质量数据集组成要素,主要包括产品类数据、时间类数据、组织类数据、工艺设计类数据、加工制造类数据。
2)质量影响因素维度。基于制造BOM和制造质量BOM信息展开,对零部件产品加工过程和产品装配过程从“5M1E”等较为系统的选取制造过程质量影响因素[11,12],包括制造人员信息、设备信息、加工数据、物料质量信息、方法质量信息、环境信息、测量信息,系统的明确质量数据集组成要素以及数据采集项的数据类型、采集频率、样本量大小和数据格式等要求。
3)数据存储维度。结合质量数据存储形式和位置,进一步清晰明确质量数据集组成要素,数据存储维度包含:接入质量数据,如MES、产品数据管理系统(PDM)、实验数据管理系统(TDM)、全面质量管理系统(TQM)等;生产线设备自动生成或手工输入数据,如经验数据、纸质记录数据、excel/word/txt/rpt等非结构化文本数据等。
为了适应制造过程不同的加工形式、人力、成本、进度等要求,质量数据的采集方式是多样的,人工记录与设备自动记录方式并存。根据采集的手段以及存储形式,可将采集方式分为:人工记录方式、移动终端自动识别方式和设备终端自动采集方式三大类。
1)人工记录。部分加工过程受制于工艺与过程因素需要,仍采用手工记录方式进行数据采集,它们通常以纸质的形式存储。这种方式较为直接方便,易于管理,但是采集效率低,实时性较差并且数据精度难以保证,在后续数据建模和质量问题溯源时需要花费较大精力进行集成和校对。
2)移动终端自动识别。条形码、RFID以及手持等方式的数据识别与采集,实现了数据的自动采集、存储和管理。这种方式较为高效、准确和稳定,且成本低廉,加工车间工人可将设备采集到的信息通过以太网传递给数据库,但这种方式存在编码信息污损、人工参与等带来的误检或漏检。
3)设备终端自动采集。这种方式在制造过程质量管控活动中广泛使用,它们能实现数据的实时采集,采集数据量较大,一般需要数据特征提取和变换才能用于建模。
在进行制造质量数据集组成要素采集时,需要结合实际质量数据分析和检测效率的需要,综合采用不同的数据采集方式,以提高数据采集的准确度和稳定性。
实际制造过程数据易受到外部干扰,直接采集数据的准确性和适用性难以保证,一般不能直接用于产品质量分析与建模,通常需要对采集的数据进行预处理。
1)数据异常值处理
数据异常值处理是去除数据集中的干扰数据并修正异常数据,以提高质量数据集的准确性和适用性。不同采集方式和存储形式带来的数据异常类型不一样,手工记录方式获得的纸质、光盘等数据,可能存在空值、漏读、误读、孤立点等问题,在构建质量数据集时需要进行数据检验和数据填补;自动采集数据受工作环境的影响,存在噪声等干扰,在构建质量数据集时一般需要进行滤波、降噪、平滑等数据清洗工作。结合不同异常类型需要采取针对性的处理方法,主要的处理措施如表1所示。
表1 异常数据处理措施
2)数据可信度检验
数据是测量的结果,测量系统的波动过大会造成数据本身的可信度降低,使得质量分析模型结果不准确。因此,在质量数据采集之前,需要对数据采集系统进行测量系统分析与评价,了解度量错误对数据采集的影响,并对造成测量系统波动的问题进行修正。
测量系统分析需评价数据结果的准确性和精确性。针对计量型测量系统,需要对测量系统开展稳定性、偏倚、线性以及重复性和再现性等分析,通常采用作图法、方差分析法、极差法等;针对计数型测量系统,一般从系统的有效性、漏判率、误判率等方面进行分析,通常采用假设检验方法、交叉表等来确定。
产品质量特性是多个制造过程因素共同作用、相互影响的结果,制造过程因素通过影响零部件质量特性从而影响产品的综合质量特性。在进行制造质量数据集的构建时,为了便于质量数据的分析和理解,需要考虑制造过程因素之间的影响关系以及制造过程因素与产品质量特性的映射关系,实现产品制造质量数据从分散到集成、从无序到有序,提高质量数据的交互性和应用性。
1)制造过程因素之间的关联关系
产品制造质量数据不仅存在因分散在不同的生产部门和信息系统中导致的数据冗余,而且存在由于数据之间相互影响导致的属性冗余。在构建质量数据集时通过分析过程因素之间的关联关系,形成产品过程因素影响关系链,完成制造过程冗余质量因素的识别、判定和处理。
在判定冗余质量因素时,重点从因果关系、时间序列关系、前后衔接关系、层次关系等展开,并结合工程机理、工艺经验和数据特征,采取针对性的关联关系分析方法。对于数据量较少的过程因素、经验数据等,常采用DEMATEL方法、模糊函数、通用生成函数等方法[13,14];对于数据量较大的统计数据,常采用主成分分析、独立成分分析、多元回归分析、相关性分析、频繁模式挖掘以及因子分析等方法。
在构建质量数据集时,对于冗余因素,根据实际建模需求,选择合理的因素予以删除;对于具有相关关系的因素集,可根据数学关系或机理关系进行因素变换。
2)制造过程因素与产品质量特性的映射关系
当产品性能出现质量问题时,为了能够追溯具体的制造过程因素,需要构建制造过程因素与产品质量特性的映射关系,打通制造过程影响因素与产品质量特性之间的“壁垒”。
制造过程因素与产品质量特性的映射关系包含两个层级,如图3所示。一是工艺过程因素与零部件质量特性之间的映射,实现工序级过程因素到零部件质量特性的传递。主要梳理制造过程各因素对零部件质量特性形成过程的影响关系,一般需要对时间信号、空间信号等进行特征提取,例如,表面粗糙度指标是受机床在一段时间内的加工信号影响的,加工过程因素与粗糙度指标是“多对一”的映射关系。二是零部件质量特性与产品质量特性的映射,实现零部件级质量特性到产品质量特性的传递。主要分析零部件到产品的组成关系,从而形成质量特性传递链,例如,汽轮机主轴的表面粗糙度对汽轮机的旋转精度、运行平稳性以及可靠性等产生重要影响,主轴表面粗糙度和汽轮机运行性能是“一对一/多”的映射。
图3 制造过程因素与产品质量特性的映射关系
从目前产品制造过程的质量分析需求、制造业信息化现状、管理现状、数据现状出发[15,16],本文提出质量数据集管理平台的功能架构包含基础模块、数据采集模块、数据预处理模块、数据应用功能模块、数据可视化模块五部分,如图4所示。
图4 系统功能架构图
基础模块:包含用户管理、权限管理、数据库管理、工作流管理、菜单管理、日志管理等,实现系统级、用户级的个性化配置。
数据采集模块:包含数据编码管理、数据配置、数据集成管理等,对数据元素进行描述,形成完整的数据信息,实现从人工检测、传感器采集、数字化扫描检测、现场终端采集、ERP/MES系统等的数据接入和管理。
数据预处理模块:包含空值检测与处理算法、异常值检测与处理算法等,实现质量数据的过滤与清洗。
数据应用功能模块:包含数据变换、数据特征变换和提取、关联关系分析、数据集组成要素动态管理、综合查询等,满足数据的多样化应用需求。
数据可视化功能模块:包含报表管理功能、图表管理功能、原型分享功能等。帮助用户直观的分析数据,方便多人合作了解数据规律。
依据前文研究所提出的质量数据集构建流程,该平台在某航空高精度产品装配过程中进行了应用。该航空产品涉及机械学、光学、电子科学、力学等多门学科。其装配过程产生大量的过程数据和检验检测数据,包含人员、设备、工装、检验、工艺、制造和质量管理等,数据存储分散、类型多样且相互关联。
首先,梳理该航空产品装配过程工序57道,形成了产品维、工艺设计维、时间维和组织维的多维数据结构,获得了数据集组成要素包括零件耗损、制造设备、检验设备等,明确了该产品质量数据集组成要素。
接下来,以该航空产品编号为索引,主要采集的质量数据有PDM、TDM、MES、TPS、PMIS、FMEA等系统数据,以及word/excel/txt/rpt等非结构化数据,形成了核心工艺参数记录700万条,单个产品的数据属性2000多条,其中结构化数据2G左右,非结构化数据4G左右;在数据预处理时,发现并修正空值异常数据2500多条,检测的异常值将近4000条,改进和修正数据采集方法和工具37处。
继而,通过频繁模式挖掘算法、层次分析等方法构建了制造过程因素之间的关联关系和单个产品与2000多条数据的映射关系,形成了22个元数据模型,建立了该航空产品与加工过程质量特性的传递链。
最后,开发了该航空产品的制造质量数据集管理平台,实现了数据的信息化管理,固化了制造质量数据产生、采集、录入、检测、清洗和检验等数据集构建流程。
本文针对目前质量数据收集不完整、采集准确性有待提高、质量数据可用性差的现状,提出了面向制造过程质量分析与建模的数据集总体构建流程。分析了制造过程质量数据的来源,明确了质量数据集要素组成;研究了与不同数据采集方式相匹配的预处理方法;探讨了过程因素间的关联关系以及过程因素与产品质量特性的映射关系分析方法;最后提出了产品质量数据集管理平台构建方法,并成功应用于某航空产品装配过程的质量数据管理中,为制造过程质量分析与管控、质量预测、质量评估、质量问题追溯提供了数据支撑。