王萌
摘 要:从当前大数据环境的特点出发,分析中国制造业及信息化的现状,阐述在大数据环境下制造业如何进行信息化及智能化的质量改进问题。分析大数据环境下质量分析与改进遇到的新挑战与新问题,并基于质量分析与改进遇到的新问题与新挑战,给出相应的解决方案,最后展望问题发展的前景。
关键词:质量分析;大数据;智能化;质量分析
中图分类号:C931 文献标志码:A 文章编号:1673-291X(2018)18-0151-02
引言
质量分析与改进是制造企业不断追求的企业宗旨之一,企业在制造中使用各种不同的方式进行质量分析与改进。质量改进是企业最有效的核心竞争力之一,对制造企业来说有着至关重要的意义。质量的不断改进有助于制造企业提高投资收益率,减少质量损失,还能够促使新产品的开发与生产技术的改进。质量改进活动一般有两层含义[1]:第一层是保持现有的质量水平,降低质量波动,其核心方法是“质量控制”;第二层是以突破的方式改进质量,主动采取改进措施,使质量有突破性进展,质量水平大幅前进。
随着大数据及物联网时代的到来,制造业得益于传感设备的普及,能够方便地收集到生产相关数据,这些制造大数据对于促进质量改进效果的作用日益变大。虽然以统计理论为基础的传统的质量分析方法在质量改进领域有着广泛的应用,但是能够在计算机上便于使用的数据挖掘方法[2]在制造业的应用越来越广泛。数据挖掘是一种用于发现潜藏于数据中人类未知知识的工具,制造业目前也大量应用了这种方法并进行改进。同样,数据挖掘方法在质量改进领域中的应用也越来越多,主要研究与应用领域为产品质量预测、工序质量描述、参数优化及质量分类四个方面[3]。
提出相应的算法需要考虑数据挖掘工具解决实际问题的全过程。具体执行流程可分为以下七个步骤:提出质量模型,采集模型相关数据,数据预处理,使用数据挖掘算法,优化算法结果,提出决策分析算法和提取改进规则。质量模型的提出与应用力求符合生产实际,提出的算法能够针对模型做有效分析,提出的知识对生产的管理人员能够起到指导生产和辅助决策的作用。
一、研究现状
数据挖掘可以简单概括为数据采集、数据预处理、数据分析和知识抽取。数据挖掘方法在质量改进领域的应用已经得到大量学者的关注。数据挖掘方法在生产数据质量改进领域的应用具体可分为以下四个方面:产品及工序质量描述、质量预测、质量分类、参数优化。粗糙集(Rough Set Theory,RST)、决策树(Decision Tree,DT)、聚类算法(Clustering Algorithm,CA)、遗传算法(Genetic Algorithm,GA)、支持向量机(Support Vector Machines,SVMs)、关联规则(Association Rules,AR)、人工神经网络(Artificial Neural Network,ANN)和模糊逻辑(Fussy Set Logistic,FSL)等常用的数据挖掘方法都广泛应用于质量改进领域的全过程。
质量数据的数字化是数据挖掘在质量改进应用的重要方向,多被应用于对数据化的描述产品基本情况。Tseng等在电路板印刷制造业中焊点特征识别中使用粗糙集理论识别,并将发现的知识应用于电路板的生产。关联规则被Chen等用于识别设备故障的根本原因。数据描述步骤中数据挖掘算法的主要作用是将采集到的复杂的数据转化为数据挖掘算法能够处理的数据,以因素识别、特征提取为主要手段,为算法做数据分析与知识抽取提供前提。经过质量数据的数字化描述后,质量预测变为可以直接实现的问题。采用适当的预测方法并优化算法参数能够较为准确地预测制造业质量结论。对于不同数据应采用不同的或者混合的预测算法,往往能够对解决问题起到决定性作用。
二、质量改进数据挖掘存在的问题
随着大数据及物联网时代的到来,质量改进问题也愈加复杂化。由于数据挖掘领域不断有许多新技术的产生,基于数据挖掘技术的质量改进是当前研究的热点问题。根据不断变化的质量改进模型会产生相应的新技术,那么相应的新工作就亟待开展。当前,基于数据挖掘技术的质量改进问题的研究存在以下问题。
1.數据挖掘算法亟待改进。经典的数据挖掘算法对于当今质量改进问题存在效率低下问题。对于数据维度与数量都在增加的质量改进问题不仅经典的质量控制算法效率低下,就连常见的数据挖掘算法算法都出现效率低下问题。因此,海量数据与高维数据的数据挖掘问题成为了数据挖掘领域的一个新课题。
2.数据挖掘算法思路的确立问题。对于新问题提出新方法是常见的解决问题的思路,但是新方法往往通用性与易用性低于经典的算法。因此,将复杂的质量数据经过数据处理转化为经典算法能够有效处理的模型是一种使数据挖掘算法在质量改进上能够焕发新的生机的思路。
3.数据挖掘算法的结合问题。当今问题需要的信息量大、数据复杂,往往使用一种算法不能达到解决问题的目的。如质量改进问题,是分类问题、预测问题和决策问题结合的混合问题。质量改进问题是多种数据挖掘算法协同完成的,方法之间是否能够有机结合得到有效结论是当前数据挖掘算法需要解决的问题。
4.定量分析与定性分析的问题。数据挖掘算法经常是解决一类数据的数据挖掘问题,如最常见的算法都是解决数值数据的数据挖掘。但是,对于质量改进这一实际问题是混合数据位,需要定量与定性方法结合起来共同完成,或者定量与定性问题之间多次转化才能到达最终目的。做到定量与定性分析相结合也是当前数据挖掘算法面临的难题。
结语
本文阐明了大数据时代挖掘技术在质量分析及质量改进领域的研究背景和研究意义,介绍当前制造业质量改进的特点和难点,分析符合当今制造业数据特点的混合分类算法,阐述混合分类算法的优点,提出改进方向。根据混合分类算的特点,论述对其分类结果需要提出新的决策分析算法的必要性。
参考文献:
[1] 鲍尔·克劳士比管理顾问中心.质量改进手册[M].北京:中国城市出版社,2003.
[2] 秦现生.质量管理学[M].北京:科学出版社,2002.
[3] 韩家炜,坎伯.数据挖掘:概念与技术[M].北京:机械工业出版社,2001.