高新勤,马强华,张艳平
(西安理工大学 机械与精密仪器工程学院,西安 710048)
数控机床故障诊断关联规则挖掘方法研究
高新勤,马强华,张艳平
(西安理工大学 机械与精密仪器工程学院,西安 710048)
基于历史维修数据挖掘故障模式与故障原因之间的关联规则,是进行数控机床故障诊断和预防性维修的重要过程。采用改进的频繁项集挖掘算法,研究数控机床故障诊断关联规则挖掘方法。在阐述关联规则相关概念和挖掘原理的基础上,构建了数控机床故障诊断关联规则挖掘概念模型;针对传统挖掘算法执行效率低且产生大量候选项集的不足,提出改进的频繁项集挖掘算法,并给出了算法流程;根据数控机床故障特点,计算频繁项集及其非空子集的支持度和置信度,生成故障诊断的关联规则。最后,以挖掘数控机床刀架系统故障模式与故障原因之间的关联规则为例,验证了所提理论和方法的有效性。
关联规则;挖掘算法;故障诊断;刀架系统
数控机床是典型的机电产品,结构复杂,零部件数量庞大,在服役过程中一旦发生故障,快速确定故障部位并及时排除故障原因尤为重要[1]。近年来,人工智能技术迅速发展,数据挖掘、模糊推理等各种智能化故障诊断方法成为数控机床故障诊断领域研究的热点[2]。王春暖等[3]提出了模糊逻辑、RBF神经网络及粒子群算法相结合的数控机床故障诊断方法;盛博等[4]针对数控机床故障诊断问题的复杂性,提出了基于图论算法的数控机床故障诊断方法;王家海等[5]提出了一种基于报警号码优先级的不确定推理数控机床故障诊断方法;朱传敏等[6]将故障树与案例推理相融合,构建了数控机床故障诊断专家系统;Rashid等[7]从机床振动数据中提取有用信息,提出了基于数据挖掘的故障识别与异常检测方法。总的来讲,现有数控机床故障诊断方法大多是基于已知的、确定的故障信息,构建故障诊断关联规则及其知识模型[8]。
事实上,数控机床的故障模式与故障原因之间具有多关联、不确定和非线性特性,故障信息变量间的关联关系并不一定遵循已知的关联规则,需要通过关联规则挖掘技术,从历史维修数据中挖掘出对故障诊断有帮助的信息,从而构建数控机床故障模式与故障原因之间的关联规则[9]。
本文在阐述关联规则挖掘概念和原理的基础上,基于历史维修数据,采用改进的频繁项集挖掘算法,研究数控机床故障诊断关联规则挖掘方法,为数控机床故障诊断和预防性维修提供指导。
1.1 关联规则挖掘的相关概念
关联规则挖掘旨在历史数据或大型事务数据库中挖掘出不同项目之间可能存在的相互依赖关系,从而发现潜在的行为模式,其概念和Apriori挖掘算法率先由Agrawal等人提出[10,11]。目前,关联规则挖掘技术已经应用于医疗、金融、互联网和故障诊断等诸多领域[12]。
1)关联规则
关联规则是形式如“A⇒B”的蕴含式,其中A称为规则的前件,B称为规则的后件,且A⊆I,B⊆I,A≠φ,B≠φ,A∩B=φ。
2)支持度和置信度
关联规则描述数据项同时出现的可能性,即关联的强度,用支持度和置信度进行度量。
如果关联规则“A⇒B”在任务数据集T中成立,则具有支持度(Support),可以用任务数据集T中包含A和B的数据记录务数与任务数据集T的数据记录总务数之比表示,即:
关联规则“A⇒B”在任务数据集T中具有置信度(Confidence),可以用任务数据集T中包含A和B的数据记录务数与只包含A的数据记录务数之比表示,即:
3)强关联规则和频繁项集
支持度和置信度越高,说明规则的关联强度越强,关联规则挖掘就是挖掘出满足一定强度的关联规则。满足最小支持度(Min_sup)的项集称为频繁项集;同时满足最小支持度(Min_sup)和最小置信度(Min_con)的关联规则称为强关联规则。
1.2关联规则的挖掘原理
关联规则挖掘需要在数据集的基础上找出频繁项集,然后由频繁项集产生形如“A⇒B”的强关联规则。图1为关联规则挖掘的基本原理,主要包括搜索频繁项集和生成关联规则两个阶。
图1 关联规则挖掘的基本原理
1)频繁项集搜索
搜索频繁项集就是扫描任务数据集,找出所有满足最小支持度的频繁项集的过程。Apriori算法是常用的频繁项集搜索算法,它应用频繁项集性质的先验知识,逐层迭代搜索,主要步骤如下:
步骤1:扫描任务数据集,统计1-候选项集C1中的每个候选项的支持数,生成满足最小支持度的1-频繁项集,记为L1。
步骤2:将L1与自身两两连接,生成2-候选项集C2,再次扫描数据集,统计每个候选项的支持数,生成满足最小支持度的2-频繁项集,记为L1。
步骤3:如此重复搜索,直到不能找到更高一维频繁项集为止。
根据Apriori定理,如果一个集合不是频繁项集,则它的所有超集都不是频繁项集。Apriori算法通过k-频繁项集Lk的“连接(Connection)”生成包含大量候选项的(k+1)-候选项集Ck+1,需要通过“剪枝(Pruning)”去除完全不可能成为频繁项集的集合,再次扫描数据集,生成满足最小支持度的(k+1)-频繁项集Lk+1。在Apriori算法的执行过程中,需要多次扫描数据集,且生成大量的候选项集,导致该算法的执行效率低下,时间和空间复杂性提高[13]。因此,本文将对Apriori算法进行改进,并将其用于搜索数控机床故障模式的频繁项集。
2)关联规则生成
生成关联规则就是在频繁项集的基础上,找出满足最小置信度的关联规则的过程。根据Apriori定理,如果一个集合是频繁项集,则它的所有非空子集都是频繁项集。关联规则生成算法的主要步骤如下:
步骤1:求取频繁项集X的所有非空子集Xi。
步骤2:计算关联规则“Xi⇒X-Xi”的置信度,并与最小置信度作比较。
步骤3:生成满足最小置信度的关联规则。
基于频繁项集生成的关联规则,同时满足最小支持度和最小置信度的要求,均为强关联规则。本文将改进传统的关联规则生成算法,求取故障模式与故障原因之间的关联规则。
2.1故障诊断关联规则挖掘概念模型
将关联规则挖掘原理应用于数控机床故障诊断领域,通过挖掘故障诊断关联规则,可以对数控机床运行过程中潜在的故障模式以及引起故障发生的可能原因进行预先识别和分析,起到故障诊断和预防性维修的作用。
图2所示为数控机床故障诊断关联规则挖掘概念模型。该概念模型以数控机床历史维修数据为基础,以故障模式频繁项集搜索和故障诊断关联规则生成为关键,以挖掘故障模式与故障原因之间的关联规则等数控机床故障诊断数据为目标,为数控机床故障诊断和预防性维修提供指导。
一般而言,数控机床历史维修数据面广量大、纷繁复杂,需要对数据进行选择,从数据库中提取出与故障诊断关联规则挖掘相关的数据;需要对数据进行清理,清除带有噪声的数据和非可用数据;需要对数据进行集成,将多个数据源组合在一起;需要对数据进行规范化和标准化处理,把数据变换和统一成适合挖掘的形式。经过前期处理的数控机床历史维修数据包括故障模式数据集、故障原因数据集以及故障模式和故障原因联合的数据集等,它们是数控机床故障诊断关联规则挖掘的基础。下面对故障模式频繁项集搜索和故障诊断关联规则生成两部分内容进行重点阐述。
图2 数控机床故障诊断关联规则挖掘概念模型
2.2故障模式频繁项集搜索
针对传统Apriori算法执行效率低且产生大量候选项集的不足,提出改进的频繁项集挖掘算法。扫描数控机床故障模式数据集中的每一务记录后,都要对候选项集进行更新、创建,直到搜索到数控机床故障模式的频繁项集为止,主要步骤如下:
步骤1:初始化数控机床故障模式数据集T,扫描第i务记录Ti(i=1),得到该记录的数据项个数n,将n赋值于最大数据项个数a,即n=a。创建候选项集C1,C2,…,Cn,并对每一个候选项计数为1。
步骤2:扫描下一务记录Ti+1,得到该记录的数据项个数n。如果n>a不成立,更新原有候选项集,即对于已经存在的数据项集,把原计数加1,对于不存在的数据项集直接插入到对应的候选项集中,计数为1。如果n>a成立,创建新的候选项集Ca+1,Ca+2,…,Cn,并对每一个候选项计数为1;将n赋值于最大数据项个数a,即n=a;同时,也要更新原有候选项集并计数。
步骤3:在以上步骤中,每扫描完一务记录后,都要判断此务记录是否为数控机床故障模式数据集的最后一务记录,如果是,扫描结束,输出满足最小支持度的数控机床故障模式频繁项集;如果不是,程序继续执行步骤2。
改进后的频繁项集搜索算法仅扫描一次数控机床故障模式数据集,算法流程如图3所示。
2.3故障原因关联规则生成
传统关联规则生成算法是求取频繁项集X的所有非空子集Xi与X-Xi之间的关联规则,即“Xi⇒X-Xi”,而数控机床故障诊断关联规则挖掘是求取故障模式与故障原因之间的关联规则,所以需要对传统关联规则生成算法做进一步的改进。改进后的数控机床故障诊断关联规则生成算法的主要步骤如下:
步骤1:求取故障模式频繁项集X的所有非空子集Xi。
步骤2:扫描故障模式数据集,计算每个故障模式频繁子集Xi的支持度,即:
图3 数控机床故障模式频繁项集搜索算法流程
步骤3:扫描故障联合数据集,计算故障模式频繁子集Xi与故障原因Rj之间关联规则“Xi⇒Ri”的置信度,即故障联合数据集中包含Xi和Rj的数据记录务数与只包含Xi的数据记录务数之比,公式为:
步骤4:对满足最小置信度要求的故障诊断关联规则“Xi⇒Rj”按照置信度从大到小排序。该排序结果即为数控机床故障诊断或预防性维修时排除故障原因先后顺序的依据。
在数控机床故障中,刀架系统的故障率最高,占据了整个故障的30%以上[14]。提高刀架系统的故障诊断能力是数控机床可靠运行的保证。下面以数控机床刀架系统故障诊断为例,对基于关联规则的故障挖掘方法进行验证。
从数控机床历史维修数据中提取刀架系统故障相关数据,构成刀架系统故障联合数据集T={T1, T2,…,Tq,…,T22},如表1所示。其中, K={K1,K2,…,Ki,…,K8}表示故障模式,R={R1, R2,…,Rj,…,R10}表示故障原因。
表1 刀架系统故障联合数据
表1中故障模式Ki和故障原因Rj所代表的物理含义如表2所示。
表2 故障联合数据集中字母的含义
3.1刀架系统故障模式频繁项集搜索
假设最小支持度为2/22=0.091,即最小支持数为2。图4和图5分别为采用Apriori算法和改进算法挖掘数控机床刀架系统故障模式频繁项集的过程。通过比较发现,二者挖掘结果相同,刀架系统故障模式的频繁项集均为X={K6,K7,K8},但挖掘过程不同,Apriori算法需要多次扫描数据集,而改进后的频繁项集搜索算法仅需扫描一次数据集,执行效率显著提高。
3.2刀架系统故障诊断关联规则生成
由先验知识可知,刀架系统故障模式频繁项集X的非空子集X1={K6}、X2={K7}、X3={K8}、X4={K6,K7}、X5={K6,K8}、X6={K7,K8}、X7={K6,K7,K8}均为频繁项集,其支持度如表3所示。
表3 故障模式频繁项集所有非空子集的支持度
扫描刀架系统故障联合数据集,生成故障模式Xi与故障原因Rj之间的关联规则“Xi⇒Rj”,同时计算各关联规则的置信度并从大到小排序,如表4所示。在进行数控机床故障诊断或预防性维修时,可参照该排序结果逐个排除故障原因。例如,当数控机床刀架系统发生故障模式K6(刀架不能锁紧)和K7(刀架锁紧装置故障)时,最可能的故障原因是R9(反锁时间设置错误),次可能的故障原因是R2(操作严重失误)和R6(制造有误差),该结果可用于指导故障诊断时故障原因排除和预防性维修工作。
表4 刀架系统故障诊断关联规则及其置信度
图4 采用Apriori算法挖掘刀架系统故障模式频繁项集过程
图5 采用改进算法挖掘刀架系统故障模式频繁项集过程
基于历史维修数据挖掘故障模式与故障原因之间的关联规则,对于数控机床故障诊断和防御性维修都具有重要意义。本文采用改进的Apriori频繁项集搜索算法,提出了数控机床故障诊断关联规则挖掘方法。将关联规则的相关概念和挖掘的基本原理引入故障诊断领域,构建了数控机床故障诊断关联规则挖掘概念模型;针对传统Apriori算法执行效率低且产生大量候选项集的缺陷,给出了改进的频繁项集挖掘算法及其流程;在计算频繁项集及其非空子集置信度的基础上,生成了数控机床故障诊断的关联规则。以数控机床刀架系统故障模式与故障原因之间的关联规则挖掘过程为例,验证了所提理论和方法的有效性。本文提出的数控机床故障诊断关联规则挖掘方法,以历史维修数据为基础,在挖掘效率和准确性方面具有明显优势,能够为数控机床故障诊断和防御性维修提供重要指导。
[1] 杨兆军,陈传海,陈菲,等.数控机床可靠性技术的研究进展[J].机械工程学报,2013,49(20):130-139.
[2] Yao XH, Fu JZ, Chen ZC. Intelligent fault diagnosis using rough set method and evidence theory for NC machine tools[J]. International Journal of Computer Integrated Manufacturing,2009,22(5):472-482.
[3] 王春暖,李文卿,吴庆朝.基于改进PSO优化模糊神经网络的数控机床故障诊断技术研究[J].机床与液压,2016,44(3):192-197.
[4] 盛博,邓超,熊尧,等.基于图论的数控机床故障诊断方法[J].计算机集成制造系统,2015,21(6):1559-1570.
[5] 王家海,刘晨阳.基于不确定推理的数控机床故障诊断的研究[J].制造技术与机床,2014,(1):48-52.
[6] 朱传敏,周润青,陈明,等.故障树与案例推理在数控机床故障诊断专家系统中的应用研究[J].制造业自动化,2011,33(10):21-24.
[7] Rashid MM, Amar M, Gondal I, et al. A data mining approach for machine fault diagnosis based on associated frequency patterns [J]. Applied Intelligence,2016,1-14.
[8] 王家海,黄江涛,沈斌,等.数控机床智能故障诊断技术的研究现状与展望[J].机械制造,2014,52(5):30-32.
[9] 张日明,贾亚洲,孙大文.数据挖掘技术在数控机床可靠性分析中的应用[J].吉林大学学报(信息科学版),2007,25(6):650-654.
[10] Agrawal R, Imielinski T, Swami A. Mining association rule between sets of items in large databases[J].ACM SIGMOD Record, 1993,22(2):207-216.
[11] Agrawal R,Srikant R. Fast algorithms for mining association rules in large databases[A].Proceedings of the 20th International Conference on Very Large Data Bases. San Francisco[C]. CA,USA: Morgan Kaufmann Publishers Inc.,1994:487-499.
[12] 崔妍,包志强.关联规则挖掘综述[J].计算机应用研究,2016,33(2):330-334.
[13] 李雷,黄蓉.基于Apriori的快速剪枝和连接的新算法[J].计算机技术与发展,2014,24(5):31-35.
[14] 张华,房议.基于故障树贝叶斯网络的数控刀架故障研究[J].科技资讯,2015,13(20):4-6.
图13 智能小车实物图
参考文献:
[1] 常州市步云自动化有限公司.BYEC-1820运动控制器操作手册[Z].2015.
[2] 黄友锐,曲立国.PID控制器参数整定与实现[M].北京:科学出版社,2010.
[3] 曾光奇,胡均安,王东,等.模糊控制理论与工程运用[M].北京:机械工业出版社,2006.
[4] 李世勇.模糊控制神经控制和智能控制论[M].哈尔滨:哈尔滨工业大学出版社,1998.
[5] 田泽.嵌入式系统开发与应用实验教程[M].北京:北京航空航天大学出版社,2005:20-21.
[6] 汤兵勇,路林吉,王文杰.模糊控制理论与应用技术[M].清华大学出版社,2002.
Association rules mining method of fault diagnosis for CNC machine tools
GAO Xin-qin, MA Qiang-hua, ZHANG Yan-ping
TH166;TP206
A
1009-0134(2016)10-0014-06
2016-07-27
国家自然科学基金项目(51575443);陕西省教育厅重点实验室科学研究计划项目(16JS075);西安理工大学青年科技创新团队建设项目(102-211408)
高新勤(1976 -),男,山西临县人,副教授,博士,研究方向为制造信息工程、智能故障诊断等。