孙臣良,郑伟,赵涛,陈洪光
(1.海军航空工程学院a.兵器科学与技术系;b.科研部,山东烟台264001;2.91557部队,浙江舟山316000;3.91440部队,河南洛阳471000)
基于数据挖掘和小波神经网络的航材消耗预测方法
孙臣良1a,郑伟1b,赵涛2,陈洪光3
(1.海军航空工程学院a.兵器科学与技术系;b.科研部,山东烟台264001;2.91557部队,浙江舟山316000;3.91440部队,河南洛阳471000)
运用数据挖掘技术对航材消耗的历史数据进行关联分析,筛选出对保障飞机飞行有重要作用的航材消耗数据,大大缩减了需要预测的航材数量,同时对消耗航材之间的内在影响关系进行量化。在分析人工鱼群算法原理的基础上,对算法中步长参数和视野范围参数的设置方法进行了改进。实例结果表明,运用小波神经网络预测航材消耗的方法大大降低了预测误差,说明了该方法的有效性、可行性和实用性。
数据挖掘;小波神经网络;消耗预测
航材管理作为飞行勤务保障的重要组成部分,其科学管理水平将对飞机战斗力的发挥产生直接的影响[1]。当代航空技术突飞猛进,航空装备不断朝着集成化、精细化、自动化、模块化方向发展,飞机也越来越现代化、复杂化。飞机巨大战斗力的发挥依赖于航材及时而又准确的供应,因而对航材保障提出了更新、更高的要求[2]。假如某一零部件发生故障,就可能导致飞机无法起飞,为避免因航材短缺而造成的飞机停飞现象,必须保证足够、及时的航材供应[3]。为此,必须储备一定数量的航材,而航材保障的经费以及航材仓库的容积都是有限的。因此,只能以有限的保障经费、有限的库容,采购有限的航材。如果储备量过大,一方面,将增加航材库存保管费和保管场所维护费用,降低经济效益;另一方面,过量库存降低了航材的质量,使航材陈旧、损坏,甚至因发霉、生锈而变质,这会致使保障成本增加,保障效益降低[4]。反之,航材储备过少会造成维修停工、飞机停飞,降低军事效益,并且因缺货往往造成临时订货,更增加了附加的人力和费用,造成更大的损失。因此,在有限的经费和现有的保障条件下,如何做到精确航材保障,提高航材保障良好率,仍是急需研究的重要课题。以往航材消耗量的预测往往存在2个方面的问题:一方面,是航材种类繁多、数量庞大,每一项航材都进行消耗量的预测工作量巨大;另一方面,选取的预测方法不合适会导致预测结果不准确。本文拟通过采用数据挖掘算法筛选待预测航材种类和名称,再利用小波神经网络(Wavelet Neural Networks,WNN)进行消耗量的预测。
数据挖掘(Data Mining)又称为数据库中的知识发现(Knowledge Discovery in Database),简称知识发现(KDD)。就是从海量的、不完全的、模糊的、随机的原始数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用、可信、新颖的信息和知识的过程[5-8]。
数据挖掘是指一个完整的过程,包括数据准备、数据挖掘以及结果的解释和评估3个部分[9-10],目的是从大型数据库中挖掘出先前未知的、有效的、实用的信息,并使用这些信息做出决策或丰富知识。
数据准备包括了数据抽取,数据预处理和数据变换;数据挖掘阶段首先要明确挖掘的任务或目的,如数据总结、分类等。确定了挖掘任务后,就要决定使用什么样的算法,同样的任务可以用不同的算法来实现;数据挖掘阶段发现出来的模式,经过用户或机器的评估,可能存在冗余或无关的模式,就需要将其剔除或返回初始阶段重新选择数据及数据变换方法。
在进行数据挖掘时,选择合适的挖掘算法,其余的工作都可以自行完成。本文为了确定消耗航材之间的关联,应用数据挖掘工具SAS中的Enterprise Miner模块进行关联规则挖掘,对某机型航材消耗数据进行分析。处理后的原始数据表结构见表1,主要存储内容有单位、消耗航材。
表1 原始数据存储表Tab.1 Table of initial data store
由于航材种类繁多,如果把所有原始数据表中列出的航材作为属性进行关联规则分析,一些不重要的、个例的属性就会影响最终的分析结果,而且会影响分析的效率。通过数据清理(填写空缺值、平滑噪声数据、识别、删除孤立点、解决不一致性),数据变换(规范化,即消除冗余属性和数据汇总),对原始数据进行预处理,最终存入数据库中准备进行实验的部分数据见表2、表3。
表2 数据库数据存储表Tab.2 Table of database data store
表3 最大频繁项目集表Tab.3 Table of maximum frequent itemsets
表2、3中,每一条数据对应一架飞机,“编号”列对应与该条数据的序号,“数据项”列存储的是这架飞机存在的故障,每个英文字母对应一类故障,如:P为分电器夹子;Q为前起上位锁;R为放油开关;S为火线;T为通风导管等。
根据实际情况,支持度设为0.1,采用Apriori算法,产生的最大频繁项目集如表3所示。由试验结果可以看出:P、Q、R、S、T发生故障的概率比较高,在33组数据中,概率超过15%。
依据产生的频繁项生成关联规则,产生结果如表4。如果最小信任度设置为0.6,从表4可以看出,产生了3条关联规则,分别是:P→S;P→T;S→T。对应到飞机故障为:分电器夹子→火线;分电器夹子→通风导管;火线→通风导管。
表4 关联规则表Tab.4 Table of association Rules
根据关联规则挖掘得出的结论,在对飞机进行维修或保养时,要对可能引起其他零部件出现故障的零件进行重点检测维修,从而减少航材消耗的诱因,对提高航材保障效率具有推进作用。
根据试验结果,分电器夹子损坏会导致火线或者通风导管损坏,火线损坏会导致通风导管损坏,或者说分电器夹子和火线或者通风导管同时损坏的概率较高。这一试验结果为飞机的保养、维修和库存的关联提供了可靠依据,但是这一结果仍需要更多的数据和实际应用来验证。从数据不难看出,从关联规则上对航空器材消耗进行挖掘,对维护飞机的技战术性能上有很大的帮助。
首先,需要考虑网络参数初始化和确定网络中的输入层、隐层、输出层节点个数;之后,构建小波神经网络,从而使航材消耗数据在网络上进行学习、训练。在利用小波神经网络模型解决航材消耗预测建模问题时,将参数初始化和网络结构问题统称为优化的WNN预测模型建立问题[11-12]。
人工鱼群算法(Artificial Fish Swarm Algorithm, AFSA)是一种模拟鱼群觅食行为的新型高效的群体智能优化算法,是集群智能思想的一个具体应用,它能很好地解决复杂非线性系统的优化等问题。其基本原理是借鉴鱼的觅食、聚群和追尾行为,从构造单条人工鱼底层行为做起,通过鱼群中各个体局部寻优,达到全局最优值在群体中突现出来的目的。
人工鱼群算法具体包括以下步骤。
1)初始化鱼群,在控制变量可行域内随机生成n条人工鱼个体,形成初始鱼群;包括人工鱼群的个体数目,每条人工鱼的初始位置,人工鱼移动的最大步长Step,视野范围Visual,重试次数try-number,拥挤度因子δ。
2)设置公告板,公告板用来记录人工鱼群寻到的最优值及对应的人工鱼个体状态。
3)对鱼群中的每条人工鱼个体所在位置的食物浓度进行评价。
4)每条人工鱼个体分别模拟执行追尾行为和聚群行为,选择行动后食物浓度较大值的行为为实际执行,缺省行为方式为觅食行为。
5)更新公告板,每条人工鱼个体每行动一次后,检验自身的食物浓度值与公告板的食物浓度值。如果优于公告板,则以自身取代之。
6)判断是否迭代停止。若是,输出结果;否则,转向步骤3)。
人工鱼在觅食行为中,其个体总是尝试向更优的方向前进,这奠定了算法收敛的基础。人工鱼随机巡视其视野范围中某点的状态Xj,如果发现好于当前状态Xi,则状态Xi的方向前进一步到达状态Xj;如果状态Xj并不比状态Xi好,则它继续随机巡视视野范围内的状态,如果巡视次数达到一定次数try-number仍未找到更优状态,则做随机游动。在上述过程中,步长参数Step与视野范围Visual对鱼群算法收敛的速度和精度影响很大。设置不当则会陷入局部极值或达不到精度。在觅食行为中,人工鱼个体没有找到较优状态时,会随机选择一个新状态,未充分利用已得到的信息,致使计算量增加和收敛速度较慢。
针对以上不足,Visual和Step可动态调整为:
式(1)中:t为当前迭代次数;Tmax为最大迭代次数;Visualmin=0.001;Stepmin=0.000 2;Step=Visual 8;s为函数a的变化速率,通常取值整数的范围为[1,30]。
用改进人工鱼群算法优化WNN的目的是为了确定与给定任务最佳匹配的WNN参数初始值和网络结构,优化的目的是不仅要确保初始化参数、网络结构最优,还要减小WNN网络的输出误差。适应值函数定义为输出的均方误差函数MSE,人工鱼群代表了不同结构的WNN,不同人工鱼对应于含有不同网络参数和隐节点数的WNN网络结构组成,且整个优化过程不是基于一种固定的网络结构。
由改进人工鱼群算法确定的WNN参数初始值和结构模型建立方法如下:
1)初始化人工鱼群的群体规模M、每条人工鱼的初始位置、视野范围Visual、步长Step、拥挤度因子δ和最大重复尝试次数因子try-number、最大迭代次数number等参数;
2)设置初始迭代次数num=0,在控制变量可行域内随机生成M个人工鱼个体,形成初始鱼群;
3)计算每条人工鱼的适应度,并与公告板的状态比较,若较好,则将其赋给公告板;
4)按式(1)计算视野范围Visual和步长Step;
5)每条人工鱼通过觅食、聚群、追尾和随机行为更新自己的位置;
6)判断num是否已经达到预置的最大迭代次数number,若满足,算法终止,输出计算结(即公告板的FC值)果;否则num+1,转步骤3);
7)将改进人工鱼群算法得到的最优解,解码为WNN参数的初始值和隐层节点数,采用BP算法,对网络参数进行梯度下降法训练。
选取研究对象为某型飞机的油箱安全活门,实验所用的数据实测于其120个月该项器材的实际消耗量。
人工鱼群算法中,WNN的初始参数(连接权值、平移因子和伸缩因子)为[-1,1]内的随机数,隐层节点数取为[1,30]内的整数。群体规模M=40,视野范围Visual=1,步长Step=0.05,拥挤度因子δ=0.168,s=3,最大重复尝试次数因子try-number=30,迭代次数number=100,采用梯度下降法训练WNN次数N=200,目标误差MSN为0.000 1。本文设计了一种组合式的WNN优化设计方法,以便于验证本文优化设计方法的有效性。即分别采用普通的BP算法和WNN算法来初始化参数和确定隐层节点个数。
表5列出了采用普通的BP算法和本文算法优化设计后的WNN的性能指标对比,即50次实验的平均值。
表5 不同优化设计方法的WNN模型的性能对比Tab.5 Performance comparison of different optimization approach with WNN
从实验结果可以看出,采用本文优化设计的方法得到的WNN模型具有较强的预测能力,仅需训练87次,就可收敛目标精度,并且选取的隐层节点数也少于后者。另外,本文方法优化过程中没有出现局部最优和不收敛现象,这也证明了本文方法的有效性。更为重要的是,该方法能够实现WNN参数初始值和隐层节点数的同步优化,从而避免了WNN工程应用出现的参数初始化和结构设计的盲目性问题,具有较好的应用前景。
本文运用数据挖掘技术对航材消耗的历史数据进行关联分析,筛选出对保障飞机飞行有重要作用的航材消耗数据,大大缩减了需要预测的航材数量,同时对消耗航材之间的内在影响关系进行量化。小波神经网络具有神经网络的非线性映射能力和小波分析的时频分析特点,其应用效果总体优于单纯使用神经网络或者小波分析。本文运用小波神经网络预测航材消耗量,实例结果表明该预测方法大大降低了预测误差,说明了该方法的有效性、可行性和实用性。
[1]张作刚.海军航材库存管理[M].北京:海潮出版社,2008:1-1;13-14. ZHANG ZUOGANG.Navy air material inventory management[M].Beijing:Tides Press,2008:1-1;13-14.(in Chinese)
[2]刘臣宇.航材供应[M].北京:国防工业出版社,2009:56-58. LIU CHENYU.Air material supply[M].Beijing:National Defense Industry Press,2009:56-58.(in Chinese)
[3]徐廷学,芮国胜,郑伟.航空装备综合保障[M].北京:兵器工业出版社,2004:12-14. XU TINGXUE,RUI GUOSHENG,ZHENG WEI.Integrated logistic support for aeronautic equipment[M].Beijing:Weapon Industry Press,2004:12-14.(in Chinese)
[4]陈云翔,杨新广.航空装备战斗损伤概率预测模型研究[J].数学的实践与认识,2011,41(18):118-122. CHEN YUNXIANG,YANG XINGUANG.Research on battle damage probability forecast model for aeronautic equipment[J].Mathematics in Practice and Theory,2011,41(18):118-122.(in Chinese)
[5]计希禹.数据挖掘技术应用实例[M].北京:机械工业出版社,2009:23-26. JI XIYU.Data mining technology application[M].Beijing:China Machine Press,2009:23-26.(in Chinese)
[6]朱玉全,杨鹤标,孙蕾.数据挖掘技术[M].南京:东南大学出版社,2006:28-30. ZHU YUQUAN,YANG HEBIAO,SUN LEI.Data mining technology[M].Nanjing:Southeast University Press,2006:28-30.(in Chinese)
[7]邵峰晶,于忠清.数据挖掘原理与算法[M].北京:中国水利水电出版社,2003:12-16. SHAO FENGJING,YU ZHONGQING.The principle and algorithm of data mining[M].Beijing:China Water-Power Press,2003:12-16.(in Chinese)
[8]薛青,罗佳,郑长伟,等.面向作战仿真的数据挖掘[J].四川兵工学报,2013,34(8):93-95. XUE QING,LUO JIA,ZHENG CHANGWEI,et al. Study on data mining for combat simulation[J].Journal of Sichuan Ordnance,2013,34(8):93-95.(in Chinese)
[9]CHENG G,LIU X,WU J X.Interactive knowledge discovery through self-organising feature maps[C]//World Congress on Neural Networks.2004:430-434.
[10]ESTER M,KRIGEL H P,XU X.Knowledge discovery in large spatial databases,advances in knowledge discovery and data mining[M].MA:AAAI/MIT Press,2006:83-115.
[11]HSU K,GUPTA H V,SOROOSHIAN S.Artificial neural network modeling of the rainfall runoff process[J].Water Resources Research,2005,31(10):2517-2530.
[12]左广东,周帅,张欣豫.小波神经网络研究[J].四川兵工学报,2012,33(4):115-117. ZUO GUANGDONG,ZHOU SHUAI,ZHANG XINYU. Research of wavelet neural network[J].Journal of Sichuan Ordnance,2012,33(4):115-117.(in Chinese)
V240.2
A
2014-01-23;
2014-03-31
国家部委技术基础基金资助项目(1036221)
孙臣良(1963-),男,副教授,大学。
1673-1522(2014)03-0235-04
10.7682/j.issn.1673-1522.2014.03.008