林涛 葛玉敏 安玳宁
摘 要:提出一种基于RBF神经网络的数据挖掘方法,将RBF神经网络应用于数据挖掘的分类和预测中,解决钢构件过程中的性能预测问题。其中用黄金分割法确定基于RBF神经网络的隐层节点数,减少该算法的计算复杂度,最终将其应用于某钢铁企业质量控制系统。构建对钢构件质量检测的数据挖掘及质量追溯平台,该平台是基于RBF神经网络的数据挖掘技术的。实际应用证明,产品的质量合格率可达到96.27%,符合国家相关的标准和技术指标。
关键词:数据挖掘;径向基函数神经网络;黄金分割法; 质量追溯
中图分类号:TP399 文献标识码:A
Abstract:To solve the performance prediction problem in the steel production process, this paper presentsed an approach which is based on RBF neural network data mining method and uses RBF neural network in classification and prediction of data mining. The hidden layer nodes of the RBF neural network were determined by the golden section method to reduce the computational complexity of the algorithm, which were applied to a steel enterprise quality control system. Finally, a platform of data mining and quality retrospective, which is based on RBF neural network data mining technology,was constructed in product quality testing in steel companies. Practical application shows that the qualified rate of products can reach 96.27%, in line with national standards and technical specifications.
Key words:data mining; radial basis function neural network;golden section method; qualitytraceability
1 引 言
在国家“全面提高信息化水平,推进信息化与工业化深度融合”的大环境下,有效的将信息技术、企业先进制造技术与现代管理技术进行结合,使得企业在生产经营过程中产生了海量数据。激增的数据背后隐藏着许多重要的信息,如何从大量的数据中提取并找到有用的信息以指导决策,是迫切需要解决的问题[1,2]。
钢构件的生产、加工、成型及实际应用的过程中涌现出企业决策的不确定性和不可预测性,大量结构化和非结构化数据,加剧了企业决策的风险。如何有效地收集数据、洞察数据,如何将数据转化为知识、将知识付诸于行动,已经日益成为企业经营者难以把控的课题。
由于神经网络对噪声数据的高承受能力和高容错能力使得神经网络在数据挖掘领域的应用得到人们的重视,但是具有结构复杂、可解释性差、训练时间长等缺点。针对这些问题本文介绍了基于RBF神经网络的数据挖掘技术构建的钢构件企业成品质量检测的数据挖掘及质量追溯平台,并且应用黄金分割法确定RBF神经网络的隐层节点数,减少了该算法的计算复杂度,进而简化RBF神经网络算法,使其更能满足大型企业数据挖掘的需求,提高工作效率。
2 数据挖掘技术
数据挖掘(DM: Data Mining.),也称为数据库中的知识发现KDD(Knowledge Discovery in Database),是源于大型零售商在面对决策支撑问题提出的,是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程[3]。它汇聚了数据库、人工智能、机器学习、统计学、可视化技术、并行计算机等不同学科和领域的知识;借助了多年来数理统计技术及人工智能等领域研究成果构建起自己的理论体系;利用了数据库技术对数据进行前端处理,应用机器学习方法从处理后的数据中提取有用的知识,并对数据背后隐藏的特征和趋势进行分析,最终给出关于数据的总体特征和发展趋势;运用了可视化技术将人的观察力和智能融入系统,用直观图形将信息模式、数据的关联或趋势呈现给决策者,使用户能交互式地分析数据。
数据挖掘大体分为三个步骤:目标数据收集采样、数据处理再加工和数据输出与结果分析。数据挖掘就是寻找隐藏在数据中的如趋势、模式及相关性的信息。数据挖掘属于数据库中的知识发现(KDD)的一部分。它的本质就是学习过去经验的简单过程。图1是知识发现过程的简单流程。
4 钢构件质量检测和追溯系统
现阶段冶金行业的运营特点趋向于严格的冶金产品质量规范,产品要进行全过程的质量跟踪和严格的质量检测,并为客户开具质量保证书。可见,质量管理在钢铁冶金行业中占据着越来越重要的地位。质量检测是实现质量管理的核心环节,只有精确地检测并分析出产品判废原因并进行质量追溯,才能把成品质量控制在最佳水平。为了更精确、更智能的进行质量检测工作,本文将RBF神经网络应用于数据挖掘的分类和预测中,把二者结合起来解决钢构件生产过程中的性能预测问题,以此构建了基于RBF神经网络的钢构件成品质量检测的数据挖掘及质量追溯平台,该平台将某钢铁企业中钢构件生产过程中的数据采集和质量控制系统历史数据库的海量数据作为目标信息源,进行数据清洗和相关性分析,减少数据噪声、删除与任务无相关的数据,建立挖掘数据库。而数据挖掘自动在数据库中寻找预测性信息,迅速直接由数据本身得出结论。
目前的钢构件检测技术基本上是将化学性能、物理性能、尺寸精度和表面质量分开检测,而化学性能和物理性能基本满足单方向相关联的关系,即产品的化学元素含量直接影响到产品的物理性能各项参数。因此,在对钢构件产品的物理性能检测时,可利用成品的化学物理性能相关性,通过RBF神经网络对化学参数的处理后,预测该产品的物理性能,从而简化了物理性能的检测环节,大量节省了人力物力并节约了检测成本。然而,数据挖掘的结果是不确定的,要和专业知识相结合才能对其做出判断,因此要结合质量追溯对结果进行深刻的分析,理解数据,了解其过程,才能对数据挖掘的结果找出合理的解释。因此对钢构件产品化学性能、物理性能、表面质量、尺寸精度的数据挖掘可按照以下流程进行:
依据上图,仅以钢构件的化学成分为例进行说明。对构件钢的化学分析用试样取样法以及成品化学成分允许偏差检测采用GB222—84标准。钢种产品牌号为Q295,A级钢,抽取了200组型钢产品的样本进行该平台的测试,首先从目标信息源即数据采集和质量控制系统历史数据库的海量数据中获型钢的化学成分数据,具体如下表1。
然后采用RBF神经网络进行数据挖掘,将数据集分为两组,一组用来训练RBF神经网络,一组用来测试RBF神经网络。为很好考察网络的泛化能力,要保证测试数据和训练数据无交集。此外,为了防止所有数据的数据冲突问题,将数据仓库与挖掘数据库分开设置。设置二级数据库为数据仓库,里面包含所有从生产线采集的数据;数据挖掘库为三级数据库,它是数据仓库逻辑上的一个子集,二级数据库是三级数据库的数据源,三级数据库从二级数据库挖掘筛选出需求数据。经过RBF神经网络对38个化学参数的处理后,预测该产品的物理性能,最后对化学成分数据、物理性能数据、尺寸精度数据和表面质量参数进行综合判定后的判定结果进行结果分析,判定结果以C#完成的界面人性化显示如图5.具体结果分析如表2。经过此成品质量检测的数据挖掘及质量追溯平台来进行产品质量控制,钢构件产品的合格率可以达到96.27%。
5 结 论
本文将RBF神经网络应用于数据挖掘的分类和预测中,把二者结合起来解决钢构件生产过程中的性能预测问题,并结合质量追溯对数据挖掘结果进行详细分析解释。其中,在预测网络的选择上综合考虑钢构件企业产品性能特点,选用结构相对简单的RBF前馈神经网络,同时对钢构件产品进行预测和检测两项工作,将数据挖掘技术深入到企业生产过程中,最终构建了成品质量检测的数据挖掘及质量追溯平台,经过此对产品进行质量控制,使得钢构件产品的质量符合国家相关的标准和技术指标。
参考文献
[1] Caiyan, Liu, and Sun Youfa. Application of data mining in production quality management[J].Proceedings of the 3rd international conference on Intelligent information technology application. IEEE Press, 2009.
[2] 储兵, 吴陈, 杨习贝. 基于 RBF 神经网络与粗糙集的数据挖掘算法[J]. 计算机技术与发展, ISTIC, 2013. 23(7):50-58.
[3] 宫晓曼, 滕荣华.基于神经网络的数据挖掘在煤矿选煤中的应用[J]. 煤炭技术, 2013. 32(009):127-128.
[4] 赵婧宏,潘维民.人工神经网络算法在数据挖掘中的应用[J].中国科技论文在线.
[5] 王行甫,覃启贤,程用远,等.一种改进的径向基神经网络预测算法[J].计算机系统应用,2012,(21)8:2-4.
[6] 李劲松.数据挖掘技术在钢企质量成本管理中应用研究[J].科技导报,2009.
[7] SPINOLA C., et al. "Image processing for surface quality control in stainless steel production lines." Imaging Systems and Techniques (IST)[J].2010 IEEE International Conference on. IEEE, 2010.
[8] 尉永青.数据挖掘技术在入侵检测系统中的应用研究[J].信息技术与信息化,2005:95-96.
[9] 林钢.基于数据挖掘的前向型神经网络在交通流时序预测中的应用[D].南京:东南大学,2004.
[10]周涛,陆惠玲.数据挖掘中聚类算法研究进展[J].计算机工程与应用,2012,(48)12:40-46.
[11]Shen, Wei, et al.Forecasting stock indices using radial basis function neural networks optimized by artificial fish swarm algorithm[J].KnowledgeBased Systems 24.3 (2011): 378-385.
[12]Cios, Krzysztof J., Witold Pedrycz, and R. M. Swiniarsk.Data mining methods for knowledge discovery.Neural Networks[J].IEEE Transactions on 9.6 (1998): 1533-1534.
[13]Buchtala, Oliver, Manuel Klimek, and Bernhard Sick.Evolutionary optimization of radial basis function classifiers for data mining applications.Systems, Man, and Cybernetics, Part B: Cybernetics[J].IEEE Transactions on 35.5 (2005): 928-947.