杨舒涵
摘 要:“中国制造2025”是我国制造业升级的国家大战略。其技术核心是智能制造,智能化程度相当于“德国工业4.0”水平。“中国制造2025”的重点领域既包含重大装备的制造业,也包含新能源、新材料制造的流程工业。本文中建立复杂流程工业智能控制大数据模型实现[Si]的准确预测控制即冶炼过程优化与预测控制。我们进行了数据整理以初步探索各个量之间的关系,发现各变量之间没有一个较好的函数关系,即不存在相关性较高的关系,所得函数预测性很差,该发现使我们进一步明确了建立数学模型的思路和方法:结合灰色预测和神经网络两种算法,探究各变量之间存在的关系,实现对流程的成功控制。
关键词:大数据模型 初步探索 灰色预测 神经网络 变量关系
中图分类号:F40 文献标识码:A 文章编号:1672-3791(2018)02(b)-0100-02
流程工業中,钢铁冶金、石油化工等行业是代表性的国民经济支柱性产业。其生产过程的系统优化与智能控制的目标函数包括节能,优质,低耗,绿色环保等多目标要求。为了实现这样的优化目标,生产过程智能控制的关键技术就要从原来的反馈控制进一步升级为预测控制。即通过生产工艺大数据的信息物理系统(Cyber Physical System)建模,通过大数据挖掘,确定生产过程的最佳途径与最佳参数控制范围,预测性地动态调整生产过程控制,获得最佳生产效果。
1 数据处理
根据背景和所查数据得出一些简单结论并对模型进行部分构建。
在高炉炼铁的背景下,铁矿石从上加入向下运动,而煤和空气从下端加入向上运动。我们简化模型合理假定铁矿石到铁水经历3个阶段按照时间先后分为第一阶段、第二阶段、第三阶段,各阶段所处位置不同,进行的化学反应不同,每阶段均为两个小时。
对数据进行处理:给出各时刻出炉铁水含硫量所对应的3个阶段的铁水含硅量(代表炉温)和风量和喷煤量同时列出;给出各时刻出炉铁水,3个阶段的铁水含硅量(代表炉温)单独列出,用于讨论两者之间关系;对铁水含硅量与风量和喷煤量单独列出,用于讨论三者之间关系。
2 建立模型
2.1 选取样本
由于神经网路的特殊性,需要足够多的训练集,我们将1000组数据均作为训练集,训练之后对这1000组再次进行预测检验。
2.2 初步探索
结合高炉炼铁的基本原理归纳出如下两个重要结论。
(1)可以影响高炉炼铁的量较多,而我们只选取4个量进行讨论,显然存在大量的未知量对于我们的结果有一定影响,因此我们也无法通过控制变量得出较为准确的函数关系,这启发我们选用灰色预测和神经网络两种算法来解决本题。(2)时间顺序对高炉炼铁结果的影响较为复杂,或许存在相互影响,即同时在炉中分别处于第一阶段、第二阶段、第三阶段的3种铁水,应该存在复杂的相互影响,此种影响难以用简单函数衡量。所以这也启示我们使用灰色预测和神经网络两种算法来解决问题。
2.3 灰色预测
在系统科学的研究中,由于内外扰动的存在和认识水平的局限,人们得到的信息往往带有某种不确定性。随着科学技术水平的发展和人类社会的进步,人们对系统不确定性的认识逐步深化,不确定性系统的研究也日益深入。灰色系统理论便着重研究概率统计、模糊数学等所难以解决的“小样本”“贫信息”不确定性问题,并依据信息覆盖,通过从已知数据中生成、开发和提取有价值的信息,实现对事物运动规律的探索。另外,灰色系统理论对数据没有什么特殊的要求和限制,应用领域十分宽广。灰色预测是灰色系统理论中的一个重要组成部分[1]。
2.4 神经网络
人工神经网络由多个神经元按照某种方式相互连接形成,靠网络状态对外部输人信息的动态响应来处理信息,网络的信息分布式存储于连接权系数中,使网络具有很强的容错性和鲁棒性。神经网络的核心是结构和算法,例如以结构见长的pField网和以算法见长的BP(Back Propagation)网。同模糊逻辑系统相比,模糊逻辑系统是从宏观功能上“软”模拟人脑的逻辑思维机制,而神经网络是从微观结构上“硬”模拟人脑的经验思维机制;模糊逻辑系统的智能级别为推理级,而神经网络的智能级别为感知级。在数据挖掘中,神经网络主要用于获取分类模式。但是由于神经网络分类方法获取的模式隐含在网络结构中,而不是显示地表达为规则,不容易被人们理解和解释;另外要多次扫描训练数据,网络的训练时间较长。因此与其他数据挖掘方法不同,神经网络用于数据挖掘,要解决好两个关键问题:一是降低训练时间,二是挖掘结果的可理解性[2]。
3 结果展示
(1)数值预测的相对误差大概为5%~10%。
(2)炉温升降方向预测成功率=(1-0.0110)×100% =98.9%。
(3)炉温升降方向预测成功率=(1-0.101)×100%=89.9%。
4 模型分析
4.1 模型优势
(1)通过主成分分析的经验型规律对于实际生产和深入研究都有一定的指导意义。(2)通过不同方法解决不同问题,更加具有针对性,解决问题的效果更好。整体分析:面向问题,建立整体的动态预测模型。优点:考虑问题全面,较好地考虑了整体的变化规律,预测结果相对较为准确。分层分析:面向问题,走向实际,对具体问题进行优化,如何降低铁水含硫量,得到高质量的铁水,如何控制喷煤量和风量,炉温会有怎样的变化。优点:较为清晰的给出了各个量之间的关系,对实际问题有一定的指导意义。(3)模型具有可成长性,获得更多种类的数据,还有更大数量的数据,对于完善我们的模型有很大意义。
4.2 模型劣势
(1)灰色预测主要用于短期的预测问题,在样本数据较少时较好的预测结果。但它仅适用于指数型函数,不适合逼近其他复杂的非线性函数。(2)神经网络能预测无序、波动的时间序列,长期预测时,具有更好的预测优势。但是在样本数据较少时,预测结果不理想[3]。
5 结语
对更多的数据进行对比分析,我们在给出的1000组数据中通过筛选之后,很难找到3个阶段中有两个阶段相同或相似,控制变量后进行对比。我们发现在控制两个阶段之后所余数据往往不超过5组,甚至更少,这对我们控制变量进行分析带来了巨大的困难,当数据量上升到10000或者更多时,我们将有充足的数据进行对比,可以分析各阶段对铁水含硫量(铁水质量)等的影响,以及各阶段相互影响的情况。
参考文献
[1] 崔立志.灰色预测技术及其应用研究[D].南京航空航天大学,2010.
[2] 孙增沂,张再兴,邓志东.智能控制理论与技术[M].北京:清华大学出版社,2011:125-140.
[3] 吴宛荣.基于改进灰色神经网络模型的顶板压力预测研究[D].中国矿业大学,2014.