高 鹏 张宁豫 张臣一 吴 剑
(1.东北大学资源与土木工程学院,辽宁沈阳110819;2.难采选铁矿资源高效开发利用技术国家地方联合工程研究中心,辽宁沈阳110819;3.东北大学基因矿物加工研究中心,辽宁沈阳110819;4.东北大学信息科学与工程学院,辽宁沈阳110819)
浮选作为选矿中应用最广泛的一种方法,是利用矿物表面物理化学性质的差异来选择矿物的方法,按照分选方式不同可分为正浮选和反浮选,浮选中常用的药剂有捕收剂、抑制剂、活化剂和pH值调整剂等。浮选过程由于工艺复杂,影响因素较多,因此优化浮选工艺指标是非常困难的,精矿品位和尾矿品位作为浮选的重要工艺指标与药剂用量之间存在复杂的非线性关系,而且特征变量之间的交互效应会影响工艺指标,因此直接通过非线性回归模型进行预测在克服维数灾祸问题方面存在一定难度,需要对模型进行一些无法验证的假设,导致预测效果一般,而药剂消耗成本是选矿成本中重要的一部分,因此药剂用量的预测是浮选作业中非常重要的问题。
随着人工智能和智能制造技术的发展,深度学习方法广泛应用于工业生产过程中,将深度学习应用于浮选药剂预测取得了良好的应用效果。本文以某选矿厂为范例,基于统计学习理论对其浮选车间的药剂消耗与影响因素进行建模,并利用模型进行优化及预测,达到管控药剂用量的目的。
由于浮选作业中药剂用量预测的难度较大,获得有价值的数据较难,因此国内外相关研究较少,耿增显等[1]利用典型案例推理的方法对复杂工业过程进行建模与控制。李海波等[2]研究了浮选过程混合智能优化的控制方法,基于RBF神经网络模型实现优化控制方案。王伟[3]利用遗传算法和非线性规划技术研究了粗铜浮选过程加药量的预测和控制。Vazifeh等[4]使用统计学技术研究了浮选过程中药剂消耗的问题,N.Aslan[5]使用统计学技术即二次规划问题研究了浮选药剂消耗的优化问题,F.Nakhaeie[6]建立的基于人工神经网络的ANN模型证实前馈神经网络能以足够的精度预测工业CISA浮选柱精矿中铜和钼的品位。
由于在未来的固定时间内(周、月、年),原矿处理量、原矿品位、原矿磁性铁含量、原矿氧化亚铁含量、浮选给矿品位、浮选给矿量、浮选精矿品位、浮选尾矿品位、浮选回收率、浮选产率,(X1,X2,⋅⋅⋅,X10)都是随机的,无法确定,因此预测未来1周、1月及1年的药剂用量,不仅是某1 d药剂消耗乘以相应的天数,本文使用Reject-Accept(R-A)随机抽样的方法来生成服从数据样本概率分布特征的随机数,其核心思想是通过事件出现的频率特征来模拟估计事件发生的概率规律,即通过大量的模拟试验,生成未来1周、1月及1年的输出随机数矩阵,从而反映1年中输入特征的变化规律,最后通过神经网络模型预测出对应周月年的药剂消耗量,并通过对多次模拟的结果取均值,进而得到未来药剂消耗的总和。
因此,利用数据库中的数据,采用核概率密度函数估计生成每个特征的概率密度函数,再利用R-A算法生成不同特征分布的随机数,利用这些随机数生成每种药剂最终的用量,每次都分别生成7条、30条、365条数据,进行300次模拟,利用这些特征数据预测相应的药剂消耗,再求和得到周、月、年的药剂消耗总和。生成周、月、年的特征数据后,利用训练好的神经网络模型对现有的数据进行预测,再对不同天数药剂消耗量做预测,即可得到相应的周、月、年的药剂消耗。
通过基本描述性分析发现,收集到的一些参数指标变化较小,因此为了研究这些参数的极限分布,就需要大量的样本辅助进行统计推断,因此采用历史的数据作为辅助,建立周、月、年预测模型。随着矿石的开采,原矿的性质也会发生一定的变化,从而引起浮选药剂用量的变化,为使该模型能够满足现场的长期使用,所以将原矿品位、磁性铁含量、碳酸铁含量和亚铁含量等原矿性质作为数据处理的指标。本文以原矿碳酸铁含量数据作为范例进行算法预测。
(1)利用555条数据作为样本,采用核概率密度函数估计的方法,生成该指标的概率密度图,假设原矿碳酸铁的含量数据分别为Z1,Z2,…,Zn,概率密度函数为fZ(z),因此概率密度函数的估计为:
步骤如下:
步骤1:产生均匀分布的随机数Y~fY(y);
步骤2:产生均匀分布随机数U~U(0,1);
(3)对原矿碳酸铁含量,生成M个n维的向量,把其中的第i个带入就能获得完整的数据,再利用完整的数据做预测,1≤i≤n,因此采用模型进行预测时,可以得到M个预测值,把这M个预测值进行平均即为药剂用量的最终预测值。
为了对样本数据进行采样,按照上节算法的运算流程,采用核概率密度函数估计的方法,生成原始输入变量的概率密度函数图,分别获取X1,X2,⋅⋅⋅,X10的概率密度函数fZ1(z),⋅⋅⋅,fZ10(z),如图1所示。
在获得原始输入变量的概率密度分布后,由于构造参考分布时,使用的是均匀分布,故选择X1,X2,⋅⋅⋅,X10分别服从如表1所示的均匀分布。
由于在构造参考分布时,使用的是均匀分布,故在确定k值的过程中,选取如表2所示的值:
根据2.2节的采样步骤,按照表1与表2的取值范围开始生成样本,在取得采样结果后,将生成的X1,X2,⋅⋅⋅,X10数据作为神经网络的输入样本,将反浮选天、周、月、年各药剂总消耗数据Y1,Y2,Y3,Y4分别作为模型的输出目标值,随后采用前馈神经网络对数据进行拟合预测。
nl表示网络的层数,第一层为输入值,最后一层为输出值;sl表示第l层神经元的个数;f(⋅)表示的是激活函数;表示第l层到第l+1层的权重矩阵;表示第l层到第l+1层的偏置;z(l)∈Rsl表示第l层的输入;表示第l层中第i个神经元的输入;表示第l层的输出,其中表示第l层中第i个神经元的输出。每个神经元的表达式如下:
需要利用数据训练,求出相应的权重矩阵及偏置向量,采用反向传播算法给定样本容量为n的样本训练集,目标函数为:
采用梯度下降算法极小化目标函数J(W,b)
在把数据集填补后,利用前馈神经网络建模预测药剂消耗。
通过数据驱动的特征筛选方法及行业知识,采用10个特征变量预测药剂用量,10个特征变量分别记为原矿量X1,原矿品位X2,原矿磁性铁含量X3,原矿碳酸铁含量X4,原矿亚铁含量X5,浮选精矿品位X6,浮选尾矿品位X7,浮选精矿回收率X8,浮选精矿产率X9,浮选给矿量X10。预测4种药剂用量:捕收剂用量Y1,pH调整剂用量Y2,抑制剂用量Y3,活化剂用量Y4,使用填补后的555条数据,进行建模研究,并利用随机数生成的方法得到未来7 d(1周)、30 d(1月)、365 d(1年)的特征数据,预测结果见表3。
如表4所示,通过计算生产数据与预测数据的误差表明,预测7 d(1周)的数据结果精度较高,误差普遍小于5%;预测30 d(1月)和预测365 d(1年)的数据相比于生产实际数据误差波动较大,这是由于在实际生产过程中存在不定期的设备停车检修和流程考察调试等无法预测的状况,所以实际的药剂用量会根据现场的情况作出相应的调整,导致长期的预测结果与实际结果存在较大波动。
本文通过对浮选药剂消耗的研究,采用拒绝采样算法对工业生产中的缺失数据进行填补,把填补后的数据利用前馈神经网络进行建模,创新性地将统计推断和深度学习相融合,对短期现场生产实践的浮选药剂消耗量预测具有一定的指导意义。