基于LSTM的浮选钼精矿品位软测量模型

2023-07-29 01:55邹奇奇廖寅飞苏海龙罗国兰王凯瑞
中国无机分析化学 2023年8期
关键词:选厂精矿预测值

邹奇奇 廖寅飞 苏海龙 罗国兰 王凯瑞

(1.中国矿业大学 国家煤加工与洁净化工程技术研究中心,江苏 徐州 221116;2.中国矿业大学 化工学院,江苏 徐州 221116)

近年来,随着国民经济社会的飞速发展,战略性矿产资源是新能源、国防军工、航空航天等战略性产业发展的物质基础。我国作为矿产资源大国,储量丰富,但部分战略性矿产资源开发利用率较低,对外依存度大[1]。战略性稀有金属矿因其“贫、细、杂”特点,分离回收难,属于复杂难选矿产资源。以钼矿为例,我国大多数钼矿品位低,成分复杂、嵌布粒度细等,造成钼矿的开采和回收成为多数选厂的技术难题[2-3]。浮选作为钼矿分离回收的重要选矿方法之一,通过在矿浆之中添加浮选药剂,实现精矿与尾矿的分离,提高矿浆中精矿品位。浮选精矿品位的检测一直是选厂的首要指标,关系到选厂的经济效益[4-5]。

实际生产中,浮选工艺流程是一个复杂的工业过程,存在众多影响浮选精矿品位指标的因素。受制于设备检测技术、矿厂环境、生产成本等问题,大多数国内选厂采取轮班制采样,通过人工化验得到精矿品位结果,但这种化验方式严重滞后于浮选工艺,难以满足对生产过程进行实时监测和操作指导[6]。

软测量技术在复杂的工业流程中得到了广泛应用,实现重要工艺节点监测、产品质量预测等关键性应用。软测量是一种以易测量数据变量作为输入,将难以测量的变量作为输出,基于机理和大数据相结合建立复杂软测量模型,解决某些变量测量困难、滞后等技术难题[7-9]。

浮选主要针对于微细粒矿物的分选,其浮选工艺流程极为复杂,往往需多流程联合分选,浮选可控制变量多而杂,且变量之间存在强非线性、强耦合等问题。部分学者利用软测量模型实现了对于浮选精矿品位的测量,为精矿品位测量提供了新方法。NAKHAEI等[10]研究了人工神经网络(ANN)与多元非线性回归(MNLR)在中试浮选柱中预测铜、钼品位的能力。利用化学试剂用量、泡沫高度、气体流量、循环水流速、气含率、粗选进料、浮选柱进料、塔尾中Cu和Mo品位等作为输入变量,使用ANN预测Cu和Mo品位和回收率的准确性高于MNLR模型,其误差变化较小且平滑。TIAN等[11]利用泡沫特征参数、浮选药剂添加量等变量,采用可变性注意力机制的LSTM(Long Short Term Memory)模型,自动增强重要变量权值。结果表明所提出的模型均方根误差RMSE和平均绝对误差MAE值分别降低了13.8%和13%,并且决定系数R2增长了9.7%。YAN等[12]利用选矿厂在各分选流程中X荧光品位分析仪的铜品位测量数据,对比了不同模型预测性能,得出窗口自适应偏最小二乘法是最准确的方法,可以提前准确预测下一个测量周期的铜精矿品位,并可用于指导操作。李海波等[13]在分析了浮选工艺指标相互影响,利用核主元分析的方法(KPCA)对模型输入变量(矿浆密度、流速、药剂量、溶液pH值、入料品位等)进行降维处理,建立极限学习机(ELM)软测量模型,输出精矿品位和尾矿品位,应用结果表明软测量模型精矿品位和尾矿品位的预测效果良好。王洪勋等[14]利用SBS算法对原矿品位、充气量、粗选pH值等易测变量进行筛选作为输入变量,采用非线性自回归神经网络进行训练,实现对浮选精矿品位进行预测,相比于其他算法具有一定的优越性。

针对浮选精矿品位结果严重滞后于生产流程,不能实时检测和反馈指导操作,本文通过对采集的各平台数据源进行数据预处理,利用LSTM网络在处理长时间序列信息的优势,提出一种基于LSTM的浮选钼精矿品位软测量模型,并与其他神经网络模型进行模型性能指标对比,充分验证基于LSTM的软测量模型预测精度高,实现浮选钼精矿品位的在线预测。

1 柿竹园东坡选厂浮选钼精矿工艺流程

柿竹园东坡选厂矿产资源丰富,矿物种类之多,是闻名世界的多金属矿床,被国内外知名专家誉为“世界有色金属博物馆”[15]。东波多金属矿选矿厂主要生产钨精矿、钼精矿、铋精矿、萤石等矿物产品,其原矿中有用矿物种类多、嵌布粒度细、共生关系复杂。针对柿竹园东坡多金属原矿品位低、成分复杂、嵌布粒度细等问题,通过多家科研单位联合攻关研发了“柿竹园法”——钨钼铋复杂多金属矿综合选矿新技术,解决了低品位稀有多金属矿分离回收的选矿技术难题。

柿竹园多金属矿为网脉状云英岩-矽卡岩钨钼铋矿石,有用金属元素钼主要以辉钼矿和钼矿等矿物存在,品位低,嵌布粒度细,成矿作用复杂,导致稀有金属钼精矿分离回收难。针对上述选矿技术难题,东坡选矿厂钼矿浮选工艺流程:钼铋硫全浮—钼铋-硫分离—钼-铋分离(图1)。浮选流程是一个十分复杂的工业过程,浮选药剂、操作条件、矿浆pH值和泡沫状态等是影响浮选钼精矿指标的关键因素,精矿指标一直是各大选厂生产效益的关键参考点。

图1 东坡选矿厂钼矿浮选工艺流程Figure 1 Flotation process flow of molybdenum ore in Dongpo concentrator.

2 神经网络LSTM模型

深度学习邻域中,循环神经网络(Recurrent Neural Networks,RNN)常常被用在处理时序问题,其特点是RNN在t时刻会将t-1时刻的隐节点作为当前时刻的输入,而传统神经网络模型的隐节点的输出只取决于当前时刻的输入特征,RNN链式结构如图2所示。

图2 RNN链式结构Figure 2 The RNN chain structure.

梯度消失和梯度爆炸是困扰RNN模型训练的关键原因之一,产生梯度消失和梯度爆炸是由于RNN的权值矩阵循环相乘导致的,相同函数的多次组合会导致极端的非线性行为。梯度消失和梯度爆炸主要存在RNN中,因为RNN中每个时间片使用相同的权值矩阵。LSTM是一种特殊的循环神经网络,引入门(gate)机制用于控制特征的流通和损失,解决一般RNN中普遍存在的长期依赖问题。使用LSTM可以有效地传递和保存长时间序列中的信息并且不会导致有用信息被忽略(遗忘),从而解决RNN中的梯度消失和爆炸问题。经典LSTM神经网络模型包括:遗忘门、输入门和输出门,其结构如图3所示。

图3 LSTM神经网络模型Figure 3 The LSTM neural network model.

遗忘门是控制是否遗忘,在LSTM中即以一定的概率控制是否遗忘上一层的隐藏细胞状态,选择要遗忘的信息ft:

ft=σ(Wf·ht-1,Uf·Xt+bf)

(1)

式中:Wf、Uf为遗忘门的系数权重矩阵;σ为ReLU激活函数;ht-1为上一序列LSTM模块的隐藏状态输出;Xt为t时刻样本序列的输入;bf为遗忘门的偏移项。

LSTM模块中输入门负责处理当前序列位置的输入,其数学表达式为:

it=σ(Wi·ht-1,Ui·Xt+bi)

(2)

(3)

式中:Wi、Ui、WC、UC为输入门的系数权重矩阵;σ为ReLU激活函数;ht-1为上一序列LSTM模块的隐藏状态输出;Xt为t时刻样本序列的输入;bi、bC为输入门的偏移项。

LSTM模块中细胞状态的更新,通过前面的遗忘门和输入门的结果作用于细胞状态,将细胞状态Ct-1更新得到Ct,其数学表达式为:

(4)

LSTM模块中输出门当前时刻隐藏层状态的数学表达式为:

Ot=σ(Wo·ht-1,Uo·Xt+bo)

(5)

ht=Ot×tanh(Ct)

(6)

式中:Wo、Uo为输出门的系数权重矩阵;σ为ReLU激活函数;ht-1为上一序列LSTM模块的隐藏状态输出;Xt为t时刻样本序列的输入;bo为输出门的偏移项;Ct为t时刻序列的细胞状态。

3 数据预处理

3.1 数据收集及模型输入变量确定

东坡多金属选矿厂作为一个创新型的现代化选矿厂,其选厂整体自动化、数字化、智能化水平较高,实现了选厂生产流程的自动化控制和监控[16]。特别是浮选生产流程中关键设备和操作条件的实时监控与数据传输。经走访调研,东坡多金属选厂拥有集控平台、浮选柱控制系统、药剂控制系统、选厂浮选质量台账、数据云平台等,为此实验提供大量可靠的实验数据。

分析整理上述各平台采集的源数据,通过对选矿厂浮选工艺和浮选机理分析,筛选出多个影响浮选钼精矿的变量作为模型输入,具体模型输入量如表1所示。

表1 预测模型输入变量Table 1 The prediction model input variables

3.2 异常值判定和缺失值填充

各系统平台源数据的真实性和可靠性对浮选钼精矿品位软测量模型的准确度起着关键性作用。实际上因选厂环境复杂、人为操作不当和设备测量异常等原因导致实测数据与真实数据存在较大误差,影响浮选钼精矿数据库质量,降低浮选钼精矿品位软测量模型的准确度。因此,采集的源数据使用前需经过异常值判定和缺失值填充等数据预处理方法,提高模型输入变量的质量。

(7)

(8)

常用异常值检测方法有:统计分析法、3σ原则[17]、箱线图[18]等,采用3σ原则进行异常值判定。3σ原则:假设一组检测数据含有随机误差,数据进行计算处理得到均值μ和标准差σ,按概率函数确定一个正常值区间(μ-3σ,μ+3σ),当样本中某一数据超过这个区间,就不属于随机误差而判定为粗大误差,含有该误差的样本数据应予以剔除。

异常值经判定策略执行剔除处理,将导致样本数据部分缺失,影响数据库的完整性。针对缺失数据的常用预处理方法包括均值填充法、中位数填充法、众数填充法等[19-20],实验采取均值填充法,在一定程度上保留数据的真实性和可靠性。

3.3 数据降噪

东坡选厂自动化程度较高,选厂关键位置均安装大量传感器,用于数据的传输、处理、显示、记录和控制等,实现了选厂自动化检测和数据实时传输。鉴于浮选工艺复杂、设备故障、溶液环境等影响,传感器难以长期稳定工作,造成传感器采集的数据存在大量噪声,从而影响模型性能。针对上述传感器采集的数据集中进行数据降噪,实验采取小波变换[21-22]。具体参数为:Sym8小波基、3层小波分解、软硬阈值折中法,以全浮扫选-BK205药剂用量为例,数据经小波变换结果如图4所示。

图4 小波变化结果Figure 4 Results of wavelet transform.

分析整理柿竹园东坡多金属各系统平台的数据源,筛选确定影响浮选产品质量的主要因素,建立以每天两班浮选工艺源数据的选厂浮选钼精矿品位时间序列数据库。将平台采集的数据经异常值判定、缺失值填充、数据降噪等数据预处理方法,获得617个样本数据,将样本数据库的80%作为浮选钼精矿品位软测量模型的训练集,数据库的20%作为测试集用于验证模型的准确度。

4 基于LSTM的浮选钼精矿品位软测量模型

4.1 浮选钼精矿品位模型构建

样本数据进行模型训练时,神经网络结构参数的选择尤为重要,直接影响模型的准确度。模型通过前向传播算法,计算预测值与真实值的误差,更新网络结构权值和阈值,满足训练要求,寻找最优LSTM模型,评估模型性能指标,输出预测值和保存最优模型。基于LSTM的浮选钼精矿品位软测量模型流程如图5所示。

图5 软测量模型流程Figure 5 Soft measurement model process.

4.2 模型性能指标评估

实验采取均方根误差(Root Mean Squared Error,RMSE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)和决定系数(Coefficient Of Determination,R2)对浮选钼精矿品位软测量模型性能指标进行评估,其计算公式为:

(9)

(10)

(11)

5 模型验证与分析

5.1 实验参数

实验机器内存为32 GB,GPU为NVIDIA GeForce RTX 3060,神经网络模型采用PyCharm软件进行编码。基于LSTM的浮选钼精矿品位软测量网络模型结构和参数设置如表2所示。

表2 模型结构和参数设置Table 2 Model structure and parameter settings

5.2 结果分析

确保模型输入数据的统一性,通过对比Linear模型、CNN模型与LSTM模型在测试集中的预测结果,真实值与预测值的对比如图6~8所示。上述三种软测量模型的性能指标进行评估,其结果见表3。不同模型预测值与真实值误差如图9所示。三种软测量模型的真实值与预测值拟合结果如图10~12所示。

表3 模型性能指标评估Table 3 Evaluation of model performance indicators

图6 LSTM模型预测结果图Figure 6 The LSTM model prediction result.

图7 Linear模型预测结果图Figure 7 The Linear model prediction result.

图8 CNN模型预测结果图Figure 8 The CNN model prediction result.

图9 不同模型预测值与真实值的误差Figure 9 The error between the predicted and true values of different models.

图10 Linear模型真实值与预测值的拟合结果Figure 10 The fitting result of the real value and the predicted value of the Linear model.

图11 CNN模型真实值与预测值的拟合结果Figure 11 The fitting result of the real value and the predicted value of the CNN model.

通过观察真实值与预测值的对比图可看出,Linear模型和CNN模型预测效果一般,在大部分样本数据的预测值与真实值偏差很大,尤其是样本数据出现突变时,模型误差会增大。由图7、8、10、11和表3可以看出Linear模型预测准确度较低,其MAPE=3.46%,RMSE=2.1646%,在3种模型中效果最差,真实值与预测值R2仅为0.300 2,拟合结果一般。CNN模型预测性能指标评估结果(MAPE=1.72%,RMSE=1.1453%),比Linear模型好,其R2为0.673 5,拟合效果较好。这是因为Linear模型为线性回归,模型对于高维数据处理能力较低,而浮选钼精矿品位数据量大、强非线性和强耦合,导致模型泛化能力降低,预测误差大,拟合效果一般。CNN模型在多层神经网络基础上,加入卷积层、激活层和池化层操作以及局部权重共享结构,可以较好地处理高维数据和网络并行学习,很好地提高了模型预测准确度。

LSTM作为一种特殊的循环神经网络RNN,引入输入门、输出门、遗忘门控制机制可有效地传递或选择性丢弃长时间序列中的信息,从而实现记忆或遗忘的功能,解决了循环神经网络RNN中长序列依赖、梯度消失和爆炸等问题。试验LSTM模型采用BatchNorm批量规范化处理样本数据,加入Dropout正则化防止过拟合,进一步提高模型预测准确度,增强模型的泛化能力。从图6、图12和表3可知,其MAPE=1.13%,RMSE=0.7049%均为实验模型最低值。以MAPE为例,LSTM模型预测误差分别比Linear模型和CNN模型降低了2.33%和0.59%。经LSTM模型训练后预测值与真实值决定系数R2为0.876 3,拟合效果很好。从图9可看出,相对于Linear模型和CNN模型的样本数据误差波动,LSTM模型误差波动相对平稳,浮动范围小,浮选钼精矿品位误差≤±2.45%,充分说明基于LSTM的浮选钼精矿品位软测量模型可以实现钼精矿品位软测量的需求。

图12 LSTM模型真实值与预测值的拟合结果Figure 12 The fitting result of the real value and the predicted value of the LSTM model.

6 结论

1)针对浮选钼精矿品位数据量大、强非线性、强耦合和难以准确预测等问题,收集及分析东坡稀有多金属选矿厂各系统平台数据源,筛选影响浮选钼精矿的变量,将各平台数据源进行数据预处理,建立柿竹园东坡稀有多金属选厂浮选钼精矿品位时间序列数据库。

2)结合LSTM模型处理时间序列信息的优势,构建基于LSTM的浮选钼精矿品位软测量模型,选择MAPE、RMSE和R2用来评估浮选钼精矿品位软测量模型性能指标。

3)结果表明基于LSTM的浮选钼精矿品位软测量模型预测效果良好,相比于Linear模型和CNN模型,LSTM模型对浮选钼精矿品位预测的MAPE和R2,分别为1.13%和0.876 3。基于LSTM的浮选钼精矿品位软测量模型,预测准确度高,模型泛化能力强。针对于现场人工化验方式大大滞后于浮选生产过程,本文提出的浮选钼精矿品位软测量方法,有助于浮选工根据预测结果实时判断浮选产品质量调整工艺参数,对节约药剂用量、提高浮选产品质、选厂智能化建设等方面起着非常关键的作用。

猜你喜欢
选厂精矿预测值
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
高硫铜钴精矿焙烧-酸浸试验
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
大宝山铜硫选厂扩产改造及生产实践
法电再次修订2020年核发电量预测值
浅谈选厂常见挡土墙设计
钼精矿沸腾焙烧铜、铁行为研究
高锑金精矿浸出试验研究
高频振网筛在180 万t/a 选厂的运用及实践
选矿厂沉淀池回水利用的研究