基于GA-ELM 的稀土混合溶液多组分含量预测

2021-01-15 07:18:28陆荣秀何权恒朱建勇
计算机工程 2021年1期
关键词:权值稀土组分

陆荣秀,何权恒,杨 辉,朱建勇

(1.华东交通大学 电气与自动化工程学院,南昌 330013;2.江西省先进控制与优化重点实验室,南昌 330013)

0 概述

多组分稀土溶剂萃取分离流程[1]是国内外稀土分离企业从稀土共生矿中获取单一、高纯稀土元素广泛采用的工艺。能否快速检测组分含量直接影响稀土萃取过程关键工艺参数调节的实时性,关系到萃取过程两端出口产品的质量,是稀土萃取过程优化控制的首要条件。目前,在大多数稀土分离企业中,仍采用“定时采样、离线实验室化验”[2]的方式获取组分含量值,该方法虽然准确、可靠,但严重滞后,不能满足实时性的要求,易导致次品、废品。现有基于设备改造的现场检测方法,如XRF 分析法、分光光度法等[3-4],均普遍存在所需硬件装置结构复杂、可靠性低、使用和维护成本高的特点,不能在各稀土分离企业推广使用。因此,研究稀土萃取分离过程组分含量快速检测方法势在必行。

鉴于稀土元素具有特殊的电子层结构,部分稀土离子在可见光区域能呈现特征颜色[5],为采用快速、准确且可连续检测的机器视觉技术[6-7]提供了可行途径。文献[8]以实验室条件下采集的Pr/Nd 溶液为研究对象,在HSI 颜色空间下采用最小二乘方法建立了H 分量一阶矩与组分含量之间的关系模型。文献[9]采用实验对比方法确定了稀土混合溶液的采集条件,并采用BP 神经网络建立了颜色特征分量与Nd 元素组分含量的数学模型。文献[10-11]分别采用最小二乘支持向量机(LSSVM)和多RBF 神经网络研究颜色特征分量与组分含量的关系模型及其自适应校正方法。但以上方法的研究对象为两者均具有离子特征颜色的稀土混合溶液。在多组分稀土萃取分离体系中,具有离子颜色特征和无离子颜色特征的稀土萃取段非常普遍,目前尚未有稀土科研工作者对这种情况下的组分含量快速检测进行系统研究,已有基于机器视觉技术的组分含量快速检测方法也不能直接用于此种工况。为此,需针对具有颜色特征和无颜色特征的稀土离子共存工况下的多组分萃取体系,进一步探讨既快速又能准确检测多组分含量的方法。

本文在上述研究的基础上,以具有颜色特征的Pr、Nd 离子和无颜色特征的Ce 离子共存的CePr/Nd萃取溶液为研究对象,采用实验对比的方法确定溶液图像特性,利用具有准确率高、学习速度快、泛化性能好等优点的极限学习机(ELM)方法[12-13],建立基于颜色特征的稀土萃取过程多组分含量的预测模型。针对ELM 的输入层到隐含层的权值及隐含层阈值具有的随机性,本文采用遗传算法(GA)进行优化,并基于某稀土分离企业CePr/Nd 萃取生产现场数据,从建模算法和优化算法两方面考虑,将本文提出的组分含量GA-ELM 模型与ELM、BP、LSSVM 以及GA-BP、PSO-ELM 算法进行仿真对比。

1 稀土萃取溶液颜色特性

在广泛采用的稀土溶剂萃取分离全流程中,虽然所有萃取段均为两出口的流程工艺[14],但不同工艺段包含的稀土元素组分不同、含量各异,且这些稀土离子有些可以表现出离子特征颜色,有些则为无色,如表1 所示。

表1 稀土离子的特征颜色Table 1 Characteristic color of rare earth ions

由表1 可知,在多组分稀土萃取分离体系[15]中,从稀土共生矿中获取单一高纯的稀土元素,包含了大量有颜色特征和无颜色特征的稀土离子共存的萃取工段。为明确有颜色特征和无颜色特征的稀土离子共存的稀土混合溶液图像特性,以CePr/Nd 萃取混合溶液为研究对象,与均具有颜色特征的Pr/Nd 混合溶液进行实验对比。实验方法及过程如下:

1)在两份浓度、体积和组分含量均相同的Pr/Nd混合溶液中,按要求分别滴入浓度和体积均相同的无色溶液CeCl3和HCl,获得浓度和体积一致的CePr/Nd 混合溶液和Pr/Nd 混合溶液。

2)在相同的图像采集条件下,采集两种混合溶液的图像。

3)在HSI 颜色空间分别提取溶液图像的H、S、I特征分量,并计算其一阶距,结果对比如图1 所示。从图1 可以看出:(1)有颜色特征和无颜色特征的离子共存下的CePr/Nd 混合溶液图像,与两者均具有颜色特征的Pr/Nd 混合溶液图像在HSI 空间下的颜色特征值均不相同,表明在有颜色特征和无颜色特征的稀土离子共存条件下,需要进一步探讨组分含量快速预测方法;(2)随着CeCl3溶液加入Pr/Nd 混合溶液的体积越来越大,混合溶液中Ce 组分的含量逐渐增大,分析图1 中H、S、I 特征分量与CePr/Nd 混合溶液的体积变化曲线,发现H、S 一阶矩均与组分含量Ce 呈一一对应关系。

为确定颜色特征分量与组分含量之间的关系,整理CePr/Nd 混合溶液图像的H、S、I 特征分量与Pr、Nd 元素组分含量之间的关系,如图2 所示。

图1 2 种溶液图像的H/S/I 特征分量一阶矩对比Fig.1 First-order moment comparison of H/S/I characteristic components of two solution images

图2 H/S/I 分量一阶矩与Pr、Nd 组分含量关系Fig.2 Relationship between the first moment of H/S/I components and the content of Pr and Nd components

分析图2 可以发现,只有H、S 分量一阶矩与Pr、Nd 组分含量单调性较好。综合图1 和图2,本文选择H、S 分量作为稀土萃取过程多组分含量模型的辅助变量。鉴于CePr/Nd 混合溶液中的Ce、Pr、Nd 3 种元素的组分含量之和为100%,若得到其中两个组分的含量,则可知第3 个组分的含量,故本文选择Pr、Nd 元素的组分含量为模型输出变量。

2 ELM 基本原理

极限学习机(ELM)是一种新型单隐层前馈神经网络。ELM 算法随机产生输入层到隐含层的权值矩阵及隐含层的阈值矩阵,且在训练过程中无需调整,只需要确定隐含层节点个数,便可以获得唯一的最优解。与传统训练方法相比,ELM 具有准确率高、学习速度快、泛化性能好以及参数调节少等优点。根据第1 节,稀土萃取过程多组分含量ELM 模型结构如图3 所示。

图3 ELM 模型结构Fig.3 Structure of ELM model

在图3 中,X={xH,xS}∈ℝn×2,xH、xS分别为稀土混合溶液样本图像的H、S 分量一阶矩,可表示为xH=[xH1,xH2,…,xHn]T∈ℝn×1,xS=[xS1,xS2,…,xSn]T∈ℝn×1,l=1,2,…,n表示稀土混合溶液样本。稀土混合溶液样本中对应的Pr、Nd 组分含量分别为y1=[y11,y12,…,y1n]T∈ℝn×1,y2=[y21,y22,…,y2n]T∈ℝn×1,当隐含层节点个数为L时,ELM 神经网络的输出可以表示为:

其中,g(·)为激励函数,可选用RBF、sine 或sigmoid等函数,t为输出变量个数,L为隐含层个数,ω={ω1,ω2},ωj=[ωj,1,ωj,2,…,ωj,L]T,j=1,2 为输入权重,β={β1,β2},βt=[β1,t,β2,t,…,βL,t]T,t=1,2 为隐含层到输出层的权重,b={bi}是阈值矩阵,bi是第i个隐含层节点的阈值,ωi·xj表示ωi和xi的内积。

通过对权值矩阵和阈值矩阵的训练,可实现模型的输出值与组分含量实际值的误差趋近于0,即:

其中,H={H1,H2}是隐含层节点的输出,Y={y1,y2}为模型的组分含量输出值。

由式(4)可知,输入权重ω和隐含层的偏置矩阵b一旦确定,隐含层的输出矩阵H就被唯一确定,进而ELM 模型(即式(1))的输出值也唯一确定。

根据上述推导过程可知,训练ELM 前馈神经网络模型可以转化为求解一个线性系统最小二乘的问题,此外,ELM 的输出对权值矩阵和偏置矩阵的初值依赖性较高。

3 稀土混合溶液多组分含量模型

鉴于ELM 神经网络模型对权值矩阵和偏置矩阵初值的设定依赖性较强,而这些矩阵的设定具有随机性,容易造成模型精度下降。遗传算法(GA)作为一种随机并行搜索算法,具有鲁棒性优良、全局索引能力强[16]等优点,尤其针对局部最优的问题拥有极佳的全局把控能力。因此,本文采用GA 对ELM模型权重和阈值进行优化设定,以提高CePr/Nd 组分含量ELM 模型的预测精度。基于GA-ELM 的多组分含量模型的流程如图4 所示。

图4 基于GA-ELM 的多组分含量建模流程Fig.4 Multi-component content modeling procdure based on GA-ELM

图4 对应的具体步骤如下:

1)数据采集:将从稀土萃取生产现场采集到的混合溶液图像,在HSI 颜色空间提取出H、S 颜色特征分量,与溶液中对应的组分含量组成输入输出对数据集。

2)数据预处理:由于各特征分量以及组分含量值表示的物理含义不同,为防止各分量数量级不一致对训练结果造成干扰,并提高网络的收敛速度[17],对数据集进行归一化处理,所有数据均归一化到[0~1]范围。

3)确定ELM 模型结构并初始化:根据数据集的特点确定模型结构,并据此初始化权值矩阵和阈值矩阵。

4)采用GA 对ELM 的权值矩阵和阈值矩阵优化设定:

(1)设置初始值。确定种群大小、最大进化代数、交叉概率、变异概率等参数,并对步骤3)中随机产生的权值ω和阈值b进行二进制编码,作为GA 的初始种群。

(2)适应度函数。适应度值是描述个体性能的主要指标,适应度函数的选取直接影响到GA 的收敛速度以及是否能获取最优解。本文将训练集样本预测的平均相对误差作为个体适应度函数,表达式为:

其中,ytk(t=1,2)为Pr、Nd 测试样本的模型输出值,为Pr、Nd 测试样本的组分含量真实值,N为测试样本数。

(3)遗传算法。遗传算法操作步骤如下:

①选择操作:选择操作是建立在群体中个体的适应度评估基础上的。根据种群中每个个体的适应度值,采用随机遍历抽样法计算出选择概率,按照适者生存的选择策略从上一代种群中挑选出优良个体,将优秀个体的基因遗传给下一代,组建新种群,同时淘汰劣质个体。

②交叉操作:本文选用单点交叉算子,即通过对自然界生物杂交过程的模拟,随机选择一个交叉点,使两个父代个体相互交换尾部基因,以产生子代新个体,达到增强遗传算法搜索能力的目的。

③变异操作:在新种群中任选一个个体,将个体染色体编码串中的一部分基因座上的基因值用其他等位基因来替换,进而形成新的个体。

(4)终止条件。当迭代次数计算到最大进化代数gmax 时,算法终止,返回当前最优权值和阈值组合。

5)ELM 模型确定。当最优权值ω与阈值b确定时,代入式(1),ELM 模型就被唯一确定,即稀土萃取过程多组分含量的ELM 预测模型确定。

至此,采用GA 优化ELM 权值和阈值,建立稀土萃取过程多组分含量模型的过程已全部实现。

4 实验验证

为验证GA-ELM 预测模型对具有特征颜色和无特征颜色稀土离子共存的萃取混合溶液多组分含量快速检测的有效性,从稀土萃取生产现场采集溶液样本图像,提取颜色特征进行模型验证。

4.1 实验数据来源与预处理

以某稀土分离公司为依托,在CePr/Nd 萃取槽体不同时段不同工况下采集102 个混合溶液样品,每一个样品分成两份,一份萃取混合溶液送到实验室化验,得到Ce、Pr、Nd 元素组分含量,它们的元素组分含量分布范围分别在0.005%~69.9%、0.019%~53.30% 和0.01%~99.965%之间,另一份用于采集CePr/Nd 混合溶液图像,并对溶液图像在HSI 颜色空间下提取颜色特征值。根据第1 节的描述,选取与Ce、Pr、Nd 组分含量单调性均较好的H、S 颜色特征分量一阶矩作为模型的输入变量,以Pr、Nd 元素组分含量作为模型的输出变量,得到102 组输入输出原始数据对,对其进行归一化处理后,表示为{X,Y}={xH,xs,y1,y2}∈ℝn×4。为验证模型的有效性,在经过预处理后的102 组数据对中随机选取92 组数据作为模型训练样本,其余10 组数据作为测试样本,分别表示为:

4.2 参数设置

采用遗传算法优化ELM 神经网络模型,首先需要确定ELM 模型的隐含层节点数,然后根据确定的模型结构优化权值矩阵和阈值矩阵。

4.2.1 隐含层节点的确定

ELM 神经网络属于单隐含层前馈神经网络,模型的预测精度与隐含层节点[18]个数紧密相关。隐含层节点数太少会导致ELM 网络“欠拟合”,太多会导致ELM 网络“过拟合”,两种情况均会造成模型预测精度降低。为此,本文借鉴“试错法”的思想[19],为优化测试样本的平均相对误差,通过连续不断地改变系统的隐含节点个数,获得较优的GA-ELM 网络拓补结构。具体方法如下:1)ELM 神经网络隐含层节点个数测试范围定为1~100;2)当模型每次取不同节点个数时分别训练10 次,将每次训练得到的模型计算测试样本最大相对误差绝对值,进行保存并计算平均值;3)将每一个隐含层节点数与10 次训练得到的误差平均值一一对应,并绘图表示出两者之间的变化关系,如图5 所示。

图5 稀土萃取中多组分含量预测模型Fig.5 Prediction model of multi-component content in rare earth extraction

由图5 可知,当隐含层节点个数设置为25 时,训练10 次得到的Pr、Nd 组分含量最大相对误差绝对值的平均值最小,因此ELM 模型的隐含节点L=25。

4.2.2 相关参数设置

根据样本数据特点,参考ELM 和GA 的相关文献[20-21],GA 的相关参数设置如表2所示。由于sigmoid 函数具有严格递增性,并能够调节线性与非线性关系,因此本文选择sigmoid 函数作为激励函数。

表2 GA 参数设置Table 2 GA parameter setting

4.3 仿真结果分析与模型对比

根据上文所述,稀土萃取过程多组分含量ELM模型的输入输出变量个数均为2,隐含层节点为25,则模型结构确定为2-25-2。在4.2 节的参数设定条件下,采用GA 对组分含量ELM 预测模型的权值和阈值进行训练,以式(5)所示的平均相对误差的均值为适应度值,得到遗传算法的进化结果,如图6 所示。从图6 进化过程曲线可以看出,采用遗传算法优化ELM 权值和阈值时具有较好的收敛性,在22 代时已基本收敛至最优权值和最优隐含层阈值。将优化后的权值矩阵和阈值矩阵赋给极限学习机,可由式(1)确定稀土萃取过程多组分含量ELM 模型。

图6 GA 优化ELM 模型权值和阈值的进化过程Fig.6 Evolution process of GA optimized ELM model weights and thresholds

为体现GA-ELM 算法在CePr/Nd 萃取过程多组分含量预测方面的优越性,将对比模型调至为最优参数下的模型,以及在训练样本和测试样本均相同的条件下进行如下对比实验:

1)采用常用的BP 神经网络、LSSVM、ELM 神经网络建立多组分含量模型。

2)采用GA 优化BP 神经网络模型与ELM 神经网络模型(即本文方法)进行仿真实验对比。

3)采用粒子群优化(PSO)算法优化ELM 模型,与GA-ELM 模型进行实验对比。其中ELM 神经网络模型采用2-25-2 结构,BP 神经网络模型采用2-20-2 结构。模型性能以式(8)~式(10)所示的平均相对误差(MRE)、均方根误差(RMSE)和相对误差3 个指标进行衡量。采用训练集Tte中的测试样本数据对6 种模型进行测试,可得到如图7、图8 所示的相对误差,对应的测试性能指标值RMSE、MRE 和最大相对误差绝对值如表3 所示。

图7 6 种模型测试时Pr 元素组分含量的相对误差Fig.7 Relative error of Pr element content in six model tests

图8 6 种模型测试时Nd 元素组分含量的相对误差Fig.8 Relative error of Nd element content in six model tests

表3 6 种模型测试的性能指标值Table 3 Performance indicators for the six model tests

由图7、图8 和表3 可以看出:

1)ELM 模型与BP 模型测试结果比较,即对比基于ELM 网络、BP 网络的元素组分含量模型测试结果,从中可以发现,组分含量ELM 模型测试得到的平均相对误差MRE、均方根误差RMSE 和相对误差绝对值的最大值Max|error|3 个性能指标值总体优于组分含量BP 模型的性能指标值,说明ELM 网络比BP 算法更适合稀土混合溶液多组分含量预测。

2)GA 优化性能分析,从两个方面进行GA 优化性能的对比分析,一方面是对比组分含量BP 和GABP 模型、ELM 和GA-ELM 模型测试结果,从中可以发现,采用GA 优化参数后的组分含量GA-BP 和GA-ELM 模型的3 个测试性能指标值均较低,而组分含量BP 和ELM 模型测试性能均有很大提高,另一方面是对比GA-ELM 模型与PSO-ELM 模型测试结果,发现前者的性能指标值更低,说明采用GA 进行ELM 模型参数优化,能有效降低预测模型的误差,提高模型的预测效果。

3)GA-ELM 模型与LSSVM 模型进行比较,前者的测试结果性能指标值更低,说明GA-ELM 方法更适用于稀土萃取过程多组分含量预测。由表3 可知,相比于GA-BP 模型、LSSVM 和PSO-ELM,组分含量GA-ELM 模型对Pr 和Nd 元素组分含量的测试性能指标MRE、RMSE 和Max|error| 分别降至1.761 4%、0.635 8、3.982 0% 和1.852 4%、1.146 1 和3.625 4%,这些性能参数值均相对较低,最大相对误差都在±4%以内,低于稀土分离企业对组分含量检测误差在±5%的最低要求。

5 结束语

在稀土萃取流程中,具有颜色特征和无颜色特征的稀土离子在共存情况下稀土元素组分含量难以快速检测。为此,本文采用实验的方法确定混合萃取液的图像特性,提出一种基于ELM 神经网络模型的稀土萃取过程多组分含量预测方法。运用遗传算法对ELM输入权值矩阵和隐含层阈值进行优化,基于CePr/Nd 萃取分离生产线采集的溶液样本数据,通过对比分析BP、ELM、LSSVM、PSO-ELM、GA-BP 和GA-ELM 6 种方法建立组分含量模型。实验结果表明,该方法具有更高的预测精度和更好的泛化能力,适用于含有颜色特征和无颜色特征离子共存的稀土萃取过程多组分含量的快速准确检测,可为稀土萃取过程各操作变量调节提供可靠的参考依据。

虽然本文方法采用的HSI 颜色空间模型贴近人类视觉对颜色的感知系统,但不同颜色空间的颜色特征侧重点不相同,为弥补单一颜色空间表征图像颜色特征信息的缺失,下一步将尝试在多个颜色空间寻找更适合表征具有颜色特征和无颜色特征离子共存的稀土混合溶液图像的特征,以获得精确度更高、泛化能力更好的多元素组分含量预测模型,同时将从稀土萃取过程机理出发,研究更适合稀土萃取生产现场的多组分含量快速检测的算法。

猜你喜欢
权值稀土组分
中国的“稀土之都”
一种融合时间权值和用户行为序列的电影推荐模型
组分分发管理系统在天然气计量的应用
一种难溶难熔未知组分板材的定性分析
CONTENTS
CONTENTS
稀土铈与铁和砷交互作用的研究进展
四川冶金(2019年5期)2019-12-23 09:04:36
黑顺片不同组分对正常小鼠的急性毒性
中成药(2018年8期)2018-08-29 01:28:26
金雀花中黄酮苷类组分鉴定及2种成分测定
中成药(2018年2期)2018-05-09 07:20:09
废弃稀土抛光粉的综合利用综述