量子遗传-神经网络算法的润滑油动力粘度值可见近红外光谱分析

2020-05-29 08:22刘晨阳唐兴佳王泰升卢振武鱼卫星
光谱学与光谱分析 2020年5期
关键词:权值润滑油遗传算法

刘晨阳,唐兴佳,于 涛,王泰升,卢振武,鱼卫星*

1. 中国科学院长春光学精密机械与物理研究所精密仪器与装备研发中心, 吉林 长春 130033 2. 中国科学院大学, 北京 100049 3. 中国科学院西安光学精密机械研究所,中国科学院光谱成像技术重点实验室, 陕西 西安 710119

引 言

润滑油之于高铁变速箱如同血液之于人体,具有冷却、密封、防腐、防锈、清洗杂质等作用。润滑油动力粘度[1-3]是衡量润滑油在一定温度下抵抗流动的能力,其检测是对液体在流动时内部摩擦力进行具体的测量,采用毛细血管粘度计测定润滑油的粘度。动力粘度对于润滑油不仅是最重要的报警依据,也是对润滑油品质的重要划分依据之一。目前,高铁变速箱润滑油仍需要在实验室的条件下进行检测,用于测量润滑油粘度的标准测试方法是ASTM D445,费时、费力而且需要专业人员操作。微型光谱仪[4]由于具有性能优良、体积小巧、价格便宜等优势,使其拥有越来越多的优势。1990年,Goldman等研制出基于平面波导和光栅的集成分光器件的波导光谱仪,此后可见-近红外光谱分析已广泛的应用于农业、化工、食品、医药等领域[3, 5-10],在润滑油粘度,含水量,污染度等方面的检测中都有所应用。Ricardo[2]等报道了基于近红外化学计量预测模型建立光谱法定量测定齿轮电机润滑油的运动粘度(37.1~93.1 cSt),其预测均方误差和相对平均误差分别为1.86%和2.97%(遗传算法),2.36%和2.97% (间隔偏最小二乘)。Jez Willian[1]介绍了一种基于红外光谱的多变量分析针对润滑剂粘度指数测定方法的研制和验证,适用于81个不同生产商/品牌的润滑油。赵芸等采用美国ASD公司生产的可见近红外光谱波段的Handheld Field Spec快速测定发动机润滑油动力粘度值方法,其中预测均方误差和决定系数分别为0.006 6和0.988 1(支持向量机)。虽然前人做了很多相关研究,但是应用微型光谱仪定量分析润滑油动力粘度方面的应用还少有报道,因此为微型光谱模块作为便携式甚至在线监测光谱仪器仍具有巨大的发展机会。

同时随着计算机技术的快速发展,可见-近红外光谱分析着重通过化学计量学的方法来进行定量或定性分析。迄今为止,提取有效信息变量,剔除无用变量仍然具有一定的物理意义。BP神经网络算法[11]是Rumelhart等在1986提出的,它是向前网络的核心,也是神经网络中的精华部分。BP神经网络具有优异的非线性拟合性能但也存在一些缺点,例如网络结构的确定、初始权值以及阈值的随机设定将导致其收敛速度慢并且容易陷入局部最小值。在BP神经网络的预测模型中,初始权值以及阈值的选择都对预测精度和性能起到关键作用。量子遗传算法[12-13]是采用量子染色体的形式,其有两个优点: 一是单个量子染色体携带了多个状态信息,故比遗传算法的进化操作带来更丰富的种群; 二是量子遗传算法中的变异和交叉是等效的,因此在该算法中只需对量子染色体采用变异操作。本文基于BP神经网络的局部精确搜索以及量子遗传算法的全局搜索特性,用量子遗传算法来优化神经网络的阈值和权重,从而提高建模效率和精度,以期为开发微型光谱仪的无损检测装置,实施油品检测过程中动力粘度的在线检测提供依据。因此,我们提出了利用微型可见-近红外光谱仪进行实时光谱数据采集,结合量子遗传-神经网络算法进行润滑油粘度定量分析,实现实时在线润滑油粘度检测。

1 实验部分

1.1 仪器

实验所用光谱仪为可见-近红外两种微型光谱仪模块拼接而成。微型光谱仪是INSION公司生产的INSION波导型光谱仪,可见短波近红外模块的工作波段为330~1 100 nm,光谱分辨率为10 nm, 光学模块尺寸为54 mm×31 mm×9.1 mm; 近红外微型光谱模块工作波段为900~1 700 nm, 光谱分辨率为16 nm,光学模块尺寸为67 mm×36 mm×22 mm。两个光谱仪模块采用一分二的光纤进行拼接,光源采用5 W的卤钨灯,实验装置示意图如图1所示。数据处理在MatlabR2014a中进行。

图1 用于测量不同粘度值润滑油的光谱实验系统图Fig.1 Experimental system for the spectral measurement of the oils with different viscosity values

1.2 润滑油样本的制备与动力粘度测定

润滑油样本是购买的VHG labs十三种不同粘度值的标样润滑油,每瓶标样都是来自符合ISO 9001及ISO Guide 34规定的工厂,而且通过了ISO/IEC 17025实验室的认证。其粘度值如表1所示。光谱数据采集时,将样本倒入宽10 mm,

表1 实验样本的动力粘度值Table 1 Dynamic viscosity values of experimental samples

长10 mm的石英比色皿中,每种样本制作6个,共78个样本,采用透射测试模式对每个样本光谱扫描采样4次,求其平均值,从而减少随机误差。采集过程中每个样本均在恒温电热板上保证采集样本为40 ℃。

1.3 数据预处理

原始光谱数据中除了包含有用的化学信息之外,还包含大量的无关信息。因此,在建立模型之前需要进行光谱预处理。图2(a)显示了不同动力粘度值润滑油的可见-近红外吸收光谱,可以看出在近红外部分,光谱曲线基线偏移严重,所以我们采用Savitzky-Golay卷积平滑进行数据预处理,平滑窗口大小为5,并对其进行一阶求导。图2(b)为吸光度光谱的一阶导数光谱,从中可以看出一阶求导可以有效地消除基线漂移和背景噪声。由于样本采集量较多,因此在采集过程中很容易出现界外样本,会对建模和预测结果产生很大的影响。我们采用主成分分析(PCA)和马氏距离(MD)相结合的方法来识别浓度界外样本,剔除了3个界外样本,主成分分析法对数据作降维处理。

图2 不同动力粘度润滑油的(a)可见近红外光谱的吸光度和(b)其一阶导数

Fig.2 Vis-NIR absorbance spectra (a) and first derivation spectra (b) of lubricant with different Kinematic Viscosity values

1.4 BP神经网络模型

BP神经网络是一种基于误差反向传播的多层前馈网络,主要包括三个部分: 输入层、隐含层以及输出层。它需要对输入和输出变量、隐含层网络数、隐含层节点数、初始权值、传输函数、学习算法、学习速率和终止条件等网络参数进行选择和设置。基本过程大致是数据由输入层输入,并施以权重传输到隐含层,隐含层经过权值、阈值和激励函数运算后,传输至输出层,输出层给出神经网络的预测值,若与期望值的误差不符合终止条件,则从输出开始进行反向误差传播,进行权值、阈值的调整,如此循环,直到满足设置的终止条件。

1.5 量子遗传-神经网络模型

量子遗传算法(quantum genetic algorithm, QGA) 把量子态矢量的表达引入遗传编码中,并利用量子逻辑门来实现染色体的演化,是量子计算和遗传算法相结合的一种概率进化算法。在量子计算中,信息单位用量子位表示,一个量子位的状态可能是1状态,0状态,或者是两个状态的叠加,因为量子位的状态可以表示为[13-14]

|Ψ〉=α|0〉+β|1〉

(1)

其中α和β是复数,表示对应状态的概率振幅。

α2+β2=1

(2)

采用多量子位编码m个参数的基因如式(3)所示

(3)

量子旋转门是量子遗传算法的演化操作执行机构,旋转门在这里使用通用的、与问题无关的调整策略,量子旋转门的调整操作为

(4)

其更新过程为

(5)

本文基于量子遗传算法的全局搜索特性,采用量子遗传算法来优化神经网络的权重及阈值,量子遗传-神经网络算法流程图如图3所示,具体流程如下:

(1) 神经网络创建,设置一个输入层,两个隐含层,一个输出层,训练次数为1 000,训练目标为1×10-10,学习速率为0.1。

(2) 对神经网络权值和阈值进行编码,设置种群数目为40,采用随机初始化的方式,得到初始化种群Q(t0), 随机生成n个以量子比特位编码的染色体。

图3 量子遗传神经网络算法流程图Fig.3 Flow chart of QGA and BPNN algorithm

(3) 为使BP网络在预测时得到最小的残差,因此选择预测样本的预测值与实际值的误差矩阵的范数作为量子遗传的目标函数的输出,

(6)

(4) 记录最优个体及其对应的适应度。

(5) 判断计算结果是否满足条件,如果满足可以结束,将权值和阈值赋予新的BPNN得出相应的样本粘度预测值,否则继续计算。

(6) 对种群Q(t)中的每个个体进行测量,得到相应的确定解。对各确定解进行适应度评估;

(7) 利用量子旋转门U(t)对个体实施调整,得到新的种群U(t+1);

(8) 记录最优个体和对应的适应度然后迭代次数t+1,设定终止代数为200,返回步骤(5)。

2 结果与讨论

2.1 BPNN模型的建立

通过对润滑油动力粘度的全波段分析,建立光谱数据与动力粘度的相关关系,将光谱数据经过平滑和一阶导数光谱处理之后作为BPNN模型的输入变量,润滑油的动力粘度作为预测值,建立BPNN预测模型。从75个样本随机抽取10个样本作为预测集,其余65个作为建模集。该模型对润滑油粘度指数的分析结果如表2所示。从表2可见,预测集的决定系数(R2)为0.850 4,预测标准误差(RMSEC)为0.345 5,取得了较好的结果。

表2 不同模型的预测参数Table 2 Prediction parameters by different models

为了进一步提高模型的预测精度,接下来探讨采用QGA-BPNN方法进行建模。

2.2 QGA-BPNN模型的建立

为提高预测润滑油动力粘度的精度,将量子遗传算法优化出的最优权值和阈值作为BPNN模型的参数,建立量子遗传-神经网络模型。每一代中所有种群的均方残差的最小值随着遗传代数的变化情况如图4所示。在训练22代后就得到较好的最优解,又进行了60代的进化,在81代得到最优解。预测集的决定系数(R2)为0.979 9,预测标准误差(RMSEC)为0.029 4。其决定系数接近于1,而且预测标准误差较小,取得了很好的结果。

图4 量子遗传算法的进化过程Fig.4 Evolutionary process of quantum genetic algorithm

两种建模方法的结果如表2所示,BP神经网络预测集的决定系数为0.850 4,预测误差均方根为0.345 5,QGA-BPNN预测集的决定系数为0.979 9,预测误差均方根为0.029 4。可以发现,QGA-BPNN模型的预测集的决定系数比BP神经网络的更接近于1,其预测误差均方根比BP神经网络的更接近于0,结果明显优于BPNN模型。可能原因是经过量子遗传算法优化BP神经网络得到的权值和阈值,并将优化后的参数用于初始化BP神经网络,可以使进化过程中的隐含信息得到全面的利用,从而得到很好的训练和预测结果。

3 结 论

应用可见-近红外微型光谱模块结合QGA-BPNN实现了润滑油粘度的快速无损检测。量子遗传算法有效地利用量子比特编码和量子旋转门操作,能有效地获得BP神经网络可变参数的全局最优解。虽然权值和阈值的优化需要较长时间的运行,但实际运用中可以直接使用优化好的参数,从而可以提高效率。最优的模型预测决定系数(R2)为0.979 9,预测标准误差(RMSEC)为0.029 4。说明应用可见-近红外微型模块快速无损检测润滑油粘度能获得满意的预测精度,为进一步开发实时在线检测润滑油粘度奠定了基础。

猜你喜欢
权值润滑油遗传算法
一种融合时间权值和用户行为序列的电影推荐模型
昆仑润滑油
长城润滑油
CONTENTS
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于权值动量的RBM加速学习算法研究
基于遗传算法和LS-SVM的财务危机预测
基于多维度特征权值动态更新的用户推荐模型研究
软件发布规划的遗传算法实现与解释
长城润滑油