基于卷积神经网络的近红外光谱多组分定量分析模型研究

2024-09-02 00:00:00于水宦克为王磊刘小溪韩雪艳
分析化学 2024年5期
关键词:近红外光谱定量分析卷积神经网络

摘要 近红外光谱分析技术已成为食品、农业和医药等领域中质量监控的重要分析手段。本研究提出了一种基于卷积神经网络的近红外光谱多组分定量分析模型(MulCoSpecNet),此模型由1 个编码解码模块、1 个专家模块、1 个门控模块、1 个多组分定量预测模块和1 个超参数优化器组成。编码解码模块通过上采样和下采样方式降低光谱噪声以及随机误差,提高光谱信噪比;专家模块和门控模块利用不同权重构建不同子光谱;多组分定量预测模块采用卷积和池化等操作提高模型的预测精度和泛化能力;超参数优化器在超参数空间中同步优化超参数。本研究以公共的谷物和玉米近红外光谱数据为例,将MulCoSpecNet 预测结果与偏最小二乘法(PLS)、极限学习机(ELM)、支持向量回归法(SVM)和神经网络(BP)结果进行比较。结果表明,与PLS 相比, MulCoSpecNet 在谷物和玉米数据集上预测精度分别提高了25.5%~45.2%和10.0%~35.7%;与ELM 相比, MulCoSpecNet 预测精度分别提高了17.8%~38.6%和18.2%~37.2%;与SVM相比, MulCoSpecNet 预测精度分别提高了33.6%~47.0%和31.3%~50.7%;与BP 相比, MulCoSpecNet 预测精度分别提高了2.0%~58.5%和29.6%~48.6%。基于卷积神经网络的MulCoSpecNet 近红外光谱多组分预测模型有效地解决了预测精度低以及泛化能力差等问题,为建立无损高精度的近红外光谱多组分定量分析模型提供了理论基础。

关键词 近红外光谱;深度学习;卷积神经网络;多组分;定量分析

随着化学计量学的不断发展,近红外光谱分析技术(Near infrared spectroscopy, NIRS)在农业[1]、石化[2-3]、医药[4]、食品[5]和饲料[6]等领域得到了广泛应用。NIRS 作为一种过程分析技术,具有快速、无损等特点,被广泛用于样品的在线分析检测[7]。建立具有预测精度高和泛化能力强的定量分析模型是近红外光谱分析技术的关键。目前,常用的近红外光谱建模方法有偏最小二乘法(Partial least squares,PLS)[8]、极限学习机(Extreme learning machine, ELM)[9]、支持向量回归法(Support vector machine,SVM)[10]和BP 神经网络(Back propagation neural network, BP)[11]等。然而,随着NIRS 的不断发展,常用的近红外光谱建模方法面临预测精度低、非线性特征处理差以及过拟合风险高等难题,导致模型无法有效地表征近红外光谱与物质化学值之间的内在关联。深度学习能够有效地处理近红外光谱中的线性和非线性特征信息[12]。在各种深度学习模型中,卷积神经网络(Convolutional neural network, CNN)被广泛用于近红外光谱的定性和定量分析[13]。例如, Liu 等[14]利用一维CNN 对葵花籽霉变进行了定性分析;Zhang 等[15]利用一维CNN 对玉米蛋白质、小麦蛋白质、土壤有机碳等进行了近红外光谱定量分析;王磊等[16]建立了一维CNN 模型,并对玉米油、柴油十六烷值、啤酒酵母等多种样品化学值进行了定量分析;Yu 等[17]将一维CNN 与多种预处理方法相结合对啤酒酵母、牛奶蛋白质、谷物水分进行了近红外光谱定量分析;Ma 等[18]将时间频率分析与一维CNN 相结合对烟草样品中的总糖、还原糖和尼古丁等化学成分进行了定量分析。然而,上述的一维CNN 近红外光谱预测模型多针对某个样本中单一组分进行预测,对多组分预测仍有较大局限性。因此,建立一种基于CNN 的近红外光谱多组分定量分析模型尤为重要。

本研究提出了一种基于卷积神经网络的近红外光谱多组分定量分析模型(Multicomponent spectral"network, MulCoSpecNet),引入了多任务多专家(Multi-gate mixture-of-experts, MMoE)[19]思想,实现了多门控与多专家相结合,提高了模型的预测性能。编码解码模块通过上采样和下采样,能够有效降低噪声,提高光谱信噪比。门控模块通过不同的门控网络得到权重并融合专家模块输出的特征光谱,使模型能够捕捉不同任务之间的差异性。多组分定量预测模块通过提取多个卷积层、池化层和全连接层的线性和非线性特征,学习多维特征信息,避免模型过拟合,提高模型预测精度。在公共的谷物和玉米近红外光谱数据集中,与PLS、ELM、SVM和BP神经网络模型相比, MulCoSpecNet模型具有更好的预测精度和泛化能力。

猜你喜欢
近红外光谱定量分析卷积神经网络
基于深度卷积神经网络的物体识别算法
大规模古籍文本在中国史定量研究中的应用探索
FTA在工业气体探测报警系统中的应用
软件导刊(2016年11期)2016-12-22 21:55:04
基于近红外光谱法的藜麦脂肪含量快速检测
商务英语词汇量与商务英语阅读能力相关性研究
国外艺术体操科研现状
体育时空(2016年9期)2016-11-10 20:23:55
深度学习算法应用于岩石图像处理的可行性研究
软件导刊(2016年9期)2016-11-07 22:20:49
基于深度卷积网络的人脸年龄分析算法与实现
软件工程(2016年8期)2016-10-25 15:47:34
洛伐他汀胶囊近红外一致性检验模型的建立
基于卷积神经网络的树叶识别的算法的研究