丁跃武,陈方方,杨 友,李四海
(甘肃中医药大学信息工程学院,兰州 730000)
近红外光谱分析技术(near infrared spectros‑copy,NIRs)具有仪器成本低、测试便捷、效率高等特点,一般与机器学习方法结合建立NIRs检测的定性分析模型。但是近红外光谱数据与采集环境、所用仪器等密切相关,不同批次样本的采集具有明显差异且较难取得大量的定标样本,导致传统的浅层网络方法往往存在特征学习能力不足、训练难等问题,其预测结果不佳。化学计量学方法是近红外光谱分析中常用的关键方法,其主要应用在以下六个方面:①异常样品的剔除。②样品集的划分。③光谱预处理方法。④光谱谱区选择方法。⑤分析模型的建立方法。⑥模型的传递与共享。这六个方面对于近红外光谱分析技术的成功最重要的一步是建立鲁棒性好的定性分析模型。目前常见的定性分析模型有主成分分析(PCA)、偏最小二乘−线性判别分析(PLS‑LDA)、支持向量机(SVM)等浅层学习模型。然而,随着大数据时代的来临,光谱数据愈发复杂,浅层学习也许能够有效地处理简单的问题,但在解决复杂问题时,往往会因函数表达能力不足等问题而效果不佳。如今,如何将深度学习与光谱分析结合起来,越来越受到近红外光谱技术研究人员的关注。
深度学习(deep learning)的概念来自于2006年Hinton 教授和他的学生Ruslan 一起发表在Science 杂志上的一篇文章,是在浅层学习结构基础上发展而来的机器学习模型,开拓了机器学习的研究新领域,极大地推动了人工智能行业的发展。近些年,深度学习作为人工智能领域一个新的研究方向,在语音识别、文本鉴别、计算机视觉等多方面有了广泛应用。深度学习是一种对数据进行抽象表达的算法,它能够使用众多基本单元构成复杂的多层网络,在网络中,低层单元的输出作为高层单元的输入,即为自下而上的学习过程,并且在输入与输出之间存在一定的映射关系,依据这一关系来对多层特征进行表达,最终实现样品的预测或分类识别[1]。
目前有大量实验和研究表明,深度学习的方法在定性分析中的准确性优于传统的化学计量学方法和传统的浅层神经网络。如Ni 等[2]发现传统的算法常能够很好地分析近似线性的近红外光谱数据,但深度卷积神经网络在处理非线性模式的数据时效果则相比传统算法更好。一些研究还表明,相比传统的特征选择算法如连续投影算法(SPA),卷积神经网络和深度自编码网络(DAE)能够从光谱数据中提取出更有代表性的特征[3]。大量文献和实验已足以说明深度学习在近红外光谱技术领域发挥了不可比拟的作用,其中最值得一提的有深度卷积神经网络(convolutional neural networks, CNN)、深度信念网络(deep belief network, DBN)和深度自编码器(deep autoencoder,DAE),这三种算法将会成为定性分析领域构建模型的重要基石,其中研究最多的是CNN,而后是AE。本文也将围绕这三个算法介绍近些年深度学习在近红外光谱定性分析领域的研究进展。
与传统的机器学习方法有所不同,卷积神经网络属于一种深层次的前馈神经网络模型。对于输入数据的特征信息,由于CNN的局部连接方式以及权重共享特性,其可以较好地提取关键信息。因此,在文本分类、图像分割领域都发挥着重要的作用。基于卷积神经网络的优化变体有很多,如残差网络、胶囊网络以及Inception[4]。局部连接这种方式可以对数据中的局部信息做出较强的响应,通过稀疏连接的方式从数据中抽取关键特征信息,最大程度减少了卷积神经网络中训练的参数。权重共享的核心在于模型所有的输入数据均使用相同的卷积核进行计算,卷积层也因此具有了平移不变性,模型的计算复杂度也相应得到了降低。图1为卷积神经网络的经典算法LeNet‑5的网络结构。
图1 卷积神经网络LeNet⁃5网络结构
近年来,由于CNN 在高维数据中具有优异的特征提取能力,在图像分类[5]、目标检测[6]等图像任务中取得了巨大成功。在近红外光谱领域,CNN 也参与其中。例如,针对马兜铃酸及其类似物的近红外光谱鉴别,Chen 等[7]提出了1D‑CNN,并取得了较高的性能。鲁梦瑶等[8]提出了一种基于CNN 和近红外光谱技术的烟叶产地分类方法。实验结果表明,在不使用特征提取算法的情况下,该CNN 模型具有较好的准确率。然而,这些网络使用了过多的卷积核来提高性能,增加了网络的参数和计算量。为了提高CNN 的训练效率和实用性,Szegedy 等[9]提出了一种名为Inception 的CNN 结构来近似局部最优稀疏度。由于近红外光谱数据是一维序列,传统的初始结构是为高维数据设计的,不能直接用于一维序列的输入数据。因此,需要对Inception 结构进行改进。Chai 等[10]对刺梨及其仿制品的近红外光谱数据进行了测定。然后,设计了一种改进的基于初始结构的一维卷积神经网络(modified 1D‑Inception‑CNN),用于处理近红外光谱数据,识别刺梨及其仿制品。改进的1D‑Inception‑CNN 具有参数少、计算效率高的特点,使识别模型更加实用。Zhang等[11]在将一维近红外光谱数据转换为二维数据的基础上结合二维卷积神经网络(2‑DCNN)提出一种鉴别烟草产地的方法。实验结果表明,提出的新方法分类准确率为93.05%,可以快速鉴别烟草的产地。Yan 等[12]提出并实现了通过卷积神经网络结合NIRs 数据对植物药产品商业化生产过程的在线实时监控。孟诗语等[13]提出了一种CNN 模型结合NIRs 数据判别木材等级的方法,经过多种数据处理方法的对比,利用已构建的卷积神经网络模型,选取样本识别准确率和模型构建过程中的损失值为判定指标,得到最佳的预处理和数据压缩方法。实验结果证明构建的分析模型可以有效地处理光谱数据和识别区分不同等级木材的关键特征,从而为广阔的木材市场提供一定的技术支持。刘晓瑜[14]创新性地将卷积神经网络算法结合近红外光谱分析应用在对冷鲜猪肉的判别上,其实验表明基于CNN 的判别模型相比传统模型可以获得更好的预测结果,证明基于CNN的冷鲜猪肉判别模型可行且有效;其次,通过对比不同预处理方法、不同训练集数量,探究其对模型预测结果的影响,从多个角度分析了卷积神经网络算法的优势。Liu 等[15]利用卷积神经网络构建分类模型,在几种常见纺织品的NIRs 数据上进行验证,实验结果表明能够实现对几种常见纺织品的分类。Zheng等[16]提出了一种基于CNN 的近红外光谱数据分析方法,现场对9 个品牌的4 种药物进行分类实验,准确率达97.3%,结果表明该方法具有较佳的识别能力。
深度自编码器由多伦多大学教授Geoffrey Hinton 和他的学生Ruslan 在2006 年首次在Sci‑ence 上提出[17],自那之后便作为深度学习领域的研究热点,引起了学术界广泛的关注。DAE是一种典型的深度学习网络模型,不仅广泛应用于海量数据建模,相比传统的浅层学习模型,它具有更优秀的模型表达能力,同时从少量样本集中也能够学习到数据的本质特征。通过使用贪婪算法,将各层网络的重构误差降至最小,同时对每一层网络进行训练,以完成对整个网络的训练。对数据采取白化处理和预处理的同时利用无监督算法对输入的数据在各层进行重构,使网络对数据内部结构特征的学习更加高效。最后再通过对带标签数据使用监督学习算法实现对整个网络的调优。图2为深度自编码器的经典网络结构。
图2 经典深度自编码器网络结构
杨辉华等[18]先为了消除光谱数据内部特征间的相关性,对琥乙红霉素真假药样本的NIRs光谱数据集进行预处理及白化处理,之后结合稀疏降噪自编码网络(SDAE)建立定性分析模型。实验结果表明,相较于BP 神经网络以及SVM 算法,稀疏降噪自编码网络在准确性和鲁棒性方面均更优。路皓翔[19]提出能够有效鉴别柑橘黄龙病的堆栈降噪自编码结合随机森林(SDAE‑RF)方法和压缩自编码结合极限学习机(CAE‑ELM)方法。为了提高SDAE 网络分析模型准确率和缩短运行时间,将随机森林与SDAE结合代替其顶层的Softmax 分类和反向微调阶段;利用引入雅克比矩阵的CAE 网络对样品光谱进行特征提取,通过采用极限学习机代替CAE 网络的Softmax 分类和反向微调阶段,降低CAE 网络时间复杂度的同时提高了预测准确率。甘博瑞等[20]提出一种以堆栈压缩自编码网络(SCAE)为基础建立的光谱定性分析方法,可以取代传统的特征提取方法更好地学习内部结构特征。将此方法应用于多类别药品的光谱分析,可以有效地鉴别不同厂家生产的同种药品。Zhou 等[21]提出了一种在稀疏降噪自编码器(SDAE)基础上构建定性分析模型的方法,结合近红外光谱数据能够有效识别药物。Le[22]通过基于堆叠稀疏自编码器和ELM 相结合的方法构建分析模型,实验结果表明该模型在公开的玉米和水稻的近红外光谱数据集上能够得到优于其他经典NIRS 数据分析方法的准确率。Liang等[23]提出了一种基于稀疏自编码器(SAE)与遗传算法(GA)的MSC‑SAE‑GA 模型。并在小麦籽粒和面粉的NIRs 数据集上进行了研究,实验结果表明提出的NIRs 定性分析模型的分类准确率可达100%。
深度信念网络是Geoffrey Hinton 教授在2006年于Science 杂志上提出,属于人工智能深度学习领域,具有非线性激活功能[24],与传统的浅层学习方法相比,DBN 拥有更复杂的非线性和高层次特征提取能力,对非线性函数的表达能力更强,可以抽取更加有效的特征信息,提高分类和预测的准确率。图3为深度信念网络的经典结构。
图3 经典深度信念网络结构
为快速判别莲子粉的真伪,胡仁伟等[25]提出一种基于近红外光谱技术和深度信念网络(deep belief network,DBN)方法的莲子粉掺杂数据鉴别模型。通过支持向量机(SVM)方法获得莲子粉数据分类的带标签结果,之后使用构建的分析模型对未知样品类别的数据进行判别。实验表明采用DBN 算法可以使模型有效避免局部最优问题和应对无大量标签样本的情况。对于近红外光谱样本数据量大、维度高等问题,以及近红外光谱内部波长间的相关性和与目标值之间的非线性关系,张萌等[26]提出利用深度信念网络算法对近红外光谱数据建模,该算法无需关于光谱数据的先验知识就可以对光谱自身的特征进行提取,只要设置的顶层隐层节点数低于输入光谱的维度,就可以在对光谱数据特征提取的同时也能够对数据降维,实验通过决策系数、均方根误差等模型指标表明了所构建模型的可行性。
王静等[27]提出一种基于DBN 和SVM 相结合的方法构建NIRs 数据的多分类模型。实验证明通过DBN‑SVM 算法构建的模型可以有效地学习NIRs 的特征内部结构并得到很好的分类结果,同时在鲁棒性等各项模型指标上也更优。针对近红外光谱数据特征往往复杂的现象,伏为峰[28]通过深度学习在特征提取阶段展现出的优势与传统分类器良好的分类能力构建分析模型,结合深度信念网络(DBN)与随机森林(RFS)提出了一种新的药品鉴别方法。实验表明,DBN‑RFS具有良好的药品鉴别能力,同时随着数据特征维数的增加,DBN‑RFS 越发体现DBN 在复杂特征下进行特征提取的优越性。Yang 等[29]将Dropout机制与DBN 结合对近红外光谱进行建模,实验表明Dropout‑DBN 方法可以有效避免小样本数据的过拟合问题,鉴别小样本药物的效果相比SVM 等经典商业算法的性能更佳。Wu等[30]结合深度信念网络和NIRs 分析技术提出了一种古陶瓷年代分类方法,实验结果表明相比一些传统的分类方法,提出的方法准确率更高,可达93.5%,证明了DBN方法的优越性。
本文分别对深度学习相关的理论思想作出了介绍,并说明了深度学习相较传统学习方法的优势,着重介绍了卷积神经网络、深度自编码器、深度信念网络三个模型在NIRs 定性分析领域的应用,为后续深度学习在NIRs 定性分析领域的应用提供了参考。但深度学习可解释性和可重复性不强限制了其在光谱分析领域的推广,因此如何克服这些困难将深度学习与光谱分析更好地结合起来,急需广大近红外光谱分析领域的研究人员解决。