胡春艳 于来行
(1. 周口职业技术学院,河南 周口 466300;2. 周口师范学院,河南 周口 466300)
近红外光谱分析技术具有快速、高效、环保以及低成本等优点,在食品、农业、制药工程和石油化工等领域得到了广泛应用。已有学者[1]利用近红外光谱技术对苹果品质评价进行了研究。目前苹果品质评价的方法主要有主成分回归法、逐步多元线性回归法以及偏最小二乘法等统计方法和人工神经网络法[2-4]。统计方法适合线性数据研究,但是针对非线性分类问题就不具备相应的优势。人工神经网络法适合非线性分类研究,但是存在过学习和易陷入局部最优的问题,且无法解决光谱冗余信息带来的复杂度较高的问题。
为了提高苹果内部品质评价模型的精度,针对近红外光谱存在大量冗余信息和预测精度较低的问题,提出一种基于连续投影法的特征波长筛选和灰狼优化算法[5](grey wolf optimization algorithm,GWO)改进深度置信网络[6](deep belief network,DBN)的苹果品质评价模型,旨在为苹果内部品质评价提供新的方法。
试验仪器采用美国Thermo Fisher公司的型号为Antaris II的近红外检测仪。该仪器集成了透射、反射、漫透射以及漫反射等不同检测模块,采用了Nicolet专利的高光通量、高速动态准直电磁式干涉仪,可以实现不同状态下样品的高效、精准的检测与分析。Antaris II的近红外检测仪的光谱范围为4 000~10 000 cm,扫描次数为64次,分辨率为8 cm。
DBN是概率网络模型,属于深度神经网络的一种。采用DBN不仅可以进行非监督学习,同时还可以进行监督学习。受限玻尔兹曼机(restricted boltzmann machine,RBM)是DBN的组成元件,一系列的RBM堆叠成DBN,图1为DBN的结构图。
图1 DBN结构组成Figure 1 DBN structure compositions
由图1可知,DBN是由多层RBM所构成的神经网络,其采用非监督贪婪逐层方法来进行预训练,获得所对应的权值。v为显层,作为输入数据;h为隐层,作为特征收集[7]。不同的显层与隐层堆叠成不同的RBM,BP层为DBN的最后一层。
设(v,h)为DBN给定的状态,在DBN网络中所有显层与隐层单元二值变量i和j的能量函数E为
(1)
式中:
θ——参数w,a,b组成的集合;
a、b——显层与隐层的偏置;
w——显层与隐层的连接权重。
设K为训练样本数,采用随机梯度法求解对数似然函数L(θ)的最大值来确定参数θ的值θ*,即
(2)
参数确定之后,由能量函数可以得到显层和隐层每一种状态(v,h)的联合概率分布函数,即[5]
(3)
显层v确定之后,隐层单元的激活概率p为
(4)
隐层h确定之后,显层单元的激活概率p为
(5)
由Gibbs采样定理得到RBM参数更新的规则,即
(6)
式中:
ε——学习速率;
〈·〉data、〈·〉recon——输入数据和重构后数据的数学期望。
GWO算法中,灰狼个体被划分为4个等级α、β、δ和ω。α负责整个狼群的决策与管理,β和δ为适应度次于α的灰狼个体,ω为除α、β、δ之外的灰狼个体。主要包括3种行为,分别为包围行为、捕猎行为和攻击行为[8]。
1.3.1 包围行为 灰狼根据式(7)和式(8)包围猎物:
D=|C·Xp(t)-X(t)|,C=2·r2,
(7)
X(t+1)=Xp(t)-A·D,A=2ac·r1-ac,
(8)
式中:
D——狼群和猎物之间的距离;
t——当前迭代次数;
X——当前狼群的位置;
Xp——猎物的位置;
r1、r2——随机数,r1、r2∈[0,1];
ac——非线性收敛因子,ac∈[2,0]。
1.3.2 捕猎行为 包围猎物之后,狼群将捕食猎物。如果α、β、δ依次为全局最优解、全局第二解和全局第三解,则α、β、δ可以根据式(9)~式(11)进行重新定位[9]。
Dα=|C1·Xα-X|,
(9)
Dβ=|C2·Xβ-X|,
(10)
Dδ=|C3·Xδ-X|,
(11)
式中:
Dα、Dβ和Dδ——α、β、δ与当前解X的近似距离;
Xα、Xβ、Xδ——α、β、δ的位置;
C1、C2、C3——随机向量。
当前解X和更新解X(t+1)为:
X1=Xα-A1·(Dα),
(12)
X2=Xβ-A2·(Dβ),
(13)
X3=Xδ-A3·(Dδ),
(14)
(15)
式中:
A1、A2、A3——随机向量。
1.3.3 攻击行为 狼群捕食猎物的最后阶段就是攻击捕获猎物。当|A|≤1时,狼群接近猎物(X*,Y*),进行集中攻击猎物;当|A|>1时,狼群远离猎物,寻找新的猎物。该过程主要通过调节参数ac实现。
DBN模型的性能受其参数θ={w,a,b}选择影响比较大,采用GWO算法对DBN模型参数θ={w,a,b}进行优化,提高DBN模型的性能,将均方根误差作为GWO-DBN的目标函数[10]:
(16)
式中:
k——训练样本的个数;
x(k)——实际值;
p(k)——预测值;
wmin,wmax——w的上限和下限;
amin,amax——a的上限和下限;
bmin,bmax——b的上限和下限。
运用GWO算法随机产生参数θ={w,a,b},将不同参数θ={w,a,b}带入DBN模型进行训练,将均方根误差最小时的对应的参数θ={w,a,b}输出,建立基于DBN模型的苹果内部品质评价模型。
基于近红外光谱的GWO-DBN的苹果内部品质评价建模流程可以描述:
① 选择苹果样品;
② 采集苹果的近红外光谱;
③ 光谱数据预处理[多元散射校正(MSC)预处理、特征波长筛选];
④ 建立基于GWO-DBN的苹果内部品质评价模型;
⑤ 苹果内部品质评价模型的验证。
苹果原料选择2021年山东烟台红富士成熟苹果为研究对象,随机挑选234个大小相似且无机械损伤的苹果进行清洗、削皮和均匀切片,切片厚度为5 mm,将苹果切片置于0.5 g/100 mL抗坏血酸钠溶液中浸泡30 min,之后苹果薄片放入65 ℃烘箱,热风干燥处理6 h,共得到234组样本数据。
光谱的预处理方法有:一阶导数算法(FD)预处理、二阶导数算法(SD)预处理、标准正态变量变换算法预处理(SNV)和多元散射校正(MSC)预处理[11-12],原始数据和不同预处理方式对比结果如表1所示。苹果原始光谱图像如图2所示。由表1可知,多元散射校正(MSC)处理结果最好,因此文中苹果光谱采用MSC预处理,建模方法为DBN。
图2 苹果原始光谱Figure 2 Original spectrum of apple
表1 不同预处理建模效果对比Table 1 Comparison of modeling effects of different pretreatment
由于苹果光谱数据具有维度高而复杂的特点,苹果品质评价模型建立之前先对光谱数据进行降维处理,文中分别对比全波段、主成分分析和连续投影法[13](SPA)筛选特征波长的结果,最终确定苹果光谱特征波长筛选方法。特征波长筛选后建模效果对比如表2所示。由表2可知,连续投影法(SPA)特征波长筛选结果最好。运用SPA筛选苹果光谱数据的特征波长,不同波长成分进行训练时,正确率和均方根误差与主数的关系图如图3所示。由图3可知,当主成分数为13时,苹果内部品质评价的正确率最高。
图3 SPA特征筛选结果Figure 3 SPA feature selection results
表2 波长筛选结果对比Table 2 Comparison of wavelength screening results
为了验证GWO-DBN模型的有效性和可靠性,将采集到的234组苹果光谱划分为校正集和预测集,校正集样本163组,其中高品质、中品质和低品质样本分别为70,46,47组;预测集样本71组,其中高品质、中品质和低品质样本分别为26,21,24组。根据维生素C含量、果实硬度、可滴定酸含量、可溶性固形物含量、可溶性糖含量、固酸比和糖酸比等7项理化指标,苹果内部品质评价标准如表3所示。不同模型参数设定如下① GWO算法:种群规模N=20、最大迭代次数Tmax=100;② 粒子群(particle swarm optimization algorithm,PSO)算法:种群规模N=20、最大迭代次数Tmax=100、学习因子c1=c2=2、惯性权重w=0.2;③ 遗传算法[14](genetic algorithm,GA)算法:最大迭代次数Tmax=100,种群规模N=10,变异概率pm=0.1,交叉概率pc=0.7。苹果内部品质评价结果如图4~图7所示,训练集和预测集的评价精度如表4所示。
表3 苹果内部品质分级标准Table 3 Grading standard of apple quality
由图4~图7和表4可知,在训练集和预测集上,GWO-DBN的准确率分别为92.02%和81.69%,优于PSO-DBN、GA-DBN和DBN的。与单独的DBN模型相比,GWO-DBN的苹果内部品质评价的准确率分别提高了3.06%和7.04%,说明GWO-DBN可以有效提高苹果内部品质评价的精度。
图4 GWO-DBN评价结果Figure 4 GWO-DBN evaluation results
图5 PSO-DBN评价结果Figure 5 PSO-DBN evaluation results
图6 GA-DBN评价结果Figure 6 GA-DBN evaluation results
图7 DBN评价结果Figure 7 DBN evaluation results
表4 不同模型评价结果Table 4 Evaluation results of different models %
为了进一步考察GWO-DBN法的有效性,将GWO-DBN与支持向量机(support vector machine,SVM)、网格搜索优化支持向量机(Grid-SVM)和粒子群优化支持向量机(PSO-SVM)进行对比,对比结果如表5所示。
表5 不同算法苹果内部品质评价结果Table 5 Results of pork quality identification with different algorithms %
由表5可知,在训练集和测试集上,GWO-DBN算法苹果内部品质评价的正确率最高。在训练集上,高品质、中品质和低品质评价的正确率分别为96.15%,97.06%,96.15%;在测试集上,高品质、中品质和低品质评价的正确率分别为100.00%,94.11%,92.31%,优于PSO-SVM模型、Grid-SVM模型以及SVM模型的苹果内部品质评价的正确率。
通过研究可知,GWO-DBN算法可以有效提高苹果内部品质评价的正确率,为苹果内部品质评价提供了新的方法。主要结论:① 苹果内部品质评价时,近红外光谱的预处理方式对评价精度有重要影响,其中多元散射校正(MSC)处理结果最好。② 苹果光谱数据特征波长的选择影响苹果内部品质评价的结果,通过对比全波段和主成分分析法、连续投影法等特征波长筛选方法,发现连续投影法效果最好。③ 与DBN模型、GA-DBN模型和PSO-DBN模型相比,GWO-DBN可以有效提高苹果内部品质评价的精度,与DBN模型相比,训练集和测试集上的准确率分别提高了3.06%和7.04%。通过GA、PSO和GWO优化DBN模型参数,可以提高DBN模型的性能。④ 与PSO-SVM模型、Grid-SVM模型以及SVM模型相比,GWO-DBN在训练集和测试集上,不同品质的评价精度更高,主要因为DBN模型可以更好地提取苹果光谱数据特征,加强了特征数据与品质类别之间的映射关系。
为了提高苹果内部品质评价的精度,提出一种连续投影法的特征波长筛选与灰狼优化算法改进深度置信网络的苹果内部品质评价模型。针对深度置信网络模型性能受参数设定的影响,运用灰狼优化算法对深度置信网络模型参数进行优化选择,提出一种连续投影法的特征波长筛选与灰狼优化算法改进深度置信网络的苹果内部品质评价模型。与粒子群算法改进深度置信网络、遗传算法改进深度置信网络和深度置信网络相比,基于灰狼优化算法改进深度置信网络的苹果内部品质评价模型可以有效提高苹果内部品质评价的准确率。
虽然研究提出的算法可以有效提高苹果内部品质评价的准确率,但是优化效率有待进一步提高。后续将从深度置信网络的内部机制进行改进,运用支持向量机或者极限学习机替换为深度置信网络的输出层来提高深度置信网络的执行效率和泛化能力。