马铃薯品质鉴别的近红外光谱与多源信息耦合

2021-06-04 09:03李学军

食品与机械 2021年5期

李学军程红

(1.四川大学锦城学院，四川成都 611731；2.成都理工大学管理科学学院，四川成都 610059)

随着机器视觉以及红外光谱技术的日益成熟，其被应用于农作物品质鉴定中。以马铃薯为例，通过这些技术的应用，获取果实的形状、尺寸、损伤、状态，以及各种成分含量等方面的数据和信息，从而反映果实的品质。赵利平等[1]融合小波算法与模糊算法，提出了一种苹果分级方法，该方法针对特定类型损伤具有较高的识别率。王立扬等[2]设计了一种自动分级方法，在LeNet-5t基础上，利用Leakerel激励函数加深网络深度，结果表明该算法准确率达97.37%。樊泽泽等[3]利用卷积神经网络提取多尺度特征，设计了一种基于颜色和果径的水果检测和分级算法，仿真表明，该方法的识别准确率达96.6%以上。目前，农产品识别鉴定研究主要集中在单一特征分类识别，只对某类特征具有较高的识别率，存在识别程序复杂、效率低的缺点[4-7]，同时，机器视觉技术的检测指标不够多样化，不能准确地反映果实表面和内部的质量等，近红光光谱则仅具备果实内部分级检测的功能[8-10]。

文章拟以马铃薯为例，基于多源信息融合技术搭建农产品无损检测分级模型。基于DS证据理论的指导，并结合分级模型概率输出，形成马铃薯无损检测分级决策模型；有关特征层的融合，通过主成分分析方法，将特征结合起来，比较分析多种方法对模型性能的影响，选择最合适的方法。此外，对决策层和特征层融合模型予以对比，提出多源信息融合技术定性分析农产品内外部品质的最优融合方法，以提高整体识别率。

1 试验与方法

1.1 试验材料

成都市售马铃薯(50 kg)，按NY/T 1066—2006《马铃薯等级规格》的要求，最终选定376个果实，其中合格、畸形、机械损伤、发芽和黑心的果实分别为85，64，50，88，89个，测定果实的长径、短径、高径，利用视觉采集试验平台，通过在线的方式采集马铃薯样品的近红外光谱。

1.2 试验装置与采集方法

将传送带速度设为0.25 m/s，通过Antaris II傅立叶变换近红外光谱仪对马铃薯样品进行近红外光谱采集，其图像采集系统装置如图1所示。

1.图像采集卡 2.近红外光谱仪 3.计算机 4.硬盘 5.马铃薯 6.光源室图1 马铃薯近红外光谱图像采集系统Figure 1 Potato near infrared spectrum image acquisition system

1.3 特征融合方法

从融合方式的角度来看，多源信息融合技术包括3种类型：数据层融合、特征层融合和决策层融合[11]。其中，数据层融合并不适用于异源数据，因此采用其他两种融合方式。

1.3.1 DS证据理论决策融合方法包括多种类型，其中应用最广泛的有贝叶斯法、DS证据理论、人工神经网络和模糊集合论方法等。作为一种决策融合方法，DS证据理论尤其适用于信任程度不一致的若干信息源的输出概率的融合。因此，建模时应用DS证据理论。

在DS证据理论中，论域被定义为识别框架，符号为Θ，基于该框架，不同命题互斥，函数m：2Θ→[0,1]符合式(1)和式(2)：

m(Φ)=0，

(1)

(2)

1.3.2 AdaBoost分类器融合 AdaBoost分类器融合在一起，得到具有更强性能的强分类器，对其进行训练后，错误和正确分类样本的权重一个增大一个缩小，完成训练样本集的更新，在弱分类器的训练环节，只需重视报错样本[12]。结束一次循环后，得到一个弱分类器，根据分类误差计算，确定其权重值。进行T轮循环后，得到T个弱分类器，根据其权重将其集成在一起，得到试验所需的强分类器[13-14]。

AdaBoost算法流程：

(1) 输入：训练集(x1,y1),…,(xm,ym)，其中xi∈X，yi∈Y。

(2) 初始化：分布权值D1(i)=1/m。

(3) 训练过程：Fort=1,…,T。

① 将权重分布Dt传给并调用弱规则学习器；

④ 利用式(3)调整矩阵D的权值。

(3)

式中：

Zt——归一化因子。

(4) 输出：最终假设[式(4)]，

(4)

2 试验结果分析

2.1 基于DS证据理论的马铃薯分级决策层融合模型

样本果实包括畸形、机械损伤、黑心、发芽和合格5种状态，基于DS证据理论创建分级融合模型。

2.1.1 建立基于机器视觉和近红外光谱分级概率输出

(1) 基于机器视觉分级概率输出模型：分别运用主成分分析法(PCA)和Hog方向梯度直方图提取马铃薯近红外光谱图像中累计贡献率超过95%的主成分特征，其中主成分特征数为13，Hog方向梯度直方图特征数为10，共23个特征数。运用支持向量机(SVM)进行识别，SVM核函数选择径向基函数(RBF)，通过网格搜索法(GS)得出RBF核函数的最优值惩罚参数c=3.021 2、核函数宽度g=0.542 1，创建分级模型，得到两个集合的概率输出。

(2) 基于近红外光谱分级概率输出模型：23个主成分特征和Hog方向梯度直方图特征构成光谱特征集，同时通过SVM识别，取得RBF核函数最优参数惩罚参数c=11.101 4，核函数宽度g=0.100 0，得到两个集合的概率输出。

2.1.2 DS证椐融合规则将DS融合模型识别框架描述成

Θ={O1，O2，O3，O4，O5，U}。

(5)

式中：

O1、O2、O3、O4、O5——畸形、黑心、机械损伤、发芽及合格；

U——不确定(为O1、O2、O3、O4和O5中的任何一种)。

融合应基于如下规则:

M图像(A)=m图像(A)Bel图像(A),

(6)

M光谱(A)=m光滑(A)Bel光滑(A),

(7)

(8)

(9)

式中：

A∈Θ。

Bel图像、Bel光谱——Θ下图像和光谱SVM分类模型对样本的信任函数;

m图像、m光谱——图像和光谱SVM分类模型;

M——概率输出值。

决策规则为：

设(∃A1)，A2∈Θ，且满足

(10)

那么A1代表最后的决策，ε1，ε2代表判定设置的阈值。

2.1.3 建模结果为验证DS证据理论融合模型的效果，对畸形、机械损伤、黑心、发芽和合格5种情况的马铃薯果实进行研究，结果如表1所示。

由表1可知，训练集和测试集的总体识别率分别为100.00%，93.55%。测试集中，畸形、黑心和发芽类果实的识别率分别为100.00%，95.45%，100.00%，机械损伤和合格类果实的识别率分别为83.33%，85.71%。综上，DS证据理论融合模型在识别畸形、黑心、发芽3类果实方面具有相当高的精度，但在识别机械损伤和合格的果实方面识别精度相对较低。

表1 马铃薯信息分级建模融合模型结果Table 1 Potato information classification modeling fusion model results

2.2 基于AdaBoost融合的马铃薯分级模型

试验共涉及畸形、机械损伤、黑心、发芽和合格5种状态的样本数据共376个，将其分成4份，其中3份为训练集，其余为测试集。

2.2.1 建立AdaBoost马铃薯二分类器模型将训练集进一步分成4份，其中1份为预测集，其他均为校正集，根据校正集构建5个AdaBoost二分类器：机械损伤、发芽、畸形、黑心、合格果分类器，迭代次数为300次，结束迭代后，5个分类器均能够100%的分类，其分类误差见图2。由图2可知，经300次迭代后，5个AdaBoost二分类器的分类准确率均显著提高。

图2 AdaBoost分类迭代过程误差信息变化Figure 2 Error information change of AdaBoost classification iteration process

2.2.2 形成5个AdaBoost二分类器联合判别规则当AdaBoost分类器输出>0时，该样本被当作正样本，其他为负样本。输出绝对值越高，吻合度越高。确定联合判别规则的过程可以详细描述为：

(1) 用A1、A2、A3、A4、A5表示5个AdaBoost二分类器的输出。

(2) 对样本Xi，存在1≤i≤N，N为样本数量，利用5个AdaBoost二分类器进行判别，由此确定输出A1(X1)、A2(X2)、A3(X3)、A4(X4)、A4(X4)。

(3) 对比Aj(Xi)值，确定输出值最大情况下的分类号jmax=MAX{Aj(Xi)}，1≤j≤5，此时证明X1属于jmax类。

(4) 全部样本均经检测，取得相应结果。

2.2.3 建模结果为验证AdaBoost融合模型的效果，对畸形、机械损伤、黑心、发芽和合格5种情况的马铃薯果实进行研究，结果见表2。

由表2可知，训练集和测试集的总体识别率分别为100.00%，91.40%。测试集中，畸形、黑心和发芽类果实的识别率分别为100.00%，95.45%，100.00%，机械损伤和合格果实的识别率分别为83.33%，76.19%。说明该模型对畸形、黑心和发芽3类马铃薯果实具有良好的识别率，在识别机械损伤果实方面表现良好，但在识别合格果实方面精度较低，达不到要求。

表2 AdaBoost多层级分类融合模型识别结果Table 2 Recognition results of AdaBoostmulti level classification fusion model

2.3 基于SVM融合的马铃薯分级模型

将23个主成分特征和Hog方向梯度直方图特征构成光谱特征集，作为SVM的输入向量，创建基于SVM融合的马铃薯分级模型。通过GS法确定RBF核函数的惩罚参数c和核函数宽度g。随机选择1/4果实为测试集，其余为训练集，其建模结果见表3。

由表3可知，训练集和测试集的总体识别率分别为100.00%和95.70%。测试集中，畸形、黑心、机械损伤、发芽和合格类果实的识别率分别为100.00%，95.45%，91.67%，100.00%，90.48%，表明该模型能够比较准确地识别任何一类马铃薯果实，达到了实际应用的要求。

2.4 不同融合方法结果对比

综合表1～表3可知，3种融合模型对畸形、黑心和发芽3类样本果实的识别率相同，但对其他两类果实的识别率存在显著差异(P<0.05)。与DS证据理论模型和AdaBoost分类器模型相比，SVM融合模型在准确识别机械损伤和合格两类果实方面有着更好的表现。从整体识别率来看，3种融合模型均超过了90%，基于DS证据理论模型、AdaBoost分类器模型的识别率分别为93.55%和91.40%，SVM融合模型的识别率为95.70%，表现最佳。因此，在马铃薯果实品质检测方面，SVM融合模型为最优的多源信息融合方法，基于SVM融合模型具有最高的识别率。

表3 SVM马铃薯数据信息融合模型建模结果Table 3 Modeling results of SVM potato data information fusion model

2.5 多源融合模型与单一模型对比

为了评估多源融合模型与单一模型的识别效果，选择分类准确率(ACC)、特异性(Sp)、灵敏度(Se)和马修斯相关系数(MCC)作为性能指标，计算公式如式(11)～式(13)。

(11)

(12)

(13)

式中：

TP、TN——被正确分类的合格马铃薯样本和不合格马铃薯样本；

FP、FN——被错分的合格马铃薯样本和不合格马铃薯样本。

针对5种情况下马铃薯果实样本进行研究，多源融合模型与单一模型的测试结果见表4。

由表4可知，多源信息融合技术能够有效地改善模型在各项品质指标上的检测精度。基于机器视觉创建的模型，在识别畸形、机械损伤和发芽类果实方面的表现比识别内部缺陷果实样本更佳；基于近红外光谱创建的模型，在识别黑心和发芽两类内部缺陷果实方面的表现比识别外部缺陷样本更佳，然而在单独应用的情况下，其整体识别率均不超过83.87%，将二者集成，形成融合模型，能够更加准确地识别各类马铃薯样本，其整体识别率提高至95.70%。

表4 不同级别马铃薯检测融合模型的识别率Table 4 Modeling data of different level potato detection fusion model %

多源融合模型与单一模型评价结果如表5所示。由表5可知，基于多源信息融合模型的ACC为95.62%，优于基于机器视觉模型的(92.85%)和基于红外光谱技术模型的(90.76%)；基于多源信息融合模型的特异性和灵敏度分别为95.38%，97.46%，优于基于机器视觉模型和基于红外光谱技术模型。说明试验方法对马铃薯的缺陷识别具有更高的分类准确率、特异性以及灵敏度。

表5 评价结果Table 5 Evaluation results %

3 结论

以马铃薯为例，创建了基于多源信息融合技术的检测方法。结果表明，在准确识别畸形、黑心、机械损伤、发芽和合格5类样本果实方面，基于DS证据理论、AdaBoost分类器和支持向量机3种模型创建的特征层融合方法的识别率最高。通过多源信息融合技术和单一技术的对比，发现基于多源信息融合技术的模型的识别率最高，说明此项技术在马铃薯整体品质检测方面具有较大的应用潜力。后续应就如何提高大规模马铃薯品质识别效率值进行进一步研究。