基于AlexNet卷积神经网络的大米产地高光谱快速判别

2022-02-18 08:13吴静珠李晓琪刘翠玲袁玉伟

中国食品学报 2022年1期

吴静珠，李晓琪，林珑，刘翠玲，刘志，袁玉伟

（1 北京工商大学食品安全大数据技术北京市重点实验室北京 100048 2 浙江省农业科学院农业部农产品信息溯源重点实验室杭州 310021）

随着我国国民生活水平的提高，以东北大米为代表的优质高端大米日趋受到青睐[1-2]。东北大米以粳米为主，除东北产区外，我国粳米产区还包括华东、华北黄淮、西北等地区。东北平原特有的自然环境，如土壤肥沃、日照时间长、昼夜温差大等为稻米生长提供了良好的条件。真正的东北大米营养价值高，口感好，腹白小，价格相对于我国非东北产地大米较高。然而，目前我国农产品市场准入制度、溯源体系和检测手段尚不完善[3-4]，不法商贩受经济利益驱动制售假冒或是掺伪东北大米的事件频发[5]，严重扰乱了我国大米流通市场的秩序，侵犯了消费者的权益。

传统的大米品质检测方法多以湿化学分析方法为主[6-7]，其检测精度高，然而普遍存在耗时长、繁琐、试样具有破坏性等弊端，无法满足我国大米市场监督和流通行业日益增长的快速、无损检测需求。高光谱技术[8]将光谱技术与成像技术的优势相结合，可用于待测目标的二维几何空间及一维光谱信息的快速、无损探测，目前已成为大米品种[9-10]、成分[11-14]、掺伪[15-16]、产地[17-20]检测领域的新兴热点。其中，王朝晖等[21]利用高光谱9 个特征波长对梅河大米与柳河县大米进行SPSS 判别分析，整体正确率达95%。孙大文等[22]提出了一种应用高光谱成像技术检测大米产地的发明专利，通过大米高光谱图像特征提取，并结合概率神经网络PNN 建立预测模型，可以快速、稳定、有效地对大米产地进行分类。Mo 等[23]应用可见/近红外（VNIR）高光谱成像技术快速识别国内和进口大米原产地，识别精度可达99%。上述研究结果表明高光谱技术结合化学计量学方法、模式识别方法用于大米产地鉴别等具有较好的应用前景。

在市场上出现的东北大米制假情况中，较难识别的是采用相同品种而非东北产区的大米售卖。相同品种不同产区的大米在外观表征上差异不明显，而内部品质存在的差异则很难通过现有技术手段进行直观、快速地判别。近年来，卷积神经网络[24-26]以其局部感知和参数共享等特点在图像处理领域表现出独特的优越性。本文探索将卷积神经网络和高光谱图像技术结合，快速判别相同品种、不同产区大米的可行性，以期能构建符合市场需求，适用范围广，稳健性好的东北/非东北大米产地快速鉴别模型。

1 材料与方法

1.1 试验材料

东北大米品种主要有长粒香、圆粒香、稻花香和小町米。为建立适用范围较广的东北大米产地判别模型，本试验分别从浙江省农业科学院（2018年6月）和北京古船米业有限公司（2018年11月）收集了东北产地大米样本5 份和非东北产地大米样本共计10 份，包括黑龙江长粒香1 份，吉林稻花香1 份，吉林圆粒香1 份，辽宁小町米2 份（不同产地），江苏长粒香1 份，江苏小町米1 份，浙江圆粒香1 份，安徽小町米1 份，河北小町米1份。每份样本随机取样100 粒，共计10×100 颗单粒大米样本。

1.2 仪器与设备

SPECIM FX17 高光谱相机，芬兰SPECIM 公司。仪器参数设置：波长范围：950～1 700 nm，FWHM 谱宽8 nm，波段数224 个，曝光时间3.8 μs，帧频40 Hz，空间采样分辨率640 px/line。

1.3 高光谱图像采集

采用SPECIM FX17 高光谱相机采集大米样本高光谱图像。将每个产地的100 颗大米样本放在10×10 的数粒板上，然后将数粒板放置于移动载物台进行成像试验。试验共计采集10×100 个单粒大米样本的高光谱图像。

1.4 数据处理方法及平台

1.4.1 高光谱预处理首先对大米样本高光谱原始数据进行黑白板校正，以去除暗电流噪声的影响，获得大米样本反射率高光谱图像；按照大米轮廓，手动选取感兴趣区域，并将感兴趣区域内所有像素点光谱取平均作为该粒大米样本光谱，得到1 000 个大米样本的光谱数据集，如图1所示。

图1 大米样本近红外光谱Fig.1 Near-infrared spectrums of rice samples

1.4.2 高光谱特征提取高光谱图像分类中主要面临Hughes 现象和维数灾难问题，因此本试验采用经典的PCA （Principal components analysis，PCA）方法对原始高光谱数据进行降维处理以消除数据共线性[17]，同时还可以借助PCA 分别从光谱维和图像维对高光谱图像进行特征提取。

1.4.3 AlexNet 卷积神经网络 2012年提出的AlexNet 卷积神经网络掀起了深度学习的应用热潮[27]。AlexNet 结构如图2所示，共有8 层，前5 层为卷积层，后3 层为全连接层。它首次在CNN 中成功应用了ReLU、Dropout 和LRN 等。AlexNet 利用ReLU 代替sigmoid 提升了模型的收敛速度；通过LRN 局部响应归一化增强模型的泛化能力；最重要的是采用Dropout 方式可以有效避免小样本数据集训练过程中极易出现的过拟合现象。本文采用AlexNet 卷积神经网络构建大米产地高光谱判别高精度模型。

图2 AlexNet 卷积神经网络结构Fig.2 Structure of AlexNet convolutional neural network

AlexNet 网络训练的试验平台如下：ubuntun16.04＋Caffe；CPU：Intel（R）Core（TM）i7-6700k CPU@4.00GHZ；内存：16GB；GPU：NVIDIA GeForce GTX 1070；显存：64 GB。

2 结果与分析

2.1 特征波长提取

相同品种不同产区的大米由于生长的自然环境不同，因此在内部品质上有着较为明显的差异，而近红外光谱可以反映样本内部成分信息，因此试验拟采用PCA 方法筛选反映产地信息的关键波长。

PCA 分解思路是按照原始数据方差递减顺序依次找出相互正交的新坐标轴来重构原始数据。首先采用标准化处理上述原始光谱数据集后，再进行PCA 分解计算可得第一、第二和第三主成分的贡献率分别为95.20%，4.50%，0.22%，其中前两维主成分累积贡献率可达99.70%，涵盖了原始光谱数据的绝大部分信息，因此后续主要针对前两维主成分进行深入分析。

PCA 分析中新坐标轴的选择与原始数据本身是密切相关的，其中主成分载荷矩阵主要反映的是主成分与原始数据之间的相关性，载荷矩阵中权重系数越大，则其所对应的波长与该主成分关系越密切。图3为第一、第二主成分载荷对应的全波长权重系数分布图。根据最大值选取与第一、二主成分密切相关的特征波长，则第一主成分对应特征波长为1 396.67 nm，第二主成分对应特征波长为1 467.38 nm。其中1 396.67 nm 附近谱区主要反映游离水O-H 键的一级倍频信息以及C-H 键的组合频信息；而1 468.37 nm 附近谱区主要是N-H 键的一级倍频，反映了大米蛋白中各种丰富的氨基酸信息。因此，试验选取1 396.67，1 467.38 nm 特征波长图像进行下一步图像特征提取。

图3 第一、二主成分载荷权重分布图Fig.3 Weight distribution of the loading of the first and second principal component

2.2 特征图像提取

试验样本集共包含了4 个品种的大米，不同品种的大米其外形和纹理特征存在显著差别，即便是相同品种、不同产区的大米也会因为内部成分的差异，导致大米的外观品质存在微小的差异。PCA 变换可以把多波段图像中的有用信息集中到数量尽可能少的新的主成分图像中，并使这些主成分图像之间互不相关，从而大大减少总的数据量。因此，试验在上述选取的1 396.67，1 467.38 nm 特征波长图像上分别做主成分分析。

图4所示为安徽产地小町米在1 467.38 nm波长处的图像进行PCA 分解得到第一、二、三主成分图像。从图4c 可以直观地看出，第三主成分图像比第一、二主成分图像能更好地区分背景和大米样本，不仅弱化了放置大米样本的数粒板背景，而且还突出显示大米样本的图像特征。这是由于PCA 变换对噪声比较敏感，本试验中大米样本是信号，数粒板背景是噪声，第一、二主成分虽然信息含量比较高，但是此时噪声方差明显大于信号方差，导致信噪比较低，因此，第一、二主成分分量形成的图像质量不如第三主成分图像。为确证试验结果，仍旧选取前三维主成分图像作为下一步分析输入。

图4 1 467.38 nm 波长图像主成分分析Fig.4 Principal component analysis of the image at 1 467.38 nm

2.3 基于AlexNet 的大米产地鉴别模型的建立与分析

1）数据集准备。采用网格分割法分别对1 396.67，1 467.38 nm 特征波长图像的第一、二、三主成分图像进行逐粒分割，得到单粒大米样本图像作为样本集，共计2（波长）×3（主成分图像）=6 组样本集。每组样本集包括1 000 个单粒大米样本图像，按4∶1 的比例划分，得到训练集样本800个和测试集样本200 个，训练AlexNet 模型用于大米产地鉴别。

2）网络参数设计。在AlexNet 网络的第1 层卷积层，应用96 个11×11 卷积模板对输入图像进行滤波，得到的卷积数据先进行局部响应归一化，然后进行池化传递到第2 层卷积层中，应用256个5×5 的卷积模板对图像进行卷积后再进行LRN与pooling，第3，4，5 层的卷积模板为3×3，且之后的生成与上一层相似。在全连接层中，dropout_ratio 为0.5，最后输出为融合的softmax loss，其中训练时参数设置为：学习率0.01，迭代次数5 000。

3）网络训练测试。试验共计训练得到6 个AlexNet 网络用于东北/非东北大米产地鉴别模型，测试结果如表1所示。

表1 基于AlexNet 的大米产地鉴别模型训练及测试结果Table 1 The training and test results of rice origin identification model based on AlexNet

①基于1 467.38 nm 图像的整体识别率高于1 396.67 nm，尤其是1 467.38 nm 第三主成分图像测试集识别准确率达99.5%，较1 396.67 nm 的最大识别率提高了17.7%。试验结果表明，特征波长筛选可以显著提高模型识别准确率，其中基于1 468.37 nm 建立的东北/非东北大米产地鉴别模型表现尤为突出。1 468.37 nm 谱区附近主要反映的是大米蛋白中各种丰富的氨基酸信息，就本试验结果而言，大米蛋白质能作为区分东北/非东北产地大米的关键性指标之一。

②对于同一特征波长图像而言，基于第三主成分图像建立的AlexNet 模型识别率最高，第一主成分图像识别率最低：其中基于1 467.38 nm 的第三主成分图像比第一主成分图像识别率提高了21.3%，比第二主成分图像识别率提高了4.7%；基于1 396.67 nm 的第三主成分图像比第一主成分提高了22.5%，比第二主成分提高了11.2%。试验结果表明，图像特征提取可以有效改善模型的识别准确率，并且佐证了2.2 节中提取的第三主成分图像能具有更高的信噪比。

3 结论

本文采集了东北/非东北10 个产地、4 个品种、共计1 000 份大米样本的近红外高光谱数据，采用PCA 预处理分别从光谱维度和图像维度进行特征提取，选取1 396.67 nm 和1 467.38 nm 特征波长图像的第一、二、三主成分作为输入，结合AlexNet 深度学习神经网络训练用于大米产地快速分类的判别模型，最终1 467.38 nm 波长处图像的第三主成分作为输入时，模型识别准确率可达99.5%。试验结果表明，近红外高光谱技术结合深度学习方法有望为大米产地溯源提供快速、无损、高通量、精细化的检测方法。