白岩康 蔡小婵 李晶晶
【摘 要】高光谱成像技术作为一项近年来比较流行的技术,在农作物检测方面展现出了巨大优势[1]。通过仪器和光源照射,高光谱技术能够获取被测物品的二维图像信息、一维光谱信息,从而无损地检测出苹果内外在的理化性质。文章通过高光谱技术获得苹果数据后,利用反向人工神经网络算法建模,实现对苹果糖度(苹果最重要的品质之一)的检测和预测。经过实际训练显示,该模型苹果糖度检测效果为R=0.910 3,预测误差均方根为13.17,预测效果较为良好,是无损检测苹果糖度的一个行之可行的方法。文章利用高光谱成像系统采集苹果的二维图像信息和一维光谱信息;对采集的数据进行降噪和预处理,筛选出特征波长;利用人工神经网络BP算法建立苹果糖度预测模型;带入实验数据训练,进行模型的评估。
【关键词】苹果糖度;无损检测;高光谱成像;人工神经网络BP算法
【中图分类号】O657.33;TS255.7【文献标识码】A【文章编号】1674-0688(2020)10-0057-03
1 项目背景与技术简介
1.1 研究背景
我国是世界农产品的生产和消费大国,水果作为农产品的重要组成部分,其产业能否稳步向前,关系到我国的经济和生态产业发展。苹果是最常见、最重要的一种水果,我国作为苹果种植面积最广、销量最大的苹果生产国,苹果产业的发展对提高农民收入,实现新农村产业改革具有重要影响。但我国的苹果产业目前还存在检测水平落后、带损检测无法高新产业化等问题。如果能够由单纯的产量大国转变为现代产业强国,那么中国的苹果产业将在经济全球化趋势下拥有更强的国际竞争力。本文利用高光谱成像技术和人工神经网络BP算法,针对无损检测和预测苹果内在品质(以糖度为代表)做初步探索与研究。
1.2 高光谱成像技术简介
高光谱成像技术是基于非常多窄波段的影像数据技术,它成功地结合了成像技术和光谱技术,通过高光谱技术可以检测出实验物品的二维图像信息和一维光谱信息[2]。如图1所示,研究人员把3个维度的信息抽象为空间坐标轴上的一个立方体,其中X轴和Y轴代表实验物品的二维图像信息,Z轴代表实验物品的一维光谱信息。通过高光谱获得的数据具有极高的分辨率,广泛的光谱波段范围能提供大量实验物品的内外信息。
随着科学技术的不断发展,高光谱技术在越来越多的领域体现了其优越的检测特性,比如食品安全方面融合了空间的图像信息和光谱中的光谱信息,可以达到同时检测果蔬等食品外部和内部指标的目的:在医学诊断方面,高光谱技术提供了一个较为先进且对人体损伤极小的诊断手法,可以清晰地描述病人的物理、化学方面的各种体征:在航空航天方面,其高灵敏度、高分辨率和高频谱范围的仪器特性可以应用于遥感和地球科学等。
高光谱技术优势明显,但是由于从高光谱仪中提取的高光谱数据同时包含二维图像和一维光谱的三维综合信息,且图像信息和光谱信息一一对应,所以图像的每一个像素点都包含了很长的连续波段信息,而图像本身又包含数据量庞大的像素点,这就必然导致数据采集量过大及冗余程度过强,给后续的数据处理分析带来一定的难度。
图2是一个高光谱检测系统的大致结构示意图,它由面阵相机、光谱仪、光电转换器、各种控制器、移动平台及与之连接的计算机软硬件等部分构成[3]。将被检测的实验物品平稳地放在移动平台上,打开光源后,其探头装置便能将物体照射面的图像和光谱信息收集在计算机中,采集的具体软硬件种类可能因物品种类差异而有所不同。
1.3 实验流程图
实验流程圖如图3所示。
2 实验材料数据采集与预处理
2.1 实验材料与实验环境
为了保证实验材料的新鲜程度,实验开始的前一天在京东商城购买了63个新西兰“皇家姬娜”苹果,每个苹果的重量范围在160~190 g,形状规整,表面光滑,颜色鲜艳。为了提升样本容量和减少苹果因实验导致的浪费,将一个苹果的两个半球面拆分开来,分别看成两个不同的苹果进行切片取样。购买的63个苹果通常都是一半面的颜色较为红润,另一个半面则呈现较多的黄色,这样切片可以在节省原料的同时为实验提供更多具有差异性的波段信息。
前期的苹果糖度检测及高光谱信息的采集在安徽大学农业大数据实验室进行。糖度的检测主要利用数字糖度计(Digital Refractometer)对苹果样本进行糖度测量。
高光谱的图像和光谱数据由实验室提供的面阵高光谱成像系统平台及连接于系统的计算机(数据采集软件为SRA Toolkit)进行采集。
采集过后的高光谱数据使用ENVI 5.2进行RGB波段选择和感兴趣区域的选择,最终导出.csv形式的表格文件。
后期的算法模型和做图分析所使用的软件工具为MATLAB2018b。
2.2 样本数据采集和预处理
2.2.1 高光谱图像采集
将购买回来的苹果放在室温下静置24 h之后,用一次性灭菌手套把苹果轻轻放入含有固定装置的高光谱检测箱系统内,预先确定好采集范围后将含有该范围的苹果的一面朝上对着光源,朝上的受光部分即为图像采集区域。调整光谱范围和光照强度,使得在SRA软件上的苹果image清晰,并且注意曝光值不超过软件的警告范围。每个苹果的一个面测好后贴上标签并标号,换另一面重复上述操作,即可获得.cube和.hdr格式的文件数据。
在上述操作中,每次采集数据都要在苹果边上放置一个硬质白板进行黑白校正,从而尽可能地减少背景噪声对高光谱数据分析产生的影响。高光谱镜头盖取下之前产生的图像计为R(全黑),将硬质白板通过光源检测生成的图像计为W(全白),则可以通过公式由原始图像I得到校正图像R[4]。
2.2.2 光谱数据预处理
未经处理的光谱反射率曲线往往含有大量的噪声信息,会对数据的分析产生较大的干扰。数据预处理的方法有很多种,本文选择矢量归一化的方法,该方法能够有效地减少因光谱变化导致的噪声影响,公式如下:
2.3 苹果实际糖度测量
使用数字糖度计对样本进行糖度测量。在用数字糖度计之前,需要将苹果的一面先切一部分下来,测量质量后按照1 g样本配1 g水的比例放入榨汁机中榨成果汁,接着倒入烧杯搅拌均匀。每次用滴管在烧杯中的一半高度取1.5 mL果汁放入糖度计检测糖度,每个切片取3次求平均值,作为该样本的糖度值,小数点后保留两位小数(单位:Brix)。将测量的结果标号并且记录在Excel表格中。统计的结果见表1。
2.4 特征波段选择
由于每个苹果在使用ENVI 5.2软件选择感兴趣的区域(ROI)后导出的 . csv表格文件中,拥有band1到band260波段及不同XY像素点,平均每个文件的数据量为260×7 000,如此庞大的数据量对后期的建模和数据分析尤为不利,所以要想办法对数据进行降维缩减,我们利用MATLAB的模糊极值算法在光谱反射回归曲线中提取8个特征波段,这8个特征波段包含了绝大部分苹果的光谱信息。
3 建立深度网络模型
3.1 人工神经网络BP算法简介
本项目采用的是基于人工神经网络BP算法的模型。人工神经网络是模拟生物神经系统的。人工神经网络中神经元之间的联系可以抽象化为权值的大小,调整的方式为循环往复的数据信息的不断刺激;而反向传播(back propagation,BP)算法就是用来调整权值的,其核心思想就是训练误差逐层反向传播,每层神经元与下层神经元间权重通过误差最速梯度下降的方法调整。
通常人工神经网络分为输入层、隐藏层和输出层(如图4所示)。隐藏层和输出层都有相应的激励函数(这个激励方式可以类比为人体的神经脉冲)[5]。
常用的激励函数有sigmoid和linear函数。本项目意图建立苹果糖度的实际值和测量值的回归模型,因此使用linear函数更合适。由训练数据集确定输入层和输出层的神经元数目;而隐藏层神经元数目的设定带有很大的经验性,对经验公式向上取整的数值可作为隐藏层神经元数目。
3.2 前向传播
采用以感知机为基础方式,训练数据中含有的信息能够逐个层次从输入层传播到输出层,公式表达如下:
Xhidden_in=Winput_hiddenXinput
Xhidden_out=fhidden(Xhidden_in)
Xoutput_in=Whidden_outputXhidden_out
Xoutput_out=foutput(Xoutput_in)
3.3 誤差BP(反向)传播
BP传播方式和上文所述的前向传播方式相反,前者是训练数据从输入层传递到输出层,而BP算法则是将训练误差从输出层开始反方向地传递到网络中的所有隐藏层,通过不断训练,误差会越来越小。本实验采用平方误差损失函数达到实验所期待的误差范围,用链式最速梯度下降法改变权值的大小,达到最好的训练效果。其中,损失函数如下:
E=21(ypred-ytrue)2
3.4 各层梯度和更新函数
输出层梯度(误差):
Gout=Xoutput_out-ytrue
隐藏层到输出层权值梯度:
Ghidden_out=Xhidden_outδhidden_output
δhidden_output=Gout×foutput'(Xoutput_in)
输入层到隐藏层权值梯度:
Ginput_hidden=Xinputδinput_hidden
δinput_hidden=δhidden_outputWhidden_output×fhidden'(Xhidden_in)
隐藏层到输出层权值更新:
ΔWhidden_output=ηGhidden_out+αΔWhidden_
outputprevious
输入层到隐藏层权值更新:
ΔWinput_hidden=ηGinput_hidden+αΔWinput_h-
iddenprevious
3.5 算法步骤
步骤1:初始化权值矩阵W、阈值b。步骤2:训练内容(包含前向传播和误差反向传播)。步骤3:迭代训练直到误差小于阈值ep或达到最大迭代次数max。上述步骤中输入参数为训练数据集x和y,阈值ep,最大迭代次数max及其他人工神经网络所必需的配置参数。输出的参数为人工神经网络的权值W。
4 模型预测结果与小结
上文“2.4节”中提到选择出8个特征波段代表苹果的光谱信息,将这8个数据作为输入导入输入层,根据经验公式和检验调整,决定隐藏层的个数为5,最终确定了8-5-1的人工神经网络BP模型。将该模型的学习速度设定为0.03,可以兼顾数据训练速度和训练精度,使得理想训练误差在0.05左右。
实际苹果糖度检测效果为R=0.910 3,预测误差均方根为13.17,并用MATLAB做出预测值和实际值的关系图。
由图5可以看出,经过前期高光谱数据采集出的苹果的一维图像和二维光谱信息,经过数据预处理和特征波长的选择后,输入基于人工神经网络BP算法的模型,该模型对苹果糖度的预测效果较为理想,是无损检测苹果糖度的一个行之有效的方法。后期本项目成员将兼顾苹果和其他水果的内外品质,并融合多指标进行分析实践,使得本项目思路能够在更广泛的平台上发挥作用。
参 考 文 献
[1]刘晶晶,刘付龙,史铁,等.高光谱图像技术检测苹果外部损伤[J].中国食品学报,2018(1):278-284.
[2]冯迪,纪建伟,张莉,等.基于高光谱成像提取苹果糖度与硬度最佳波长[J].发光学报,2017(6):799-806.
[3]管晓梅,杜军,张立人,等.基于高光谱技术的果糖检测优化算法和可视化方法[J].光电子·激光,2018(2):173-180.
[4]吴龙国,何建国,贺晓光,等.高光谱图像技术在水果无损检测中的研究进展[J].激光与红外,2013(9):990-996.
[5]刘思伽,田有文,张芳,等.采用二次连续投影法和BP人工神经网络的寒富苹果病害高光谱图像无损检测[J].食品科学,2017(8):277-282.