宁景苑,叶海芬,孙雨玘,熊思怡,梅正昊,蒋晨豪,黄科涛,张苏婕,朱哲琛,李昱权,惠国华*,易晓梅,郜园园,吴 鹏
(1.浙江农林大学信息工程学院,林业感知技术与智能装备国家林业局重点实验室,浙江 杭州 311300 2.浙江农林大学信息工程学院,浙江省林业智能监测重点实验室,浙江 杭州 311300)
苹果是家喻户晓的水果,作为世界四大水果之冠,苹果富含有机酸、果胶、维生素和矿物质、膳食纤维、多酚和黄酮类化合物,营养价值很高,可以帮助调节酸碱平衡,对人体健康有很大的帮助。 2019 年我国苹果栽培面积占全球的30%,产量占全球的32.7%。 然而,我国苹果出口量仅占世界苹果总出口量的12%左右[1]。 苹果在运输过程中,由于包装或运输方式不当,很容易受到机械性损伤,从而加速营养成分的流失,加速苹果腐败,最终导致营养价值及商品价值下降[2]。 因此,探索一种快速、无损、低成本、易操作的苹果损伤检测方法迫在眉睫。
近年来光谱技术在食品科学研究中得到了广泛的应用,许多学者将可见光谱技术应用于水果品质的无损检测。 韩浩然选择市场上常见的黄瓜作为检测对象,利用U-net 深度学习网络结合可见光谱图像,实现了黄瓜褐斑病的像素特征提取和病斑分割。黄亮等[4]的研究证明,利用可见光谱可以快速、无损地预测花椰菜中硫代葡萄糖苷的含量。 余怀鑫等[5]利用可见光谱对温州蜜桔的含水量进行了研究,证明了利用可见光谱检测温州蜜桔含水率的可行性。 刘燕德等[6]利用可见光谱技术建立了油桃的无损检测模型,对油桃的糖度、硬度和最佳贮藏天数进行了预测。 孟庆龙等[7]利用可见光谱技术对猕猴桃的糖度进行了快速、无损的检测。 尚静等[8]利用可见光谱采集系统获得的光谱信息实现对李子硬度的检测。 黄玉萍等[9]利用可见光谱判别西红柿的内部颜色。 车文凯等[10]利用多种重采样方法对苹果损伤区域内的光谱进行重采样,建立并比较了不同的苹果损伤时间分类模型。 穆炳宇等[11]利用可见-近红外光谱技术检测花椰菜的色泽。 韩亚芬等[12]利用可见近红外透射光谱检测技术结合PLS-DA 优化模型,实现对马铃薯内部缺陷的快速无损检测。
以上研究证明可见光谱可以无损检测水果的品质,但所使用的仪器设备体积大,费用高。 那么,如何利用样品的漫反射或透射光信号,以最小化的硬件体系实现样品的品质检测呢? 本文为验证弛豫光谱的可行性,采用单波长光作为光源,利用激光控制器控制激光器电流产生弛豫现象,激发苹果内部化学官能团的弛豫特性,通过采集被测样品的弛豫光谱,基于BP 神经网络算法构建SNV-BP-RS 苹果轻微损伤探测模型,并与利用传统光谱建立的SNVBP-CS 模型进行比较研究,以验证本文提出方法的有效性。
苹果样品选用同一批次的红富士苹果,质量为(120±10)g,直径为70 mm~80 mm,色泽鲜艳,新鲜度好,无机械损伤、虫蛀等现象。
实验仪器包括650 nm 100 mW 可调焦红光点状激光发射器(MTO-LASER)、S3000 光谱仪(杭州晶飞)、光谱分析平台(杭州晶飞)、LASER-5A DPSS LASER DRIVER(MicroStep MA1-106)、T40-CTRGZJ-43-150 强力磁铁软管支架激光器定位灯用固定支架(Anford)、铁架台、擦拭纸、遮光罩。 弛豫光谱采集系统如图1 所示。 实验过程中,通过激光驱动器调节电流大小,从而改变激光的强弱,强度不同的激光能够激发样品内部化学官能团的弛豫性能,产生弛豫光谱。 再通过感光纤维探头采集弛豫光谱,经光谱仪处理后上传至电脑。
图1 弛豫光谱采集系统
在物理学中,弛豫过程是指物体的原始平衡态被破坏后,再次恢复到平衡态的过程。 在机理方面,由于处在非平衡态,非晶态物质总是向低能态弛豫,故弛豫行为是理解非晶态物质中各种物理现象的关键[13]。 激光的强度与电流有关[14],通过控制电流来控制激光强度,模拟激光照射到苹果表面的过程,使苹果表面的激光强度逐渐增加,苹果内部的化学官能团对光动态吸收,而这种动态吸收过程与稳态吸收过程的反射光信号是不同的,这就是动态弛豫光谱的产生机理。 图2 所示是不同电流强度下对应的弛豫光谱。 为了保证弛豫过程的单一性,实验采用650 nm 单波长激光照射苹果表面,改变激光器控制电流,采集并记录苹果样品的漫反射光谱数据并进行分析[15]。
图2 不同电流强度下的弛豫光谱
实验开始前,用蒸馏水仔细清洗苹果表皮并用擦拭纸吸干残余水分,重复两次,确保苹果表面的灰尘、石蜡等物质被彻底清洗,减少对实验的干扰。 清洗完毕后,在苹果侧面任意位置选取一个半径为1.5 cm 的圆形区域,用记号笔做好标记。 将苹果放置在铁架台的铁圈上,确保选定的区域朝上,以所选区域的圆心作为采样点,将感光纤维探头移至采样点,需保证探头与其贴合紧密的同时不得误伤苹果表皮。 将激光驱动器的激光电流调至0.9 A 以下,打开激光并手动调整激光入射位置,入射点可在距离采样点1 cm 的圆周上任意选择。 位置调整完毕后,为铁架台罩上遮光罩以创造黑暗环境,防止外来光源对实验环境造成干扰。
在激光驱动器的控制下,以0.9 A 为初始电流强度,以0.05 A 为电流递增步长,记录每一采样点在0.9 A 和2.05A 电流区间内的光谱数据,最后关闭激光驱动器测量背景光状态下的光谱数据,得到25 组数据。 为降低实验误差,采取平行实验方式对每一无损采样点重复测量15 次,累计获得375 组苹果在无损状态下的实验数据。
测量完毕后,取出苹果并用研钵棒按压所选区域,在保证苹果表皮无损的情况下,使该区域的果肉受到深度为1 cm 的损伤,创造出受损苹果。 该步骤完成后立马将苹果放回,在相同实验条件下以相同实验方式测量苹果在受损状态的光谱数据,重复进行15 次,累计获得375 组苹果在有损状态下的光谱数据。
1.4.1 标准正态变量变换法(SNV)
每个苹果的生长情况不同,个体之间必然存在差异,不同苹果的光谱数据也不同,此时需要用SNV 算法优化处理光谱数据。
标准正态变量变换(Standard Normal Variable Transformation,SNV)可以作为光谱数据的预处理方法,主要是为了消除固体颗粒的影响。 在固态样品的检测中,有助于减少固体表面散射和光程变化对光谱数据的影响[16]。 与相同公式的标准化算法中对一组光谱的处理方法相比,SNV 直接对单条光谱的数据进行处理,其处理方法如下:
式中:Xi,SNV是经过SNV 算法处理后第i条光谱的数据值,Xi表示第i条光谱的平均值,Xi,k表示第i条光谱中第k个波点数,m表示光谱中波长点数,m的大小与光谱仪相关。
1.4.2 BP 神经网络
图3 是BP 神经网络模型建立的流程图。
图3 BP 神经网络模型建模流程
BP 神经网络是一种基于误差反馈算法训练的人工神经网络,应用广泛[17]。 其网络结构主要由一个输入层、一个或多个隐含层、一个输出层组成。 由于本实验的数据之间呈现简单的非线性关系,包含一个隐含层的BP 神经网络模型可以满足需求。 实验建立的模型网络结构如图4 所示。
图4 BP 神经网络结构
本文使用的光谱分为传统静态光谱和弛豫动态光谱两大类,每类光谱采集了1 000 组,其中无损状态苹果光谱500 组,有损状态苹果光谱500 组。 将每类光谱按照8 ∶2 的比例划分训练集和测试集,训练集包括有损状态光谱400 组,无损状态400 组。测试集包括有损状态100 组,无损状态100 组。
2.1.1 数据筛选
对于采集的传统静态光谱,选取600 nm~800 nm波长的光谱,其他波段的光谱数据舍去。 传统静态光谱筛选处理前后如图5 所示。进行整合,其他波段的光谱数据舍去。 弛豫光谱筛选处理前后如图6 所示。
图5 传统光谱筛选处理前后对比图
图6 弛豫光谱筛选处理前后对比图
对于采集的弛豫动态光谱,将电流为0.9 A ~2.05 A 时对应的650 nm 波长的光谱曲线筛选出来,
2.1.2 SNV 优化
SNV 是一种标准化算法,针对单条光谱数据进行处理。 SNV 算法主要用于消除样本表面固体颗粒等外界因素对样本数据的影响。 通过对筛选出的光谱数据进行SNV 算法优化处理,标准化单条光谱数据,消除由于苹果个体差异引起的光谱数据差异,进一步减小光谱样本数据之间的差异,最终得到的光谱数据更为紧凑,趋于一致。 在此将筛选出的光谱数据,进行SNV 算法优化处理,如图7、图8 所示。
图7 传统光谱曲线SNV 处理前后对比图
图8 弛豫光谱曲线SNV 处理前后对比图
根据模型的网络结构,设置模型各层的初始化参数如表1。
表1 苹果损伤检测模型初始参数
按照BP 神经网络模型建立流程对模型进行调参,具体如下:
①隐含层节点数:
图9 所示是不同隐含层节点数时模型的准确率,经过实验测试,当隐含层节点数为48 时,基于传统光谱建立的模型精度最高。 当隐含层节点数为76 时,基于弛豫光谱建立的模型精度最高。
图9 不同隐含层节点数时,模型的准确率
②迭代次数:
图10 所示是不同迭代次数时模型的准确率,经过实验测试,当迭代次数为20 000 次时,基于传统光谱建立的模型精度最高。 当迭代次数为5000 次时,基于传统光谱建立的模型精度最高。
图10 不同迭代次数时,模型的准确率
经过以上实验,最终确定模型参数如表2 所示。
表2 苹果损伤检测模型最终参数
将光谱数据分为两组,第一组数据仅进行数据筛选,不使用任何算法进行处理。 第二组数据进行数据筛选后,再使用SNV 算法优化。 将两组数据输入模型训练测试,结果如表3 所示。
表3 苹果损伤检测模型判别结果
为了进一步测试模型的性能,增加稳定性、可重复性验证实验,使用不同的测试集测试模型,每个模型测试20 次。 测试结果如图11 所示,基于弛豫动态光谱建立的苹果损伤检测模型稳定性、可重复性、准确率均优于基于传统光谱建立的检测模型。
图11 稳定性、可重复性实验结果
本文以红富士苹果为实验对象,以单波长光为光源,利用激光控制器控制激光器电流产生弛豫现象,激发苹果内部化学官能团的弛豫特性,采集样品的弛豫光谱,建立基于BP 神经网络算法的损伤检测模型,以验证利用弛豫光谱判别苹果是否损伤的可行性。 实验首先对原始光谱数据进行筛选,采用SNV算法对筛选后的光谱数据进行优化,利用传统静态光谱和弛豫动态光谱,基于BP 神经网络算法分别建立SNV-BP-CS 和SNV-BP-RS 模型。 SNV-BP-CS 模型最优网络结构参数:输入层的尺寸为713×1,隐含层节点为48,输出层尺寸为2×1,迭代次数为20 000 次。SNV-BP-RS 模型最优网络结构参数:输入层的尺寸为24×1,隐含层节点数为76,输出层尺寸为2×1,迭代次数为5 000 次。 采集的光谱数据通过筛选、SNV算法优化后,代入模型训练测试。 SNV-BP-CS 模型的训练集准确率为95.26%,测试集准确率为86.39%,检测一个样本用时0.454 s。 SNV-BP-RS 模型的训练集准确率可以达到99.79%,测试集准确率达到91.48%,检测一个苹果是否损伤用时为0.291 s。 相较于基于传统静态光谱和BP 神经网络算法建立的SNV-BPCS 苹果损伤检测模型,基于弛豫动态光谱技术和BP神经网络算法建立的SNV-BP-RS 苹果损伤检测模型能够有效降低光谱检测对激光波段的需求,模型检测准确率高,用时短,稳定性良好。 用本文提出的基于弛豫动态光谱技术的苹果损伤检测方法判别苹果是否损伤,仅需一个单波长光源、一个光谱仪、一台电脑以及若干固定设备即可,大大缩小了检测设备的体积和成本。 为水果精准、高效、低成本的探伤性研究提供了一种新的思路。