基于遗传算法BP 神经网络芒果成熟度判别模型的构建与优化

2023-12-29 03:42房芯如邢靖萱索郎措江亿平
北方农业学报 2023年5期
关键词:糖度成熟度芒果

房芯如,邢靖萱,索郎措,江亿平

(南京农业大学,江苏南京 210000)

芒果(Mangifera indica L.)属漆树科常绿乔木果树,其果实风味独特且富含膳食纤维、有机酸、胡萝卜素、维生素、矿物质、多酚等营养物质,具有较高的经济价值,被誉为“热带水果之王”[1],其种植地主要分布在我国广东、海南、广西、福建等地区[2]。芒果属于呼吸跃变型果实,采摘后其细胞的呼吸作用会导致水果内部品质发生变化[3],芒果不耐存储,易腐烂,一旦达到呼吸高峰,其品质便会急剧下降[4]。运输过程中,果实之间的挤压、摩擦、碰撞等也会造成不同程度的机械损伤,导致芒果发生应激反应,引起果实品质发生劣变[5],并极易在运输过程中受到微生物的污染,影响其食用价值。因此,芒果采收期和运输方式的适宜与否对于延长芒果的贮运期和货架期至关重要。

成熟度是芒果采摘和贮藏的重要依据,而芒果采摘的成熟过程受多种因素影响。芒果成熟度判定的评价指标可以分为外部指标和内部指标。外部指标主要包括果实大小、颜色[6]、形状等,内部指标主要包括果肉硬度[7]、可溶性固形物含量、酸度[8]、pH 值、总糖含量[9]等。此外,水分含量差异也是考查芒果成熟度和品质的重要参数。BAI 等[10]利用激光背散射成像(LLBI)检测技术,实现了对芒果水分含量的动态检测,但仅以单一评价指标判定,忽略了芒果后熟过程的复杂性,判别结果准确性较低。

目前,主要利用图像处理技术[11]、近红外光谱[12]、超声波检测[13]、嗅觉可视化技术[14]和声学检测技术[15]等无损检测技术来判别芒果成熟度。黄毅英[16]采用计算机视觉技术对芒果的相对运输距离信息进行分析,并采用互相关算法弥补了质心算法无法对篇幅较少图像进行准确处理的缺点。向阳等[17]针对芒果形状不规则难以检测的问题,使用ANSYS 软件建模分析芒果承受挤压力的范围,并用迁移学习方法在卷积神经网络模型上进行芒果成熟度分级。辛华健等[18]采用自适应Canny 算法对图像进行预处理,并通过压力传感器采集芒果的重量数据,实现了芒果的综合检测与分级。

鉴于电容传感器、气味传感器、光谱技术等检测芒果成熟度的方法都难以在芒果采摘现场应用。本试验根据芒果采摘中需要关注的果实表皮颜色问题,探究了芒果的硬度、糖度以及图像特征变量(R、G、B、H、S、V 分量)与芒果成熟度之间的相关性,并通过遗传算法优化BP 神经网络来预测芒果的成熟度,从而建立一套遗传算法优化BP 神经网络的芒果成熟度判别模型,以期为后续芒果采摘、拣选发货和优化冷链配送提供技术支撑。

1 材料和方法

1.1 试验材料

试验样品于2022 年8—9 月在广西百色市芒果种植园采集,试验选取小台芒作为试验材料,试验期间共采集350 个有效样本。其中,300 个有效样本用于测量芒果的糖度、硬度并拍摄RGB 图像,其中青熟、完熟、过熟的芒果样本各100 份,每种成熟度划分为4 组,每组各25 个,共12 组。其余50 个青熟芒果用于做贮藏期试验,间隔24 h 采集RGB 图像,直至芒果腐烂。芒果成熟度等级分别为青熟、完熟、过熟,用字母A、B、C 表示,不同成熟度的果实样本见图1。

图1 不同成熟度的芒果样本Figure 1 Mango samples with different maturity

1.2 芒果成熟度数据获取

1.2.1 果实硬度测定

使用GY-2 型果实硬度计,直径为3.5 mm,测量芒果硬度(单位N)。将果实硬度计垂直于被测果实表面,压头完全压入果实,屏幕所显示的读数为芒果硬度值。为了减少人工测量的误差,结果取3 次测量的平均值,最终获取芒果硬度数据共300 份,其中青熟数据、完熟数据和过熟数据各100 份。

1.2.2 果实可溶性固形物含量测定

使用数显糖度仪测定芒果中的可溶性固形物含量。滴入芒果液体至样品槽三分之二处,按下仪器测量键,结果取3 次测量的平均值。注意用柔软潮湿的布擦拭样品槽,将样品槽擦拭干净后继续下次测量。最终获取芒果糖度数据共300 份,其中青熟数据、完熟数据和过熟数据各100 份。

1.2.3 果实表皮颜色测定

使用产品型号为SHL-500W,像素500W 的CDD 工业相机,并结合配套软件采集芒果的上部、底部共两面图像。最终获取芒果RGB 图像共600 份,其中青熟数据、完熟数据和过熟数据各200 份。在RGB 颜色模型中,提取每个像素的R、G、B 分量,将提取到的目标图像由RGB 颜色模型转化为HSV颜色模型,提取每个像素的H、S、V 分量,并计算所有样本特征分量的均值和方差,这些图像特征描述了图像的颜色信息,反映了芒果在成熟过程中的颜色变化。

计算芒果图像黄色着色率的流程见图2。首先,先对采集到的芒果图像进行预处理(图3a),在HSV分量当中通过直方图选择易于图像分割的分量H,在该分量当中把该类芒果的特征颜色——黄色区域从芒果原始图像中分割出来,分割结果见图3b。其次,通过灰度化、二值化得到芒果原始图像的二值图像以及提取出黄色色素区域的二值图像,芒果图像处理的结果见图3c 和图3d。最后,计算出该黄色区域占芒果整体像素面积的比例,通过这个比例来表示芒果的黄色着色率。

图2 芒果图像处理流程Figure 2 Mango image processing procedure

图3 芒果图像处理结果Figure 3 Mango image processing results

1.3 构建芒果的成熟度判别模型

遗传算法将寻优问题编码成基因,从基因配置杂交的角度实现问题的优化。遗传算法具有并行性、通用性、全局性和鲁棒性的特点,是稳健有效的全局优化求解算法。算法的基本步骤为编码、初始化种群生成、适应度评估。BP 神经网络存在网络初始权值比较难以设置的问题,基于遗传算法的全局寻优能力以及优化对象的通用性,本试验采用遗传算法计算最佳权值和阈值来进行BP 神经网络的优化,从而提高BP 神经网络模型的准确性。

本试验将青熟、完熟、过熟3 种成熟度芒果的糖度、硬度以及图像特征变量(R、G、B、H、S 分量)作为芒果成熟度判别模型的输入量,以芒果成熟度等级作为模型的输出量。首先对芒果数据进行预处理,提升模型的收敛速度和精度。选择300 组芒果成熟度数据进行BP 神经网络训练以及测试,进一步建立的芒果的成熟度判别模型。芒果成熟度建模流程见图4。

图4 芒果成熟度建模流程图Figure 4 Mango maturity modeling flowchart

2 结果与分析

2.1 芒果成熟度数据分析

根据上述试验方法测量芒果的硬度、糖度以及采集芒果的RGB 图像,不同成熟度芒果的糖度、硬度以及RGB 图像的R、G、B、H、S、V 分量的均值和标准差见表1。由表1 可知,硬度和糖度的变异系数分别为42.44%、44.20%,相较于其他成熟度指标,硬度和糖度与芒果成熟度的相关性更为显著。

表1 不同成熟度芒果贮藏期成熟度指标分布Table 1 Maturity index distribution of mango with different maturity level during storage period

由图5 可知,芒果的硬度随着果实成熟度的增加表现出较为明显的下降趋势,在300 份芒果的硬度数据中,硬度在不同成熟度阶段呈显著性差异(P<0.05)。

图5 芒果硬度数据的箱线图Figure 5 Box plot of mango firmness data

由图6 可知,芒果的糖度随着果实成熟度的增加表现出较为明显的增长趋势。在300 份芒果糖度数据中,在同一成熟度的糖度数据分布较为分散,但糖度在不同成熟度阶段呈显著性差异(P<0.05)。

图6 芒果糖度数据的箱线图Figure 6 Box plot of mango sugar content data

由图7Ⅰ、7Ⅱ、7Ⅲ可知,不同成熟度芒果的RGB颜色模型在各个特征分量分布情况不同。在RGB 颜色模型中,R 分量、G 分量和B 分量在不同成熟度阶段呈显著性差异(P<0.05)。

图7 芒果RGB 颜色模型分量的箱线图Figure 7 Box plot of mango RGB color model components

根据芒果的RGB 彩色图像,将其转换到HSV颜色模型。不同成熟度芒果的HSV 颜色模型在各个特征分量分布情况见图8Ⅰ、图8Ⅱ。在HSV 颜色模型中,H 分量在青熟阶段与完熟阶段间差异不显著(P>0.05),而该特征分量在完熟阶段与其他两个成熟度阶段(青熟阶段、完熟阶段)呈显著性差异(P<0.05);S 分量在不同成熟度阶段呈显著性差异(P<0.05);V 分量表示明度,与芒果成熟度相关性不大,故不考虑此分量。

图8 芒果HSV 颜色模型分量的箱线图Figure 8 Box plot of mango HSV color model components

2.2 贮藏期试验结果分析

根据试验所采集的RGB 图像对芒果进行成熟度等级的判断,芒果成熟度随时间变化的分布情况见表2。

表2 芒果成熟度随时间分布情况Table 2 Distribution of mango maturity over time

由表2 可知,青熟芒果在10 d 内出现较为明显的表皮颜色变化;完熟芒果在7 d 内没有发生明显的表皮颜色变化。因此,选取贮藏期试验中青熟芒果第1 天至第4 天(芒果青熟阶段到完熟阶段)所测量的硬度、糖度和所拍摄的RGB 图像进行分析。青熟芒果的糖度、硬度和黄色着色率随时间变化的情况见表3 和图9。

表3 青熟芒果随时间变化的指标分量数值Table 3 Index component values of unripe mango over time

图9 青熟芒果成熟度指标随时间变化的情况Figure 9 Changes in unripe mango maturity index over time

由表3 可知,在贮藏期第1 天至第4 天(芒果青熟阶段到完熟阶段),芒果硬度、糖度数据变化不显著。因此,选取硬度与糖度这两个成熟度指标和芒果黄色着色率进行综合分析。

贮藏期第1 天至第4 天的青熟芒果图像的黄色比例见表3。黄色着色率的计算公式如下

y=0.107+0.182t

由图9 可知,在贮藏期第1 天至第4 天(芒果青熟阶段到完熟阶段),芒果表皮图像的黄色比例与芒果成熟度呈正相关关系。虽然单个芒果存在图像特征H 分量在青熟阶段和完熟阶段之间表现为无显著性差异,但芒果其他的图像特征分量在青熟阶段和完熟阶段则表现为差异显著(P<0.05),故将单个芒果的5 个图像特征分量进行综合分析,不同成熟度的芒果根据整体的图像特征能够在一定程度上隔开,说明图像特征变量(R、G、B、H、S 分量)可以有助于判别出不同成熟度的芒果。

果实的硬度、糖度以及果皮颜色与成熟度密切相关,是常用的成熟度评价指标。综合上述分析可知,芒果的硬度、糖度以及图像特征变量(R、G、B、H、S 分量)可以判别出不同成熟度的芒果。因此,在试验中基于遗传算法优化BP 神经网络的芒果成熟度判别模型采用果实硬度、糖度以及上述5 个图像特征变量(R、G、B、H、S 分量)作为输入因子。

2.3 芒果成熟度建模结果与分析

为了检测以上方法的准确率,本试验在300 份样本集中任意抽取240 份样本作为训练集,剩余60 份样本作为测试集。为了达到交叉验证的目的,上述过程执行100 次后获得的准确率作为适应度评价函数,该方法能够有效避免机器过学习的现象,即避免学习精度过高而泛化能力较差的现象产生。GA 优化的过程中设置最大迭代数为1 000 次,隐藏层个数为5 个,种群规模是20,最大遗传代数设定为50。

由表4 和图10 可知,整个模型训练的结果,24 份青熟样本中有1 份被错误预测成完熟,判别精确率为95.8%。22 份完熟样本中有1 份被错误预测成青熟,判别精确率为95.5%。预测结果的准确率是96.6%。该模型对60 份样本进行10 次预测,10 次预测值分别为96.67%、95.00%、100%、93.33%、98.33%、96.67%、96.67%、98.33%、98.33%、90.00%,求取平均值,准确率为96.3%。

表4 遗传算法优化BP 神经网络的预测结果Table 4 Prediction results of BP neural network optimized by genetic algorithm

图10 遗传算法优化BP 神经网络测试集结果对比Figure 10 Comparison of BP neural network optimized by genetic algorithm test set results

由表5 和图11 可知,整个BP 神经网络模型训练的结果,16 份青熟样本中有3 份被错误预测成完熟,判别精确率为81.2%。20 份完熟样本中有1 份被错误预测成青熟,判别精确率为95.0%。24 份过熟样本中有1 份被错误预测成完熟,判别精确率为95.8%。预测结果的准确率是91.6%。该模型对60 份样本进行10 次预测,10 次预测值分别为93.33%、93.33%、95.00%、93.33%、95.00%、90.00%、96.67%、93.33%、91.67%、90.00%、93.17%,求取平均值,准确率为93.2%。

表5 BP 神经网络的预测结果Table 5 Predicted results of BP neural network

图11 BP 神经网络测试集结果对比Figure 11 Comparison of BP neural network test set results

2.4 两种算法预测结果对比分析

两种算法预测准确度及性能见表6。遗传算法在计算种群个体适度值时,会将每个个体编码赋值给神经网络,然后采用同一组样本进行训练,并记录不同神经网络的预测误差,该误差为种群个体的适应度函数。在不断迭代优化的过程中,BP 神经网络的初始权值会朝着预测误差值不断减小的方向进行搜索,最后优化出的最佳个体包含的权值矩阵即作为BP 神经网络的初始权值矩阵,建立遗传算法优化BP 神经网络,并得到预测结果。

表6 两种算法预测准确度对比Table 6 Comparison of predicted accuracy of the two algorithms

由表6 可知,相对于BP 神经网络模型,遗传算法优化的BP 神经网络实际运行结果的分类准确率为96.3%,平均误差由6.8%降到3.7%,优化算法的分类性能也有所提高。遗传算法优化BP 神经网络的判别芒果成熟度模型能基本上反映出实际的芒果成熟度等级。

3 讨论与结论

芒果品质评价的最常用方法是主要针对果实外观品质进行的感官评价。传统的水果成熟度的检测主要是依据果农的经验进行,但是经验判断方法受主观因素影响较大,不仅效率低而且检测水果果实成熟度的错误率也高[19]。通过测量芒果的硬度和糖度可以明显地判断芒果的成熟度等级,但在测量过程中会破坏芒果表皮,以此来获取硬度与糖度数据。这种测量方法是芒果成熟度的有损检测方法,会影响芒果采摘后的销售环节。

各种无损检测技术的出现,为芒果成熟度检测、采后分级以及品质检测提供了更加有效的解决方案。陈文悦等[20]将机器学习与迁移学习两种方法用于芒果RGB 图像进行成熟度分类,测试时间短,但准确率不高。由于当前的芒果成熟度判别方法在采摘过程中存在一定的误判率,因此,本试验考虑结合多种特征进行芒果成熟度判断,探究芒果硬度、糖度以及图像特征变量(R、G、B、H、S 分量)与芒果成熟度的关系。

本试验采集了芒果的硬度、糖度数据并拍摄了芒果RGB 图像,通过对比分析成熟度指标数据,证实了芒果硬度、糖度以及图像特征变量(R、G、B、H、S分量)与芒果成熟度呈显著相关关系。本试验构建了基于遗传算法优化的BP 神经网络的芒果成熟度判别模型,相较于常见的硬度、糖度等成熟度指标的单一检测,该模型将芒果的硬度、糖度以及图像特征变量(R、G、B、H、S 分量)进行了综合考虑,并利用改进遗传算法进行BP 神经网络的参数寻优,不仅有效避免了盲目选择参数的问题,而且相比于其他的寻优算法更加简单,可以得到更加准确的结果。在对芒果成熟度等级的预测上,该模型预测芒果成熟度的分类准确率达到96.3%,验证了芒果判别模型的准确性以及有效性,证实了根据芒果硬度、糖度以及图像特征变量(R、G、B、H、S 分量)可以对芒果成熟度进行分类判别,也表明了芒果成熟度判别算法是一种行之有效的方法。在此后的研究中还需要深入研究芒果图像特征的分析方法,进一步探索芒果成熟度的无损检测方法。

本试验所建立的芒果成熟度判别模型和求解算法可获取较为准确的芒果成熟度判别结果,为芒果的自动化作业采摘与智能拣选分级环节提供技术支撑,可为生鲜冷链物流的发展提供参考。

猜你喜欢
糖度成熟度芒果
糖度高、类型多、瓜味足 “炫彩”系列小西瓜 亩产值3.5万元
产品制造成熟度在型号批生产风险管理中的应用
整机产品成熟度模型研究与建立
我才不要穿
不同成熟度野生水茄果实的种子萌发差异研究
小洞会“咬”人
小洞会“咬”人
刚好够吃6天的香蕉
甜菜块根糖度检测使用重复检测进行质量控制的方法
基于不同物候期苹果树叶片光谱特征预测果实糖度