张皓婷 李明 薛海峰 图拉 李敏 闫凤 祝鹏
摘要 本试验以番茄为材料,在施用不同量的有机肥下,对基于机器学习的番茄果实识别和产量估算进行了深入研究和综合评价。通过重复训练、验证、分析,得出基于Faster R-CNN网络模型在番茄果实识别模型的准确率为90.89%,准确率较高;结合运用图像识别测算得的产量与番茄不同施肥量处理实际测产误差较大,实际运用效果相对较差;4种不同施肥量设置对番茄的结果数、识别数和产量的影响都高于对照处理,实际生产施用有机肥4 500 kg/hm2效果最好。基于Faster R-CNN网络模型的番茄数据集的测试结果效果较好,识别准确率较高,可作为其他指标测定的基础。
关键词 机器学习;Faster R-CNN;番茄识别;产量估算
中图分类号 TP181;S641.2 文献标识码 A
文章编号 1007-7731(2023)10-0136-04
番茄是我国设施栽培的主要蔬菜作物之一[1]。为能够四季供应新鲜番茄,番茄以设施保护栽培为主以达到周年供给的目的。目前,活性有机肥被大面积使用,可提高土壤供肥能力,促进有机质分解和团粒结构[2]形成,可明显提高番茄产量。番茄产量测定是番茄生产中衡量经济效益的关键指标[3],设施番茄人工测量番茄生长的各项生理指标中存在测量精度、准确度不高和实用性差等问题。机器学习[4](Machine Learning,ML)是人工智能的核心,使计算机模拟人类的学习活动,不断学习已有知识、获取新知识,逐步实现设施生产系统的改进与完善;利用现代最新信息技术和手段,通过对数据深度挖掘、融合、分析和人工智能决策,可促进基于机器学习与设施番茄的生产进行智能又精确的识别与估算方面研究;进而有效促进番茄生产,提高品质产量和减少资源浪费。利用深度学习技术进行番茄产量的预测和估算,通过设计番茄果实特有的颜色、纹理、形状以及空间方向特征属性[5],从背景枝叶中分离出番茄果实,然后再采用基于区域和计数的方法对产量进行估计[6],用基于Faster R-CNN网络模型的训练模型识别出的番茄果数的计数方法来预测番茄的数量。本试验设计基于Faster R-CNN网络模型对番茄果实的识别,并提出了基于果实识别方法将不同施肥量与产量的关系构建相关系数,在尽可能提高准确率的同时有效提高测量效率,以期实现机器学习对作物的识别与产量的预测,为丰富和优化设施番茄栽培生产提供一定的参考。
1 材料与方法
1.1 试验材料
品种:草莓番茄。材料:拍摄设备(vivo手机)、温度传感器、湿度传感器、光照传感器、CO2传感器。试验平台:本文所有试验均在Win10系统计算机64位操作系统Ubuntu16.04下完成。
1.2 试验方法
试验采用随机区组,番茄幼苗5月6日定植,种植密度为27 700株/hm2,每个处理小区面积20 m2,重复3次;设置4种不同施肥量处理,依次为施用有机肥1 500、3 000、4 500、6 000 kg/hm2,各处理依次标记为A1、A2、A3和A4,将未施肥处理设置为对照(CK),共计5个处理,并在每种处理中加入等量腐殖酸水溶肥(300 L/hm2),其余田间管理措施一致。各项数据在番茄生长期间测定,每个处理随机测量10株,并计算平均值。测量番茄的小花数、花序数、单株结果数、单果重、单株产量,在番茄苗期、结果前期、结果中期和结果后期分别进行图像采集。
图像采集及数据集制作方法:先在田间光线良好条件下采集图片,然后将拍摄的原始图像进行处理、缩小、标注,将数据整理成为数据集;该数据集为番茄目标检测数据集,其中共有600张训练样本图像和400张测试样本图像,自制的VOC格式的数据集中只包含1种带标签的待测目标,使用 Faster-RCNN 模型进行训练,以得出测定数据和相应结果。
2 结果与分析
2.1 Faster R-CNN模型对番茄果实识别检测结果
本文运行的faster R-CNN网络模型学习率(lr=0.001)设为0.001,Batch size为64,dropout参数设为0.5。通过Faster R-CNN网络模型对数据集的运行训练、测试和验证,得出数据。
Faster R-CNN网络模型的结构主要是由2个网络组成,损失函数分为4个部分,4个损失相加得出最后的损失,即训练结果得出损失率0.233 929 117;训练過程不断地反向传播和更新参数,经过对数据集在Faster R-CNN网络模型上多次训练的分类回归,发现不同施肥量处理番茄识别检测训练的损失曲线高度一致,且总损失率几乎相同;由数据可知,同一模型训练多次的回归损失函数值是近似相同的,且目前训练的损失率相对较小。Faster R-CNN网络模型中进行的函数运行、检测、计算得出mAP值。
Faster R-CNN网络模型训练完成后测试集的mAP值为0.908 9;以采集的4种不同施肥量(A1、A2、A3和A4。)处理及对照(CK)处理的番茄果实图像作为验证,经过变次运行得到的mAP值为0.908 68~0.908 95,即可得出测试集的检测准确率为90.89%。综上得出,Faster R-CNN网络模型在训练样本时,损失函数的下降速度快且变化幅度小,测试准确率曲线先下降再上下震荡然后趋于平缓,Faster R-CNN网络模型检测番茄果实的损失率及准确率曲线波动幅度小,且Faster R-CNN网络模型测试准确率较高;Faster R-CNN网络模型在不同施肥量处理的番茄果实检测方面,准确率为90.89%,检测效果较好。
2.2 不同施肥量处理结果数间的数据比较
经过Faster R-CNN网络模型运行番茄果实图像和识别检测,对4种不同施肥量处理(A1、A2、A3、A4)和对照(CK)处理进行识别数的比较。
4种不同施肥量处理和对照处理间的Faster R-CNN网络模型识别结果数:A3的识别结果数最多,A4次之,其次为A2和A1,CK最少。为验证结果的其可靠性,与实际测量的数据相比,识别结果数与实际单次测量结果数基本吻合。对实际测量的不同处理间的数据进行比较,单次测定的番茄结果数依然是A3的识别结果数和实际测量结果数最多,A4次之,其次为A2、A1,CK最少,由此可以得出在实际生产中施用有机肥4 500 kg/hm2的效果最好、识别数和实际结果数最多,施用有机肥6 000 kg/hm2的效果次之,不施肥料的效果最差。Faster R-CNN网络模型识别效果较好。
2.3 不同施肥量处理识别结果数与实际结果数验证
2021年6月11日至8月10日,对不同施肥量处下的番茄采集图像数据,并对设施番茄产量检测识别和预测进行验证。为排除偶然误差,先利用2021年6月11日至8月10日期间的一部分数据进行训练、验证和测试3次参数辨识,后利用Faster R-CNN网络模型对2021年6月11日至8月10日期间的相应数据在不同施肥量处理的番茄识别数和实际生产测量数据进行预测比较,对单株测定值取平均,结果如图1所示。
由图1可看出,4种不同施肥量处理的番茄结果数均高于对照处理,经过3次测定和模型运算,A3的识别结果数和实际结果数最多,其次是A4、A2、A1,CK最少。
2.4 番茄产量估算
使用Faster R-CNN网络模型对番茄果实图像样本进行训练,获取训练过程准确率数据并对数据集做训练和预测。通过训练过程检测识别出的番茄果实数预测结果数量,再依据模型识别出的数量、矩形标注框的大小和相应矩形内的果实,进而估算产量。即Faster R-CNN网络模型检测出图像中每个番茄果实的真实边界框体积和正切圆体积构建的系数约0.523。采用单株产量=每穗果数(Faster R-CNN网络模型的单张图片识别数)×每株穗数×单果重或实际测量值做验证。
通过在网络模型中的多次训练、测试和验证,得出番茄的结果数据,将检测出的番茄果实数与构建系数相乘,得出预测产量,并与实际生产测得的产量数据进行比较。
依据Faster R-CNN网络模型检测出的番茄结果数据计算得出预测产量1、2,与实际生产测得的产量数据进行比较。由图2可以看出,预测1和预测2与实际测量相比,分别低于实际测量33.30%和25.00%。由于目前是初次使用这种方式对产量进行预测和估算,在图片拍摄距离、角度、方向上还尚未标准化,标记部分重叠及果实之间相互遮挡均可能对估测值有较大的影响。虽然使用基于Faster R-CNN网络模型果实识别方法与产量构建的估测系数能预测番茄产量,但实际测量值更接近按单株产量计算得出的产量,故未对不同施肥量处理的预测进行比较。基于Faster R-CNN网络模型果实识别方法与产量构建的估测系数预测不同施肥量处理的番茄产量在后续试验中有待进一步提高。
3 讨论
孙素云等[7]收集了苹果树叶病害图像,对原始样本先进行直方图均衡化、滤波,再利用阈值分割算法分割图像获得病害区域,继而获取该区域的颜色和纹理特征,最后用SVM建立模型获得分类的准确率为92.68%。本试验运用的Faster R-CNN网络模型在不同施肥量处理的番茄果实检测方面,准确率为90.89%,有待继续改进;与实际测量值对比也需进一步提高。邓赓[8]基于机器视觉提出了一种串—粒融合的两阶段葡萄产量预测框架,先利用目标检测器进行葡萄串定位,在经改进的网络模型进行葡萄计数,并将这2个阶段互相融合起来,实现葡萄产量预测,提高了产量预测的准确性。张立彬等[9]利用改进的退火粒子群算法构建了一种机理模型和参数辨识相结合的温室番茄产量预测模型,该优化模型预测的总产量与实际测量总产量的相对误差为2.20%,总产量的预测精度高达97.80%。本试验结果表明,基于机器学习中Faster R-CNN网络的番茄识别2次预测方式和实际测量值相比,预测值显著低于实际测量的产量值,分别比实际测量低33.30%和25.00%。学者们认为利用机器学习技术在产量预测方面,机器学习结合遥感技术和粒子群算法进行的预测更接近实际产量,也存在环境不稳定影响产生一定的误差。本试验中,由于标记部分重叠和果实之间相互遮挡,以及在图片拍摄方面也可能存在距离、角度、方向上不标准,这些因素均可能对估测值造成一定的影响,所以基于Faster R-CNN网络模型果实识别方法与产量构建的估测系数预测番茄产量在后续试验Faster R-CNN网络模型中有待进一步的优化。
4 结论
本次试验利用机器学习下的Faster R-CNN网络模型对番茄种植过程中4种不同施肥量处理A1、A2、A3、A4和对照(CK)处理图像数据样本进行番茄果实目标检测,准确率为90.89%;识别结果数与实际测量结果数比较得出,A3的识别结果数和实际测量结果数最多,A4次之,其次为A2和A1,未施用有机肥CK最少;预测结果数与实际测量的结果数基本吻合。在基于模型构建的果实识别与产量的相关系数的预测方法中,第一次预测、第二次预测和实际测量值相比,预测值显著低于实际测量的产量值。
机器学习算法在识别中表现精度较高,最近几年,由于人工智能的不断发展与完善,采用机器学习的方法进行作物的识别和产量的预测有了新的进展,机器学习的预测精度也在不断提升。利用机器学习下的Faster R-CNN网络模型进行目标检测可为农业领域其他方面提供指标测定基础。目前基于模型构建的果实识别与产量的相关系数的预测方法中,在图片拍摄方面可能存在距离、角度、方向上的不标准,以及标记部分重叠和果实之间相互遮挡均可能对估测值造成一定的影响,所以在后续的试验中还需进一步的研究和优化。
参考文献
[1] 陈杏禹.蔬菜栽培[M].北京:高等教育出版社, 2015.
[2] 杨志臣,吕贻忠,张凤荣,等. 秸秆还田和腐熟有机肥对水稻土培肥效果对比分析[J].农业工程学报,2008(3):214-218.
[3] 王振华,陈潇洁,吕德生,等.水肥耦合对加气滴灌加工番茄产量及品质的影响[J].农业工程学报,2020,36(19):66-75.
[4] 陈凯,朱钰.机器学习及其相关算法综述[J].统计与信息论坛,2007(5):105-112.
[5] 张燕,田国英,杨英茹,等.基于SVM的设施番茄早疫病在线识别方法研究[J].农业机械学报,2021,52(S1):125-133,206.
[6] 郑太雄,江明哲,冯明驰.基于视觉的采摘机器人目标识别与定位方法研究综述[J].仪器仪表学报,2021,42(9):28-51.
[7] 孙素云.基于图像处理和支持向量机的苹果树叶部病害的分类研究[D]. 西安:西安科技大學,2017.
[8] 邓赓.基于机器视觉的葡萄产量预估模型关键技术研究[D]. 成都:四川大学,2022.
[9] 张立彬,应建阳,陈教料.基于IPSO-SA算法的温室番茄产量预测方法[J].浙江工业大学学报,2019,47(5):527-533.
(责编:何 艳)