基于物联网的甘蔗长势估计方法

2024-09-12 00:00:00杨瀚李修华张木清王泽平黄豪
物联网技术 2024年4期
关键词:甘蔗物联网

摘 要:针对现有农作物长势监测技术成本高、依赖特定传感器硬件等问题,本文在现有农业物联网技术的基础上,利用植物生长影响无线通信信号强度的特性,提出了一种利用物联网接收信号强度指示(RSSI)结合环境数据估计甘蔗长势的方法。基于ZigBee无线网络搭建物联网平台,将物联网平台部署于大田中监测甘蔗生长周期,获取RSSI、株高等实验数据,再利用机器学习方法构建株高估计模型及比较验证。结果显示:基于随机森林的回归模型的评价指标优于其他机器学习模型,决定系数(R2)为0.92,均方根误差(RMSE)为20.97 cm,该方法可满足农业株高监测的需要,为农作物长势监测提供了一种低成本方案。

关键词:甘蔗;长势估计;物联网;ZigBee;信号接收强度指示;CC2530

中图分类号:TP202;S24 文献标识码:A 文章编号:2095-1302(2024)04-0-04

DOI:10.16667/j.issn.2095-1302.2024.04.026

0 引 言

甘蔗是全球第一大糖料作物和第二大生物能源作物。广西是国内甘蔗生产主产区,蔗糖业也是广西重要的支柱产业,其蔗糖产量自1992年至今已30多年位居全国第一[1]。然而,当前广西在甘蔗种植产业领域仍存在机械化利用率低,智能化管理欠缺等问题。因此,在甘蔗大田搭建物联网系统,实时监测田间环境数据及气象数据,建立准确的甘蔗长势估计模型,对甘蔗生产和保障蔗糖供应具有重要的意义。

以往测量农作物的长势主要是以实地测量为主,但这种长势获取方法往往费时费力。随着近年来信息化水平的提高,一些新技术也运用到农作物长势监测领域。Chang等人[2]提出了一种基于无人机低空遥感监测高粱作物高度的方法,使用无人机搭载专业RGB相机,拍摄高粱作物的低空图像,通过算法将图像生成3D点云,从3D点云数据生成数字地形模型(DTM)和数字地表模型(DSM),然后利用DSM数据减去DTM数据得到作物高度。Kim等人[3]研究基于深度像机,通过立体匹配将获取的立体图像转换为视差图,以确定相机和作物之间的距离深度,再通过像素的坐标变换来计算作物高度。Banerjee等人[4]开发了一种集成于树莓派平台的激光雷达传感器,将传感器布置于农作物正上方,通过雷达扫描的方式测量作物株高。Alighaleh等人[5]开发了一套测量农作物高度的激光传感器阵列,将激光传感器阵列部署在可移动的支架上,通过移动扫描的方式测量小麦和水稻的株高。

以上农作物长势监测研究已经取得了一些阶段性的成果,但是这些技术也存在造价昂贵或需要特定传感器硬件支持等问题。近年来,随着无线传感器网络技术研究的深入,对无线传感器网络信号传播衰减规律的研究也成为一个新的研究方向。Luomala等人[6]研究了空气温度与湿度对无线信号强度的影响。张云皓等人[7]设计了基于LoRa技术的农业物联网系统,该系统通过对不同天气、距离状态下的接收信号强度指标(Received Signal Strength Indication, RSSI)进行分析,确认了利用RSSI值预测甘蔗长势的可行性。Bauer等人[8]研究了以叶面积指数(LAI)为代表的作物长势与无线收发器信号传播衰减之间的关系,证明LAI和接收信号强度指标(RSSI)时间序列之间存在显著相关性,综合气象因素构建了一个估计LAI的多元线性模型。本文基于ZigBee无线传输技术搭建大田物联网系统,通过该系统采集各末端节点的接收信号强度指示(RSSI)数据,并结合环境数据构建甘蔗长势估计模型,提供了一种新的甘蔗株高监测方法。

1 材料与方法

1.1 研究区域概况

本研究试验地点位于广西大学扶绥农科新城甘蔗试验田(22°3035.9 N,107°4638.7 E),该地区属亚热带季风型气候,夏季高温多雨,光热充足,春季温暖湿润、秋季干燥少雨,冬季短促气温较低,适宜种植甘蔗[9]。一般甘蔗生长分为5个时期,萌芽期(3~4月)、幼苗期(4~5月)、分蘖期(5~6月)、伸长期(6~10月)、成熟期(10~12月),本研究主要针对甘蔗的伸长期和成熟期。

1.2 甘蔗物联网环境监测系统总体架构

本文设计的农业物联网系统架构主要包括信息感知层、网络层和应用层,其主要功能模块包括田间环境监测模块、云服务存储模块及上位机数据监测模块等,农业物联网系统总体架构如图1所示。末端节点装有收集环境信息的传感器,将收集的环境数据以ZigBee数据包的方式发送至协调器节点;协调器节点接收数据后记录本次通信的信号强度指示(RSSI)值,通过4G-LTE网关模块发送至上位机;上位机部署在阿里云服务器中,采用TCP/IP协议同网关连接,将接收的数据存储到数据库,通过网页提供数据查询及可视化展示。

系统的硬件部分由微处理器模块、网关模块、电源模块组成,其中,微处理器模块选用TI(德州仪器)出品的CC2530芯片作为主控芯片,其内置ZigBee协议无线射频模组,I/O接口充足、运算能力强、功耗水平低,符合农业物联网的实际要求;网关模块选用WH-LTE-7S4的4G-LTE透传模块,该模块支持多种宽幅电压输入方式,待机功耗低,能满足试验要求。此外,田间环境监测模块还设置了一个天圻气象站,采集甘蔗生长环境的温湿度、风速、风向、雨量、太阳辐射强度等信息。

1.3 数据获取与处理

本试验于2021年6月21日至12月15日将农业物联网系统部署于广西大学扶绥农科新城甘蔗试验田中,系统共设置了6个ZigBee节点,包括1个协调器点、5个末端节点。节点布置位置如图2所示。水平于甘蔗种植方向布置的是1、2号末端节点,分别与协调器节点间隔5 m、10 m处;垂直于甘蔗种植方向布置的是3、4、5号末端节点,分别与协调器节点间隔5 m、10 m、15 m。

系统设置各ZigBee末端节点每隔60 min以3 dBm的发射功率向协调器节点发送环境数据。协调器节点接收后记录每次通信的RSSI数据。试验期内,共获取RSSI数据29 951条。

本研究以株高作为模型因变量,株高真值采集的方法:在2个相邻末端节点间选取5株具有代表性的甘蔗,利用株高尺测量甘蔗植株基底部至最高可见肥厚带的高度,将采集的株高数据取平均值作为该区域的株高真值。在试验周期内,测量时间为7天一次,共测得株高真值数据115份。为匹配农业物联网系统的60 min采集周期,本文假设甘蔗株高在每个测量周期内呈均匀线性变化,使用线性插值法得到以小时为周期的株高真值20 150份。

为提高建模精度,建立的模型需要考虑环境变量对接收信号强度(RSSI)的影响。系统设置了一个气象环境监测站,提供每小时的空气温度、相对湿度、土壤温度、雨量、太阳辐射强度、大气压力和风向等气象数据。除这些气象因素外,节点间的距离也对RSSI的大小产生影响。因此,本次试验还引入了末端节点与协调器节点的水平距离D1和垂直距离D2用于建立模型。这样可以更全面地考虑环境因素和节点距离对RSSI的影响,从而提高建模的精度。

将采集的20 150份数据样本剔除有空值、异常值的数据后,剩余15 541份样本。按照7∶3的方法随机抽样,最后得到训练样本10 878份、测试样本4 663份。用多种机器学习模型建模方法进行比较验证,得到最优的株高估计模型。模型建立的总体路线如图3所示。

1.4 模型预测精度评价指标

本研究选择决定系数(R2)、均方根误差(RMSE)作为评判模型拟合和预测准确度的评价指标。其公式为:

(1)

(2)

式中:n为样本数;yiobs为株高实际值;yipre为株高模型估计值;yavg为实测株高样本均值。上述值的单位均为厘米(cm)。R2越大RMSE值越小,表示模型预测的效果越好。

2 结果与讨论

2.1 RSSI与株高相关性分析

5个末端节点RSSI周平均值与周平均株高的时间序列如图4所示。可看出,1、2号节点的信号衰减相较于3、4、5号更快,推测原因是由于节点布置的方向不同,在节点信号传播路径内,水平于甘蔗种植方向布置的节点相较于垂直布置的节点经过的甘蔗叶片数量更多,所以受到信号干扰的强度更大。单独对比1号与3号节点、2号与4号节点数据也能发现相同规律,距离协调器节点距离相同的2个节点,垂直于种植方向布置的节点信号值始终高于水平布置的节点。横向对比节点的RSSI与甘蔗平均株高可看出,在甘蔗伸长期内,甘蔗株高快速增高,同时各节点的RSSI值快速下降;在甘蔗成熟期后,甘蔗的株高上升变缓,而各节点RSSI却小幅上升。主要原因是甘蔗进入成熟期后,叶片干枯掉落,对信号的遮挡减少,从而导致RSSI值上升。由此可见,甘蔗的叶子、茎干等生物组织可以对无线信号产生一定的衰减作用。当植物生长茂密时,物联网节点的无线信号在传播路径内可能会受生物组织吸收、散射或反射的影响,导致信号强度下降。

2.2 基于随机森林的株高估计模型的建立

随机森林(Random Forests, RF)是由Breiman于2001年

提出的一种集成算法[10],通过生成多棵决策树,再通过某种集成策略进行组合,输出最终结果。根据决策类型的不同可以分为分类和回归两种模型,其中分类型RF是根据不同决策树的分类结果进行投票表决以决定最终分类,回归型RF的决策结果是根据不同决策树的决策结果取平均值进行决策。其训练方式是从训练样本进行bootstrap抽样,即随机且有放回的抽样。再根据每个不同的抽样结果各生成一棵决策树,通过重复以上步骤m次生成m棵决策树组成随机森林。随机森林的实质是一种加强版的决策树,将多个决策树组合在一起,能够减少随机误差带来的影响,使得随机森林算法具有很强的抗噪能力,在多个领域都有广泛应用。

在随机森林建模的过程中需要设置的关键参数有决策树数量、每棵树的最大深度。理论上,决策树的数量越大,模型的预测精度越高;每棵树的最大深度越深,模型的预测误差越小。但是决策树的数量越大,深度越深占用的内存与训练和预测时间也会相应增加。为了寻求最优参数,在建模时逐一尝试n_estimators与max_depth参数,计算模型测试集与训练集的决定系数R2与均方根误差RMSE,结果如图5所示。从图中可以看出,当决策树数量达到100、决策树最大深度达到25后,模型的R2与RMSE趋于稳定。因此,将n_estimators设置为100,max_depth

设置为25。

基于随机森林回归模型的预测结果如图6所示。训练集的均方根误差RMSE为7.85,决定系数R2为0.988 9;测试集的均方根误差RMSE为20.97,决定系数R2为0.921 6。

2.3 几种回归模型预测结果比较

为了评估随机森林回归模型的精度,基于决定系数(R2)、均方根误差(RMSE)指标,与其他几种常见的机器学习算法进行对比,结果见表1所列。从结果中可以看出,随机森林回归模型取得了最高的预测精度,模型的各项指标均优于其他几种回归模型。综上所述,随机森林算法构建的甘蔗株高估计模型有更好的预测能力和泛化能力。

2.4 讨论

本文研究了甘蔗大田环境中ZigBee无线信道通信的接收强度指示(RSSI)与甘蔗株高的回归模型。对于甘蔗而言,在伸长期内甘蔗的株高会不断增高,甘蔗的枝叶也变得更为茂盛,由植株引起的通信信号散射与反射更强烈,从而导致信号强度(RSSI)下降;在甘蔗进入成熟期后,叶子会随着甘蔗果肉的成熟自然枯萎变黄掉落,使得信号强度(RSSI)上升。在大田复杂环境中,引起RSSI变化的因素不仅有株高变化,空气温湿度、风速风向都能使得信号值有不同程度的衰减。因为不同因素导致RSSI波动难以量化,所以本文采用机器学习的方式联合多个影响因素共同建立株高估计模型,建立的模型具有较强的适应性和准确度。

3 结 语

(1)文中设计了1套基于ZigBee技术的物联网环境信息采集系统,实现了对蔗田温湿度、风速、雨量、光照强度等环境信息的实时监测与上传,可实时获取各节点的RSSI值。

(2)将物联网节点部署于试验地内,采集了2021年

6月至12月甘蔗伸长期与成熟期的环境信息,试验周期内共采集有效实验数据15 541条。

(3)本文构建的随机森林株高估计模型的R2最高为0.92,RMSE为20.97 cm,相较于其他机器学习算法,更能满足农业株高监测的需要,为农业生产指导提供决策依据。

注:本文通讯作者为李修华。

参考文献

[1]莫般. 广西甘蔗“双高”建设探讨[J]. 南方农业,2017,11(27):69-70.

[2] CHANG A,JUNG J,MAEDA M M,et al. Crop height monitoring with digital imagery from unmanned aerial system(UAS)[J]. Computers and electronics in agriculture,2017,141:232-237.

[3] KIM W,LEE D,KIM Y,et al. Stereo-vision-based crop height estimation for agricultural robots [J]. Computers and electronics in agriculture,2021,181:105937.

[4] BANERJEE B P,SPANGENBERG G,KANT S. CBM:An IoT enabled LiDAR sensor for In-Field crop height and biomass measurements [J]. Biosensors,2022,12(1):16.

[5] ALIGHALEH P,GUNDOSHMIAN M T,ALIGHALEH S,et al. Feasibility and reliability of agricultural crop height measurement using the laser sensor array [J]. Information processing in agriculture,2023.

[6] LUOMALA J,HAKALA I. Effects of temperature and humidity on radio signal strength in outdoor wireless sensor networks [C]// 2015. Polish Information Processing Society (PIPS),2015.

[7]李修华,张云皓,李婉,等. LoRa物联网设计及其甘蔗生物量预测可行性研究[J]. 农业机械学报,2019,63(s1):228-232.

[8] BAUER J,ASCHENBRUCK N. Towards a low-cost rssi-based crop monitoring [J]. ACM transactions on internet of things,2020,1(4):1-26.

[9]冯振家. 影响武鸣县甘蔗生产的气象条件分析[J]. 气象研究与应用,2011,32(3):49-52.

[10] BREIMAN L. Random forests [J]. Machine learning,2001,45(1):5-32.

收稿日期:2023-04-13 修回日期:2023-05-17

基金项目:广西重大科技专项:广西数字蔗田技术平台的构建与应用示范(桂科AA22117004);广西重大科技创新基地建设项目:广西甘蔗生物学重点实验室(桂科2018-266-Z01);国家自然科学基金:低空航拍图像融合田间环境及气象信息立体构建甘蔗长势、品质及产量预测模型(31760342)

猜你喜欢
甘蔗物联网
花式卖甘蔗
清明甘蔗“毒过蛇”
基层中医药(2021年3期)2021-11-22 08:08:04
爱咬甘蔗的百岁爷爷
特别健康(2018年3期)2018-07-04 00:40:08
23个甘蔗品种对甘蔗黑穗病的抗性测定
中国糖料(2016年1期)2016-12-01 06:48:57
基于物联网的煤矿智能仓储与物流运输管理系统设计与应用
基于高职院校物联网技术应用人才培养的思考分析
中国或成“物联网”领军者
环球时报(2016-08-01)2016-08-01 07:04:45