农英雄,陆瑛,陈智斌,黄聪,黄崇峻,梁冬*,陈宁江,陈玉华
1 广西中烟工业有限责任公司,信息中心,广西南宁市北湖南路28号 530001;
2 广西大学,计算机与电子信息学院,广西南宁市大学东路100号 530004;
3 广西中烟工业有限责任公司,原料供应部,广西南宁市北湖南路28号 530001
物联网在作物灌溉、监测、病虫防治、产品追溯等农业领域具有广泛用途,通过感知设备能够识别、监测、定位以及获取各种作物信息数据,并实现农业精准种植和管理[1-3]。烤烟的生产包括选种育苗、田间种植、采收初烤、分拣收购、打叶复烤和原料入库等环节,其中选种育苗和田间种植阶段对烟叶的质量和产量有着直接关系。李文卿等[4]发现推迟烟草移栽期,由于温度提高和光照增强,可以提高烟叶产量;陆永恒[5]研究和总结了影响烟叶品质的田间气候、土壤类型和海拔高度等主要生态条件;侯壮伟等[6]研究土壤pH值对烤烟的生长发育和干物质的影响;此外,烤烟的耕种方式和灌溉模式对烟草生长和烟叶品质也有不同作用[7-8]。烟草作为一种对环境敏感的经济作物,移栽期、气候、土壤和耕作方式等因素与烟叶的质量、产量有密切关系。
近年来,行业采用物联网技术在烤烟的复烤、仓储和产品追溯等环节都有相关研究,但该技术在烟草种植和管理方面的研究应用相对较少[9-10]。吴波等[11]在烤烟物流管控方面构建了一套基于RFID技术的精益物流管理体系,提高了作业效率;陶健等[12]研究遥感技术在大面积烟田种植和管理方面的应用;李光雷等[13]设计的烟叶信息系统对烟地、育苗点和烤房等信息进行采集,提高数据录入效率和信息化管理水平,但采用物联网技术实现对烟草种植全生命周期监控的工作还不够充分。
在烟草种植数据的获取和监控方面,目前是由农技人员到田间手动采集种植数据,该方式存在采集周期长、人力成本高、数据滞后和效率低等问题。本文所关注的“智慧烟叶”模式,即在烟叶全产业链的产前、产中及产后等环节以大数据分析、人工智能、农业物联网等技术作为支撑,推动生产精准化和智能化。为了实现烟草精准种植和智能管理,本文研发了一套基于物联网监控的烟叶精准种植管理系统,设计了基于物联网技术的多源异构种植数据采集和传输机制,提出了基于机器学习的烟草精准种植和智能管理方法,同时构建了烟区烟草种植信息数据库,为烟草精准种植管理和烤烟原料生产提供有效数据支撑。
基于物联网监控的烟叶精准种植管理系统采用层次结构,由感知与网络层、存储层、数据服务层、业务逻辑层和表示层构成,以物联网、云计算和大数据等技术作为支撑,实现烟田多源异构种植数据的实时采集、传输、存储、处理和分析。
如图1所示,感知与网络层是关键层,实现基于物联网技术的烟田气象数据、环境数据、土壤数据和作物长势图像等多源异构数据的精准采集和可靠传输,表1展示了本系统主要采集的数据;存储层主要实现存储传感器数据、图像数据和烟草业务领域数据;数据服务层主要是处理大量的种植数据和烟草领域数据,向上为核心业务提供模型支撑,向下为构建烟区种植知识数据库提供有效的数据分析服务;业务逻辑层是系统功能和应用实现的核心部分,主要功能包括实时监控、数据可视化、种植管理、用户管理、监控点管理等;表示层采用响应式架构,实现界面渲染和前后端数据的响应,为移动端和电脑端用户提供良好的交互体验。
图1 系统的体系结构Fig.1 System architecture
表1 数据采集内容Tab. 1 Data acquisition content
烟草大田种植时期包括移栽期、团棵期、开花期和成熟期,以往烟农依靠历年种植经验耕作,种植过程不够精细,对烟叶生长状况、产量和品质监控缺乏数据依据;通过农技人员定期到烟田采集和检测土壤样本、记录烟株生长状况信息、收集录入气象数据的方式存在数据采集滞后、精度低、问题反馈不及时等问题。为了实现烟草精准种植和智能管理,本系统主要通过两个方面的关键技术来解决上述问题:(1)针对采集和传输烟田数据,设计了一套基于物联网技术的多源异构种植数据采集和传输机制,实现种植数据的实时采集和低能耗稳定传输;(2)针对烟草种植管理,提出了基于机器学习的烟草精准种植和智能管理方法,训练两个烟草模型,智能识别烟草大田各个生长周期,并提供种植管理建议,为烟田管理人员提供决策支持。
烟草植株的生长受田间气压、温度、湿度、降雨量等因素的影响,烟草不同生长期间对各类生态条件的要求也不同。若适当推迟移栽期,则可缩短大田生长期;若过早或过迟移栽,则对烟草的生长会产生不利的影响[14]。通过物联网传感器实时监测和采集烟田的各类种植数据,可以为植株在不同生长阶段准确提供合适条件。系统主要采集气象、环境、土壤和作物长势图像四类数据,气象数据包括气压、大气湿度、光照辐射量、紫外线强度、大气温度、风速和风向等;环境数据包括降雨量和蒸腾量等;土壤数据包括土壤温度、相对湿度和土壤pH值等;作物长势图像包括烟草作物的各种长势图像数据。面向这四类多源异构的数据,首先在数据采集方面设计了物联网设备部署与采集规范;其次,针对户外大田能源和网络有限的情况,设计低能耗、精准和稳定的数据传输方案。
2.1.1 物联网设备部署与采集规范
面向数据采集需求,设计物联网设备部署和采集规范。首先,在基于统一地块、烟株和耕作方式的原则下,在烟田部署气象和环境数据采集传感器。其次,根据烟株根系生长发育特点,在土壤数据采集方面,设计了一种分层土壤监测采集传感器,用于监测和采集土壤状况。烟株根系的生长发育和生长环境关系到植株对养分的吸收,直接影响到烟叶的产量和品质[15]。在烟株旺长前期,根系的根重和根长仅分布在0~20 cm的土层;在旺长期至打顶期,根系生长到20~40 cm的土层;在成熟期,根系在0~40 cm土层内迅速增加,并开始深入到40~80 cm土层内。烟草的根重、根长、根表面积及活跃吸收面积主要集中在0~20 cm的土层中,其次是20~40 cm的土层[16]。因此,本系统的分层土壤监测采集传感器设计如下:在烟田放置传感器时分别在15cm和30cm处放置土壤温湿度和pH值传感器,监测和采集烟草根系的生长环境信息,如图2所示。
图2 分层土壤传感器示意图Fig.2 Schematic of layered soil sensor
2.1.2 基于物联网技术的数据传输方案
为了适应野外田间用电问题和保证数据稳定可靠传输,系统采用低能耗和稳定的数据传输方案,采用太阳能供电、低能耗通信技术,传感器采用低能耗无线通信ZigBee技术的传输模块,并组网。种植数据通过ZigBee技术汇集到数据网关,并通过蜂窝移动网络以4G/3G网络的方式传输到远程存储服务器并进行数据持久化,如图3所示。烟田的气象传感器、环境传感器和土壤传感器的采集周期为2次/每小时,监控相机拍摄图像周期2次/每天,当数据汇集到数据网关之后就会进入待机模式。至此,实现了多源异构种植数据的采集和传输。
基于机器学习的烟草精准种植和智能管理方法,包括两个部分:大田种植期分类模型和基于决策树算法的智能管理模型。首先,通过历年采集到的作物长势数据,采用神经网络技术训练大田种植期分类模型,对种植时期进行分类;其次,关联大田种植分类模型的输出数据,训练基于决策树算法的烟草智能管理模型,根据实时种植数据,反馈最佳种植管理建议,为烟田管理提供数据依据。
图3 数据采集示意图Fig.3 Schematic of data collection
2.2.1 大田种植期分类模型
为了训练烟草大田种植期分类模型,通过采集设备收集足够的烟叶图像数据,把图像数据划分为4个类别:团棵前期、旺长期、开花期和成熟期,并将其作为标注数据集。为了增加图像数据的多样性以及提高模型的泛化性,通过图像增强技术对图像数据进行随机色彩变更、旋转、缩放和加噪,进一步扩充数据集。模型采用基于ResNet-50[17]和MobileNet[18-19]的卷积神经网络结构,以4种时期的标注数据作为输入,其中训练集占70%,测试集为20%,验证集为10%,共计10080张图像数据,训练烟草大田种植期分类模型。通过对数据的图像处理,模型性能得到增强,最终模型准确率从83%提高到95%。表2为使用图像增强处理数据集前后模型准确率对比表。
表2 模型效果Tab. 2 Effect of model
在模型测试过程中,发现模型对于相邻的烟草生长期图像分类准确率不高,例如旺长期与开花期的过渡阶段,模型难以准确分类。为此,通过设置多个分类器模型对不同方向和角度的n个图像数据集分类,第i类图像数据集为di , i∈n,训练后的n个分类模型为f1(d1),f2(d2),…fn(dn),然后计算多个分类器模型识别图像的结果,将多数类的模型结果作为最终的识别效果,大田种植期分类模型结果计为Result,如式(1)所示。
最终通过多张不同图片作为输入选取多数类模型结果Result,优化模型分类效果,至此完成大田种植期分类模型的训练。该模型可以通过烟田作物图片,识别大田种植期,为种植管理提供服务支撑。图4为使用图像增强技术生成的图像数据;图5为模型识别的烟草生长期,其中(a)为团棵前期,(b)为旺长期,(c)为开花期,(d)为成熟期。
图4 图像增强Fig.4 Image enhancement
2.2.2 基于决策树算法的烟草智能管理模型
在大田种植期分类模型的基础上,结合模型输出的烟草大田种植期数据和采集的气象数据、环境数据、土壤数据以及种植管理数据,训练生成烟草智能管理模型。该模型采用决策树算法[20-21]训练。模型训练分为两步:第一步是通过训练数据集进行学习,构建决策树模型;第二步是利用构建的决策树模型进行验证和测试应用。在使用决策树模型对新数据样本进行分类时,从根节点开始逐步对该样本的属性进行测试,并沿着相应的分支向下行走,直至到达某个叶节点,此时叶节点所代表的类型即为该样本的类型。表3展示了模型数据集样本信息。
表3 数据样本Tab. 3 Data sample
计算信息增益的方法为:
其中,数据集S的经验熵(empirical entropy)H(S)如下计算:
计算特征A对数据集S的经验条件熵(empirical conditional entropy)H(S|A):
通过计算信息增益,取最大信息增益率的属性作为测试属性,基于决策树算法的烟草智能管理模型自上而下地完成决策树的建树过程,以烟草大田种植期数据、气象数据、环境数据、土壤数据、烟区农技人员田间管理数据作为模型输入。该模型对超过生长期指标的阈值参数进行警报,并根据烟草种植的进程指标、生长状况指标和生态影响因子,动态反馈给系统管理员和技术人员,为精准种植提供依据。同时把实时采集烟叶种植数据,进行清洗、关联和融合,存储到数据库中,形成烟草生长种植信息数据库。模型构建流程如图6所示。
图6 烟草智能管理模型构建流程Fig.6 Construction process of smart tobacco management model
通过在靖西烟区建立实验基地部署系统,对系统效果进行验证。
图7为系统实时采集的烟田种植数据界面,数据采集间隔为一小时;图8是数据可视化界面,对多维数据可视化展示。
表4对比了系统部署前后的应用效果。
系统应用后,在数据采集方式上,改变了人工采样、送检、记录的方式,大大减少了农技人员出工的次数和工作量。原来在烟草种植期间,每名农技人员负责和管理500亩烟田,平均每周要用4天时间到烟田采集数据。系统替代了人工数据采集的方式后,农技人员只需要针对问题烟田进行实地考察和记录,平均每周用时1天,节省了75%工时。采集频率由原来每周采集一次,转变为实时采集,效率大大提高。同时,扩大了数据采集种类,包括了气象数据、环境数据、土壤数据以及烟草长势数据,每个监测点平均每天产生不少于270条数据,由此可以建立烟草生长信息数据库和管理知识库。
图7 实时监控界面Fig.7 Real-time monitoring interface
图8 数据可视化Fig.8 Data visualization
表4 系统应用效果Tab. 4 Effect of the system application
农技人员根据系统反馈信息,可实时了解烟田种植情况,督促和推进各个环节的进度,省去了多部门汇报或实地探察等环节,工作效率得到很大提高。表5为农技人员工作效果对比表,对比了系统应用前后的变化。
表5 农技人员工作效果对比Tab. 5 Comparison of working effect of agricultural technical personnel
系统采用物联网技术对烟田烟草生长全生命周期监测,实时采集种植数据和监测烟田环境,推进了烟草种植向数字化、精准化发展,在广西靖西基地试验取得良好效果。在现有基础上,下一步对烟草生长期干预条件进行实验,探索影响烟叶产量、质量的关键影响因子,为智慧烟叶生产提供科学支撑。