孙孟孜 韩兵 韩海仙 王森
摘要:针对当前温室大棚信息化程度较低,种植经验与知识缺乏,导致无法更好地培养种植管理作物,大幅度地降低了作物收成。通过“人工智能+农业”在大棚种植草莓的生长环境的研究和总结,分析植物生长环境和果蔬的成熟期之间的关系,从而保证稳定高效的生产经济农作物前提下提升农业经济的产出。本研究对象为草莓作为标本经济作物,通过人工智能算法,根据监测大棚环境的数据,给出环境调整的参数建议,同时实现预测草莓种植周期的天数,推测出成熟的日期。实验证明,通过人工智能算法能够通过植物生长过程数据准确预测其成熟期,为大棚种植果蔬提供依据,将新技术投入到现代化农业中,让农业真正实现现代化,智能化,高效化。
关键词:人工智能;生长周期;线性回归;训练模型;成熟度
中图分类号:TP311 文献标识码:A
文章编号:1009-3044(2021)10-0209-04
乡村振兴战略是在党的十九大报告中提出的战略,十九大报告指出,农业农村农民问题是关系国计民生的根本性问题,必须始终把解决好“三农”问题作为全党工作的重中之重,实施乡村振兴战略。
然而,我国的农业智能种植技术使用较晚,直到二十一世纪初期我国的农业科技人员才开始通过国外进口种植大棚设备选型,培育技术等领域深入研究探索[1]。依托部署在农业生产现场的各种传感节点(环境温湿度、土壤水分、二氧化碳、图像等)和无线通信网络实现农业生产环境的智能感知、智能预警、智能决策、智能分析、专家在线指导,为农业生产提供精准化种植、可视化管理、智能化决策,提高农业水利化、机械化和信息化水平,提升农业竞争力。
1大棚种植草莓的分析
草莓消费大多集中在春节前后,尤其是在春节期间,由于对草莓的大量需求,常常供不应求。华北地区地理和自然资源丰富,具有典型的北温带半湿润大陆性季风气候,夏季高温多雨,冬季低温并偶尔带有降雪,春秋季节时间短,为了进行自然培植就要利用大棚种植技术来调整草莓的生长环境[2]。
人工智能在农业的应用,能够让农业成为科学化和现代化农业。温室大棚经过技术辅助,更加简单容易控制掌握,提供一个高效稳定的控制温室大棚的草莓良好的种植环境,让从业者拥有稳定可观的经济收入[3]。因此,通过当前最新的人工智能算法建立数学模型,对温室大棚环境给出调整,让温室大棚种植全面自动化,从而减少人力物力以及技术的难度,提高产量和收入。
2 草莓生长环境参数研究
草莓生长环境主要包括:二氧化碳浓、度温度、湿度、光照强度、土壤湿度、土壤酸碱度六个方面。每一项对草莓生长都有一定的影响,需要通过大棚的智能控制单元将其控制在一定的范围之内[4]。
通过查看文献,草莓对环境的温度是尤为重要,草莓会分成萌芽期,生长期,开花期,结果期,旺盛生长期,花芽分化期和休眠期,每个周期对温度的要求不一样。例如,发芽期适宜温度在15℃~20℃时最适合草莓的生长,生长期适宜温度为 20℃~26℃,开花期为是 25℃~ 30℃。过高或者过低,都会影响草莓的发育,幼芽无法发育或者花粉受精失去活力提高畸形的概率等问题[4]。
此外,光照时长需要在8h~12h,光照的不足会导致花芽的形成,减少养分的获取降低成活率;二氧化碳浓度和土壤湿度也是影响草莓正常生长的重要因素,经验表明:二氧化碳都处于800~1800ppm之间会提高草莓的萌芽期和开花期的长势;土壤湿度控制在60%~80%之间是保证丰产的关键;酸碱度范围在pH5.5~6.5之间,同时也适用于草莓生长适宜的土壤酸碱度,因此把大棚土壤的pH值控制在5.5~6.5最适宜[5]。
3 数学训练模型研究
图1是系统使用的数学训练模型,开始训练时,从训练集读取数据,训练模型初始化模型,根据线性回归计算环境参数得出一个标准数值,筛选不符合要求的参数,增减训练项,重新计算模块做出模型参数的调整。
系统首先将清洗好的数据输入到训练集中,数据聚类重叠,将同一时刻的不同日期的数据叠加一起,通过线性回归算法计算。线性回归是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,运用十分广泛[6]。其表达形式为y = w'x+e,e为误差服从均值为0的正态分布[7]。回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析[8]。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。通过公式化简可以拟合方程为最小二乘法。一般来说,线性回归都可以通过最小二乘法求出其方程,可以计算出对于y=bx+a的直線[9]。将数据清洗筛选后,增加或减少聚类项,再次重复计算,得出新的数学模型,多个数学模型对比调整参数,得出一个与真实情况最为接近,最可以接受的模型,成为标准模型使用。
3.1 回归算法的研究
课题使用的模型算法为回归算法,又分为线性回归算法,和曲线回归算法(又称高斯曲线),假设温室大棚的环境参数,二氧化碳为θ1,温度参数为θ2,湿度θ3,光照强度θ4,土壤湿度θ5,土壤pH值θ6。再对每一个影响项拆分,就可以通过线性回归的最小二乘法进行推导出直线方程。拟合平面公式为式(1):
最终,公式整合为直线方程式(2):
并不是所有的参数都可以用直线表示,例如温度和光照强度属于曲线,所以线性回归就不能适用于这两个参数。就要使用曲线回归来完成,曲线回归又分为指数函数曲线,对数,幂函数,双曲,S型和多项式曲线,符合本次温度和光照强度的函数方程是多项式曲线。经过试验三次多项式就可以更加接近实际温度和光照情况的走势,无须再使用更多次多项式方式就可以解决实际问题。三次多项式方程式(3):
3.2成熟度预测
系统每小时将环境参数传入数学模型中,通过引入偏差值概念,可以保证数据在一定的范围内波动,同时还有参数上限与下限约束条件。系统可以根据采集到的数据偏差进行计算并做出提示的调整建议[10]。将环境监测数据CO2浓度,温度,湿度,土壤湿度,土壤pH值,光照强度根据权重占比计算,得出一个当前环境分数设为合格率,大于70%时就可以添加到数据集中,把不符合要求的环境数据筛选掉以保证数据的准确性[11]。
系统在每日凌晨2点对此前24小时的样本数据进行统计,计算种植草莓的成熟率和预计成熟日期。c成熟周期,r为成熟率,rd当天成熟率,D为待成熟天数。此时,可推算出成熟率公式为式(4):
同时,也可推算出成熟天数公式(5):
4系统设计
系统首先获得草莓种植的环境数据,并对得到的监控数据进行数据清洗,获得可以进行计算的数据格式,当符合训练条件的数据在规定的环境参数要求的范围内,则放入训练数据集;不符合直接进入计算草莓种植环境的分数逻辑。根据模型的标准参数和偏差值,得出当前草莓种植环境的分数,同时给出草莓种植环境的调整建议方案,同时预测草莓的成熟度和成熟日期。
系统由以下四个模块组成:
(1)环境监测模块:用于连接传感器监测数据的管理,监测数据是以接口的形式传入数据,监测数据也支持直接写入数据库中,并且可以直接查看监控数据功能。
(2)数据清洗模块:监控数据的格式和单位,可能出现数据不符的情况,此时就需要进行数据清洗,课题将清洗后的监测数据存入数据库中。
(3)训练模型模块:当系统获取到准确的训练数据,包括CO2浓度,温度,湿度,光照强度,土壤湿度,土壤PH。根据环境的基本训练数据,对每个参数,计算出一天中每小时的参数的所处的范围,使用线性回归算法进行预测。
(4)周期计算模块:系统将每次采集的环境数据与标准的大棚环境的模型对比,给予建议的同时,计算当前大棚环境的分数值。当一天结束时,根据当天每小时的分数,计算出当天的草莓生长成熟度0~100%,从而实现对草莓成熟度和成熟期的预测。
系统流程图如图2所示。
5实验验证
系统运用Python中的Numpy科学计算模块,把数据转化为二维矩阵放入模型中训练[12],利用Pandas来分析结构化数据,使用Matplotlib生成出版质量级别的图形展现[13]。
5.1数据的清洗
数据通过格式化后,并不是可以直接拿来使用,因为数据存在部分的异常情况,不符合人们的认知或者真实的情况,例如:夜晚有光照,光照强度都比白天中午的强度都高,或者夜晚温度高,白天温度低,土壤pH值出现强酸强碱情况等等,都不是真实的正常情况,很有可能是监测设备异常。因此,将不符合真实情况的数据导入模型中,必然影响模型的训练效果,需要提前将有问题的数据筛选清洗出去。
图 3 中的0-5时刻和18-23时刻都属于夜晚,存在光照强度数值存在异常情况,尤其0-5时刻的数值,都达到200 lx必然存在问题,还有过高的数值都是需要清洗掉的数据,会存在对模型整体的影响。通过策略将光照强度的数据集清洗,呈现出图4的效果。温度,湿度,二氧化碳浓度,土壤湿度,土壤pH值同理,使用符合每一项的筛选策略,清洗出符合预期效果的数据。
5.2线性回归
以光照强度为例,在图5中,发现曲线回归的常量值处在一个负值,不符合实际情况,所以再次对数据进行截取:6-18时的数据即为有效曲线,0-6时和6-23时的数据无效, 对图5样本走势图截取,得出图6为参考曲线回归图。
5.3模型训练
通过创建CropModels类中的init_model函数为初始化数学模块,并且执行CO2,湿度,土壤湿度,土壤pH值,温度以及光照强度等六项的函数,获取到相应的线性回归的k,b参数和曲线回归的三项式公式[14]。执行init_model初始化模块后,本对象就拥有6个环境参数的数学模块,等待传入某时刻的数据进行计算。调用calc函数,并且传入7个参数数值,并可返回温室大棚的环境建议和当前环境种植的分数情况。
当传入的草莓种植环境符合模型给出的标准参数,并计算与标准参数相似率达到70%以上,就会把本次传入的环境参数放入到训练集中,当成符合要求的训练数据,对模型再次矫正。
5.4 成熟期预测
根据每小时传入温室大棚的环境参数,经过一天的数据收集,第二天凌晨2点会对前天的24小时的样本数据进行统计,计算种植草莓的成熟率和预计成熟日期。通过使用线性回归算法构建数学模型,预测温室大棚环境的标准曲线[15],并且监控大棚环境在某一时刻是否能符合一定的范围之内,根据每天的环境监测情况,计算出当天的成熟率,并且累计以往的数据,推测出草莓的成熟日期。
6 结束语
课题通过线性回归算法,对草莓生长过程环境参数进行跟踪,利用拟合函数和最小二乘法进行线性曲线的多项式统计预测,将人工智能运用在实际的项目之中,预测温室大棚草莓的种植环境的标准曲线,并且监控种植环境在某一时刻是否能符合一定的范围之内,根据每天的环境监测情况,计算出当天的成熟率,并且累计以往的数据,推测出草莓的成熟日期。实验证实,该方法能够有效地预测草莓的成熟期,对草莓的种植有很大的帮助。
参考文献:
[1] 尹娟.物联网驱动的智慧农业精细种植系统的设计与开发[J].金陵科技学院学报,2020,36(1):88-92.
[2] 杨会苗,毛清云,刘兰英.北京和保定地区草莓产业基本情况调研报告[J].北方园艺,2019(6):170-174.
[3] 潘小红,杨志勇.基于物联网技术的温室大棚种植园环境监测系统[J].现代电子技术,2019,42(14):127-130.
[4] 孙亚玲,刘少军,许念芳,等.山东省草莓产业现状及发展对策[J].中国果菜,2018,38(9):44-47.
[5] 王艳芳,苏婉玉,张琳,等.土壤改良剂在设施蔬菜上的应用研究进展[J].贵州农业科学,2018,46(4):102-105.
[6] 王钢.基于多元线性回归法的平潭综合实验区需水量预测模型研究[J].水利科技,2020(2):48-50.
[7] 冷建飛,高旭,朱嘉平.多元线性回归统计预测模型的应用[J].统计与决策,2016(7):82-85.
[8] 宋静,张利益.基于机器学习的线性回归预测数据库空间使用情况的应用研究[J].电子测试,2020(15):58-59,62.
[9] 罗博炜,洪智勇,王劲屹.多元线性回归统计模型在房价预测中的应用[J].计算机时代,2020(6):51-54.
[10] 孙建花.草莓日光温室种植技术要点分析探讨[J].农业开发与装备,2020(6):159-160.
[11] 刘永红,倪中应,谢国雄,等.浙西北丘陵区农田土壤微量元素空间变异特征及影响因子[J].植物营养与肥料学报,2016,22(6):1710-1718.
[12] 姚建盛,李淑梅.Python在科学计算中的应用[J].数字技术与应用,2016(11):76.
[13] 吴铭.基于多视图的雾霾数据分析方法[D].杭州:浙江大学,2017.
[14] 王俊杰,张宇波.基于线性回归的图像边缘处理算法的研究[J].江西师范大学学报(自然科学版),2013,37(1):46-50.
[15] 魏超,代晓航,郭灵安,等.蜡样芽孢杆菌在草莓中的生长及预测模型的建立[J].现代食品科技,2019,35(9):291-296.
【通联编辑:光文玲】