王师+陈学斌
摘 要: 通过传感器采集到的作物数据进行统一管理建立作物灾情数据集群池,Map-Reduce模型映射归类预处理后,再利用BP网络动态训练,最后利用权重归总输出预测结果。充分利用云计算技术优势在网络训练时动态调整计算资源,有效缩短训练周期,优化调整改进BP网络结构,从而提高系统的整体运行效率并且达到作物准确预警的目的。实践表明该模型收敛速度快,稳定性好,能够解决作物病情灾害预警问题,是作物综合防治的有效模型。
关键词: 云计算;BP网络; Map-Reduce;作物预警
中图分类号:TP301.6
文献标志码:A
文章编号:2095-2163(2017)02-0105-03
Abstract:In this paper, the crop data collected by the sensors are uniformly managed to establish data cluster pool, and after Map-Reduce model mapping classification preprocessing, BP network dynamic training are applied, further weights are summed up to output prediction results.Make full use of cloud computing technology advantages to dynamically adjust computing resources in network training, effectively shorten the training cycle, optimize and improve BP network structure, so as to improve the overall efficiency of the system and achieve crop accurate early warning. The experiment shows that this model which has good convergence speed and good stability, can solve the problem of crop disease and disaster warning. It is concluded that the proposed construction is an effective model of comprehensive prevention and control of crop.
Keywords:cloud computing; BP network; Map-Reduce; crop warning
0 引 言
我国农业生产劳作形式呈多样化分布,致使作物生长受多因素影响,对作物生长状况探索推出准确的判定是农务工作者做好种植工作和实现作物大丰收的基础和前提。传统技术上采取人工干预的手段对作物进行必要的例行检查,随后对作物设计引入生长状况判定,一般情况下进行人工干预的参与人员大都是农业专业学者或从事农业生产多年、并具深厚经验的工作者。人工手段预警既费时又费力,而且往往由于专业人员短缺,多数情况下未能及时开展例行作物检查,使得作物遇到灾情警情时得不到最佳预警处理造成作物大面积病害,给农民将直接带来可观经济损失。为了解决这个问题,研究决策开发建立农作物数字化监测预警平台,利用数字化手段收集作物病虫害数据、分析定义后供专家学者参考预测,这种数字化预测手段某种程度上降低了人工干预的依赖度,能够及时发现、精细调控受灾作物,而且随着物联网的兴起与发展,利用智能算法获得现场自动采集数据,同时利用云计算技术设计构建大数据平台,这就为智能算法事实推理提供有效技术支持。具体来说,BP网络集分布并行分析处理、非线性映射功能、自适应学习能力和强鲁棒性于一体,从而重点、全面地解決了非线性系统模型预测问题。另据研究可知,云计算拥有的强大计算能力,能更加灵活、高效地组织、分配和使用计算资源;云计算拥有的海量存储能力,能承载大众参与的云计算中的海量信息和服务;云计算拥有的友好交互能力,还能为用户确保提供智能化、多元化的服务[1]。此外,Map-Reduce则是一种可扩展的通用并行计算模型,可以有效地处理海量数据[2]。
目前,国外部分国家采取农作物病虫害数字化监测预警的方式对作物进行评估、识别诊断、网络互联预警和数据样式的规范统一,通过建立病虫害诊断和综合治理体系、网络远程互联体系、病虫害信息系统实现农作物病虫害监测数字化、信息采集自动集成化和一线监测人员技能化[3-5]。中国已有数省也推广试行了农作物病虫害数字化监测预警,但是针对我国农业信息资源的开发利用仍比较分散、独立性也有待完善以及信息资源多样化亦难以整合,省份间建立数字化监测预警系统的框架不同、功能各异、系统运行的软硬件配置存在较大差异而使得作物灾情数据无法通用共享等多重现实问题,数字化监测预警在全国进入实践应用也仍尚需一定时日,而物联网和云计算的研发运用则成功地解决了信息共享问题[6]。基于我国目前现状,本文则将打造海量作物数据信息共享平台作为出发点,通过云计算技术与智能算法相结合设计实现一套农作物灾情预警机制,用户借助本机制可以方便获取到作物的生长情况,并依据由此生成的有效信息,定制形成完备结果预判[7]。
本文引入云计算优化BP网络训练结构,设计一个结构合理、运行效率高、预警速度快的模型,该模型能够辅助专家学者对作物的生长状况做出判定,最终得出预警结果。利用云计算的弹性伸缩和动态调配的优良特性,不仅解决了原BP网络训练所需计算资源动态调配和预警速度慢从而导致模型预测不准确、不及时等问题,而且更进一步改善了用户体验,同时还可显著突出地提高数据处理能力。
1 模型系统设计
1.1 模型算法设计
考虑到以往由于使用智能算法推算事实根据时所使用的数据信息未臻充分客观,导致智能算法模型预测存在准确性差、偏差大的问题,通过传感器采集作物生长的信息,包括作物生长环境的温湿度和土壤情况、平均风速、光照强度、降雨量等,通过有针对性地采集存储影响作物生长的有关信息,在此基础上设计建立作物灾情数据集群池。
面向集群池中大样本、大数据处理,传统BP网络在计算资源的动态使用情况、训练周期长短等方面将面临严峻挑战,为了提高作物预警的准确度,本文对收集的大数据样本在加工经过了必要的数据预处理后,再利用BP网络进行动态训练,优化结构,算法流程如图1所示。
Map-Reduce模型對作物灾情数据资源池进行数据映射归类预处理,研究给出的运作机制过程如图2所示。本文即是利用该运作机制处理海量作物灾情数据,满足网络训练对数据的处理要求。
1.2 模型总体结构
为了解析得到一个具备适应作物灾情海量数据处理能力的BP神经网络结构,本文采取在传统BP结构的基础上匹配指定一个数据处理模块和结果归总模块,前者是建立在海量数据并行处理上的,采用Google提出的分布式并行编程模型组织集群处理大规模数据集,即Map-Reduce模型,后者是建立在动态调整加权归总输出的基础上。至此,本文则基于开源Hadoop云计算支撑平台,研究设计BP算法的Map-Reduce并行海量数据处理作物预警模型。模型总体结构如图3所示。
由图3可见,这里将给出模型总体结构中各个关键模块的技术功能展示,可做如下论述。
1)数据处理模块。采用Map-Reduce模型处理机制,作物灾情数据经过设定操作后分割转换为互不相交、最小分解的Task,主服务器对这些Task分析产生
2)网络训练模块。利用Map-Reduce模块输出的结果集,拓展加入了MATLAB必要的数据处理后将产生网络训练样本集,网络训练的目的也是为了得到最佳的权值阈值,利用误差反向传播调整权值。模型可以对后来数据进行预测判断。
3)结果归总模块。网络训练模块对多种数据构建自适应学习,得出预测结果集,本模块将根据网络训练结果预测集合按照权重归总得出最终预测结果,可结合专家意见后实现协同优化智能研判。
1.3 模型设计实现
1.3.1 建立数据采集中心
为了更好地对作物灾情进行准确预测,对传统数据采集个人使用的局面进行升级处理,在信息大爆炸时代,信息共享则显得尤为重要,建立作物预警模型的基础就是建立作物灾情数据集群池,在农作物生长环境中架设多类传感器实时采集存储影响作物生长因素,研发创立了数据采集中心。采集的数据主要有作物的受害部位图像、生长环境的温湿度和土壤情况、平均风速、光照强度、降雨量等,作物信息数据可根据用户的个人需求灵活选取、自主收集。
1.3.2 建立数据集群池
为了实现农作物灾情数据信息共享最大化和统一管理高效化,就要规划创建分布式数据集群模式化的存储模型。数据采集中心利用云计算技术灵活调度全网区域资源合理分配,并对数据采集中心的数据提供高效可靠、整体统一的存储管理,从而技术可行地实施建立了信息共享池。
1.3.3 数据预处理
数据处理模块是网络训练模块的前提基础,也是整个作物预警模型的核心关键。数据预处理对于模型建立更是具有首要地位作用,数据处理的好与坏直接影响模型建立的成败。本文提出采用Map-Reduce模型对数据共享池中的作物数据进行分类处理[8],以及运用MATLAB工具对数据集成设定加工处理及网络训练。
1.3.4 模型网络训练
数据处理后,网络通过智能算法自学习找到样本数据的自身规律,得到一般的非线性映射预测模型的权值和阈值。网络训练模块充分利用云计算技术优势,在网络训练时动态调整计算资源,明显缩短训练周期,高效快捷地得到准确度颇高的预警模型。
1.3.5 结果归总输出
为了准确预测作物灾情,综合多方面预测影响因素,即需对网络训练输出结果集进行归总处理,可根据准确度高低加进不同的权重对这些预测结果形成加权输出。确定权重是重点关键,模型初态取平均比例,后期根据预测结果与实际结果的误差大小设计选择动态调整,调整规则可表述为:
1)初始状态采用平均权重的方式进行归总。
2)将输出结果与期望结果来构建对比,偏差大的,权重相应减小;偏差小或无误差的,权重相应增加;偏差不变的,权重保持不变。
3)若同一权重阈值的预测结果多次出现较大预测偏差,权重将会减小至零值,即该网络的权重阈值将舍弃不用。
2 结束语
本文在BP基础上融入云计算技术对研究模型结构进行调整优化,对预测结果综合切入了多方位、多因素的全面考虑,对预测结果的准确度设计展开了动态调整优化,对于预测结果差、准确度低的实际输出通过调整降权,使模型预测偏向预测准确度更高的一方,最终整体获得智能高效的作物灾情预测结果。经实践验证,模型呈现出良好的收敛性、较高的准确率以及较好的预测能力。作物灾情数据资源池和知识库的建立将为作物智能监控提供有力保障,突破传统信息采集模式,实现作物实时监测与控制,进而提升我国农业生产智能化、管理科学化的发展水平。同时,模型还可准确地对作物灾情进行预测,给农耕者和专家学者们报送有价值的作物生长状况信息,并有利于及早做出合理的种植计划、以及制定正确的决策部署,模型应用具有广阔可观现实前景。
参考文献:
[1] 邓维, 刘方明, 金海, 等. 云计算数据中心的新能源应用:研究现状与趋势[J]. 计算机学报, 2013, 36(3):582-598.
[2] 李成华, 张新访, 金海, 等. MapReduce:新型的分布式并行计算编程模型[J]. 计算机工程与科学, 2011, 33(3):129-135.
[3] 刘万才, 刘宇, 曾娟, 等. 推进农业有害生物数字化监测预警建设刍议[J]. 中国植保导刊, 2009, 29(10):11-15.
[4] 刘万才, 武向文, 任宝珍, 等. 美国的农作物病虫害数字化监测预警建设[J]. 中国植保导刊, 2010, 30(8):51-54.
[5] 刘宇, 刘万才, 韩梅. 农作物重大病虫害数字化监测预警系统建设进展[J]. 中国植保导刊, 2011, 31(2):33-35.
[6] 陈学斌, 张淑芬, 王向东. 物联网在小麦病虫草害监控中的应用[J]. 中国植保导刊, 2014, 34(5):38-42.
[7] 张宁. 关联数据下的农业信息资源构建[J]. 中国农机化学报, 2013, 34(5):214-216.
[8] 陈学斌, 王师, 董岩岩. 面向大数据的并行分类混合算法研究[J]. 微电子学与计算机, 2016, 33(4):138-140.