张勇辉,冯琦胜,梁天刚,高新华,黄晓东,孙德伟,吴安东
(兰州大学草地农业科技学院 / 草种创新与草地农业生态系统全国重点实验室, 甘肃 兰州 730020)
草地是一种空间分布广阔的重要陆地生态系统。全球草地面积有35 亿hm2,大约覆盖26%的陆地面积[1]。据我国第一次草地资源调查统计结果,全国拥有各类天然和改良草地接近4 亿 hm2,占国土总面积的41.7%,仅次于澳大利亚,位居世界第二位[2]。草地生态系统具有提供畜牧业和植物资源产品、气候调节、土壤碳积累、截留降水、侵蚀控制、废弃物降解、营养物质循环等功能[3],在我国社会经济发展和生态环境保护等方面具有重要作用[4]。开展草地资源调查与监测是动态掌握全国草地资源状况、科学制定草原保护和建设决策、推进草原生态文明建设、促进草原合理利用的重要前提[5]。
传统草地资源调查方法通常是相关专家与外业调查人员利用手持GPS (global position system)、数码相机、样方框以及记录本等工具在野外现场进行作业,然后内业工作人员将野外记录、GPS 数据、数码照片等进行文档电子化、数据空间连接、统计汇总、空间制图等,最后分析和评价区域草地资源的空间格局和时间动态[6]。随着草地资源调查工作逐步走向信息化、专业化,传统的草地资源调查方法已经不能够满足当前的工作需求,主要表现在调查流程繁琐、工作效率较低、多人协同性较差、内外业分离等方面,草地资源调查迫切需要新的技术手段[7]。
近年来随着智能移动终端设备的快速发展,为智能识别等专业应用软件的普及和科研实践提供了硬件支撑[7],并在林地资源调查[8]、地质灾害信息[9]和土地利用变化[10]信息无纸化采集等方面得到成功应用。在草地资源调查方面,陈祖刚等[11]基于实地拍照实现了野外草地盖度的自动测量。胡云锋等[7]设计开发的草地资源信息协同采集系统,实现了草地资源调查信息采集、数据展示、数据同步等功能。现有草地资源调查相关系统虽然已基本实现多源信息无纸化采集的汇总以及部分信息的自动获取等功能,但与草地资源相关的很多专题信息仍然需要专业人员辨识和录入,智能化和自动化程度较低,缺乏一套完整的草地资源外业调查监测的数字化与智能化分析平台。
目前我国大量草地资源调查数据分散保存在不同的科研和技术推广单位。由于思想观念和相关制度等的影响,大多未能实现共享,造成草地资源信息流通与反馈受阻,草业领域的研究成果难以充分应用,严重阻碍了我国草业科学在信息化及智能化领域的健康发展,限制了草地资源信息的高效共享。草地资源外业调查监测资料包括文本、数据、视频、图像等多种类型的数据,是开展草地生产力评估、草畜动态平衡分析、草地生态健康与退化状况评价等研究的基础。数字化及智能化调查监测系统的研发是草业科学及相关产业智慧化管理的重要环节。在草地资源信息管理、草原发展战略规划、草地资源的合理利用和评价等方面,迫切需要建立草地资源调查监测与数据分析平台[12],这对推动我国草地资源外业调查监测的数字化与智能化发展,以及相关数据信息资源的深度挖掘和共享服务具有重要作用。鉴于此,草地遥感与地理信息系统研究团队利用现代人工智能、数据库及移动通信等技术开发出一套草地资源调查数据采集及智能分析系统。
系统采用国内云计算领先企业阿里云的云资源建设,可根据峰值访问情况动态调配硬件资源。主要包括Web 端的草地资源监测与智能分析系统和移动端的“草伴侣”App 两部分。其中,草地外业调查数据的采集由移动端App 实现,调查数据的管理与分析通过Web 端实现。草地资源数据采集共享平台是该系统的核心业务功能模块。该模块包括用户管理、外业调查、地图数据展示、知识库等。模块支持Web 端和移动端App 访问,根据终端特性和业务侧重点不同,功能会有所不同。数据备份模块是系统稳定运行的基础,基于人工智能技术的草地植被及牧草植物智能识别与分析模块是该系统实现智能化和自动化的关键模块(图1)。
图1 系统设计图Figure 1 System design
引入人工智能技术开展草地调查工作,主要负责图像识别和智能分析计算等任务。包括草地类型诊断、牧草植物物种识别、草地盖度分析、草地生物量估算、植物多度与频度智能分析等功能。
草地类型与牧草植物物种的智能识别。基于卷积神经网络(convolutional neural networks, CNN)技术,对草地类型或牧草植物进行简单地拍照或提供图片即可快速准确地提供识别结果,供相关草地工作者对草地类型进行识别辨认,方便外业工作。并集成在草地调查与智能分析系统平台中提供自动化识别服务。
草地关键生物物理指标的智能分析。基于卷积神经网络技术,对无人机(unmanned aerial vehicle,UAV) (如DJI 系列UAV 等)、传统相机、智能手机和Pad 等移动设备拍摄的样地或样方正射图像进行盖度评估、植物多度与频度分析以及生物量的实时计算。对无法通过单一手段获取的数据(如草高等),可采用人工等辅助手段进行必要的补充。根据草地资源调查实际需要,上述智能识别与分析算法支持在没有网络的环境下离线运行,并实时保存在移动端设备,在有网络的环境下动态上传至服务器端。
草地外业调查App“草伴侣”是实现草地资源地面调查全流程数字化与智能化作业的工具软件,提供用户注册登录、调查作业管理、样地和样方管理、调查数据录入、智能识别、智能分析以及调查数据统计分析和展示等功能。
在使用该系统平台前,用户可通过电脑浏览器进入“草地资源监测与智能分析系统”平台(访问网址:https://herbs.aiplants.cn/)。使用手机号注册账户,并提交系统由管理员分配外业调查权限。完成注册后登录进入平台首页,获取“草伴侣”App 安装包。安装完成后可使用该系统。总体上,该系统可实现以下4 个方面的重要功能:
调查任务规划与分解。草地外业调查的任务规划与分解主要在Web 端实现。外业调查项目负责人可对需要调查的区域以项目的调查方式进行管理,具体包括对项目的创建、修改、删除、查询以及对调查样地、样方的创建等操作,使调查工作数量化,以方便基于基础地理地图的样地、样方定位和规划管理。根据调查工作的量化数据,负责人可指定样地、样方的调查人员或小组,形成任务列表;同时,为方便草地资源调查、加强信息管理、共享与利用,系统根据不同调查需求,预置了多种样地、样方模板供用户选择。
图像采集与智能分析。通过系统平台或移动端设备,可基于用户拍摄或上传的图片,进行草地类型、牧草植物种类的快速判识,实时提供识别结果。同样,系统可通过拍照或上传图片的方式提供准确的草地盖度、植物多度与频度、草地生物量等关键生物物理指标的智能分析结果,辅助相关科研工作者进行外业调查数据的统计分析。Web 端可利用简易无人机、手机或相机拍摄的图片完成草地类型、牧草植物的识别以及草地生物量的估算、草地盖度的分析、草地植物多度与频度等信息的快速计算。
专业数据录入及动态传输。外业调查人员可利用“草伴侣”App 快速记录样地、样方的景观、海拔、经纬度、地貌、土壤、植被等信息,其中大部分信息在填写时使用选项的方式获取文本、数值信息,避免用户键入大量文字。系统可调用内嵌的人工智能模块进行样方盖度估算与植物种类的智能识别,辅助外业调查数据的录入,并可通过移动设备位置定位功能对样地经度、纬度、太阳高度角等基本信息自动计算与录入,提高外业调查的工作效率。同时,系统可实现外业调查数据的动态传输。外业调查人员使用“草伴侣”App 采集的信息可快速同步至Web 端,同时可实现同一外业调查团队成员之间的多人协同作业和数据共享。若遇到某些调查区域没有网络的情况,“草伴侣”App 可将数据保存在移动设备中,等待设备连接网络后完成数据同步。
数据库自动构建与数据处理分析。外业调查团队采集的调查数据完成同步后,系统可自动汇总数据、构建调查项目数据库并完成数据的处理与分析,最终以图表的形式展示。同时,这些统计数据还能以Excel 文件格式导出,导出字段包括:样地数据汇总、样方数据汇总、物种信息汇总,以及景观照片、样方照片和植物照片汇总等。
通过以上主要功能,可以实现草地资源外业调查的全流程数字化作业以及相关数据的智能分析。图2 是利用该系统平台开展草地资源外业调查的流程图。
图2 外业调查流程图Figure 2 Flow chart of the field survey
随着算法的提升和图形处理单元(graphics processing unit, GPU)计算能力的发展以及训练数据的不断丰富,使得卷积神经网络(CNN)对于图像的识别准确度大幅提升,这一技术目前已经成为主流的图像识别方法[13-17]。与传统的图像识别方法相比,基于CNN 的图像识别不需要对目标图像进行特征的人工描述和提取,而是按照某种分类模型通过神经网络自主地从训练样本中学习特征,并且这些特征与分类器关系紧密,可以很好地解决人工提取特征和分类器选择的问题,从而实现了分类识别问题真正的智能化。因此,该系统平台基于CNN 的分类模型,根据草地类型、草地植物知识库和图像库,可以实现对照片的快速识别分析,反馈结果可以辅助相关草地工作者对草地类型和植物种类(图3)进行辨识。
图3 草地类型诊断和草地植物识别Figure 3 Grass-type diagnosis and grassland species recognition
图像分割与图像识别有很大的不同,图像识别任务是依据图像包含的目标将图像准确地归于某一类,不需要标注出图像中的目标位置,而图像分割任务主要是把图像中的目标、背景等不同区域位置准确的标注出来[18]。CNN 同样被广泛地用于图像分割,通过某种分割算法利用其多层结构在大量样本中自动提取出图像不同层次的、具有区别性的特征,这些特征与人工设计并提取的底层特征相比更具有效性和鲁棒性。因此,该系统平台基于CNN的分割模型可以通过拍照或图片对草地盖度提供准确的分析,辅助相关草地工作者对草地盖度进行自动化计算、录入和统计(图4)。
图4 草地盖度分析Figure 4 Grassland coverage analysis
目前草地生物量的研究方法主要为直接收获法,这种方法不仅费时费力,还容易破坏脆弱的草地生态系统,并且无法实现连续观测。而利用草地植被群落中容易测定的变量及其同地上生物量的相关关系建立回归模型,能够实现对草地地上生物量快速、准确且无破坏的估算。该系统采用基于植被盖度和高度构建的反演模型,可以快速估算草地的地上生物量[19]。为了提高草地地上生物量的反演精度,针对我国不同区域草地的特点,该系统提供了不同分区的草地地上生物量反演模型(图5)。
草地资源调查监测数据采集及智能分析系统基于卷积神经网络的图象识别和图像分割、数据库及移动通信等技术,实现了草地资源外业调查的数字化作业和相关数据的智能分析。与传统的人工外业调查相比,该系统在Web 端能够实现草地外业调查的任务规划与分解,在 “草伴侣”App 端提供实时AI 辅助分析功能,解决了外业流程繁琐、多人协同性差、内外业分离,以及数据共享难的问题,从而显著提高外业调查的工作效率,减少内业工作量。该系统的推广使用能推动草原外业调查数据的广泛交流、深度挖掘和应用,可为大范围的草地资源调查提供基础性的技术支撑。
为了更好地评价该系统的应用性能,对比现有的外业调查与记录软件和系统功能,包括由中国科学院昆明植物研究所开发的“生命观察”App(Biotracks)、无锡维乐彩智科技有限公司开发的田野调查数据采集软件数图,及由北京青远生态环境有限公司研发的“北极花”生物调查App。上述软件或系统均有较为完善的图像识别、数据记录、数据分析等功能,然而对于草原区域的外业调查而言,草地资源调查监测数据采集及智能分析系统因其具有大量天然草地植物图像数据库而更具优势。基于深度学习的图像处理相关模型通常需要大量数据来进行训练以保证模型的识别精度。该系统主要用户群为草原工作者,系统会在用户使用的过程中收集所上传的图片对数据库进行扩充,定期对模型进行优化以提高识别和分析的精度,同时避免模型的过拟合,以提供更准确智能分析。同时,该系统的智能分析模块除了植物图像识别外还设计了更多与草业相关的分析,如草地类型识别、草地盖度分析、草地生物量估算等对于草原调查更具针对性的功能。此外,该系统在规划调查任务阶段还提供了较多适合草原外业调查的模板,用户也可以根据需求自由设计外业调查流程,相较于上述对比的软件而言具有更高的自由度。
然而该系统也具有局限性,相比于“生命观察”和“北极花”App 中较为完善的离线记录功能,“草伴侣”在外业调查过程中不支持在用户离线状态下进行数据记录,因此该软件的使用范围受到一定的限制。在未来的系统优化中,将考虑加入离线记录的功能,通过提供分区域的离线地图包使用户在没有信号的区域也能够记录经纬度等相关数据,使软件的适用范围更广,进一步提高本系统的实用性。
本文介绍的草地资源调查监测数据采集及智能分析系统实现草地资源外业调查的全流程数字化作业和相关数据的智能分析,可为大范围的草地资源调查提供基础性的技术支撑,以推进我国数字草业及智慧草业的发展。