刘 哲 刘帝佑 朱德海 张 琳 昝糈莉 童 亮
(1.中国农业大学土地科学与技术学院, 北京 100083;2.中国农业大学农业农村部农业灾害遥感重点实验室, 北京 100083;3.中国农业大学信息与电气工程学院, 北京 100083)
随着全球人口的持续增长和气候环境剧变,如何在确保粮食安全的同时兼顾社会、环境资源的可持续发展将是一个严峻的挑战,也对农业生产及经营调控提出了更高的要求。自20世纪90年代以来许多学者开展了相关研究。结合卫星导航系统[1]和地球卫星观测系统[2-4],在农业地块上的单点变量监测、作物生长模拟和产量估计方面取得了较大的进展,“精准农业”的概念也同时被提出。随着更多的新兴技术与理念的出现,如生物技术、遥感技术、云计算、物联网和人工智能,并逐渐应用到农业领域的各个环节,“智慧农业”的概念成为新的时代共识[5]。而智慧农业,以各个环节的数字信息流动为基础,深度结合以人工智能为核心的分析与决策手段,在确保农业粮食安全的同时兼顾环境与资源的可持续性,有助于真正实现农业的可持续发展。
而在智慧农业的各种场景中,不管是面向种植过程的作物长势监测、作物关键生育期的风险胁迫评估,面向收获的成熟期预测、作物产量估计,还是面向宏观调控的作物种植结构调整与优化等,作物类型识别与制图数据产品都是各个农业应用场景的一种基础支撑数据[6-8]。随着遥感技术的发展,作物类型识别与制图在国内外也取得很大进展。美国在1974年和1980年,分别制定了LACIE(Large area crop inventory experiment)和AgRISTARS(Agriculture and resources inventory surveys through aerospace remote sensing)计划,开展全球范围内主要作物的识别、多种粮食作物的长势监测和产量估算;欧盟在1987年提出MARS(Monitoring agricultural with remote sensing)计划,开展基于遥感的欧盟农业统计及获取作物相关信息;与此同时,其它国家如俄罗斯、法国、德国、日本等也有遥感作物识别相关的研究[9]。我国农业遥感开始于1979年联合国粮农组织在中国农业大学援建的“中国农业遥感应用与培训中心”,随后在遥感作物识别、种植面积提取、作物长势监测与估产等方面发展和探索了系列技术方法[10-12]。
经过几十年的发展,基于遥感的作物类型识别与制图取得快速发展,而随着农业发展进入智慧农业时代,对作物类型识别与制图产品在空间范围、实时性、产品精度等方面提出新的需求。而对地观测技术的进一步发展,如我国GF系列卫星、欧空局的Sentinel系列卫星,全球范围的微小卫星星座计划(如Planlab等),以及各种无人机平台,为获取全球覆盖、无缝的高时空地表反射数据奠定了坚实的数据基础;与此同时,数字影像处理技术、机器学习,特别是深度学习为核心的人工智能技术的突破进展,为获得满足智慧农业需求的作物类型识别与制图产品提供了新的方法与手段。
本文从3方面:小尺度、近实时、高精度的作物识别,大尺度、可靠精度的自动化作物制图,由确认监测型向提前预判型和特定作物类型转变的作物识别与制图模式,来阐述智慧农业时代的作物类型识别与制图面临的新需求和新变化,总结国内外面对这些新变化所开展的研究工作以及存在的科学问题和技术难题,并对遥感作物识别与制图研究与应用予以展望。
遥感技术的高速发展促使农业生产和研究从传统阶段进入精细化、定量化和机理化阶段,尤其是高分辨率影像使得地物精细分类和监测成为可能[13]。智慧农业时代,人们希望能够通过对农业生产环境的智能感知与预警,实现农业生产的种植精准化、管理可视化、分析决策智能化,要实现该目标除了需要大尺度的农业遥感监测支撑之外,还需要获取村级乃至地块级的农作物生长信息。与大范围的农业监测主要服务于宏观决策不同,小尺度(农田尺度或试验小区)的农情或表型信息可直接用于栽培管理优化、育种决策分析等应用,具有更大的应用潜力[14-15],但是对影像数据的时效性、空间分辨率、提取的作物信息的精度等都有更严格的要求。
目前用于小尺度农情监测的影像主要是高分辨率的卫星影像以及无人机遥感影像[16-17]。ZARCO-TEJADA等[18]利用1m空间分辨率的ROSIS高光谱影像估算了西班牙南部地区橄榄树林的叶面叶绿素含量;竞霞等[19]利用高分辨率IKONOS影像提取一系列植被指数,包括增强植被指数(EVI)、再归一化植被指数(RDVI)、差值植被指数(DVI)、修改型土壤调整植被指数(MSAVI)、归一化植被指数(NDVI)等,有效地估测了棉花黄萎病的病情严重度;较多的学者研究表明,无人机影像相对卫星影像而言,具有低成本、高时间、高空间分辨率的特点,在精细化的农业管理方面更具优势[20],例如小范围的农作物倒伏监测[21]、农作物的种植密度估计[22]等。
田间作物表型信息是揭示作物生长发育规律及其与环境关系的重要依据,准确快速地获取作物表型信息可以为现代农业的发展提供技术支撑[23]。借力于光学传感器的快速发展,小尺度的农情监测使非破坏性、快速实时地估计作物表型成为可能,当前估算的表型特征主要包括:株高、叶面积指数(LAI)以及作物倒伏等。作物株高是反映作物生长状态的有效指标,与生物量、LAI产量等有显著的相关关系。利用无人机获取的可见光成像数据,通过构建作物表面模型(CVMS)可以提取作物的株高信息[24-25]。光谱特征分析可以依据植物对光谱的吸收、反射特性识别植物的不同性状,例如通过对光谱反射数据进行经验性处理构建大量的植被指数可用于预测作物LAI、生物量以及叶绿素含量等。归一化植被指数、可见光大气阻抗植被指数(Visible atmospherically resistant index, VARI)、修正的土壤调节植被指数可用于预测作物LAI[16, 26-27];再归一化植被指数可用于预测作物生物量[28]。作物倒伏是常见的农业自然灾害之一,基于遥感的农业自然灾害监测可以弥补传统方法费事费力的缺点,有较好的应用前景[29]。部分学者提出无人机影像中的纹理特征和颜色特征有利于区域尺度的倒伏评估[30-31];HAN等[32]利用统计方法计算无人影像的各项特征因子,如纹理特征、光谱特征等,并通过构建nomogram 预测北京市昌平区小汤山国家精准农业研究基地的玉米倒伏情况。
小尺度农情监测依赖于高分辨率的遥感影像,如今随着传感器技术的快速发展,我们能获取大量的高时空分辨率遥感影像,但受限于计算机性能,遥感影像的快速处理仍存在问题;同时,通过遥感构建的作物表型模型普适性较差,针对不同作物、不同种植区域存在参数乃至模型有效性的问题;而且遥感反演模型本身的误差会降低作物表型信息解析精度,后期研究可以通过融合多源遥感信息、环境以及作物生理学知识提高作物表型反演精度[23]。
大尺度指区域、国家乃至全球尺度,该尺度下的作物识别与制图产品更多服务于宏观的应用与决策,如作物的长势监测、灾害风险评估、产量预测以及作物种植结构的监测与优化等。将遥感技术引入农业领域,开展作物识别与制图的研究与应用,最初的目的是为了解决传统作物抽样调查无法获得大范围面状的作物空间分布信息。但是受限于当时的遥感技术发展水平,难以获得高时空分辨率的遥感数据,因此大尺度的作物识别与制图多采用MODIS数据,得到的通常是250、500、1 000 m的粗糙空间分辨率的作物识别与制图产品[33-37]。
在智慧农业时代,对大尺度的作物识别与制图产品有了更高的要求,首先需要这些产品具有更高空间分辨率,如从30 m 到10 m[38]。快速发展的遥感技术为获取大范围、高时空分辨遥感数据奠定了坚实的数据基础;同时云计算和机器学习、深度学习等人工智能技术为海量遥感存储管理及分析计算奠定了存储、计算与分析基础。因此,数据与存储、计算与分析能力的发展为获取大范围、高空间分辨率、可靠精度的作物识别与制图产品带来巨大的机遇,同时也带来“时空大数据”、分类方法适应性等关键问题与难题。
开展大范围高空间分辨率的遥感作物识别与制图,在数据处理、存储管理与计算分析等方面都面临着新的挑战。过去大范围作物识别与制图产品使用的MODIS数据,宽幅大、空间分辨率小,覆盖一个大区域需要的数据量相对不大,而制作高空间分辨率的作物识别与制图产品,目前符合条件的遥感数据源有GF-1 WFV、Sentinel-2和Landsat-8,全覆盖一个大区域的数据量将是海量的。以京津冀地区(约21.7156万km2)2017年全覆盖影像数据为例,如图1和表1所示,从MODIS、Landsat-8、GF-1 WFV到Sentinel-2,数据的时空分辨率越来越高,其数据量也急剧增长,就全年数据量而言,Sentinel-2大约是MODIS 8 d合成地表反射率数据的250倍。除了海量数据之外,遥感数据在用于作物识别研究前,还需要一系列复杂、繁琐的预处理过程(如辐射定标、大气校正、云检测以及几何配准等步骤),而传统的单机、人工处理模式在人力成本和时间成本上都是无法接受的。因此,适应海量遥感空间大数据存储管理与计算分析的新工具、新平台成为迫切的需求。
图1 4种遥感数据在京津冀地区的全覆盖示意图Fig.1 Full coverage of four remote sensing data in Beijing-Tianjin-Hebei region
Google Earth Engine(GEE)是当下空间大数据平台中最为知名的平台,是Google公司推出的一个基于云环境下全球尺度的地理空间分析平台。该平台上开放了PB级的空间数据,包含几十种矢量和栅格数据集,如行政边界数据、MODIS、Landsat和Sentinel遥感数据等;Google数据中心还为GEE平台提供了内在的并行计算访问,使之具有强大的计算能力,用户可以通过互联网调用API形式访问和使用GEE平台的数据与计算能力[39-41]。当前,全球范围的科学家基于GEE开展了很多科学研究,如PATEL等[42]基于GEE开展了多年的居住区和人口制图,JOHANSEN 等[43]基于GEE在澳大利亚开展了植被制图,LEE等[44]基于GEE开展了油棕探测研究。当然,也有不少学者在GEE上开展大范围的作物识别与制图相关研究工作[45-48]。除此之外,全球还有不少科研团队在海量多源数据的时空框架设计方面开展了相关研究与应用。如澳大利亚地球科学局LEWIS等[49]通过将OpenStack搭建在澳大利亚国立大学国家计算中心的超级计算机上,建立了数据立方体,在地表水资源观测、多源数据融合和水资源质量监测等方面进行了广泛应用。浙江大学戚将辉等[50]利用大数据技术与智能化思想,研究空间信息组织模型,探索构建了一个智能化的空间信息立方体,满足空间信息发现和智能化预测等应用需求。YE等[51]设计了RDCRMG格网体系,可对多源栅格数据进行切分和统一编码,实现了多源遥感数据的格网化存储、管理和计算;同时YAO等[52-53]研究了基于Hadoop大数据平台的矢量数据空间划分方法和编码规则,实现了全国尺度的矢量数据计算和可视化。
表1 京津冀地区2017年4种遥感数据信息统计Tab.1 Statistical information of four remote sensing data in 2017 in Beijing-Tianjin-Hebei region
综上所述,在大范围开展可靠精度的遥感作物识别与制图面临着海量数据预处理、存储管理和分析计算的问题,而类似GEE这种同时提供数据与计算能力的新型空间大数据云平台,使得大范围、可靠精度的作物识别与制图成为可能。
基于遥感数据实现作物识别与制图,主要实施过程为:针对目标对象从遥感数据中寻找合适的区分特征,将区分特征作为某种分类算法的输入参数,经过运算后获得某个时空范围内的作物分布结果。由此可见,除了遥感数据外,基于遥感的作物识别主要考虑两个要素:区分特征和分类算法。总结国内外的遥感作物分类研究可知,从遥感数据中常被选为区分特征的有:光谱及其衍生指数信息、纹理信息、时间序列的阈值和变化信息。而分类算法的选择则与计算机领域的发展密切相关。
在区分特征中,光谱及其衍生指数的信息相对容易获得也是最常用的。陈思宁等[35]基于MODIS数据利用波谱分析方法对东北三省作物类型的空间分布进行了研究。郑利娟[54]针对GF-1 PMS数据,对融合后的2 m数据采用多特征的面向对象分类方法进行作物类型区分,取得了较好的分类效果。FORKUOR等[55]利用RapidEye和TerraSAR-X数据融合后的光谱信息进行农作物分类。UPADHYAY等[56]对DigitalGlobe的WorldView-2多光谱数据集中的新增附加波段进行评估,发现WorldView-2中原有的第5、7波段和新增的第4、6、8波段对于作物识别非常重要。用纹理信息作为区分特征进行作物分类研究,通常在高分辨率(米级或亚米级以下)的影像数据上能获得较好的分类效果[57],但是在一个作物生育期内,获取大范围全覆盖的高分辨率非常困难,因此纹理信息通常在小范围的分类理论方法探索研究中使用。张超等[58]针对制种玉米种植特点,在新疆维吾尔自治区奇台县坎尔孜乡,通过利用多时相1 m分辨率GF-2 PAN遥感影像的EVI 数据结合Sobel边缘检测算子和Hough 变换方法进行纹理特征提取,实现了制种玉米地的识别。CHUANG等[59]在台湾地区中部,利用WorldView-2影像的波段信息和灰度共生矩阵(GLCM)纹理信息获得80个变量作为分类算法的输入,实现了亚热带地区的茶树识别。随着国内外对地观测技术的发展,具有高时空分辨率(时间分辨率在4~5 d或更高,空间分辨率在10~30 m,如GF-1、Sentinel-2)卫星数据越来越多,能反映作物在一个生育期内生长变化的时间序列信息越来越受到关注且被大量使用。黄健熙等[60]使用GF-1 WFV数据构建多时相多植被指数特征,对黑龙江省黑河市嫩江县进行了主要农作物面积提取。贺鹏等[61]使用多时相GF-1数据,对黑龙江农垦赵光农场开展作物分类研究。TATSUMI等[62]利用Landsat 7影像的EVI时间序列特征进行了遥感作物分类,发现EVI的总和、方差以及多样性对作物分类精度有很大的影响。INGLADA等[63]在法国西南部,使用Sentinel-1和Landsat-8的融合时间序列特征,开展了早期作物识别研究,发现融合SAR数据可以规避可见光影像受云的影响。而随着小卫星群对地观测技术的进一步发展,大范围全覆盖的高时空分辨率数据将越来越多,多种区分特征协同是一种趋势,也将会进一步促进大范围作物分类的研究与应用。
遥感作物分类算法与数字影像处理、机器学习等领域的发展密切相关。机器学习属于人工智能的范畴,从20世纪50年代到现在,人工智能的发展经历多个阶段,形成了不同的学派[64],而遥感分类算法往往倾向使用在某个时段处于主流的算法。基于遥感开展作物分类研究从2000年以来逐渐增多,在这期间使用较多的分类算法有决策树[65-67]、贝叶斯[68]、神经网络[69-71]、支持向量机[71-74]和随机森林[62]。自2010年以来,深度学习在人工智能领域迅猛发展,将深度学习用于遥感作物分类的研究也迅速增加,在多数场景下能够比经典算法获得更优的分类效果[75-76]。
然而,在大尺度的场景下,因为遥感卫星的轨道参数、云遮挡等因素而导致的遥感影像数据覆盖状态在时空维度上存在不平衡、不规则的问题;加之不同地区物候、农事活动的差异而导致作物生育期和生长状态的不同,从而有可能扩大类内差异,缩小类间差异,进而增大遥感作物分类识别的难度[46,77-78]。当前遥感作物识别中常用的区分特征、分类方法并不能很好地解决上述问题,对此,PETITJEAN等[77]引入语音识别领域的DTW(Dynamic time warping)算法,能够有效克服大范围下遥感影像时间序列不规则的问题。YOU等[79]和WANG等[80]从遥感时间序列影像中提取像素的频谱直方图,以此作为深度卷积神经网络的输入进行产量估算研究,这些研究从遥感数据中获取的频谱直方图有别于前述的3种区分特征,而且这种直方图特征很适合当前在计算机视觉领域取得突破性进展的深度卷积神经网络,为从遥感数据中获取区分特征提出一种新的思路,很有借鉴意义。
综上所述,在大范围开展可靠精度的遥感作物识别与制图面临着因遥感数据覆盖的不平衡、不规则和因物候、农事差异带来的生育期、生长状态不同导致作物分类识别难度增大的问题,需要进一步发展新的区分特征和更加鲁棒的分类方法。
上述分类算法都是采用监督分类策略,必须有地面样本数据辅助训练和验证。当前的研究中,地面样本数据主要有两种获取途径:从高分辨率影像中目视解译和开展地面调查。而从影像中解译地表覆盖相对容易,但是解译作物类型却很困难,在这种情况下地面调查往往必不可少。所以,当面向大范围实施作物分类,大量的地面辅助样本数据的获取必将带来大量的人力、物力、财力消耗。因此如何科学且高效地扩大地面样本量,成为目前大范围遥感分类研究与应用中亟待解决的问题。该领域的研究团队主要从优化样本采集、提高样本获取自动化水平和充分利用历史积累数据方面解决遥感作物分类的地面样本需求。
样本数量、样点位置选择的好坏不仅关系到资源的有效利用,而且对后续研究结果产生重大影响[81]。针对这一问题,国内外均进行了科学采集样本的研究与应用,美国大面积农作物估产计划(LACIE)、农业和资源空间遥感调查计划(AgRISTARS),以及欧盟的农业遥感监测计划(MARS,CROP4CAST),均建立了相应的空间抽样方案[82]。吴炳方等[83]提出了基于农作物种植结构区划,采用整群抽样和样条采样技术相结合的解决思路科学采集样本,进行农作物播种面积的估算。张焕雪等[84]开展了抽样率、格网大小、样本空间分布对湖南省晚稻面积估算精度的敏感性定量分析,为农作物种植面积监测空间抽样方案的选取以及确定特定的抽样方案可以达到的面积估算水平提供了理论支撑。王迪等[85]对现行农作物播种面积空间抽样技术体系的研究发现,在进行抽样时以分县冬小麦播种面积大小为分层标志的分层抽样方法效率最高。科学采集样本不仅包括通过抽样技术获得科学的样本空间分布,还包括不同作物类型合理的比例分配。张焕雪等[86]以黑龙江红星农场为研究区,基于少量已有地面调查数据,快速获取2 016个玉米样本、1 512个大豆样本、504个小麦样本,利用环境星CCD数据的NDVI时间序列在对象尺度上进行决策树训练,获得了较满意的分类精度。杨闫君等[87]利用GF-1数据构建的NDVI时间序列,将1 050个样本等比例分配为水稻、花生、冬小麦-夏玉米3种作物类型,使用多种分类方法对河北省唐山市南部区域进行了分类研究,结果显示,支持向量机的分类效果最好,总体精度达到96.33%。
GONG等[88]在进行全球土地覆盖监测研究中,利用Global Analyst、Global Mapper的扩展功能以及Google Earth开发了土地覆盖的样本数据库系统,研究人员在该系统上通过参考2010年MODIS EVI时间序列信息和Google Earth的高分辨率影像,以人机交互的方式高效获取大量的样本数据。此后,在该样本数据库系统的基础上,又增加了在光谱空间存在显著差异的新样本单元,建成包含各地主要季节物候信息的动态普适样本训练数据库,这些样本可用于多种数据制图且分类精度较高[89]。
在现有作物分类研究中,当季样本数据往往仅用于当季作物分类,很少用于下一季甚至后几季,使得每个生育期的作物分类都需要重新开展地面样本数据采集,这也是造成采样成本高的主要原因之一。部分学者在作物种植结构相对稳定的区域,探索使用历史样本用于当季作物分类的方法。基于历史样本的遥感作物分类目前有两种思路,一种是基于年际间同种作物的光谱相似性进行分类。如MASSEY等[90]将美国划分为12个生态区,使用MODIS的NDVI数据,基于历史样本得到不同作物不同时相的光谱区间,进而应用于当季作物的分类,分类精度与使用当年样本进行分类时相当。HAO等[91]以新疆博乐和玛纳斯为实验区,使用ABNet方法充分利用历史地面参考数据建立主要作物的NDVI时间序列参考曲线,开展当年作物分类,与利用当年样本分类相比,博乐市基于历史参考曲线精度低3.08%,而玛纳斯高0.61%。另一种思路是通过历史样本数据创造当季作物的“训练样本”,基于此样本对当年进行分类而不实地采集样本。如MUHAMMAD等[92]基于MODIS EVI时间序列数据和2008—2013年的地面参考数据,使用ABNet分类器和其它年份的地面样本对美国堪萨斯州各年主要作物冬小麦、玉米、大豆、高粱和苜蓿进行分类,总体精度介于74.4%~81.9%之间。PETITJEAN等[77]提出使用DTW算法解决大面积作物分类时影像时间维的不规则以及样本时序性的缺失问题,使用历史样本进行聚类分析再应用于次年的分类中,次年可以不重新采集样本数据。HAO等[93]利用美国堪萨斯州的历史分类结果CDL数据提取假设样本,并利用ABNet方法基于准确性筛选假设样本,得到“训练样本”对当季作物进行分类,获得了较好的分类精度。
综上所述,在大范围开展可靠精度的遥感作物识别与制图面临着海量地面样本需求带来的大量劳力、时间和财力消耗的问题。目前已经有学者从样本获取的科学性与高效性做出探索,一定程度上解决了大范围、少作物或小范围、多作物的作物遥感分类问题,但是对于任一给定区域,特别是大范围区域,对于至少需要多少样本量,不同作物样点在时间、空间上如何分布,才能确保主要作物分类精度,还缺少有效的测算方法和明确结论。如何充分利用历史积累的样本数据,国内外也有学者开始研究,但是对于如何使用历史积累数据才能保证遥感作物识别与制图产品的准确性与可用性尚未形成共识,需要进一步拓展研究。
目前,遥感作物识别与制图模式还处于确认监测阶段,即在已知的作物种植区,获取作物一个生育期内的遥感数据和实地样本数据,经过训练、识别和验证得到种植区生育期内的农作物种植的空间分布。但是这种确认型监测,大都需要使用整个生育期的遥感数据,在生育期即将结束或已经结束后才能获得目标区域的作物种植分布和面积,存在一定的滞后性。随着智慧农业发展的需要,针对主要粮食和经济作物,在一个生育期内,越早获得作物的空间分布信息对农业的经营管理、作物估产、灾害预警方面的指导决策越有利[94-95],也更具现实意义[96];针对特定的作物,在不确定种植与否或精准的空间位置的情况下,能通过遥感作物识别的方式探测和确定精准种植位置与面积,对于国家农业补贴、农业保险,相关部门的监管、执法和维护市场秩序稳定等都具有重要意义。
对于遥感作物识别与制图的模式转变,国内外已有学者关注到,并开展了初步研究。针对提前预判识别,目前主要有两种思路,一是根据不同作物在物候上的差异,从先验知识和遥感数据中寻找早期识别的作物特征,从而能在生长发育早期的遥感数据中使用该特征达到早期预判识别的目的。DONG等[97]基于水稻在移栽期独特的光谱特征,提出使用时间序列Landsat图像和基于物候的水稻自动提取算法。另一种是在某个目标区域,使用历史积累的样本数据构建参考库或训练分类模型,在当季作物生育期的早期遥感数据中应用参考库或分类模型,从而实现早期预判识别。HAO等[91]在中国新疆博乐县和玛纳斯县,使用2006—2010年的地面参考数据和MODIS的NDVI数据,构建参考NDVI时间序列,对2011年Landsat-5和环境卫星融合的30m影像和构建的参考NDVI时间序列进行系列转换,最终用于作物识别,在没用2011年样本的情况下整体精度达85%左右。在此基础上,郝鹏宇等[95]在美国堪萨斯州,基于2006—2013年的MODIS EVI时间序列数据和crop data layer数据获得2014年的“潜在”训练样本,使用这些样本和2014年的Landat 30m NDVI数据进行了作物识别,总体分类精度为94.02%,并探讨了使用短时间序列数据提前获得作物识别结果的可行性。MUHAMMAD等[92,98]根据往年的样本和遥感数据,在中国新疆和美国堪萨斯州进行作物分类实验,总体精度80%。
针对特定作物的探测识别,目前的研究还不多,与这种需求比较专业和小众有关。例如,针对罂粟的识别,陆永帅等[99]利用机载多光谱数据,提出基于深度置信网络模型罂粟识别算法,建立面向罂粟识别的模型,提前识别罂粟的种植分布,可节省人工地面识别排查非法种植罂粟的大量人力物力,为禁毒工作提供支持。又如,针对部分企业和商贩在我国西北玉米核心制种区私自繁制种子,导致种子供应严重过剩、非法种子流通猖獗等监管难题,刘哲等[58,100-102]从2015年开始,利用高时空分辨率的GF-1、Landsat等卫星遥感数据,在新疆和甘肃玉米制种地区,探索准确、客观、早期、定量的制种玉米空间分布和种植面积提取方法,制种玉米的识别精度在90%以上,为确保农业供种安全、增强市场监管能力和促进种业健康发展提供了新的思路和方法。
在智慧农业信息流中充当基础支撑数据的作物分布数据显得越来越重要,同时也对作物分布数据的时效性、空间覆盖程度、空间分辨率和精度等提出了更高的要求。近年来,对地观测系统,云计算、物联网和人工智能等数字技术的蓬勃发展,为遥感作物识别与制图提供了丰富的数据和强大的存储、计算能力,在全球范围内极大地促进了遥感作物识别与制图研究和应用。但是,随着实际应用中对作物分布数据提出的更高要求以及越来越丰富的遥感数据,遥感作物识别与制图也面临着新的问题。本文最后从加强科学研究与加快应用落地的角度展开展望。
多学科、多技术以及多应用领域交叉,是遥感天然的属性,遥感作物识别与制图是遥感在农业领域发挥作用的具体体现之一。针对作物类型分布产品的新需求、更加丰富的数据等现状与趋势,需要新的区分特征、更鲁棒的分类算法以及更深刻的农业种植场景的理解。研究者可以增加对作物生物结构、生物活动及其相应的物理电磁过程的理解,由此寻找新区分特征的灵感,荧光遥感就是一个很好的例子;尽管目前遥感作物分类的研究已经得到计算科学的很多支持,特别是图像识别领域,但是还应该把交叉的视野放到更宽的计算机应用领域,如PETITJEAN等[77]从语音识别领域引入DTW算法解决遥感时间序列不规则的问题;而深入了解农业种植场景有利于制定高效、针对性强的作物识别方案,如刘哲等[58, 100-102]深入考察我国制种玉米的农事过程,根据纯合玉米植株相对杂交植株矮小、瘦弱以及生产过程母本去雄和除父本行的现象,找到结合光谱特征与纹理特征的制种玉米地的识别方案。
太空、天空、近地及地面的遥感数据平台产生了丰富的数据资源,而且不同平台、不同波段的遥感传感器都有各自的优势与劣势;与此同时,互联网、物联网以及农业领域多年的数字化发展,也积累了不少农业气象、种植生产、土地利用等方面的数据。这些不同来源且依旧不断增加的天空地数据,既为行业应用提供了丰富的数据基础,也促进了多源协同的技术需求。在遥感作物识别与制图的研究与应用中,研究者可以融合地面辅助数据与先验知识,如地表覆盖数据和生态区划数据,对待分类识别的空间作一个场景区分,降低分类识别场景的复杂性,在不同场景采用不同数据与分类算法组合。研究者也可以在区分特征上,采用不同电磁波段的遥感数据,如丰富的可见光遥感数据、不受云雨天气影响的SAR数据,组合得到优势互补的区分特征集。研究者还可以根据不同分类算法的适应性,选择相对应的数据和场景,用某些分类算法结果作为另一个算法输入,通过这种算法层级的信息传递最终得到满足需要的作物分布数据;如在小范围、超高分辨率(米级或亚米级以下)的影像数据比较容易获得,结合面向对象的策略通常可以获得较优的分类精度;不少研究表明,大多数情况下,深度学习算法在分类问题上要比其它机器学习算法表现得更加优异,但是它需要海量的训练样本;因此,在大范围上开展高精度的作物识别制图之前,可采用超高分辨的影像数据、面向对象策略加上支持向量机或者随机森林等算法,得到高精度的作物识别结果,然后,使用该作物识别结果与高分辨率的影像数据(如GF-1、Sentinel-2)制作深度学习的训练数据集,在大范围上用高分辨率影像加上深度学习算法,最终得到大范围、高精度的作物识别与制图产品。
当前遥感作物识别研究和应用中,能够得到相对可靠且稳定分类识别效果的分类算法都是监督型的算法,即便是非监督的算法,在验证阶段依旧需要地面样本数据支撑,所以地面样本数据在遥感作物识别中仍是不可或缺的;另外,随着对作物识别制图产品需要更实时,覆盖范围更大,意味着地面样本数据的需求量将会进一步增加。在这种形势下,依靠当前常用的实地采样、人工在高分辨率从影像目视解译的手段难以满足日益增长的样本需求。因此,结合当下各领域的前沿进展,发展多元化、智能化的地面样本获取与共享机制势在必行。可以从以下4个方面加以探索:①增强与农业相关的行业和单位合作。随着农业分工的愈发精细,在田间活动的,除了第一线的种植户,还有一些相关群体,如农机类、植保类以及经常到田间检查、考察的部门、单位等。如果能设计一些互益、共赢的机制以及交互简单、智能的工具(如手机APP、微信小程序等,可采用语音交互),将这些资源纳入样本获取的渠道,可以产生海量的地面样本数据。②增强与互联网平台合作。近些年互联网飞速发展,除了很多普及程度高的大平台外,也产生了许多小众但是有特色的平台。比如,专用于识别花草植被的平台“形色”、“花伴侣”、“微软识花”等。这些平台通常都拥有定位功能,在不泄漏用户信息的前提下,可以和这些平台合作获取与作物相关的信息。③利用众包和公众参与模式。众包模式在一些创意设计行业已经相当成熟,在作物样本采集方面,可以和一些导航平台合作,以众包的模式发布一些作物识别的任务。也可以搭建田间样本共享平台,吸引感兴趣的公众参与其中,如俄克拉荷马大学的“Earth Observation and Modeling Facility”搭建的“Global Geo-Referenced Field Photo Library”。④增强人机协同的智能化样本生产。以当下的人工智能技术完全自动化的样本采集尚有难度,但是可以开发人机交互的智能样本生产系统来提高样本获取的数量和效率。如使用历史样本训练深度学习模型,用于当年的定点识别,将识别的可能结果和一些指标、区分特征可视化,相关人员则根据模式识别和一些区分特征做进一步确认。
可以预见,未来可用于遥感作物识别与制图的数据会越来越多,计算能力也会越来越强,但是数据和计算能力的可获得性在学术界和工业界仍存在不对等。如一些国家资助的遥感数据源仅在某个范围公开,超出则需要系列复杂的申请,有的还需要收费;计算能力的不对等也比较突出,一些研究经费不是很充足的团队很难获得开展研究所需的计算能力。相对而言,部分组织(如NASA、ESA)和跨国企业(如Google、Amazon)的数据和计算能力共享方式值得借鉴,对于全球的用户,只要经过简单的注册,都能免费获取众多的遥感数据资源;Google推出的Google Earth Engine更是向全球用户提供免费的数据和计算资源。随着国内遥感数据源越来越多,在国内数据不上传Google等国外公司平台的情况下,急需国家相关部门单独或与国内大公司合作,推出类似GEE的平台,以促进遥感数据与计算能力“平民化”,推动遥感研究应用快速发展。
作物类型分布数据作为农业和国土资源领域众多应用的基础数据,具有广阔的应用空间。然而,当前国内尚未有公开的作物类型分布数据产品,导致了众多研究工作在开展前首先需要进行作物识别与制图。因此,联合国内农业遥感相关的知名大学、研究院所或者相关政府部门,生产和发布全国性的作物分布相关的数据产品十分必要。该数据的基础性,意味着其潜在用户有可能不熟悉遥感作物识别,因此需要形成作物识别相关产品的基本数据规范,同时搭建共享门户通道,提升该系列数据产品的社会价值。