彭道松 聂小飞 莫明浩 计勇
[关键词]水土保持措施;遥感图像解译;卷积神经网络;深度学习模型
[摘要]近年来计算机视觉图像处理的发展与遥感影像分辨率的提高,使得遥感影像水土保持措施快速精准提取成为可能。为有效推进水土保持措施圖斑精准快速提取的研发与应用,在总结水土保持措施信息提取和卫星遥感影像解译常用方法的基础上,系统分析深度学习方法在遥感解译和遥感影像水土保持措施提取方面的改进与运用,对研究发展趋势进行了展望分析。
[中图分类号]S157[文献标识码]A[文章编号]1000-0941(2023)04-0045-05
水土保持措施是防治水土流失,保护、改良与合理利用水土资源,改善生态环境所采取的工程、植物和耕作措施[1]。准确判别水土保持措施空间分布是深入研究区域水土流失规律、系统评价水土保持效益、科学开展水土流失动态监测的关键。遥感影像是提取水土保持措施的重要依据,但对于大范围的水土保持信息,无论是野外人工走访调查还是遥感目视解译都不能满足快速提取的要求。近年来随着计算机硬件性能的快速提升及算法的优化发展,以深度学习为代表的人工智能技术在遥感影像分类与地物提取中逐渐得以应用,并显现出快速、高效等特点。
1遥感解译信息提取方法
总体上,水土保持措施信息提取经历了由目视解译、计算机半自动化解译到人工智能自动化遥感解译的发展过程。
1.1目视解译
目视解译是早期水土保持措施信息提取的重要方法。一般是由专业人员对遥感影像进行解译分类,提取水土保持措施信息等。赵帮元等[2]运用ArcGIS软件,采用人机交互综合解译的方式进行水土保持措施信息的提取和验证;赵兴实等[3]使用目视解译的方法进行黑龙江省土壤侵蚀调查。由于解译人员对遥感影像上的图斑信息存在认知差异、不同时相卫片存在色差等,因此解译结果受解译人员主观影响较大,需要多次交叉检查和复核,导致解译时间周期过长。目视解译是遥感影像解译最经典的方法,且在使用监督学习或半监督学习开展影像分类时需要基于目视解译结果进行验证[4]。
1.2基于像元的提取方法
基于像元的提取方法主要有监督分类和非监督分类两种。监督分类方法又被称为训练分类方法,此类方法在训练模型时需要收集一定量的样本数据集,一般通过目视判读或野外调查的方式进行收集,存在一定的人为主观性因素,其优势在于使用经样本数据集训练后的分类模型,通过有效的精度测试,可对其他遥感影像数据中的地物信息进行分类。监督分类中遥感影像的空间分辨率对分类结果的精度十分重要,但目前遥感影像主要通过卫片获取,存在着时间分辨率长、易受大气环境影响等问题。为弥补这些问题,徐存东等[5]使用高像素的无人机设备收集遥感影像,并使用平行六面体、支持向量机等监督分类方法对研究区域的盐碱地信息进行提取。基于监督分类的地物信息直接提取,分类精度往往受到所选分类样本的影响,综合利用多种地物分类方法可以有效减少错分,提高总体分类精度。比如,邵安冉等[6]基于归一化植被指数和归一化水体指数,采用指数计算和监督分类相结合的融合提取方法,能够对矿区土地利用信息进行快速识别分类,但适用范围有待验证且泛化能力不足。
非监督分类方法又称聚类分析或者点群分析,常用的有K-means法、ISODATA法等算法。其优势在于分类前不需要获得任何的先验知识,而是通过遥感影像上不同地物的光谱实现特征信息提取,缺点是检测效率较低。基于这个问题,韩萍等[7]提出了一种图像与非监督分类结合的提取方法;王冬利等[8]提出了一种以非监督分类为核心结合多尺度数据的地面信息提取模型,使模型能够达到监督分类的精度。半监督分类方法是近年机器学习领域的一个新的研究方向,其优势在于可以使用少量的训练样本对模型进行训练,并对没有标签的数据进行标签预测。王立国等[9]提出了一种联合多种空间信息的高光谱半监督分类方法,对高光谱的影像进行预处理并提取其空间特征信息,在训练样本少时较经典监督分类方法能够提高遥感影像的分类性能。在水土保持措施提取方面,ZHANGHYPERLINK"https://www.sciencedirect.com/science/article/pii/S2095633916301125"l"!"etal.[10]使用高分一号遥感数据,采用边缘特征统计算法、模板匹配算法和傅里叶变换算法等3种边缘检测算法自动识别提取梯田,结果表明上述方法对典型梯田的识别和提取非常有效,但只考虑了梯田纹理和灰度特征,对其他特征信息关注度不足。
1.3基于面向对象的提取方法
面向对象分类是对遥感影像中地物的纹理、空间等信息进行综合判断的一种方法,其对光谱分辨率和空间分辨率要求较高[11]。随着遥感技术的高速发展,遥感影像的分辨率得到了极大提升,面向对象分类方法的性能也得到了进一步提高。无论是基于样本还是基于规则的方法,在小区域内的地物信息提取都能够取得较好的效果,但是对于大区域的地物信息提取却存在泛化能力不足的问题。张雨果等[12]使用面向对象中基于规则的提取方法对梯田进行提取,并且将监督和非监督分类进行对比,结果表明监督分类的结果存在大量细碎斑块,“椒盐”现象严重;非监督分类方法的目视效果差,地物错分、漏分严重。相对而言,面向对象分类方法具有更好的性能,能够比较有效地去除“椒盐”现象[13],获得更好的分类精度。夏晨真等[14]基于厘米级无人机影像,采用面向对象分类方法,选取光谱、地形和纹理等特征进行影像分割,开展水土保持措施信息提取,结果表明横坡改垄和生态恢复乔木林识别精度较高,分别达到了97.35%和96.61%,而非线型水土保持措施的分类精度远低于线型水土保持措施的。
2深度学习在遥感解译中的应用
2.1基于初级卷积神经网络的遥感解译
在遥感影像分类解译中,相较于传统算法,卷积神经网络的优点在于能够获取大量的表层特征信息及丰富的深层语义信息,具有较高的自动化程度和分类准确度,但缺点是依赖于大量的标签数据集且模型训练周期较长。在当前大数据的环境下,各种遥感数据集的丰富和遥感影像分辨率的提高,使得卷积神经网络遥感解译相较于传统的目视解译,在分类效率、可行性和精度方面均具有较大优势[15]。将深度学习某单一模型或知识运用于遥感影像分类提取,所取得的分类提取精度、效果往往存在着一定的欠缺,而深度学习知识与其他领域知识联合构成的系统性综合卷积神经网络模型在遥感影像的分类提取中,无论是性能稳定性还是分类提取精度都得到了进一步提高。赵伍迪等[16]提出一种将卷积神经网络与空间纹理特征相结合的多源遥感数据特征融合的分类模型框架T-F-CNN方法,并与支持向量机分类方法进行了对比,结果表明前者分类精度较高。李道纪等[17]采用VGG16与AlexNet分别提取局部和全局视觉特征,与性能优异的U-Net进行对比,在效果相当的情况下模型收敛时间仅为U-Net网络的15.46%。AlexNet、VGG等基于初级卷积神经网络的图像处理模型在遥感影像的提取分类中单独运用较少,主要用于辅助开展影图整体分类,作为语义分割等高级模型的主要特征提取模块,其原因主要是基于初级卷积神经网络的图像处理模型仅对输入影像进行整体的类别判断,没有判别主要识别对象的位置及边界情况。
2.2基于现阶段卷积神经网络的遥感解译
随着卷积神经网络深度和广度的不断拓展,各种优化方式、网络模型结构在初级网络模型上发展运用,以及高级卷积神经网络模型与遥感领域中的综合知识联合,使得遥感影像分类提取性能得到不断提高。深度学习模型的深度增加,意味着模型能够取得更多的深度语义特性,但模型训练的时间也随之增加,导致训练中存在梯度弥散和梯度消失的情况[18]。DeepLab系列网络模型在初级卷积神经网络模型的基础上逐步引入了空洞卷积,加快了模型训练速度,减少了训练时间,并且将随机条件场(CRF)引入了网络模型,不仅提高了网络模型的定位精度,而且使得遥感影像语义分割的边界更加准确[19]。罗李焱等[20]提出了一种基于DeepLabv3+语义分割模型的高分辨率遥感影像建筑物提取方法,收集了大量的样本数据集,可有效提取各类建筑物。初级卷积神经网络(如AlexNet和VGG等)都可通过不断增加网络深度来获取更高的层次遥感影像语义信息,但随着网络层数的增加,参数呈几何级数增长,使得模型难以优化。GoogLeNet系列网络模型则是从另外一个角度思考和用密集成分来近似最优的局部稀疏结构,通过不断完善发展来保证模型既能够保持网络的稀疏性,又能利用密集矩阵的高计算性[21-22]。韩要昌等[23]在GoogLeNet模型基础上进行结构改进,提出了GoogLeNet16模型,提高了遥感影像分类准确度;Heetal.[24]提出的ResNet是在深层卷积神经网络的基础之上,通过引入残差单元,来解决由于神经网络模型过深引起的梯度消失问题,使得ResNet网络模型的深度更深,从而提高网络模型的识别准确度;章晨等[25]提出一种基于改进残差网络结构的ResNet,以适应背景复杂的遥感图像数据集,与AlexNet、VGGNet-16等卷积神经网络模型相比,分类提取准确度得到了小幅提升。
现阶段遥感影像分类提取解译中,运用最广泛的是各类卷积层深度较深的语义分割模型,此类模型的优势在于完成遥感影像地物提取特征分类后,通过反卷积解码对原始遥感影像上的每一个像素进行预测分类,提取地物信息边界并且进行标识。由于遥感影像尺度较大、地物信息丰富复杂,且遥感影像与图像级摄影机的分辨率仍然存在较大的差距,因此目前语义分割卷积神经网络模型在遥感影像提取应用方面仍存在较大局限性。在分辨率较小时,语义分割模型提取的各种光谱、纹理、空间等深层的语义信息较少,对提取分类精度的影响较大。因此,现阶段的深度学习模型主要用于纹理、空间、光谱特征较为明显的道路、水体、建筑物等地物提取。U-Net和DeepLab系列模型是运用较为广泛且效果得到很多研究者验证的两种语义分割模型,它们能够获得比传统遥感影像提取方法更好的提取精度,但训练模型的过程较长,需要人为调整训练参数,特别是如果需要调整模型的内部结构则需要比较高的计算机编程能力,且拥有大量遥感领域的知识。
当前阶段,遥感数据集还未普遍开源共享,需要自主建立大批的数据标签集,费时费力,且精度受人为因素影响。
3深度学习在水土保持措施信息提取中的应用
深度学习中卷积神经网络对于图像分类任务性能优异,能够预测出整幅图像的属性,但无法预测出遥感影像中地类的边界,并且对于空间大尺度的遥感影像目标地类信息的提取任务,卷积神经网络的分步、分割、分类提取在程序上复杂和冗余。而深度学习中全卷积神经网络语义分割模型分类预测的结果更加注重地物图斑在待分类影像中的位置、边界、面积等信息,因此深度学习语义分割模型更加适用于水土保持措施图斑的提取。
目前主流的语义分割模型有DeepLab、FCN[26]、U-Net[27]、PSPNet[28]等。FCN模型和U-Net模型早期主要应用于医学影像领域,经过迁移学习和模型适应性场景调整能够应用于各种遥感地类识别提取。金飞等[29]将改进双U-Net模型用于道路提取,程锐等[30]将改进多种语义分割模型用于耕地提取,可见通过改进深度学习模型,适用于水土保持措施图斑提取的方法已经在其他地物深度学习模型分类中得到了成功验证。针对目前水土保持措施图斑传统提取方法費时费力等问题,研究如何改进深度学习模型,实现水土保持措施图斑的智能、高效、精确提取,具有广阔的前景。
目前对于深度学习在水土保持措施图斑提取方面的研究成果仍较少,与水土保持措施图斑的公开数据集有限、图斑在遥感影像中面积较小、部分措施目视解译很难分辨有关。因此,现阶段主要应用于提取特征信息显著的水土保持措施图斑,如工程措施中二级分类梯田(因其形状规则且与其他地类信息有较为显著的差异)和生物措施中二级分类造林、种草等。例如,杨亚男等[31]采用以VGG19网络模型为基础构建的FCN-8s模型,深度学习后可实现梯田精细化边界预测和高精度面积提取;白翠[32]将基于MobileNet主干网络和基于ResNet50主干网络的深度学习PSPNet模型运用于梯田提取,对比结果表明在验证精度最优的网络参数下,基于ResNet主干网络模型的提取效果明显优于基于MobileNet主干网络模型的。郭争强[33]使用胶囊网络对新疆唐布拉草地进行分类,结果表明该矢量深度学习模型相较于支持向量机等传统遥感解译方法有更好的分类精度,但缺乏与主流的深层卷积模型的对比数据。唐川江等[34]利用DeepLabv3+模型对炉霍县、丹巴县、阿坝县、金阳县等地的草地进行分类提取,结果表明DeepLabv3+模型与人工判读的结果相近,比传统监督分类方法精度更高。刘春亭等[35]利用DeepLabv3+模型对城市的防尘绿网等进行提取,与传统NDVI方法和经典语义分割模型对比,DeepLabv3+模型具有更高的提取精度,但DeepLabv3+模型对防尘绿网的提取精度略低于其他地物的。葛小三等[36]也得到结论,使用DeepLabv3+模型对道路提取的精确率等高于防尘绿网的。综上,目前在应用层面,深度学习的水土保持措施信息遥感智能解译主要是有关面措施的提取,主要集中在梯田等工程措施提取方向,而对于其他的点、线型水土保持措施图斑,受影像分辨率等因素限制,仍难以取得精准的提取结果。
4结语
随着无人机影像在小区域遥感分类中的运用,遥感影像的分辨率大幅提高,无论是传统分类还是深度学习分类的提取精度都得到极大提高。在遥感分类提取中运用深度学习起步较晚,目前主要集中在特征显著的地物提取上,主要采用卷积神经网络语义分割模型,相较于传统的解译方法提取精度有所提高,但依赖于高分辨率的遥感影像和大量有关地物的标签数据集,且主要集中于真彩色图斑提取,对于多光谱信息尚有待发掘运用。
水土保持措施遥感解译经历了从传统费时费力的人工解译到面向对象的半自动或全自动计算机解译,逐渐步入到基于深度学习等人工智能技术的智能解译阶段,使水土保持措施信息的高效精准提取逐步成为可能。目前深度学习在水土保持信息提取领域还存在一些有待深入研究的方向:注重遥感影像数据的多源融合,结合无人机等其他高分辨影像,增强各种水土保持图斑的空间、纹理、颜色特征,进一步提高中小图斑水土保持措施的辨识率;应用深度学习提取水土保持措施时要想获得更高的精度,需要依靠海量的水土保持措施图斑标签数据集,因此建立包含各种水土保持措施的大容量标签数据集至关重要;耦合计算机视觉算法及水土保持领域知识的判别方式有望进一步提高水土保持措施提取精度。
[参考文献]
[1]袁希平,雷廷武.水土保持措施及其减水减沙效益分析[J].农业工程学报,2004(2):296-300.
[2]赵帮元,马宁,杨娟,等.基于不同分辨率遥感影像提取的水土保持措施精度分析[J].水土保持通报,2012,32(4):154-157.
[3]赵兴实,田中雨,刘岩,等.卫片目视解译在土壤侵蚀现状调查中的应用[J].水土保持通报,1996,16(1):149-152.
[4]陈斌,王宏志,徐新良,等.深度学习GoogleNet模型支持下的中分辨率遥感影像自动分类[J].测绘通报,2019(6):29-33,40.
[5]徐存东,李洪飞,谷丰佑,等.基于无人机遥感影像的盐碱地信息的精准提取方法[J].中国农村水利水电,2021(8):116-122.
[6]邵安冉,李新举,周晶晶.基于Sentinel-2A影像的矿区土地利用信息提取方法[J].山东农业大学学报(自然科学版),2020,51(3):441-446.
[7]韩萍,刘亚芳,韩宾宾,等.图像分割与分类相结合的PolSAR图像机场跑道区域检测[J].信号处理,2021,37(11):2084-2096.
[8]王冬利,张安兵,赵安周,等.非监督分类的冬小麦种植信息提取模型[J].测绘通报,2019(8):68-71,77.
[9]王立国,马骏宇,李阳.联合多种空间信息的高光谱半监督分类方法[J].哈尔滨工程大学学报,2021,42(2):280-285.
[10]ZHANGY,SHIMC,ZHAOX,etal.Methodsforautomaticidentificationandextractionofterracesfromhighspatialresolutionsatellitedata(China-GF-1)[J].InternationalSoil&WaterConservationResearch,2017,5(1):17-25.
[11]刘洁,赖格英,宋月君,等.水土保持措施图斑遥感识别提取研究进展[J].水土保持应用技术,2020(5):38-42.
[12]张雨果,王飞,孙文义,等.基于面向对象的SPOT卫星影像梯田信息提取研究[J].水土保持研究,2016,23(6):345-351.
[13]常虹,詹福雷,杨国东,等.面向对象的高分遥感影像信息提取技术研究[J].测绘通报,2015(1):99-101,130.
[14]夏晨真,张月.基于厘米级无人机影像的水土保持措施精准识别[J].水土保持学报,2020,34(5):111-118,130.
[15]曹林林,李海涛,韩颜顺,等.卷积神经网络在高分遥感影像分类中的应用[J].测绘科学,2016,41(9):170-175.
[16]赵伍迪,李山山,李安,等.结合深度学习的高光谱与多源遥感数据融合分类[J].遥感学报,2021,25(7):1489-1502.
[17]李道纪,郭海涛,张保明,等.结合双视觉全卷积网络的遥感影像地物提取[J].中国图象图形学报,2020,25(3):535-545.
[18]董蕴雅,张倩.基于CNN的高分遥感影像深度语义特征提取研究综述[J].遥感技术与应用,2019,34(1):1-11.
[19]CHENLC,PAPANDREOUG,KOKKINOSI,etal.DeepLab:semanticimagesegmentationwithdeepconvolutionalnets,atrousconvolution,andfullyconnectedCRFs[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2018,40(4):834-848.
[20]羅李焱,朱婷萼,张桂铭,等.基于DeepLabv3+模型的高分辨率遥感影像建筑物提取[J].电子信息对抗技术,2021,36(4):65-69,73.
[21]IOFFES,SZEGEDYC.Batchnormalization:acceleratingdeepnetworktrainingbyreducinginternalcovariateshift[C].France:JMLR.org,2015:448-456.
[22]SZEGEDYC,IOFFES,VANHOUCKEV,etal.Inception-v4,Inception-ResNetandtheimpactofresidualconnectionsonlearning[C].MenloPark:AAAIPress,2017:4278-4284.
[23]韩要昌,王洁,史通,等.基于改进GoogLeNet的遥感图像分类方法[J].弹箭与制导学报,2019,39(5):139-142,153.
[24]HEKMHYPERLINK"https://ieeexplore.ieee.org/author/37085360867",ZHANGXYHYPERLINK"https://ieeexplore.ieee.org/author/37088458974",RENSHYPERLINK"https://ieeexplore.ieee.org/author/37085368998"Q,etal.Deepresiduallearningforimagerecognition[C].LasVegas:2016IEEEConferenceonComputerVisionandPatternRecognition(CVPR),2016:770-778.
[25]章晨,夏凯,杨垠晖,等.改进残差网络的遥感图像场景分类[J].测绘科学,2020,45(8):151-156.
[26]SHELHAMERE,LONGJ,DARRELLT.Fullyconvolutionalnetworksforsemanticsegmentation[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,2017,39(4):640-651.
[27]RONNEBERGERO,FISCHERP,BROXT.U-Net:Convolutionalnetworksforbiomedicalimagesegmentation[C].Berlin:SpringerInternationalPublishing,2015,9351:234-241.
[28]ZHAOHS,SHIJP,QIXJ,etal.Pyramidsceneparsingnetwork[C].LosAlamitos:2017IEEEConferenceonComputerVisionandPatternRecognition(CVPR),2017:6230-6239.
[29]金飞,王龙飞,刘智,等.一种双U-Net的遥感影像道路提取方法[J].测绘科学技术学报,2019,36(4):377-381,387.
[30]程锐,魏妍冰,陆苗,等.基于集成深度学习模型的耕地地块提取[J].中国农业资源与区划,2022,43(7):273-281.
[31]杨亚男,张宏鸣,李杭昊,等.結合FCN和DenseCRF模型的无人机梯田识别方法研究[J].计算机工程与应用,2021,57(3):222-230.
[32]白翠.基于深度学习梯田信息提取及其对土壤侵蚀量估算的影响[D].西安:西安科技大学,2021:25-26.
[33]郭争强.基于深度学习的草地变化监测研究[D].成都:电子科技大学,2020:38-40.
[34]唐川江,唐古拉,鲁岩,等.基于深度学习方法的草地信息智能提取研究[J].中国草地学报,2020,42(3):175-180.
[35]刘春亭,冯权泷,刘建涛,等.DeepLabv3+语义分割模型的济南市防尘绿网提取及时空变化分析[J].遥感学报,2022,26(12):2518-2530.
[36]葛小三,曹伟.一种改进DeepLabV3+网络的高分辨率遥感影像道路提取方法[J].遥感信息,2022,37(1):40-46.
[作者简介]彭道松(1997—),男,江西宜春人,硕士研究生,主要从事水土保持和水资源信息化技术研究;通信作者莫明浩(1981—),男,江西抚州人,博士,教授级高级工程师,主要从事水土保持与生态环境方面的研究。[收稿日期]2022-06-01
(责任编辑李杨杨)
[基金项目]国家自然科学基金项目(42067020);江西省水利厅科技项目(202123YBKT16,202325ZDKT02);江西省博士后科研择优资助项目(2019KY46);南昌工程学院校级研究生创新计划项目(YJSCX202106)