基于Sentinel-2遥感影像的农田防护林自动提取研究

2023-09-22 08:40贾孟豪郭群佐邓荣鑫
农业与技术 2023年17期
关键词:防护林农田噪声

贾孟豪 郭群佐 邓荣鑫

(华北水利水电大学测绘与地理信息学院,河南 郑州 450046)

前言

农田防护林是我国重要的生态屏障,对于改善生态环境、防止水土流失、增加农作物产值具有重要意义和价值[1]。因此,快速获取并监测防护林的结构,空间分布特征,林带长势等信息对于研究防护林结构监测与功能发挥具有重要意义。传统的防护林调查主要依靠人力野外采样考察,需要消耗大量的人力物力且时效性差,难以满足科学研究和生产应用需求,亟需设计一种快速、精准的农田防护林提取方法。

遥感具有大范围、重复观测等优势,现已广泛应用于大尺度地物识别与动态监测研究。一些学者也尝试利用不同类型的遥感影像进行农田防护林的提取研究。秦丽梅等[2]基于Landsat 7 ETM卫星遥感图像,采用BP人工神经网络开展了农田防护林提取研究;邓荣鑫等[3]利用Landsat TM卫星用影像与决策树分类方法进行了农田防护林地与其它林地的区分;扈晶晶[4]利用HJ-1和ZY-3卫星数据与决策树分类的方式进行农田防护林的信息提取;幸泽峰[5]利用ZY-3卫星数据与面向对象分类方法进行全区分类,并对结果进行数学形态学处理的分类研究;Wiseman等[6]基于高分辨率多波段影像,参照光谱信息、纹理信息、空间统计信息等,运用面向对象方法对加拿大草原的农田防护林带信息进行提取。这些方法在防护林分类提取的研究领域均取得了较好的效果。

本研究以Sentinel-2影像为数据源[7],分析农田防护林分类提取的关键特征,构建特征空间,并结合随机森林分类算法和数学形态学处理算法,研究并建立一种两步集成的农田防护林自动提取方法。该方法可为大范围农田防护林的自动提取提供参考,为农田防护林经营管理和动态监测提供可靠技术支持。

1 研究区概况

研究区位于吉林省中西部的德惠市和农安县境内(E125°12′10″~125°38′34″,N44°18′33″~44°42′37″),见图1。该区域地处吉林省中北部、松辽平原腹地,气候属于温带半湿润大陆性气候,多年平均气温为4.9℃,多年平均降水量为520.13mm,但由于春季风害严重,生态环境较为脆弱。该地区农田防护林工作起步早,规模大,效果较好[8]。

2 数据及预处理

本研究采用欧洲航天局Sentinel-2卫星数据作为主要数据源,采集时间为2017年6月28日,精度评价数据为高精度Google地图历史卫星影像。

本文所下载使用的Sentinel-2A数据,为欧空局(ESA)发布的数据产品级别为Level-1C的数据,是经正射校正和亚像元级几何精校正后的大气表观反射率产品,并没有进行大气校正。因此预处理过程主要为基于Level-2A级数据提供的参数对影像进行大气校正。

3 研究方法

3.1 农田防护林分类特征空间构建

研究区内农作物多以高杆玉米为主,直观上会对同是植被的防护林识别带来干扰,所以仅参照光谱波段和某些植被指数进行分类难以满足精度和效率需求。本研究将前人研究防护林分类时选取的分类特征[3-6,9-12]与研究区实际情况相结合,进行分类特征的选取,最终共选取分类特征42个,包含了光谱特征、纹理特征、植被指数与空间特征4大类,构建农田防护林分类特征空间。

3.2 基于随机森林分类的农田防护林初步提取

随机森林(Random Forest,RF)分类算法是一种多决策树集成的机器学习算法。大量研究表明,集成分类器的分类精度优于单一分类器。近几年,RF作为一种较新的机器学习算法,因其运算速度快,分类精度高并且对噪声数据不敏感等优势,被广泛应用与遥感数据的研究当中[13]。

本研究共选取了42个分类特征,通过多次实验剔除相同的冗余信息,与OOB曲线计算分类特征的重要性排序,最终选择NDVI、RVI、红光波段等14个特征变量构成特征空间集。

3.3 基于数学形态学的农田防护林精细提取

对农田防护林初步提取结果进行基于数学形态学的精细提取,以解决城建区噪声与林网数据破碎的问题。数学形态学被广泛应用在图像处理、模式识别等领域。尤其在遥感影像提取河流、沟渠、道路等线性地物方面,已有学者进行研究,并达到了较高的识别精度[14]。

本研究综合利用Matlab的Imfill函数及Floodfill算法也就是种子填充算法[15]对基于NDBI提取的城建区数据进行孔洞填充,并通过使用该数据掩膜处理解决城建区噪声问题。

对提取后的结果进行合理闭运算可以剔除细碎噪声点,并连接临近区域。但是部分区域由于闭运算参数的设定无法连接所有符合条件的防护林,所以这时候形态学膨胀运算就十分必要,但由于膨胀后腐蚀会造成短小防护林的信息缺失。所以本文最终采用膨胀后细化运算,最终得到的是由单一像元构成的连续不断的防护林带,更利于长度信息的统计。

在进行上述操作后几乎剔除了所有误差,但是仍有一些高秆农作物、村庄部分边界树木,以及孤立不连通的独立树木难以剔除。本研究采用设置连通面积阈值的方式对此类噪声点进行剔除。

经过上述方案处理最终得到的农田防护林分类处理结果是连续不断的,且已经剔除了绝大部分噪声点和不具备防护效益的林木。

3.4 精度评价

综合上述的两步集成农田防护林提取方案,精度评价分为2个部分:初步分类精度评价,精细化处理结果精度评价。

针对随机森林分类后的初步结果,结合1m分辨率的谷歌卫星影像准确地构建评价样本集合。构建预测与实际对应像元个数构建3行3列的混淆矩阵,计算总体精度(Overall Accuracy)、Kappa系数进行精度评价。

农田防护林的典型特点是线状地物,通常都将长度作为评价参数[9]。综合研究提取结果,本文提出冗余度、吻合度、遗漏度及长度正确率4种参数,定量对精细化提取结果的长度和空间位置进行评价。计算公式:

Δα=L1/LT

(1)

Δρ=L2/LT

(2)

Δβ=L3/LT

(3)

Δγ=LC/LT

(4)

式中,L1表示冗余长度;L2表示空间吻合长度;L3表示遗漏未提取长度;LC表示分类结果长度;LT表示实际长度。

4 结果与分析

4.1 基于随机森林方法的农田防护林初步提取结果

利用综合前人研究和研究区特点所构建的分类特征集合,构建训练样本集合。使用随机森林算法进行分类,多次实验并结合OOB曲线进行优化,得到分类结果如图2所示,分类混淆矩阵见表1。

表1 分类混淆矩阵

图2 分类结果示意图

通过选取对植被反应敏感的红光,近红外等共6个光谱波段及NDBI、NDVI、RVI、NDWI 4个光谱指数和2个高通滤波图像、2个纹理特征影像,共计14个分类特征构建分类特征空间。训练样区的选择一定程度上直接影响了分类精度,进行合理的样区选择,准确且均匀分布的采样,建立ROI训练样区。

多次实验,最终进行3类地物划分,分别为城建区、农田防护林以及其他(农田,水体等)。在连片性较好的农田附近农田防护林网识别情况较好,反之则质量略差,整体识别精度达到95.2%。

虽然整体识别精度达到了95.2%,但还是存在大量问题。如,明显的断点,边界毛刺,部分像元噪声,以及研究区域内的村庄绿化林带造成的误统计。大量防护林带断裂现象不利于统计,如图2a所示,部分错误分类需要筛选剔除如图2b所示,还有大量的破碎图斑出现在城建区内如图2c所示。

4.2 农田防护林精细提取结果

针对农田防护林初步提取结果展示出的不足,通过膨胀、填充等基于形态学处理与掩膜、细化等处理,去除图像噪声及离散点,同时填充断点、平滑边界,提取效果如图3所示。

图3 初步分类结果与精细化处理结果对比

由图3可知,在精细提取后得到的农田防护林分类处理结果是连续不断的,且已经剔除了绝大部分噪声和不具备防护效益的林木,极大改善了图像噪声及离散点问题。

在图4所展示的试验区1中使用ArcGIS统计分类识别长度,结合高精度卫星影像图矢量化标准防护林,对试验区1的精细化处理结果进行定量评价,精度评价结果见表2。

表2 试验区1定量精度评价

图4 精细化处理结果

5 结论

综合考虑光谱波段、光谱指数、纹理特征、空间滤波构建多维的分类特征集合,可以更加准确地提取农田防护林,最终准确识别精度达到95.2%。

相比初步分类结果,经过精细化提取处理操作的农田防护林网识别结果,在减少城建区绿化植株过统计,降低噪声(高杆作物、部分错误分类),去除毛刺,以及改良由于断裂造成的防护林提取断带方面均有巨大提升,结合4个实验样区进行4个定量参数精度评价,平均精度均在90%以上。该结果充分说明了本方法在大范围农田防护林自动提取方面的可行性,并可为农田防护林自动提取提供参考,为农田防护林动态监测提供可靠技术支持。

猜你喜欢
防护林农田噪声
噪声可退化且依赖于状态和分布的平均场博弈
农田创意秀
农田搞养殖需办哪些证
农田制作所
一种基于白噪声响应的随机载荷谱识别方法
车内噪声传递率建模及计算
云南防护林工程建设任重道远