谢新乔,杨继周,邓邵文,李湘伟,秦发侣,王美艳,柳成柱,史学正
(1.红塔烟草(集团)有限责任公司,云南 玉溪 653100;2.玉溪师范学院,云南 玉溪 653100;3.土壤与农业可持续发展国家重点实验室(中国科学院南京土壤研究所),南京 210008;4.玉溪市烟草公司元江县分公司,云南 元江 653300)
烤烟是云南省玉溪市最为重要的经济作物。应用遥感技术识别区域范围内烤烟种植田块并统计种植面积,对烤烟种植规模进行宏观、及时、准确地监测,可以为合理设置烤烟监测站、科学预估烤烟产量提供详实的数据,为烤烟产业的高质量发展提供支撑。
遥感技术可用于监测农作物种植分布,根据数据源的不同,遥感技术可分为光学遥感[1-3]和微波遥感[4-6]。一般而言,光学遥感影像的获取易受到云、雾、霾等天气的影响[7-9],导致研究区域遥感影像质量难以保证,可获取时间存在不确定性,不利于建立适用于不同年份的作物监测模型[3,10-11]。相较于光学遥感,微波遥感因波长较长、能穿透云雾而具有全天候监测能力,可为多云、雾、霾区域作物监测提供潜在可行的方法[12-13],但其需要通过获取时间序列上的多景合成孔径雷达(SAR)影像来弥补单景SAR 影像波段数不足所导致的作物识别精度不高的问题[13-15]。
光学遥感一般基于多光谱遥感的近红外、红光、绿光和蓝光计算归一化植被指数(NDVI)、比值植被指数(RVI)、差异植被指数(DVI)、增强植被指数(EVI)、归一化差异绿度植被指数(NRI)和绿度归一化植被指数(GNDVI)等,然后根据这些指数应用决策树、支持向量机和随机森林等方法对地物进行分类并提取烤烟分布。如王政等[16]基于HJ-1 卫星的多光谱遥感影像计算不同地物的光谱反射特性、NDVI 和RVI,识别了广西靖西县烤烟种植区域分布特征,结果表明烤烟在红波段与近红外波段的比值与其他地物无交叉区间,最终利用RVI模型所提取的靖西县烤烟种植信息总精度为92.79%,Kappa系数为0.837 4。张阳等[17]根据2019 年4 月至7 月间湖南省茶陵县烤烟与水稻、油菜、林地、建设用地、水体和灌木草地等地物之间光谱反射特征差异性,从多景不同时间节点的Sentinel-2 卫星影像中选择6 月4 日获取的一景云量少、图像质量好的影像,计算了NDVI、RVI、EVI、NRI和GNDVI,采用决策树分类方法提取县域烤烟种植面积,总体分类精度达90.29%,与实际调查种植面积相比,误差为3.7%。可见,由于多光谱遥感具有多个波段,而不同地物对多个波段反射差异性的可区分度较大,因此,单景高质量的多光谱遥感影像能获得较好的烤烟识别效果。然而,在烤烟生长季多云、多雨的地区,高质量的多光谱遥感影像往往难以获取,单景影像上难免有云污染的现象存在,这极大地限制此种方法的普遍适用性。
微波遥感应用以SAR 为主,多基于SAR 影像上不同地物对水平发射水平接收(HH)、垂直发射垂直接收(VV)、垂直发射水平接收(VH)和水平发射垂直接收(HV)这四种不同极化类型的散射系数差异性进行地物类型的区分。如廖娟等[18]获取了TerraSAR-X卫星2013 年8 月24 日的一景影像,提取了烟地、玉米地、水稻田、林地和居民点的HH、VV 和HH/VV 三种极化类型的散射系数,并根据五类地物散射系数的差异,采用支持向量机方法提取贵州清镇烤烟种植分布情况,烤烟识别精度(制图精度)和分类总精度分别为78.4%和85.1%。这说明基于烤烟生长季关键时间节点的TerraSAR-X 影像,能获得较准确的烤烟种植分布数据。但研究者同时指出TerraSAR-X 影像的购置成本限制了其在大区域范围、长时间序列的应用。
以上研究仅利用了单期多光谱和SAR 影像的波段信息,而未将烤烟生长周期的物候特征纳入模型中,虽获得了较好的识别效果,但所建立的遥感反演模型仅适用于特定的时间节点,难以保证影像的可获取性和遥感反演模型的可重复利用性。若将烤烟的物候特征纳入模型中,有望获得更高的反演精度。Sentinel-1 的SAR 影像具有免费、固定时间间隔和高可获取性的特点,为构建大区域、不同年份可重复利用的烤烟种植反演模型提供了较好的数据源。因此,若能建立基于多期Sentinel-1 SAR 影像的融合烤烟物候信息、可重复利用的烤烟种植遥感反演模型,将有望大幅提高烤烟数字化管理水平。
作为云南省最为重要的产烟区,玉溪市的烤烟生长季为5 月至9 月,烤烟生长关键期正处雨季。这导致该区域烤烟生长关键期的高质量光谱遥感影像难以获取。因此,本研究拟基于连续多时相Sentinel-1卫星影像,探究VV、VH 以及VV 与VH 比值(VV/VH)等不同极化信息组合对不同土地利用类型的可区分度,使用随机森林分类方法构建适用于玉溪典型烤烟种植区的烤烟Sentinel-1 反演模型,并在区域范围内验证模型精度,以期揭示玉溪市烤烟种植区域分布,为当地烤烟产业数字化和高质量发展服务。
玉溪市位于云南省的中部,辖区内地貌以山地和坝子(山间盆地)为主。市内的红塔坝子、澄江坝子、江川坝子和通海坝子是主要的农业生产区,也是烤烟的主要种植区。除坝子外,市内烤烟多分布于丘陵山区的坡地,呈小面积零星分布格局。本研究选择具有代表性的澄江坝子、江川坝子及周边山坡地为研究区(24°19′15″~24°46′58″N,102°43′11″~103°07′13″E),面积约2 050 km2(图1)。研究区内多年平均气温为11.5~11.9 ℃,多年平均降水量为900~1 200 mm;土壤类型主要为水稻土、红壤和紫色土;土地利用类型主要包括建设用地、农业用地和水域。区域内夏季作物主要为烤烟、蔬菜、水稻、蓝莓和莲藕等。其中,烤烟于每年5 月上旬移栽完毕,6 月中旬揭掉地膜,8 月初开始采收,9月中旬采收结束。
图1 研究区调查样点分布Figure 1 Sample distribution in the study area
2020年5月至10月间每月进行1次野外调研,并根据调研情况将烤烟、菜地、水稻、蓝莓、莲藕、城镇、林地和水体确定为最终的土地利用分类类型。使用集思宝UG908 手持卫星定位平板采集了烤烟、菜地、水稻、蓝莓和莲藕等样地的经纬度,其监测样点数分别为168、115、69、54 个和71 个。根据从https://scihub.copernicus.eu/dhus/#/home 下 载的2020 年7 月30日Sentinel-2 影像,解译判读出水体、城镇、林地分别为21、51、48 块。随机抽取70%样地作为训练样本,30%样地作为验证样本,分别用于训练基于连续多时相Sentinel-1 卫星影像的作物分类模型,以及验证模型在研究区作物上的分类精度。
由欧洲航天航空局(European Space Agency,ESA)发射的Sentinel-1 SAR 卫星由A、B 两颗C 波段(波长约6 cm)卫星组成。其单颗卫星的重访周期为12 d,两颗卫星的重访周期为6 d。每颗卫星提供VV和VH 双极化影像。目前在欧洲以外地区,一般同一相对轨道的上行或下行方向仅能获得12 d 间隔的影像[19]。由于农作物的后向散射系数会受到卫星视角和航向的影响,为消除卫星视角和航向对分类的不利影响,从https://scihub.copernicus.eu/dhus/#/home 下载2020 年5 月22 日至9 月19 日每隔12 d 一景的Sentinel-1A 卫星的干涉宽幅模式下行轨道的L1 级地距(Ground Range Detected,GRD)影像共11 景(表1),该产品已经过多视处理,再利用ESA 提供的SNAP 8.0软件中Sentinel-1 工具箱对11 景影像数据进行预处理。处理步骤依次为精密轨道参数修正、研究区裁剪、热噪声去除、辐射定标(Sigma0)、后向散射系数单位转换为db、基于SRTM(Shuttle radar topography mission)数字高程模型的地形校正以及窗口数为5×5 的Boxcar滤波[20-21]。
由于每个时相需要两景相邻的Sentinel-1A 卫星影像才能完整覆盖玉溪市,因此,需另从https://scihub.copernicus.eu/dhus/#/home 下载与表1中获取时间一致的另外11景影像。整个玉溪市共有22景影像。
表1 研究区Sentinel-1影像信息Table 1 The metadata of Sentinel-1 images acquired for the study area
为探究准确、高效的Sentinel-1影像的分类方法,本研究基于研究区的训练样本,使用SNAP 8.0 软件中随机森林分类方法进行地物分类;设置11 景Sentinel-1 影像的VV、VH、VV+VH 以及VV+VH+VH/VV四种不同组合,依次训练分类模型;每次训练时,均设置随机森林分类模型的训练样本数为5 000,分类树的个数为200;使用训练得到的随机森林分类模型,基于全市范围内的11 个时相的22 景Sentinel-1A 卫星影像进行玉溪市烤烟种植的分布反演,得到玉溪市烤烟种植分布情况。
基于总体精度(OA)、Kappa系数(K)、用户精度(UA)和制图精度(PA)4 个指标验证地物分类模型在研究区的精度[21]。其中OA表征所有正确分类像元占全部像元的比例,Kappa系数量化分类结果与实际地物类型的一致程度,二者度量所有土地利用类型分类正确性的总体程度。分类正确性的总体程度高,并不能代表每一种土地利用类型的分类精度高。而UA和PA则是针对某一土地利用类型的度量指标。UA是像元分类可靠性的度量指标,PA是地物分类正确性的度量指标。UA、PA和OA均为百分数,数值越大表示结果越可靠。Kappa系数介于0~1 之间,越接近于1,分类效果越好。
Sentinel-1的SAR影像后向散射系数受到农作物种类、茎叶结构、含水量、生长周期等因素的影响,使得不同作物在影像上表现出不同的散射特征,这是Sentinel-1影像分类的基础。基于预处理后的多时相Sentinel-1 影像,统计8 种不同地物训练样本覆盖区域像元的VH、VV 的平均值(图2、图3),以此来表征不同地物后向散射系数随时间的变化。
图2 8种土地利用类型的VH后向散射系数的季节性变化Figure 2 The VH backscatter of eight land use types
图3 8种土地利用类型的VV后向散射系数的季节性变化Figure 3 The VV backscatter of eight land use types
由图2可知,烤烟的VH 从6月初至8月初总体处于上升状态,在6月中旬和8月初各有一个波峰,并从8 月初至9 月初呈下降状态。这一现象与烤烟的种植、生长周期相关性较强。一般认为VH 在作物生长的初期主要受地面粗糙度的影响[22],而在作物生长的中后期则对作物的体散射较为敏感,通常与NDVI 等参数高度正相关[11]。当烤烟于5 月上旬移栽完毕时,烤烟的个体较小,VH 基本反映的是地块内土壤表面的情况。烤烟移栽后,土壤受降雨、灌溉等影响会逐渐光滑,因此VH 略微下降[11]。6 月中旬烤烟种植者会揭掉烤烟种植时覆盖的地膜,此时会扰动土壤,致使地块内VH 大幅提高,导致6 月中旬出现波峰。此后,降雨、耕作管理措施会让土壤紧实、平滑,故而VH明显降低。但烤烟经过一个月的生长,烟株已经有一定程度的成长,NDVI也随之增加,故相较于刚移栽完毕时VH 有一定程度的提高。此后烤烟逐渐生长直至成熟,VH 也一直上升,最终于8 月初达到顶峰。烤烟采摘开始后,烤烟的叶片数开始减少,NDVI也随之减小,VH 即呈现出降低的状态。到9 月初烤烟采摘完毕,地块内仅剩烟杆和烟株顶部的部分细小叶片,故VH接近于刚揭掉地膜时的状态。
从图3 可见,不同于VH,烤烟的VV 仅在6 月中旬出现明显的波峰,7月初至8月初基本平稳,而后明显下降直至9月初烤烟采摘完毕。这是因为VV 主要受地面直接散射和作物冠层结构的影响[11-12]。6 月中旬烤烟揭掉地膜后,受扰动土壤会使VV 急剧升高。之后随着烤烟的生长,冠层会增加,从而减弱部分地面直接散射,但由于冠层减弱的地面直接散射与作物冠层产生的散射基本抵消,因此VV 基本平稳。但当8 月初烤烟开始采摘后,冠层产生的散射减弱,而采摘活动会进一步使地面土壤紧实、平滑,从而减弱地面直接散射,因此,VV 呈现出下降的状态。可见,烤烟与其他土地利用类型的VH 和VV 在时间序列上具有可区分性。这一后向散射的特性是基于Sentinel-1时间序列影像进行不同土地利用类型分类的前提。
为建立准确而高效的烤烟用地识别模型,将11个时相的VV、VH、VV+VH 和VV+VH+VV/VH 四种极化组合方式作为随机森林分类器的输入参数,结合研究区采集的训练样地训练Sentinel-1反演模型并对不同土地利用类型进行分类,之后对比分类结果与验证样本的一致程度来量化分类精度(表2 和图4、图5),筛选最合适的模型。由表2 可知,8 种土地利用类型的分类总体精度指标OA和Kappa系数由高到低的极化信息组合方式依次为VV+VH、VV+VH+VV/VH、VV 和VH。相比于VH 和VV 这两种单一极化数据,VV+VH 的极化组合分类总体精度分别提高了15.8和9.7 个百分点,Kappa系数分别提高了0.191 和0.120。值得注意的是,增加VV/VH 信息的VV+VH+VV/VH极化组合反而比VV+VH 在分类总体精度上降低了1.3 个百分点,Kappa系数减小了0.016。因此,VV+VH 是分类总体精度最佳的极化组合方式,正确分类像元占所有像元的比例为87.6%(OA),分类结果与实际地物类型的一致程度为0.847(Kappa系数)。
表2 基于四种极化信息组合的8种不同土地利用类型的随机森林分类总体精度Table 2 The overall accuracy values calculated based on four polarization combinations
与其他研究[11,14]结果相似,本研究中Sentinel-1的VV 比VH 获得了更高的土地利用类型分类精度。这主要是由于VV 不仅接收作物的体散射从而在作物生长的前期与植被覆盖度具有强相关性[11],同时还受植被与地面的交互影响,能在一定程度上反映植被的几何结构和冠层特征,因此较VH 在不同作物间有更明显的区分度[14]。Veloso 等[11]指出通过求取大麦、小麦和玉米的VV/VH 能消除数据获取时部分环境因素造成的误差,从而更准确地反映作物的生长情况;而对于向日葵而言,VV/VH 并未呈现出与作物生长情况的强相关性。本研究中烤烟的叶片与向日葵相似,均属于较大的阔叶,这从一定程度上解释了加入VH/VV 比值之后训练的模型相比VH+VV 精度并无明显提升的原因。
相对于OA和Kappa系数,PA和UA是对单独地物分类精度的评价指标。PA可衡量某一土地利用类型分类正确的频率,UA用于表征已分类土地利用类型中可靠像元的占比。从图4 的PA可知,基于VV+VH+VV/VH 分类的蓝莓、烤烟和林地三种土地利用类型的分类正确性最高,而基于VV+VH分类的水稻、蔬菜和城镇分类正确性最高。对于分类后的可靠性指标UA而言(图5),基于VV+VH+VV/VH 分类的林地、城镇、蔬菜和莲藕可靠像元的占比高,但基于VV+VH 分类的水稻和烤烟可靠像元的占比高。因此,需综合考量PA和UA进而筛选合适的组合。
图4 基于四种极化信息组合的7种不同土地利用类型的随机森林分类制图精度(PA)Figure 4 The producer accuracy(PA)values calculated based on four polarization combinations
图5 基于四种极化信息组合的7种不同土地利用类型的随机森林分类用户精度(UA)Figure 5 The user accuracy(UA)values calculated based on four polarization combinations
以烤烟分类为例,假设有10 000 个像元,则基于VV+VH+VV/VH 分类和VV+VH 分类的PA和UA的理想综合精度应分别为8 428(10 000×96.4%×87.4%)和8 613(10 000×96.3%×89.4%)个像元。此外,与VV+VH 相比,基于VV+VH+VV/VH 建立分类模型和用于分类所需的计算量均较大,故选择基于VV+VH分类方法进行研究区的烤烟种植提取。
基于VV+VH 分类结果(表3)发现,水体的综合分类精度最高,100%水体被正确分类;蓝莓的综合分类精度最低,仅31.0%的蓝莓被正确分类,且分类为蓝莓的像元中仅39.0%可靠。这主要是由于蓝莓种植地块情况复杂(有育苗、覆盖纱网、起垄种植等情况),当前样本中的代表性不够。与蓝莓的情况类似,仅55.9%的林地被正确分类,但不同于蓝莓,分类为林地的像元中96.9%可靠。其余农作物中,水稻的综合分类精度最高,烤烟、其他作物和莲藕的综合分类精度依次降低。其中烤烟的PA和UA分别为96.3%和89.4%,烤烟的识别综合精度较为理想。
表3 基于VV+VH组合的8种不同土地利用类型随机森林分类的精度Table 3 Validation results of random forest classification based on VV+VH and field samples
基于11 景不同时相的Sentinel-1 卫星影像可反演烤烟种植分布情况,图6 为抚仙湖周边的烤烟种植分布。由图可见,澄江坝子烤烟为片状分布,这主要由于澄江坝子进行了土地集中流转,由企业按片租赁后统一种植同一类型作物。不同于澄江坝子,周围山地上的烤烟多为零星种植,只有少部分为片状。这与山区耕地的分布特征较为一致,多分布于山顶、缓坡和山脚谷底几个地形部位。当几个地形部位的平缓区域面积较大时,烤烟的种植面积也相对较大,反之,则烤烟的种植面积相对较小。
图6 基于Sentinel-1遥感影像反演的抚仙湖周边烤烟分布Figure 6 The classified flue-cured tobacco distribution in the study area based on Sentinel-1 images
图7 为反演出的玉溪市烤烟种植分布情况。所有县(区、市)中仅澄江坝子由于土地流转呈现出明显的片状分布,其他县(区、市)烤烟多在坝子、山谷和缓坡进行种植。由于农户分散种植,因此呈现出大部分区域零星点状分布、少部分区域聚集的种植趋势。种植面积由高到低分别为华宁县、澄江市、新平县、峨山县、易门县、江川区、元江县、通海县和红塔区,分别占总种植面积的21.4%、13.5%、12.8%、11.3%、9.2%、8.6%、8.1%、7.9%和7.2%。
图7 基于Sentinel-1反演的玉溪市烤烟种植分布Figure 7 The classified flue-cured tobacco distribution in Yuxi City based on Sentinel-1 images
对比王政等[16]、张阳等[17]、廖娟等[18]和李富欣等[23]针对烤烟种植识别的研究可以发现,基于单景多光谱影像识别烤烟的精度普遍高于基于单景SAR 识别的精度[3]。这主要是由于多光谱遥感影像相比于单景SAR 影像具有更丰富的波段信息。本研究基于11 景Sentinel-1 的SAR 影像,以时间序列上的VH 和VV 波段弥补了单景SAR影像波段数的不足,烤烟分类用户精度为89.4%,制图精度为96.3%,高于廖娟等[18]基于四极化的TerraSAR-X 获得的78.4%的烤烟识别精度(制图精度)和85.1%的分类总精度。相对于以TerraSAR-X 为代表的四极化SAR,双极化的Sentinel-1单景影像波段数仅有VV和VH两个,但前者多为商业产品,获取多期、多景影像成本非常高,限制了多时相、大范围的应用;而后者可以免费获取,以多时相来弥补单景影像波段数不足的问题,从而获得高于四极化SAR的作物分类精度,且能在区域上大范围应用[24]。
在烤烟生长季多云多雨的玉溪,相比于获取时间和云覆盖程度均不确定的多光谱影像,Sentinel-1 影像具有更稳定的数据源,因此基于Sentinel-1 影像进行烤烟识别分类的方法具有更高的可行性。此外,多时相Sentinel-1影像还能够作为多光谱遥感数据的有力补充,提升农作物关键生长期长势情况获取的准确性。因此,基于多时相Sentinel-1 影像进行作物分类和监测的应用具有广阔的前景。
本研究基于11 期不同时相Sentinel-1 影像构建了地物分类模型,由该模型获得的烤烟识别结果基本能满足烤烟种植监测的目的。下一步拟探索基于面向对象的方法和结合光学多源遥感数据[6,13,25-27]进行极化SAR 数据的分类识别。此外,还应在不同年份验证和改进模型的识别精度,同时探索基于多时相Sentinel-1影像反演烤烟等作物长势的方法[28]。
(1)本研究基于烤烟生育期内的11 期Sentinel-1雷达卫星影像,分析了烤烟与其他7 种土地利用类型的VV 和VH 在时间序列上的可区分性,结果表明,VH 和VV 均可反映烤烟生长期内的主要后向散射系数特点,这是区分烤烟与其他7 种土地利用类型的基础。
(2)本研究比较了VH、VV、VV+VH 和VV+VH+VV/VH 四种不同极化信息组合作为输入参数时,使用随机森林法建立的Sentinel-1烤烟种植反演模型的精度,其中VV+VH 的极化信息组合方式获得的反演精度最高,分类总体精度为87.6%,Kappa系数为0.847,制图精度为96.3%,用户精度为89.4%。反演出的烤烟区域分布与实际种植情况一致性较高,研究结果能满足烤烟种植监测的目的。