王克晓,周 蕊,欧 毅,虞 豹,黄 祥,王 茜
重庆市农业科学院,重庆 401329
油菜是我国第一大油料作物,准确、及时掌握其种植面积是国家制定粮油和经济计划的重要依据[1-2].遥感具有覆盖面积大、重访周期短等特点,在农作物分布调查中具有比较明显的优势[3-4].西南地区是我国冬油菜的主产区,产季适逢冬春多云多雾季节,使得较为成熟的基于多时相光学遥感的农作物分布信息提取技术因数据获取问题而较难开展.合成孔径雷达(Synthetic Aperture Radar,SAR)遥感由于不受云雾影响,具有全天候、全天时、周期短等特点,为我国西南多云雾地区农作物分布识别提供了有力的数据支撑[5-6].
近年来,国内外诸多学者对SAR和光学影像的结合应用开展了相关研究.Blaes等[7]用光学遥感和微波遥感比较了复杂种植结构下作物分类的精度,探索了光学和微波遥感数据相结合的最佳方式.Haldar等[8]融合多时相Radarsat雷达数据与AWIFS遥感数据实现了水稻与其他作物的分离.Kussul等[9]结合SAR数据与光学数据有效区分乌克兰地区的玉米、大豆、甜菜等作物.韩可欣等[10]利用Sentinel-1雷达数据在贵州高原山区进行短期土地利用监测研究,验证了利用SAR监测高原山区土地利用变化的有效性.贾坤等[11]利用资源卫星多光谱数据与ENVISAT-ASAR数据结合,通过光谱信息与雷达VV极化数据增强不同地物之间的光谱差异,提高了作物分类精度.周涛等[12]以多时相Sentinel-1雷达和Landsat-8光学影像为数据源,在南京市高淳区构建了不同的特征向量组合来提取冬小麦种植面积,证明引入光学影像的多时相SAR数据能够有效提高冬小麦识别精度.郭交等[13]融合Sentinel-1雷达影像和Sentinel-2光学影像,对陕西省渭南市大荔县某农场农作物进行分类提取,获取了比光学数据较高的分类结果.陈磊士等[14]结合Landsat8和Sentinel-1影像,在昆明市主城区验证了基于机器学习分类算法的光学与雷达融合数据在土地利用分类信息提取方面的可行性.
上述多项研究表明,中高分辨率的光学与SAR数据结合能够较好地应用于农作物种植面积提取中,但在种植结构复杂、地块破碎的我国西南丘陵山区冬季作物提取中,相应研究却相对较少.本研究以丘陵山区地貌为代表的重庆市合川区为例,利用2019年冬油菜产季的单时相Sentinel-2光学数据和多时相Sentinel-1 SAR影像为数据源,构建光学影像主成分特征波段、植被指数和不同极化时间序列后向散射系数特征集等组合,以支持向量机为分类器,对研究区冬油菜分布进行识别提取,探索中高分辨率多时相SAR与光学数据对丘陵山区冬油菜种植面积提取的能力,为我国西南地区农作物信息提取提供参考.
本研究区位于重庆市合川区,地理坐标为东经105°58′37″-106°40′37″,北纬29°51′02″-30°22′24″之间,全区幅员面积2 344.07 km2(图1).合川区地处川中丘陵和重庆平行岭谷的交接地带,东南边缘的华蓥山区为平行岭谷地形,西北大部分为平缓丘陵地型.研究区内地块破碎,作物种植结构复杂,大宗作物主要以冬油菜、早稻及春玉米等为主,其中油菜作物物候期如表1.油菜作物开花期和黄熟期冠层光谱特征明显,绿熟期由于角果含水量增加使得冠层雷达散射特征也较为明显,因此,基于光学与雷达遥感协同的油菜识别最佳时期为开花期至黄熟期间.
表1 研究区油菜作物物候期
图1 研究区位置及地貌图
主要采用Sentinel-1的干涉宽幅模式( interferometric wide swath,IW)双极化地距影像产品,像元分辨率为10 m×10 m,极化方式为同极化(VV极化)和交叉极化(VH极化),坐标采用 UTM/WGS84投影系统,其中包括2018年12月23日和2019年1月4日、1月16日、1月28日、2月9日、2月21日、3月5日、3月17日、3月29日、4月10日、4月22日、5月4日等 12个时间节点,基本涵盖了研究区油菜生长发育主要过程.
主要采用Sentinel-2多光谱数据和GF-1影像数据,参考系为WGS-84坐标系,其中,GF-1为已经过正射校正的空间分辨率为2 m的融合多光谱图像,成像时间为2019年3月29日.Sentinel-2数据为2019年4月7日成像的L1C级多光谱产品数据,为正射影像且经过辐射定标、去噪等预处理,其可见光与近红外波段空间分辨率为10 m,红边及短波红外波段空间分辨率为20 m,Sentmel-2数据主要多光谱波段信息如表2.另外,本研究还获取了研究区局部地区2019年3月11日Google Earth卫星影像图,作为样本选取和制作地物类型剖线的参考底图.
表2 Sentinel-2影像主要多光谱波段信息
主要利用 SNAP(Sentinel Application Platform)对Sentinel-1双极化SAR数据和Sentinel-2多光谱影像进行预处理.多时相 SAR数据的预处理主要包括精密轨道校正、辐射定标、滤波、地形校正以及数据变换等过程,得到以dB为单位的地物后向散射系数定标结果;多光谱光学影像预处理主要是在Sen2Cor插件工具下大气校正和Sen2Res插件下的数据重采样,得到涵盖可见光—红边—近红外—短波红外等10个空间分辨率为10 m×10 m的多光谱波段集.以GF-1融合图像为参考对经处理过的Sentinel-1 SAR影像和Sentinel-2多光谱影像做几何校正,误差小于1个像元.
本研究所涉及特征集主要有光学影像主成分波段、植被指数、单时相SAR及多时相SAR数据集构成.其中,主成分三波段通过对光学影像进行主成分分析(Principal Components Analysis,PCA))获得,不同时相的SAR数据集影像为经预处理的12期雷达影像后向散射系数定标结果,植被指数(NDVI)及其改进指数(NDVI-RE)[15]主要通过红波段B4、红边波段B7、近红外波段B8等波段提取,植被指数及改进指数分别用fNDVI和fNDVI-RE表示,公式如下:
fNDVI=(B8-B4)/(B8+B4)
(1)
fNDVI-RE=(B7-B4)/(B7+B4)
(2)
在油菜开花期,基于Google Earth高清影像建立包含绿色植被、裸地及水体等不同地物类型的剖线如图2(a),绿熟期影像剖线路径如图2(b),对应剖线路径上fNDVI变化趋势如图3.通过剖线路径定位确定不同地物在多光谱影像上的fNDVI值,初步确定以fNDVI≥0.548为研究区绿色植被的分布范围,并以此为掩膜建立目标作物提取潜在兴趣区.根据油菜物候期内绿色植被的主要类型确定油菜、林地、其他绿色植被等3种识别类型,并从GF-1多光谱影像和Google Earth影像上目视获取标准样本点集410个,采用分层随机抽样方法选择样本集的50%作为训练样本,剩下的50%被用于执行分类精度评定.
图2 地物剖线走向
图3 剖线NDVI变化曲线
为了定量评价样本的可分离性用以区分油菜与林地、同期其他绿色植被,分别基于光学影像PCA和SAR影像及其组合计算了不同特征集组合典型地物的J-M距离[16],计算结果见表3.可以看出:在光谱主成分特征下,油菜样本特征与林地样本特征J-M值为1.910,同期其他绿色植被J-M值仅为1.385;在SAR影像散射特征下,油菜与林地可区分程度值下降至1.797,而与其他绿色植被间的可区分性特征值提高到1.722;在融入光学主成分特征波段与多时相SAR图像的条件下,油菜样本与林地、同期其他植被的可区分J-M值均在1.9以上,表明在光学和SAR数据的组合下,油菜与林地、同期其他植被的可区分性最高.
利用ENVI 5.3对Sentinel-2多光谱影像进行面向对象分割,Edge切割算法选择尺度20,Full Lambda Schedule合并算法选择尺度50.对地物分割对象与样本点集进行相关分析,获取训练样本与验证样本的对象多边形.分割对象与预处理的多时相SAR及多光谱图像进行相关空间统计分析,并获取对象内的图像均值,获取分割对象层次的SAR散射系数产品和反射率产品.
支持向量机分类是在统计学习理论基础上发展起来的一种新的机器学习方法[17],通过引入VC维理论能有效控制网络的收敛速度、样本错分的界和风险,得到小样本条件下的全局最优解,已广泛应用于遥感图像分类识别研究中[18].
利用ASD-HH2手持地物光谱仪采集绿熟期油菜、道路、草地、水田及裸地等典型地物光谱曲线,如图4,油菜与杂草地的绿色植被光谱特征明显,油菜作物反射率整体高于草地,反射率在红边波段B5位置开始明显区分,红边B6位置达到最大区分,红边B7位置达到稳定.
图4 典型地物光谱曲线
由不同典型地物样本对象的后向散射系数变化如图5所示,绿色植被的VV极化SAR后向散射系数明显整体高于VH极化方式,其中林地与其他绿色植被散射特征时相变化趋势基本稳定,油菜在整个生长发育期内散射特征变化较为明显.从特征变化与物候期关系可以看出:油菜VV极化散射特征在现蕾期基本稳定在-64.3 dB,进入开花期后,散射特征系数有所减小;绿荚期油菜散射系数较大幅度增加,在处于绿熟期的4月10日上升到最高的-62.6 dB,之后黄熟期出现下降;油菜VH极化散射特征在现蕾及开花期均保持基本稳定,绿荚期大幅增加,绿熟时达到最大值-67.7 dB,黄熟期开始下降.上述后向散射变化特点表明:抽薹期油菜进入营养与生殖生长两旺阶段,随着茎秆、叶片等器官水分积累增加,冠层散射作用较为明显;开花期油菜各器官水分分配发生较大变化,茎秆水分所占比例基本维持不变,叶片所占水分大幅减少,冠层水分积累速率降低,导致VV极化出现下降趋势,而VH极化对此过程却不敏感;绿荚期油菜呈现以茎秆、角果为主的垂直冠层结构,伴随着叶片退化水分转移至角果,VV极化及VH极化均出现上升趋势,角果成熟过程中,冠层脱水较为明显,含水量快速下降,SAR极化特征均出现下降.
基于图5可知,处于绿熟期的油菜在VV及VH极化特征上都明显区分于林地和其它绿色植被.本研究将绿熟期4月10日成像的SAR数据作为最佳单时相SAR数据,与4月7日成像的光学影像进行PCA变换融合处理,并记作PCA_SAR.基于光学影像PCA主成分波段与SAR后向散射特征集组合的丘陵山区油菜信息提取精度见表4.
表4 不同方案组合下提取精度
图5 典型地物多时相下不同极化后向散射系数变化
为探索植被指数及红边波段对丘陵山地复杂地貌地区油菜提取精度的改善效果,本研究引入了植被指数(NDVI)及红边波段改进的植被指数(NDVI-RE)进行精度对比.基于光学影像PCA主成分分析前三波段的研究区油菜分布信息遥感识别精度见方案A,油菜制图精度46.07%,用户精度87.23%,总体精度55.50%,Kappa系数0.27,整体精度较低.在引入植被指数后,油菜漏分误差减小,油菜制图精度提高到85.39%,用户精度下降到77.55%,制图精度与用户精度的调和值F1上升到0.81,总体精度达到69.80%,Kappa系数提升到0.53.方案C为引入NDVI-RE指数后油菜提取精度情况,油菜制图精度提高到89.89%,用户精度为69.57%,F1值为0.78,总体精度达到69.31%,Kappa系数0.52.上述A、B、C三方案的精度比较说明:尽管B4红波段、B7红边波段和B8近红外波段信息参与了光学影像PCA主成分分析提取,但这3个通常对绿色植被敏感的波段的作用在油菜信息提取时并没有凸显,可见在绿色作物识别中,NDVI及NDVI-RE能够起到明显改善识别精度的作用;再从方案B、C的比较结果看,NDVI-RE对油菜提取的总体效果影响不大,但对于油菜制图精度影响较大,能够明显减小油菜的漏分误差,对于处于绿荚物候期的油菜信息提取,红边B7波段比近红外B4波段更加有效.
在地块破碎、种植结构复杂区域,单一的极化方式和低空间分辨率大大限制了农作物SAR分类识别的效果.为进一步探索SAR散射特征在丘陵山地油菜分布识别中的作用,本研究进一步利用了单时相多极化和多时相多极化SAR数据进行油菜分类提取研究.从表4中方案A和方案D对比可以看出,在引入绿熟期单时相SAR数据后,由于油菜冠层角果含水量增加,油菜作物雷达散射特征得到加强,油菜漏分误差减小,制图精度由46.07%提高到66.29%,总体精度达到60.40%,Kappa系数也有所提升,表明引入适宜单时相SAR数据有助于地块复杂地区的油菜遥感识别制图精度的改善.方案E为12期多时相多极化SAR数据下油菜分布提取结果,可以看出在多时相SAR数据VV+VH特征组合下,油菜制图精度比光学影像PCA特征下高出15.74%,其它精度指标变化不大,说明多极化SAR数据在一定程度上可以替代光学影像用于丘陵山地地块破碎地区油菜种植分布信息的提取,与周涛等[12]利用多时相SAR与光学影像提取南京高淳区冬小麦分布研究结果一致.方案F为光学影像PCA特征与多时相SAR散射特征组合下的研究区油菜提取结果精度情况,可以看出油菜制图精度由E方案的61.81%提升到70.79%,用户精度从71.43%提高到85.14%,F1调和值上升到0.77,总体精度也提高了10%左右,Kappa系数提高0.16.上述研究证明:在云雾影响获取油菜物候期内多时相光学数据困难的情况下,以多时相SAR数据为主导,光学影像为补充的方法是提高西南丘陵山地地块破碎、种植结构复杂地区油菜作物遥感识别精度的可靠途径.
本研究基于中高空间分辨率的光学影像和SAR数据,考虑到尺度和红边波段问题,采用了与Sentinel-1双极化地距影像同尺度的空间分辨率为10 m的Sentinel-2多光谱影像,利用单时相光学影像和多时相多极化SAR数据,构建了光学影像PCA主成分特征波段、不同植被指数和不同极化时间序列后向散射系数特征集等组合,对重庆市合川区为代表的西南丘陵山区油菜分布进行提取,得到以下结论:
1) 在丘陵山地复杂地区,植被指数能够有效改善油菜信息提取精度,但不同植被指数改善效果不同.Sentinel-2影像红边波段B7比近红外波段B8更有效,引入B7红边波段指数NDVI-RE,油菜制图精度提高4.5%.
2) 在油菜生长过程中,VV极化后向散射特征对物候期引起的作物冠层含水率变化较为明显,在4月10日左右的绿熟期达到最大值;VH极化后向散射特征在开花期前相对不明显,但对油菜绿荚期反应较为敏感,比VV极化提前出现明显变化,且在绿熟期与其他植被后向散射特征差异达到最大.
3) 引入绿熟期单时相SAR数据,由于该时期内油菜冠层角果含水量增加,油菜作物雷达散射特征加强,油菜制图精度由46.07%提高到66.29%,F1调和值上升到0.72,总体精度提高到60.40%,Kappa系数也有所提升,说明适宜物候期的单时相SAR数据特征的引入可以提高地块破碎地区农作物识别精度.
4) 在一定程度上,多时相极化SAR数据VV+VH特征组合可以替代光学影像用于丘陵山地地块破碎地区油菜种植分布信息的提取.光学影像PCA特征与多时相SAR散射特征组合下,油菜制图精度、用户精度均有所提高,总体精度提高了10%左右,Kappa系数提高0.16,结合光学数据与多时相SAR影像能有效提高丘陵山地复杂地区的作物识别精度.
综上所述,在西南多云雾地区,当获取作物关键物候期内多时相光学影像困难时,以时间序列SAR数据为主导,光学影像为补充的方法在西南丘陵山地地区作物种植信息提取是一种较为可靠的方法.今后研究中,选用更高空间分辨率的光学影像及空间尺度匹配的SAR等数据进行协同分析,以改善丘陵山区农作物种植信息提取结果,是进一步研究的重点.