赵希妮,璩向宁,王 磊,3,刘雅清,许 兴
(1.宁夏大学 西北土地退化与生态系统恢复省部共建国家重点实验室培育基地,宁夏 银川 750021;2.宁夏大学 西北退化生态系统恢复与重建教育部重点实验室,宁夏 银川 750021;3.南京大学 国际地球系统科学研究所,江苏 南京 210093)
中国是葡萄、葡萄酒生产和消费大国[1]。宁夏贺兰山东麓作为我国3大葡萄酒地理标志产品区域之一,近年来种植面积迅速扩大,如何快速获取葡萄的空间分布及其生长状态,为葡萄种植的精细化管理、产业的可持续发展及其生态效应评价提供技术支撑,是当前亟需解决的问题。遥感作为重要的对地观测手段,因其具有探测范围大,速度快、受地面条件限制少、成本低等优点,可作为开展葡萄种植时空分布调查的重要手段[2-3]。高空间、高时间分辨率遥感数据的出现,遥感时间序列如NDVI(Normalized difference vegetation index,归一化植被指数)、EVI(Enhanced vegetation index,增强型植被指数)的相关研究成为当前遥感对地观测技术发展的热点内容和重要方向[4]。REED等[5]通过分析农作物NDVI时间序列的特征值并结合其物候规律,得出NDVI在构建植被生长动态时间序列剖面、提取物候特征、进行植被分类、监测土地覆盖变化等方面具有重要价值;MURAKAMI等[6]基于 SPOT/HRV影像,以日本SAGA平原为研究区,分析了其NDVI时间序列变化特征并选取最佳时相,提取出了多种农作物面积;BROWN等[7]通过对MODIS植被指数时间序列数据的构建分析,对巴西Mato Grosso地区多年的农用地进行了分类研究,取得了较好的分类结果。国内应用遥感时间序列的研究也较多,ZHANG等[8]以HANTS滤波法重构了MODIS/EVI时间序列数据,研究了华北地区土地覆盖分类;康峻等[9]基于MODIS/EVI数据分析提取植被物候特征参数,得到了作物和森林较好的分类结果。
在时间序列植被识别方面,以往研究主要针对MODIS、SPOT、HJ等中低分辨率影像,制约了识别精度的提高。GF-1卫星的发射,为高空间分辨率时间序列的构建提供了数据支持。索玉霞等[10]基于决策树分类法和MODIS植被指数时间序列对中亚土地覆盖类型分类进行了研究;张赫林等[11]基于祁连山区域时间序列数据,结合光谱扩展与基于决策树分类方法,研究了近30 a的土地利用变化情况;梁守真等[12]基于MODIS/NDVI时间序列数据和多时相的Landsat TM数据,通过分析橡胶林的季相和光谱特征得到了橡胶林识别的关键时期和特征参数,构建了橡胶林决策树分类模型。关于遥感识别与提取在农作物方面的应用已进行了大量相关研究,但在森林遥感提取,尤其是果树识别与提取方面的研究相对较少,对葡萄分布遥感的提取更是鲜见报道。鉴于此,以宁夏贺兰山东麓葡萄种植区域为研究区,利用具有较高时间、空间分辨率等优点的GF-1/WFV数据,获取了覆盖研究区葡萄完整生长期(2017年3—12月)的影像,构建GF-1/WFV时间序列,并对波段光谱特征进行挖掘,计算提取NDVI、EVI,通过分析植被指数在时间序列上所发生的明显变化,提取相应的关键时间节点及特征值,构建宁夏贺兰山东麓葡萄的决策树分类模型,实现研究区内葡萄的快速自动识别与提取。
贺兰山东麓位于东经105°45′—106°47′,北纬37°43′—39°23′,地处宁夏回族自治区境内,为贺兰山洪积扇与黄河冲积平原之间的狭长地带,涵盖了石嘴山市、银川市、吴忠市。该区属于大陆性干旱半干旱气候,干燥少雨,光照充足,昼夜温差大。全生育期积温(≥10 ℃)3 400~3 800 ℃ · d,气温日较差12~15 ℃,降水量150~240 mm,日照时数1 700~2 000 h,无霜期160~180 d,土壤类型以淡灰钙土、风沙土为主。独特的气候、土壤条件使其成为世界公认的优质酿酒葡萄最佳生态区之一,是世界葡萄种植的黄金地带和优质葡萄产区。
2013年4月26日发射运行的高分一号卫星中国高分辨率对地观测系统的第1颗卫星搭载4台WFV多光谱宽幅相机,组合扫描幅宽为800 km,星下点的分辨率为16 m,WFV传感器共设置4个波段,光谱为0.45~0.89 μm,重访周期为2 d。
本研究所用数据包括研究区GF-1/WFV遥感数据(表1)、贺兰山东麓矢量边界数据、外业调查数据及利用手持GPS(Global positioning system)对典型地物类型(以下简称地类)进行外业定点调查的数据(图1)。
表1 影像时间序列数据与葡萄所处时期Tab.1 Image time series data and grape period
图1 贺兰山东麓位置及样本点分布Fig.1 Schematic diagram of the location and distribution of sample points at the eastern foot of Helan mountain
影像预处理主要包括辐射定标、大气校正和几何精校正,最后根据矢量数据裁剪研究区影像数据。在ENVI5.3软件平台中,借助其波段计算功能计算NDVI、EVI,公式如下:
NDVI=(PNIR-PR)/(PNIR+PR)
(1)
EVI=(PNIR-PR)/(PNIR+6PR-7.5PB+1)×2.5
(2)
式中,PNIR表示近红外光波段反射率;PR表示红波段反射率;PB表示蓝光波段反射率。本研究采用的GF-1数据为遥感影像,因此,近红外光波段为Band4,红光波段为Band3,蓝光波段为Band1。
贺兰山东麓区域冬季气候寒冷,葡萄12月进入休眠期,为预防葡萄藤风干和受冻对其进行埋土防寒[13],翌年春季4月中旬左右将其挖出。
葡萄于5月初开始萌芽抽枝;5月21日左右进入花期;6月中旬进入坐果期;7—8月葡萄枝蔓和果实进入生长旺盛期;8月中旬打秋梢(减少养分流失);9月葡萄果实成熟;10月之后枝蔓开始泛黄;10月21日—11月20日(采摘完成后)清除叶子,只留主茎并将其埋土防寒(葡萄处于掩埋期);随后,葡萄进入休眠期;之后,再进入长达6个月的生长季。
为获取宁夏贺兰山东麓主要地类的分布,2017年7月对贺兰山东麓进行地面实地调查(图 1),使用手持 GPS测量不同地类地块的经纬度坐标。根据本研究实际地面调查,研究区主要地类包括葡萄、防护林、水稻、玉米、小麦、芦苇;非植被包括裸地、建筑用地、水体。依照上述分类,根据实地调查点数据选取样本点,构建训练样本集。分析不同植被的时间序列曲线和物候特征,对因与葡萄生长规律相似而无法区分的植被类型开展目视解译,采用决策树结合法对葡萄进行提取。
1.4.1 训练样本选取 根据随机性、典型性以及区域样点的完备性原则选取样点。野外GPS及目视解译所取得的样本数据共生成1 633个样本点,其中,葡萄566个,防护林106个,水稻415个,玉米152个,小麦116个,芦苇85个,裸地105个,建筑物88个。从总样本中随机抽取2%的样本作为训练样本集,剩下的点作为验证样本集。所选样本均匀分布在研究区内,因此,这些样本可以代表其地类的区域特点。
1.4.2 分类模型构建 NDVI是监测植被生长状态及覆盖度的最佳指示指标,且能很好地将植被从背景中分离出来[14-16]。由于葡萄种植行距较宽,与防护林较为相似,而EVI能够矫正土壤背景和气溶胶散射的影响,且对植被茂密区较为敏感[17],因此,对葡萄识别提取具有较大优势。鉴于此,在识别与提取过程中,运用了基于GF-1影像运算得到的NDVI数据作为植被覆盖地类信息提取的重要特征变量,结合葡萄和防护林的生长旺盛期EVI曲线,以减小地物同物异谱和同谱异物的影响,通过统计其平均值信息,试图找出不同地类分类之间的差异,从而实现目标地类提取。
采用基于决策树分类方法,分析不同植被的时间序列曲线和植被的物候特征;采用阈值法的决策树规则,在ENVI 5.3平台中,构建基于GF-1/WFV影像典型地物上述2种植被指数的决策树模型,实现对葡萄的识别,得到2017年宁夏贺兰山东麓葡萄的空间分布图。
植被的生理特征在不同生长季节、生育时期表现均不同,植被的旺衰信息可以通过植被指数体现出来。作物生长变化过程影响其植被指数的增长或降低[18],同一植被类型在不同生长期及不同植被类型在同一生长期的差异均可以用其植被指数时间序列曲线表现[19-20]。因此,本研究利用训练样本集获取NDVI和EVI 2种植被指数,求取不同地类在不同时间的均值,得到各个地类植被指数时间序列均值变化曲线(图2—3)。
图2 典型地物的NDVI时间序列曲线Fig.2 NDVI time series curve of typical ground objects
图3 葡萄和防护林的EVI时间序列曲线Fig.3 EVI time series curve of grape and shelterbelt
从图2可以看出,NDVI时间序列的植被指数总体上符合物候规律,植被生长期大致从5月初开始,11月后结束。葡萄、水稻、玉米、小麦的NDVI时间序列曲线有部分交错,但还是存在NDVI差异明显的时间窗口。其中,水稻的NDVI曲线为单峰,5月中旬—6月中旬其NDVI呈明显增长趋势;6月中旬—7月NDVI不断升高,此阶段为水稻的生长旺盛期,其NDVI高于其他植被,利用该特征可以将水稻从其他作物中区分出来。
9月水稻逐渐成熟,一般于10月上旬收割,之后其NDVI降到最低,水稻NDVI的最高值与最低值相差0.738。玉米NDVI曲线具有与水稻相似的变化特征,但在3—6月中旬其NDVI较水稻略高。7月初—9月为玉米生长旺盛期,其NDVI较水稻偏低,但此阶段内其NDVI明显高于小麦,利用此特点可以将玉米从小麦等植被中区分出来。
5月初葡萄开始萌芽抽枝,5月中下旬进入花期后生长迅速,其NDVI随之快速上升。6月10日左右进入坐果期,在此阶段为消除由于葡萄藤生长过快而对坐果造成的影响,将葡萄春梢去除,抑制藤蔓生长。在此期间,其NDVI上升缓慢。7月葡萄枝蔓和果实进入生长旺期,7月底其NDVI达到最大。8月上旬果农为减少养分流失,对葡萄进行了大规模的打秋梢活动,葡萄覆盖度明显下降,其NDVI呈下降趋势。8月下旬—10月葡萄果实成熟,葡萄枝蔓覆盖度稳定,其NDVI变化不大。10月中旬—11月中旬,葡萄采摘完成后,果农将葡萄枝叶清除,只留主茎并作掩埋处理,葡萄在此阶段的NDVI均在0.1左右,且时间序列曲线十分平缓,因此,葡萄掩埋期可以作为将葡萄从防护林中区分出来的一个重要时间窗口。葡萄的生长曲线与防护林较为相似,单纯利用NDVI很难将二者区分开,因此,引入EVI对二者进行区分(图3)。从图3可以看出,7—8月中旬葡萄、防护林的EVI曲线均呈快速增长趋势,8月中旬二者的EVI均达到最大,此后呈现缓慢下降趋势。葡萄、防护林的EVI曲线在8月初相交,8月前期,葡萄较防护林的EVI大,8月中旬葡萄受打秋稍影响,后期其EVI随覆盖度降低而降低,防护林的EVI则依旧处于较高水平。因此,8月中旬可作为区分葡萄和防护林的重要时间窗口。
NDVI时间序列数据对各作物区分的效果较好,但芦苇和葡萄生长规律相似,二者的NDVI与其他作物相差不大。受不同区域水质、地下水位以及灌溉水量的影响,芦苇长势不等,导致其同期的NDVI域较宽,极易混淆于葡萄中[芦苇与葡萄的J-M(Jeffries-Matusita)距离< 1.8)]。因此,根据芦苇生长习性及图斑形状的不规则性,通过目视解译判断研究区内的芦苇分布,去除芦苇对葡萄提取的干扰。 此外,种植年限长、覆盖度高的葡萄和防护林在NDVI时间序列中的区分度不明显,因此,结合葡萄和防护林生长旺盛期的EVI曲线建立决策树判别模型,进行主要植被类型的提取(图4)。
NDVI时序数据中,7月各植被生长最旺盛,可利用7月30日的影像区分植被和非植被。经过反复试验,最终设定NDVI0730<0.2为阈值提取非植被类型,其他为植被类型。
水稻4月28日—5月26日在各类植被中的NDVI最低,7月6—30日在各类作物中的NDVI最高。根据水稻样点数据的统计值,经过反复试验,最终设定NDVI0706<0.7为阈值提取水稻。
玉米7月6日—8月16日的NDVI较大,此后其NDVI迅速下降。根据玉米样点数据统计的特征值,经过反复试验,最终设定NDVI0706+NDVI0816>1.18为阈值提取玉米。
小麦4—7月中旬的NDVI均高于葡萄,同时,6月16日—8月16日,其时间序列曲线出现2个峰值。小麦收割后,7月30日出现NDVI低谷。根据小麦样点数据在这几个时期的统计值,经过反复试验,最终设定NDVI0616+NDVI0816>0.8、NDVI0730<0.5、NDVI0526>0.3为阈值提取小麦。
防护林的NDVI相比葡萄较高,但与葡萄的NDVI时间序列曲线较为相似,结合其生长旺盛期的EVI曲线,经过反复试验,最终设定NDVI0428<0.28、NDVI0706<0.18、EVI0816<1.5为阈值提取防护林。
葡萄掩埋期的NDVI在0.1左右,较其他植被低。8月上旬葡萄打秋梢后其NDVI下降,8月16日达到最低,此特点在EVI时间序列中表现明显,因此,可结合NDVI和EVI时间序列曲线将葡萄提取出来。根据葡萄样点数据在这几个时期的统计值,经过反复试验,最终设定NDVI0326<0.16、NDVI0428<0.16、NDVI0526<0.25、0.15
采用上述方法对宁夏贺兰山东麓葡萄种植区进行葡萄提取,获得的分类结果如图5所示。因本研究主要对葡萄进行提取,在进行精度验证时,将防护林、水稻、玉米、小麦等植被归为其他植被。因此验证样本集按照葡萄、其他植被、非植被类型进行验证。将分类后的结果与地面验证样本计算混淆矩阵。基于野外采样数据及实际调查,随机选择1 299个验证点,建立混淆矩阵,选取生产精度、用户精度、Kappa系数和总体精度4个指标对分类结果进行验证,分类精度评价见表2。
图4 基于GF-1/WFV时间序列遥感识别的主要植被类型提取流程Fig.4 Flowchart of extraction process of main vegetation types based on GF-1/WFV time series sensing recognition
图5 基于GF-1/WFV时间序列遥感识别的葡萄提取结果Fig.5 Grape forest extraction result based on GF-1/WFVtime series remote sensing recognition
如表2所示,在所有验证样本点中,被正确分类的样本点有1 235个,分类总体精度为95%,Kappa系数为0.91。葡萄提取的生产精度为93%,用户精度为96%。葡萄验证样本点共470个,被正确分类的样本点有436个。但是由于葡萄与非植被类型中的裸地在3—5月具有相似的光谱特征,且其他植被中光谱特征与防护林的也较为相似,因此,葡萄与裸地和其他植被容易出现错分的现象。其他植被验证样本点共706个,被正确分类的样本点为682个。由于其他植被中包括水稻、玉米、小麦、防护林,总体训练样本较充分,且在时间序列曲线中区分窗口较明显,因此,整体分类精度较高。非植被类型验证样本点共123个,被正确分类的样本点为117个。在非植被类型中,由于将裸地、建筑用地和水体等都归入其中,光谱差异较大,影响时间序列曲线的构建和比较,分类精度相对较低,由此,非植被类型样本点中错分为其他植被的样本点也较多,其他植被和葡萄错分到非植被类型中的样本点也较多。
表2 基于GF-1/WFV时间序列遥感识别的混淆矩阵Tab.2 Confusion matrix based on GF-1/WFV time series remote sensing recognition
本研究试图建立快速、简单、操作性强的葡萄提取方法,主要基于遥感影像的光谱特征等来构建决策树分类模型,通过将葡萄不同物候期表现的光谱差异与其他植被类型进行比较提取葡萄,获得较高的分类精度。由基于GF-1/WFV遥感数据构建的NDVI时间序列葡萄识别模型可知,宁夏贺兰山东麓葡萄主要集中在贺兰山洪积扇区域,呈条带状分布。其中,贺兰山沿山产区、永宁产区、青铜峡产区集中成片,分布最典型,主要植被类型的植被指数时间序列的构建基本满足在宁夏贺兰山东麓进行植被次级分类提取植被类型的需求。其中,NDVI时间序列曲线能够较好地区分作物和防护林,而EVI结合NDVI对葡萄和防护林的区分效果更好。与传统的计算机辅助分类相比,基于时间序列的数据,结合葡萄物候期,探索出了提取葡萄的窗口期。葡萄在3—5月处于掩埋期时其NDVI明显低于玉米和小麦,可有效将葡萄从作物中区分出来,但葡萄覆盖度相对较低,与裸地容易发生混淆。8月葡萄受打秋稍影响,其后期EVI变化不大,且防护林的EVI高于葡萄,可作为区分葡萄和防护林的窗口期。
葡萄与其他植被的生长季较为相近,使用单一时相的遥感影像对葡萄进行提取易发生混淆,从而影响提取精度。基于选择NDVI 时间序列曲线特征并结合葡萄生长物候期、种植规律的分类识别方法,是根据葡萄NDVI时间序列遥感数据完整地反映葡萄的生长趋势的特点,通过反复试验寻找特殊节点,并运用决策树模型对其识别,具有需参数少、自动化程度高、适用性强、精度高的优点。因此,具有较高时间和空间分辨率优势的GF-1/WFV遥感数据能够较好地重建葡萄生长季 NDVI 曲线,反映其变化特征,利用时序植被指数进行分类,可以有效减小异物同谱现象的干扰。各地类交界处像元具有相似光谱特征,且空间相邻,易形成混合像元,导致区分困难。不同植被类型也有可能形成相同的植被指数时间序列曲线,因此,有必要结合纹理特征及形态特征等提高图像的分类精度。