汪 松,王 斌,刘长征,王思远
(1. 北京交通大学,北京 100044; 2. 石河子大学,新疆 石河子 832003; 3. 中国科学院遥感与数字地球研究所,北京 100094)
利用Landsat时序NDVI数据进行新疆石河子垦区灌溉作物分类
汪 松1,王 斌1,刘长征2,王思远3
(1. 北京交通大学,北京 100044; 2. 石河子大学,新疆 石河子 832003; 3. 中国科学院遥感与数字地球研究所,北京 100094)
精确的农作物分类信息对于农业环境评估、水资源利用规划非常重要,尤其是在干旱、半干旱地区。本文利用30 m分辨率的Landsat NDVI时间序列数据进行了新疆石河子垦区混合农作物精确区分的潜力研究。首先利用S-G滤波重构了Landsat NDVI时间序列,然后基于SVM模型对研究区域农业类型进行了精确分类。在SVM分类模型作用下,S-G重构后的时间序列有效地将该地区棉花、玉米、小麦等主要作物区分开来,精度高于0.86,Kappa系数大于0.82。结果表明,S-G滤波能够有效提高NDVI时间序列数据质量;TM影像时间序列在监测干旱、半干旱地区的作物类型和种植方式随时间的变化方面存在巨大潜力。
NDVI;S-G滤波;时间序列;SVM
随着精准农业的发展,农业的用水评估、环境评估、农业估产都需要精确的农作物信息,特别是在干旱、半干旱地区,精确的农业分类信息在水资源保护合理利用等方面具有非常重大的意义。利用遥感手段来获得农业的精确分类信息是一种快速有效的方法。
利用归一化植被指数(NDVI)时间序列作大面积的农业作物种类区分已经有了广泛的研究,早期对于区域尺度的大面积作物植被区分研究主要是通过1 km左右分辨率的NOAA-AVHRR和SPOT VGT两种数据源[1-3]。MODIS数据出现后,由于它的高时序性和空间分辨的适度性,在区域层次中,MODIS NDVI时间序列在世界范围内被广泛用来分类灌溉作物区域[4],也有将MODIS NDVI数据和一些中分辨率数据如Landsat、AWIFS结合起来描述作物的类别[5]。虽然MODIS和Landsat数据都是免费的,但是MODIS数据的空间分辨率为250~500 m,经常会出现混合像元问题。而Landsat数据30 m的分辨率会让混合区域的作物类型区分得更加细致和精确,尤其是那些热带、亚热带中较小的农作物生产区域[6]。
尽管Landsat数据经常受到气候、天气等因素的影响,在世界大部分地区难以获得大量无云覆盖的高质量数据,限制了Landsat时间序列的应用,但是在一些干旱、半干旱地区,受气候的影响,这些地方的数据质量还是相当可观的。基于此,本文以新疆石河子垦区为研究区域,利用S-G滤波后的Landsat NDVI数据结合SVM分类方法进行灌溉作物的精确分类识别研究,并对Landsat NDVI时间序列分类结果进行评价。
本文研究区域为新疆石河子垦区,石河子垦区地处天山北麓中段,古尔班通古特大沙漠南缘,地理坐标位于84°58′E—86°24′E,43°26′N—45°20′N。该地区属于典型的温带大陆性气候,冬季长而严寒,夏季短而炎热。
垦区农业主要依靠灌溉用水,灌溉农业用水占玛纳斯河流域总用水量的95%以上[7-8]。由于温暖的气候条件及肥沃的土地条件影响,该地区种植了各种各样的农作物,主要有棉花、小麦、玉米等。这些作物中,棉花和玉米位于高密度灌溉用水区域,收获时间大概为7—9月;小麦有春小麦和冬小麦,分别于7—8月和6月之前收获。棉花是夏季作物,种植时间稍微会晚点。该地区也种植一些大豆、西红柿及其他各种蔬菜,蔬菜种植区域一般除了冰雪覆盖时间,常年都会处于种植生长收获期。作物的一般种植和收获时期如图1所示。
图1 主要作物种植收获时期
(1) Landsat NDVI
NDVI是遥感监测中反映植被在可见光、近红外波段与土壤背景之间光学差异的指标,是对地表植被活动的简单、有效和经验的度量[9]。计算公式为
(1)
式中,Rnir为近红外波段反射率;Rr为红波段反射率。笔者从美国地质勘探局(USGS)数据中心下载了研究区域2013年12景Landsat8 TM影像(path 144,row 29)来构建NDVI时间序列。其中,1—3月与12月份数据云量覆盖较大,但由于石河子垦区这段时间都处于冰雪覆盖时期,地表真实NDVI的辐射率处于很低的水平,因此这些数据对于研究影响基本可以忽略不计。
(2) S-G滤波重构NDVI时间序列
NDVI反映植被生长过程的时间序列曲线通常是连续平滑的,但由于传感器本身性能、数据传输过程等不同因素的影响,得到的NDVI时间序列呈锯齿状的不规则波动,对陆地生态系统监测、植被覆盖变化分析和信息提取等产生诸多干扰[10]。因此,本文利用S-G滤波方法重构Landsat时序NDVI。Savitzky和Golay提出的S-G滤波器的设计思想是能够找到合适的滤波系数(Ci)以保护高阶距,即在对基础函数进行近似时,不是常数窗口,而是使用高阶多项式实现滑动窗内的最小二乘拟合。其基本原理是:通过取点xi附近固定个数的点拟合一个多项式,多项式在xi的值,就给出了它的光滑数值gi。基于S-G滤波原理,NDVI时间序列数据的S-G滤波过程公式为
(2)
研究表明,SVM分类方法在处理NDVI时间序列、高维模式识别中具有独特的优势[11]。SVM是一种基于统计学理论的模式识别方法,对于非线性问题,能把样本非线性映射到高维核空间,在高维核空间创建具有低维的最优分类超平面。在线性可分的情况下,通过求解一个约束条件下的极值问题,转化成它的对偶问题,就会得到简化的不等式约束极值问题,最终得到最优分类函数为
(3)
(4)
目前常用的核函数有:①线性核函数(Linear);②多项式核函数(Polynomial);③径向基核函数(Radial Basis Function);④S形核函数(Sigmoid)。
本文利用TIMESAT 3.2重构了Landsat NDVI时间序列,设置好NDVI有效值域、原始NDVI值权重、噪声去除阈值、滑动窗口大小、迭代次数等参数,利用S-G滤波重构的时间序列,结果如图2所示。
从整体来看,S-G滤波提高了NDVI水平,这种滤波结果比较符合植被覆盖地区的一般季节变化规律。如图2中棉花的NDVI变化曲线,未经过滤波的原始NDVI曲线在2月份棉花未种植时期就出现了较低的峰值,而在6月份生长期回落了,违背了棉花的生长变化规律;S-G滤波降低了2月份而提高了6月份的NDVI波谱值,使得NDVI时间曲线更加符合棉花的种植生长规律,有益于对棉花的精确识别。也有一些作物经过S-G滤波后也不能完全符合作物的变化规律,如冬小麦的NDVI时间曲线难以完整反映冬小麦的生长态势变化。一般冬小麦在冬季NDVI会呈现高亮度显示,但石河子地区受冬季冰雪覆盖的影响,冬小麦种植区NDVI值也会较低。虽然经过S-G滤波还是会存在一些误差,但是整体上改善了NDVI时间序列的质量,也有助于进行精确的作物识别。
图2 NDVI时间曲线
根据图2显示的不同作物的时间光谱特性的差异及统计的垦区作物种植数据,本文选取了108个像素作为训练样本。将这些样本点应用于支持向量机分类模型,分类的结果见表1。从分类结果来看,石河子垦区的主要农业灌溉作物为小麦、棉花、玉米3大类,其中棉花占的比例最大。除这3大主要产品外,也有一些甜菜、打瓜、西红柿等蔬菜的种植,但是占的比例十分有限。
表1 分类精度评价
本文搜集了Google地图中0.2 m分辨率的高分影像和石河子垦区的农业规划信息作为试验的检验数据。根据农场的规划信息和高分影像,以及从视觉上估计的各种作物每个时期的NDVI波谱特性检验分类方法的效果,一共有180个检验点(如图3所示)。
图3 作物分类图
在180个随机抽样的样本中,蔬菜种植地、冬小麦区域的分类精度都很高,这主要是因为其NDVI周期特征十分明显:蔬菜种植地区的NDVI值波动性大且常年处于活跃状态,一年中出现多次NDVI值波峰波谷;冬小麦种植区域整体的NDVI周期持续时间长,在植物繁茂的夏季出现间歇性的NDVI值低谷,而深秋季节在一般植被处于枯萎期时显示相对较高的NDVI值。其他的一些春种秋收的作物由于与正常植物的生长周期相似,提取的精度会稍微有所下降。有些非农业用地被错误分类到农业地区,这主要是因为非农业区域存在一些非农业的植被干扰,如路边的一些树木、杂草等。在检验数据中,春小麦、玉米、棉花都有像素被错误分到非农业用地中,这可能是由于这些植物生长势态遭到破坏或病态原因,也有可能是由于传感器的误差造成了它们和非农业用地的NDVI时间光谱特性相似。尽管存在一些并不理想的区分效果,但是该试验的整体精度可以满足农业部门的分析规划和当地机构对农业用水管理、合理安排的需求。
本文以新疆石河子垦区为试验区域进行了灌溉作物的精确识别分类研究,综合分析了不同灌溉作物的生长特征,以Landsat NDVI时间序列作为研究基本数据,经过S-G滤波重构时间序列,然后利用SVM分类方法处理时间序列,并对分类结果进行了精度评价。
试验结果表明:利用30 m分辨率的Landsat NDVI时间序列数据开展干旱、半干旱地区灌溉作物识别分类研究是可行的,分类结果有效反映了石河子垦区作物种植的宏观格局。S-G滤波方法重构NDVI时间序列在一定程度上改善了时间序列数据的精度,提高了NDVI时间序列区分于不同作物的能力。支持向量机分类方法在处理干旱、半干旱地区的Landsat NDVI时间序列上具有很强的适用性,可以用来挖掘干旱、半干旱地区Landsat时间序列的应用潜力。但是研究中作物的提取精度受到了遥感数据的时间和空间分辨率上的限制,更深一步的灌溉作物与水资源等农业环境关系的综合分析和评估并未完善,未来需围绕这些需求展开进一步的研究工作。
[1] 童庆禧,丁士心,郑兰芬,等.应用NOAA气象卫星图象资料估算草场生物量方法的初步研究[J].自然资源学报,1986(1):87-95.
[2] 肖乾广,周嗣松,陈维英,等.用气象卫星数据对冬小麦进行估产的试验[J].环境遥感,1986,1(4):160-269.
[3] STIBIG H J,MALINGREAU J P,王胜.用低空间分辨率的新近卫星图像对东南亚岛屿的森林覆被进行制图[J].AMBIO-人类环境杂志,2003,32(7):469-475.
[4] VINTROU E,DESBROSSE A,BEGUE A,et al. Crop Area Mapping in West Africa Using Landscape Stratification of MODIS Time Series and Comparison with Existing Global Land Products[J]. International Journal of Applied Earth Observation and Geoinformation,2012,14(1):83-93.
[5] THENKABAIL P S,WU Z. An Automated Cropland Classification Algorithm(ACCA) for Tajikistan by Combining Landsat, MODIS, and Secondary Data[J]. Remote Sense,2012,4(10):2890-2918.
[6] ZHENG B,MYINT S W,THENKABAIL P S,et al. A Support Vector Machine to Identify Irrigated Crop Types Using Time-series Landsat NDVI Data[J].International Journal of Applied Earth Observation and Geoinformation,2015,34(1):103-112.
[7] 范文波,李小娟,张凤华.石河子垦区农业水资源供需平衡分析[J].水土保持通报,2008,28(2):212-214.
[8] 郑旭荣,李明思,樊曙光.新疆干旱地区农业用水利用研究[J].中国农村水利水电,2002(2):38-41.
[9] 任志明,李永树,蔡国林.一种利用NDVI辅助提取植被信息的改进方法[J].测绘通报,2010(7):40-43.
[10] 宋春桥,柯灵红,游松财,等. 基于 TIMESAT的 3 种时序 NDVI 拟合方法比较研究——以藏北草地为例[J].遥感技术与应用,2011,26(2):147-154.
[11] 徐芳.航空影像中地物识别的 SVM 方法研究[J].测绘通报,2004(2):43-45.
ResearchonIdentificationofIrrigatedCropTypesinShiheziReclamationAreaUsingTime-seriesLandsatNDVI
WANG Song,WANG Bin ,LIU Changzheng,WANG Siyuan
NDVI=(Rnir-Rr)/(Rnir+Rr)
汪松,王斌,刘长征,等.利用Landsat时序NDVI数据进行新疆石河子垦区灌溉作物分类[J].测绘通报,2016(9):56-59.
10.13474/j.cnki.11-2246.2016.0292.
P237
B
0494-0911(2016)09-0056-04
2015-12-22
兵团科技攻关与成果转化计划(2015AD108)
汪 松(1990—),男,硕士生,主要研究方向为遥感理论与应用。E-mail:13121160@bjtu.edu.cn