基于决策树模型分类多时相早稻信息提取研究

2019-07-16 07:36吕红梅李栩滨
福建地质 2019年2期
关键词:早稻波段纹理

吕红梅 李栩滨

(福建省地质测绘院,福州,350011;福州大学紫金矿业学院,福州,350108)

农业是一个国家的基本产业。在农业生产方面,国家宏观调控需要对耕地(尤其水田)的分布信息准确把握。应用遥感信息分类技术为水田分布信息的获取提供了方法依据,然而如何准确地利用遥感数据来提取水田分布信息是为国家宏观调控服务的关键。20世纪90年代,前人利用不同遥感数据提取方法进行大量研究,积累的资料相当丰富[1-5]。在前人水稻信息的提取研究中,大多数研究人员只利用较单一的分类方法,如使用最大似然法、纹理、各指数或特征库,且所使用的数据源大多为米级分辨率,甚至是百米级的低分辨率数据源,但是已经不能够满足当今农业经济的发展了,特别是现代的精细农业。

此研究以多时相不同分辨率遥感影像为数据源,直接利用归一化植被指数(NDVI)计算,配合纹理分析,逐步剔除非耕地的信息,得到耕地的初步分类结果;再结合多时相的地表水分指数(LSWI)与归一化植被指数综合判析,进一步筛分出早稻和其他作物,最终得到该研究区的早稻图斑分布信息。结合野外验证及谷歌资料比对,证实该方法提取早稻信息的可靠性、准确性,也为后期水稻产量的预估提供科学决策依据。

1 研究区和数据

1.1 研究区概况

研究区位于福建龙岩长汀南山镇下辖村,区域以丘陵为主,东、西、北三面高,中南为山间盆地,地势低。该区属于中亚热带季风气候,年平均气温为18.4℃,年平均降水量为1 711 mm[6],其行政区面积约为18.85 km2。该村主要地类以林地、耕地、建设用地、水域、园地为主,草地零星分布。该村种植结构相对较单一,农作物种植以水稻、槟榔芋为主,水稻分早稻和晚稻,烤烟与早稻轮种。大多数农作物均分布于地势低洼处及部分的丘陵地带。早稻播种或蓄水期的时间段为3月份、4月份,生长返青期为5月份,收获期为7月份;槟榔芋播种和返青期与早稻类似,收获期在8月份,相对早稻时间较晚;烤烟则是在1月份播种,4月份处于生长返青期,6月份、7月份为收获期。

1.2 数据源

根据研究区早稻种植时间的特点可知,4~7月为早稻种植的关键物候期,其中4月份为蓄水期,5月份为返青期,返青期间水分光谱特征仍然发挥着较大的作用。Landsat8 OLI的短波红外波段与近红外波段组成的地表水分指数,对该特征具有很好的指示作用。高分辨率影像纹理清晰,地类识别度高,但面积小;中低分辨率影像虽然识别度较低,但面积大。综合考虑各类影像特征及性价比,搜集了4~5月Landsat8 OLI、6~7月GF1WFV影像作为指数数据源,高分辨率影像作为纹理分析和图斑界线圈定的数据源(表1)。

表1 研究区遥感影像数据源

2 基于决策树模型的分类

决策树模型法是一种典型的分类方法,首先对样本区数据进行处理,利用归纳算法生成可读的规则和决策树,然后使用决策树对新区数据进行分析预测。决策树模型是基于决策点和策略点等构成的树形图,主要用于序列决策或多级决策。它的本质是一颗由多个判断节点组成的树。在使用模型进行预测时,根据输入参数依次在各个判断节点进行判断游走,最后到叶子节点即为预测结果[7]。南山村多时相早稻信息提取的决策树模型分类步骤(图1)。

图1 南山村多时相早稻信息提取的决策树模型图Fig.1 Decision tree model diagram for information extraction of multi-temporal early rice in Nanshan village

2.1 归一化植被指数的计算

在植被遥感影像识别中,归一化植被指数是植被生长状态及植被覆盖度的最佳指示因子。对于陆地表面而言,云、水、雪在可见光波段比在近红外波段有较高的反射作用,其NDVI为负值;岩石、裸土在两波段有相似的反射作用,其NDVI值近于0;若有植被覆盖的情况下,NDVI为正值,且随植被覆盖度的增大而增大。NDVI计算公式如下:

NDVI=(ρnir-ρr)/(ρnir+ ρr)

式中:ρnir为近红外波段的反射率值;ρr为红光波段的反射率值。

通过计算研究区6月份的GF1卫星影像中多光谱数据的近红外波段和红光波段,得出其NDVI值。该研究将NDVI结果进行重分类二值化,分为NDVI≤0(如建筑用地、水域、坑塘水面等)及NDVI>0(如林地、草地、园地和耕地等),并将NDVI大于零值的栅格单元作为早稻提取的初步基础栅格数据。

2.2 影像纹理分析

纹理是物体结构的反映,分析纹理可以甄别影像中物体的重要信息。影像纹理分析是指通过一定的影像处理技术提取出一系列的纹理特征参数,从而获得定量或定性描述纹理的处理过程。从总体上来讲,影像纹理分析可以分为统计方法、结构方法和谱方法3大类[8-10]。其中统计分析方法是基于影像相关属性的统计分析出发,该研究采用基于方差(Variance)的统计方法对研究区进行影像纹理分析,其中方差计算公式如下:

式中:u为矩阵均值,反映影像的不均匀特性。当值较大时,则说明影像中的灰度变化较大。

2月份GF2卫星影像有相对较高的分辨率,为0.8 m,笔者以GF2卫星影像基于3×3窗口的方差纹理分析计算,不同地物纹理结果具备各自的特征(照片1)。林地纹理较粗糙,耕地质地最均匀,边界明显;草地质地仅次于耕地,但没有明显边界;园地纹理居中。该研究区域经过NDVI值的计算之后,有植被覆盖的地类,即林地、草地、园地和耕地。通过对纹理的异质均匀度分析,将研究区的异质度分为4个级别,耕地、园地、林地、草地分别赋值为1,2,3,4,并将赋值为1的值单独提取出来,可以利用纹理分析的结果对NDVI值的初步成果进一步剔除出林地、草地和园地的伪信息,得出该研究区的耕地信息。

照片1 2月份GF2影像各地类的纹理特征Photo.1 Texture Features of local classes in February GF2 Imagesa—耕地的影像纹理特征;b—园地的影像纹理特征;c—林地的影像纹理特征;d—草地的影像纹理特征

2.3 特征指数分析

各种作物的生长都有各自的规律,如播种、出苗、生长最旺盛、成熟和收获等,同一种作物在同一地区具有相对稳定的生长周期规律。不同作物的物候期不同,导致反映作物生长植被的各指数时间曲线形态不同,并按一定规律变化。

2.3.1 地表水分指数曲线分析

水稻生长的动态变化一般包括灌水期、秧苗移栽期、生长返青期、成熟收割期[11]。在水稻的多数生长期内,其反射光谱是陆地表面水体和水稻秧苗及其他地物的混合光谱。而水稻的灌水与秧苗移栽期水分含量较大,是区别于其他农作物的一大特征,因此研究构建对水体较为敏感的地表水分指数。LSWI依据原理是植被在近红外波段吸收率较低,而在短波红外波段的吸收率较高,即水分在短波红外波段的强吸收特征。LSWI 指数包含对土壤湿度和植被水分敏感的短波红外波段反射率,可以用于土壤湿度变化的监测[12]。湿度越大,LSWI值越高。LSWI 指数计算公式如下:

LSWI =(ρnir- ρswir)/(ρnir+ρswir)

式中:ρnir为近红外波段的反射率值,ρswir为短波红外波段的反射率值。

研究利用Landsat8 OLI的近红外波段和短波红外波段对该区域含水量较大,且较能体现在影像光谱特征上的4月份、5月份进行LSWI的计算,并为了扩大各区间值的对比,将该比值再乘以1 000,最后对早稻和其他作物样本的LSWI曲线进行分析及比对(图2)。显示了早稻和其他作物样本在4月份和5月份的LSWI曲线值存在较大的差别。通过多次试验,将4月份和5月份的阈值分别设置为-285

图2 Landsat8 OLI影像不同时相早稻和其他作物样本的LSWI曲线Fig.2 LSWI Curves of early Rice and other crop samples in different phases of Landsat8 OLI image

2.3.2 归一化植被指数曲线分析

4~5月间部分作物因为灌溉或者降雨等原因,影像上显示出的LSWI指数相对较高,基于LSWI指数提取的早稻可能含有部分其他作物的信息。考虑到不同植被在各季节表现出的生长特征不同,其植被指数时间序列差异较大,利用植被指数时间序列进行植被信息提取,能够区分同一时段内无法区分的植被,减少因为季节变化而造成的误分现象[13]。

早稻和其他作物生长期的差异主要体现在早稻6月份最茂盛时期,而7月份、8月份处于收获期,植被指数也随之降低,而其他作物则是上升的趋势。为了更好地研究作物在不同季节种植的变化,该研究分别选取了早稻和其他作物的5个样本,同LSWI处理类似,将该比值乘以1 000以扩大对比,分别得出5期早稻和其他作物的NDVI分析曲线(图3、图4)。早稻在4月份的NDVI值最低,随着早稻的返青,5月份之后逐渐升高,至6月份中旬达到最高值,之后便呈下降的趋势。虽然7月份为早稻的收获期,但其NDVI值并未达到最低,除了一些收获期会推迟因素,16 m的混合光谱像元也是主要的原因之一。各时期早稻和其他作物的NDVI曲线特征存在很大区别,特别是6月中旬至7月份早稻区NDVI曲线特征呈下降趋势,而其他作物区则呈继续上升的特点。因此可以对6月份、7月份NDVI做差值运算,若NDVI(6月)- NDVI(7月)>0,则识别为早稻的分布区域。

图3 不同时相早稻样本的NDVI曲线Fig.3 NDVI Curve of early rice samples at different time phases

图4 不同时相其他作物样本的NDVI曲线Fig.4 NDVI Curve of other crop samples at different time phases

综合上述的LSWI 指数的初步分类结果,结合该NDVI曲线变化特征,最终叠加综合分析出种植早稻的图斑空间分布与面积统计。

3 结果和分析

通过NDVI值的计算,得到具备植被覆盖的地类信息;结合影像纹理分析,进一步剔除林地、草地和园地,得到该研究区的耕地信息;再比较不同时相耕地的LSWI曲线和NDVI曲线,进一步区分出早稻和其他作物,最后再结合0.8 m高分辨率的GF2卫星影像进行图斑边界的圈定,得出该研究区的早稻图斑分布信息。结合GPS野外验证和谷歌地球高清数据目视判断相结合,研究区通过专业软件随机生成200个验证点(图5),对所分的早稻和其他作物结果进行精度评价。评价结果显示早稻的用户精度达到87.50%,生产者精度为85.71%,总体精度达到了93.50%,Kappa系数为0.823。Kappa系数具极好的一致性,进一步证实该方法提取早稻信息的可靠性、准确性。通过统计计算得出该村的早稻种植面积约为45 120 m2。该村的早稻主要集中分布在建筑区相对较密集,且地势低洼处(图6),其余的均零星分布;丘陵地区则主要以其他作物为主。

图5 2018年南山村地类野外验证点 Fig.5 Field verification sites of land species in Nanshan Village, 2018

图6 2018年南山村早稻其他作物分布图Fig.6 Distribution map of early rice and other crops in Nanshan Village, 2018

表2 早稻和其他作物图斑识别精度统计

4 结论

(1)通过研究水稻在各个生长期的特点,基于多时相遥感影像信息进行决策树模型分类法的分析,逐步剔除出其他作物,最终得到了南山村的早稻空间分布信息,种植面积约为45 120 m2。

(2)该研究区处于早期生长阶段早稻的LSWI曲线值不论在4月份还是5月份,其地表水分指数值都比其他作物的要高;而NDVI曲线则展示了早稻和其他作物在4月份左右值最低,在7月份二者有明显差异,且是区分二者类别的主要特征之一。

(3)结合相关资料验证,早稻的用户精度达到了87.50%,生产者精度为85.71%,总体精度达到了93.50%,Kappa系数为0.823。Kappa系数值显示出极好的一致性,进一步证实该方法提取早稻信息的可靠性、准确性。

(4)该研究采用分类算法为早稻遥感测量提供有效技术方法。该方法对基于时间序列分析有较好的效率,但其对样本量的需求量较大,该研究区仅是一个村尺度,早稻信息的相对较少即为该研究的局限性所在。

(5)由于获取的遥感影像时相受限,只获得了5个时相的遥感影像,可以反映出早稻的基本长势,能较好的区分早稻和其他作物的区别,但是其他作物间又有各自的生长特征,今后可以在获取遥感影像数据源时,尽量考虑时序的完整性及较高的分辨率,不仅能更好地展现早稻生长周期的完整性,也能更大限度地分析各自作物间的光谱特征,及区分出容易混淆的作物,如该研究区的烤烟和槟榔芋。从而为农业规划、政府管理等相关部门,对耕地种植的规划或是种植水稻面积的准确预估提供科学决策依据。

本文承蒙高建阳教授级高级工程师、张书煌教授级高级工程师悉心指导、审阅,并提出宝贵修改意见,在此表示衷心感谢。

猜你喜欢
早稻波段纹理
早稻迎丰收
2021年全国早稻总产量2802万吨增长2.7%
2021年全国早稻总产量2802万吨 比2020年增产72.3万吨
宋代早稻若干问题探讨
基于BM3D的复杂纹理区域图像去噪
使用纹理叠加添加艺术画特效
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
TEXTURE ON TEXTURE质地上的纹理
M87的多波段辐射过程及其能谱拟合