陈越豪,何光熊,,李 婕,史亮涛,方海东,史正涛
(1. 云南师范大学 地理学部,云南 昆明650500;2. 云南师范大学 云南省高原地理过程与环境变化重点试验室,云南 昆明650500;3. 云南省农业科学院 热区生态农业研究所,云南 元谋651300;4. 元谋干热河谷植物园,云南 元谋651300)
目前,高原特色现代农业是云南八大产业之一,对云南经济发展有着举足轻重的作用。农作物种植是高原特色现代农业产业的主要基础性内容,且随着种植培育技术的提高,出现了许多区域性的特色农作物。番茄是云南地区露天栽培的主要蔬菜种类之一,因其具有优越的食用价值与药用价值,深受消费者喜爱[1]。元谋热区由于其独特的山地环境与充足的光照条件[2],成为西南地区冬季蔬菜培育的主要产区。当地的番茄又因汁多味美、营养价值高,在30多年的种植发展中被推选为元谋热区的特色农作物之一[3]。随着三农政策的推广普及,元谋番茄的种植面积呈现扩大趋势,精准农业体系的搭建与应用显得愈发重要。及时准确获取番茄种植的空间分布信息,有助于地方农业主管政府部门对当地番茄种植进行监管与优化,也为当地的农业种植补贴政策制定提供数据来源。
相对于地面调查,遥感技术具有宏观、快速、准确的特点,能够实现大范围的目标地物的遥感识别与监测[4],已被广泛应用于农作物信息获取的研究中[5-11]。当前,由于高空间分辨率的遥感影像数据具有丰富的地物纹理与形状结构信息,已成为特色农作物精细化识别的理想数据源[12-13]。随着亚米级遥感卫星数据的不断民用化,可提供空间分辨率优于1 m 的高分二号(GF-2)数据已被广泛应用于资源工程、生态资源以及农业等领域[14-16]。目前,基于应用GF-2 数据进行番茄识别特征提取构建以及遥感应用方法的研究尚未见到,但应用GF-2数据与遥感手段识别其他农作物已有较多成果。例如张飞飞等[17]在GF-2 影像中通过构建大麻识别特征的规则集,采用面向对象的方法对破碎地块大麻进行识别,克服了传统基于像元分类不准确的缺点;郭燕等[18]利用监督分类的方法应用GF-2 卫星数据提取县域尺度的小麦信息,结果表明,采用最大似然法提取小范围的小麦信息精度比较高,可为应用高分辨率影像数据提取农作物信息提供方法参考;滑永春等[19]则是以甘肃民勤县的白刺包为主要研究对象,采用冬季过境的GF-2 数据,利用影像的最小值差值+最大值差值与纹理信息提取白刺包,结果表明,GF-2 遥感影像在识别小面积种植作物中拥有广泛的应用前景。以上的研究都以GF-2 影像为基础数据,针对各自的研究对象提取不同的识别特征,应用不同的方法实现农作物信息的遥感提取。但对于利用高分辨影像数据中丰富的细节特征增强农作物的信息,实现特色农作物遥感识别的辅助作用仍缺乏适普性探究,且目前对于番茄种植信息提取特征与方法应用的研究还较少见。鉴于此,以GF-2 为基础数据源,充分挖掘GF-2 数据的辅助信息特征,利用光谱、植被指数、纹理等多种识别特征组合的方法,对元谋热区冬季露天特色农作物番茄的种植信息进行遥感提取,以期通过构建不同的识别特征组合方案,实现元谋番茄种植信息的准确提取。
元谋热区位于云南省楚雄州彝族自治州元谋县内,海拔1 210 m,属南亚热带干热季风气候,拥有丰富的光热资源。元谋全县年平均气温达21 ℃,最高气温为42 ℃,最低气温为-0.8 ℃;年均降水量613.8 mm,主要集中于5—10月,蒸发量为降水量的6.4 倍,无霜期350 d[20]。独特的盆地地形与气候条件使得元谋热区成为冬季露天番茄主要种植区。元谋冬春蔬菜种植开始于1978年,经过40 a的发展已经成为我国重要的反季节蔬菜种植基地,在我国北方与海外市场反季节蔬菜供给中占据着重要的地位。其中元谋番茄一直都是元谋冬春蔬菜产业的支柱品种,是当地蔬菜种植户以及蔬菜产业的主要经济收入来源[21]。当前,元谋热区的番茄品种主要有樱桃番茄、圣女番茄等。由于元谋番茄果肉汁多糖分高、口感好、质量高,于2013年入选为国家地理标志证明商标产品。冬季露天番茄主要种植在元谋县的黄瓜园镇、元马镇、老城区等区域(图1)。
所获取的GF-2 影像数据来自中国资源卫星应用 中 心(http://www. cresda. com/CN/),景 号 为:7087683。GF-2 卫星共搭载2 台PMS(多光谱/全色)可见光传感器,拥有4 个多光谱(MSS)波段和1个全色(PAN)波段,其空间分辨率分别为4 m 和1 m。研究区的GF-2 遥感数据获取时间为2019 年11 月15 日12:16:28,影像拍摄时的太阳方位角为166.42°,该时段的影像无云、雾覆盖,影像成像时相偏差较小,成像环境较稳定,表明该影像可以作为番茄信息识别的基础数据源。为消除大气影响和降低传感器带来的误差,需要对获取的GF-2 数据进行正射校正、辐射定标和大气校正等预处理工作[22]。最后,借助ENVI5.3 软件中的NNDiffuse Pan Sharpening 算法将GF-2 数据的多光谱波段与全色波段进行影像融合,从而获得空间分辨率为1 m 的多光谱影像数据,实现提高影像空间分辨率的目的。
样本选择上,通过结合3 次野外采点实测数据以及谷歌地图影像验证数据,对研究区采用人工目视解译与实地数据相结合的方法,将获取的样本按照2∶1 的比例分为训练样本与验证样本,用于训练分类和分类结果的精度评价。将研究区的地类分为番茄、水体、城镇用地和其他(未分类的农作物、裸地等)4类,样本数量见表1。
表1 不同地物类别的样本数量Tab.1 Sample sizes of different feature category个
在GF-2 遥感影像预处理、样本选择等工作已完成的基础上,借助影像多尺度分割(Multiresolution segmentation,MRS)算法和尺度参数评价(Estimation of scale parameter,ESP)工具[23]获取该GF-2 影像中针对番茄对象的最优分割尺度,通过分割获得异质性较强的不同影像对象,随后将从影像数据提取到的光谱指数、纹理等多种指标特征进行组合,构建番茄作物多个辅助特征信息遥感识别方案,再利用最大似然法(MLC)以及支持向量机(SVM)2 种分类器分别完成不同识别特征组合维度下的番茄信息提取工作。最后,利用相关的评价指标对识别结果进行精度评价[24]。
1.3.1 多尺度分割 遥感影像信息的集中表现主要取决于地表空间格局的尺度覆盖范围和卫星拍摄观测角度的变化[25]。单一地物单元从小尺度上观测是异质的,而从大尺度观测则可能变成均质的[26],所以需要实现尺度观测与影像同质的共性目标。BAATZ[27]认为多尺度分割充分考虑了目标影像地物的纹理以及空间性,是实现地物同质性的理想选择,该方法被广泛应用于遥感影像的面向对象提取[28-29]中,且提取效果较好。本研究利用eCognition Developer 8.9 软件中的多尺度分割算法对GF-2 数据进行影像分割。在ESP 工具中,对影像分割尺度的取值范围设置为50~180,步长为10;形状指数取值范围为0.1~1.0,步长为0.1;紧密度指数的取值范围同样设置为0.1~1.0,步长为0.1。并通过实际分割效果,对影像不断进行参数调试,最终根据目视解译与第五边界的大致吻合情况确定影像的最优分割参数,从而获取到最终的影像对象。
1.3.2 识别特征构建 在对影像进行目标对象识别特征提取时,需要充分挖掘GF-2 影像中潜在的辅助信息。通常遥感信息提取的准确度取决于所选取的对象特征,且关键特征对于研究对象的提取起着决定性作用。因此,除了构建常规的光谱指数特征外,还应充分利用GF-2 影像中丰富的纹理信息。通过灰度共生矩阵(Gray level co-occurrence matrix,GLCM)、局部二值模式(Local binary pattern,LBP)、灰 度差 向 量(Gray level difference vector,GLDV)以及像元形状指数(Pixel shape index,PSI)等算法对人工番茄作物的纹理特征进行提取。由于试验区的地块复杂,因此使用归一化植被指数(Normalized difference vegetation index,NDVI)和比值植被指数(Ratio vegetation index,RVI)来增强植被信息,提高植被识别度[30]。这2 种植被指数的综合应用,可有效剔除试验区内大部分的水体、裸地、城镇用地等非植被地物。
GLCM 算法可以反映影像灰度纹理的方向以及深浅程度的变化,经过算法处理后可以将纹理特征转化为纹理特征量,进而对不同纹理信息量进行评价分析。常用的GLCM 纹理特征量[31]有角二阶矩、相关性、对比度和熵等。LBP[32]能够很好地描述影像局部的纹理特征,具有灰度影像旋转不变性和灰度不变性的特点,因此可以借助该算法进一步获取人工经济作物的规则纹理特征信息。GLDV 算法可以更好利用灰度图像间的纹理,充分反映地物的生长局势。PSI[33]是指利用中心像元及其相邻像元的关系,计算具有光谱相似性的相邻像元组的维数,并拉大不同方向领域像元之间的特征值,以增强影像的空间细节信息。PSI算法相对于其他3种算法,能够更好地考虑地物间的形状大小以及长度,对规则地物的提取有重要的辅助作用。各种算法具体的提取公式如表2所示。
表2 对象特征与指数选取计算公式描述Tab.2 Object characteristics and index selection calculation formula description
1.3.3 多特征辅助识别方案 综合各种纹理、植被指数以及光谱特征,根据主成分的相关理论[34],探讨不同提取方法的纹理数据对番茄种植信息遥感识别精度的影响,将其分为10种特征识别辅助组合方案(表3)。
表3 不同特征组合识别方案Tab.3 Different feature combination recognition schemes
1.3.4 分类器 为了比较基于GF-2 影像数据构建的多特征辅助识别组合在不同分类方法中的提取效果,采用常用的MLC、SVM 2 种分类器进行不同识别方案维度下的元谋番茄信息提取。
MLC 是传统机器学习分类方法的一种,在遥感信息方法中应用较为常见。该算法的主要思想是统计分析影像数据中的像元数,预先设定研究区内的各种地物为正态分布,并通过机器学习,对训练样本进行判别。该算法能够根据判决准则构建非线性判别函数,进而判定每个像元对各类别的归属度,把各像元分配到相应地物中,因而MLC 方法应用较为广泛,发展也较为成熟[35]。
SVM 的理论基础较强,其优势在于进行分类获取的样本数量有限的条件下,能够实现地物分类与模型的均衡模拟,从而最大限度地避免了非线性“过学习”和“维数灾难”等问题,使得经过模型训练获得的极值解具有较大的科学性与合理性。因此,SVM 方法具有较高的泛化学习能力;在解决小样本、非线性及高维模式识别中表现出其特有的优势,并能够推广应用到函数拟合等其他机器学习问题中[36]。
1.3.5 精度评价 采用基于混淆矩阵计算获取到的生产者精度(Production accuracy,PA)、用户精度(User accuracy,UA)、总 体 分 类 精 度(Overall accuracy,OA)和Kappa 系数等评价指标来评价分析最终的提取结果。其中,OA和Kappa系数指标用于评价整体的分类精度,PA 和UA 指标则用来评价特定类别的分类精度[37]。
经过多次参数调整以及ESP 评价工具的验证,最终确定了影像最优分割尺度的参数:影像分割尺度为80、形状指数为0.5、紧密度指数为0.7。从多尺度分割的结果来看,最终选择的结果能够更好将同一地物的像元分割在同一空间内,且最大程度上使得分割对象都能够接近同质对象,从而避免了过分割问题。从最终选择的分割尺度参数设置结果(图2)来看,最终选择的分割效果能够符合试验设想与实际要求。
2.2.1 植被指数提取分析 通过对NDVI 的提取分析,植被的NDVI 值大于0,非植被指数则是小于0,这能够较好地剔除水体与非水体的地物;通过对样本中的番茄地进行试验,番茄地物的NDVI 值主要集中于0.38~0.72,通过该区间的阈值设置,可以较好区别于其他地物。RVI 值大于2 的区间,可以有效区分植被地类与其他作物。由于高分辨率影像容易出现“同物异谱、同谱异物”的现象,综合使用多种植被指数可以很大程度上弥补该缺点。
2.2.2 纹理特征提取分析 为了更好地确保提取的纹理有较高的辨识度,将影像全色波段作为纹理提取的基础数据,经过4 种算法提取的纹理信息如图3 所示,并由此分析影像中地物形状与空间分布情况。GLCM 算法可以直观地反映影像地物纹理的粗细程度、邻域内的灰度变化以及遥感影像灰度之间联系的紧密性情况。由于番茄属于人工种植作物,种植地块相对规整有序,纹理比较清晰,因此GLCM 图像上深灰整齐分布的地块可能是番茄的种植区域;GLCM 图像出现大面积的灰白区域,主要是因为城镇用地与其他混杂植被之间存在反差,因而获取的信息量较少;除中间部分的农田地和塑料大棚的地块比较均匀外,其他区域呈现的纹理比较散乱(图3a),这可以有效区分农作物区域与非农作物区域。GLDV 纹理中的规则地物纹理是呈现大片分布的(图3b);LBP 影像则能够充分反映各影像地物直接的纹理信息,获取的地物纹理比较丰富(图3c);PSI 影像纹理比较细致,能够清晰地反映各地物之间的分区(图3d)。基于不同算法提取的纹理都突显了影像地物的各向异性,获取的纹理信息也较清晰,这都有利于番茄信息的遥感提取。
为了更好体现不同分类方法及分类方案的可比性,以便直观地反映番茄的识别效果,将研究区地类分为2类,即番茄为一类,水体、城镇用地、其他地物统归为一类。各方案提取结果如图4和图5所示。
从表4 可知,在MLC 中,从10 种组合方案识别结果来看,其中方案7(RGB-NIR-NDVI-RVIGLCM-LBP)对番茄作物的识别精度最高,OA 为97.20%,UA达到93.31%,Kappa系数高达0.91,表明该方案所采用的特征组合对于提取番茄的效果最好。从最终的识别精度来看,方案7 相对于其他9种组合方案来说,OA 提高0.06~12.18 个百分点。方案7 与单一光谱指数提取的方案1 相比,OA 提高12.18 个百分点,UA 从76.88%提高到93.31%,有效提高了16.43 个百分点,Kappa 系数提高0.16。而与其他添加了多种纹理信息特征进行辅助识别的方案相比,添加了GLCM-LBP 2 种纹理进行组合识别的方案7,对于番茄的识别效果最佳,OA 与Kappa系数较其他方案都得到了有效提高,OA 提高0.06~1.25 个百分点。在10 种组合方案中,添加纹理特征进行辅助识别后,番茄的识别精度都得到了大幅度提高,这表明纹理信息在人工作物的遥感识别中有着重要的辅助作用。所以合理使用纹理信息特征能够使得番茄的提取精度得到一步提升。
表4 不同组合方案的识别精度Tab.4 Recognition accuracy of different combination schemes
在SVM 中,多特征组合识别精度最高的是方案2(RGB-NIR-NDVI-RVI-GLCM),OA 为96.44%,UA 为88.23%,Kappa系数为0.87。识别精度最低的组 合 为 方 案1(RGB-NIR-NDVI-RVI),OA 为82.21%,UA 为72.21%,Kappa 系数为0.72。方案2识别的OA比方案1提高了14.23个百分点,UA提高了16.02 个百分点,Kappa 系数提高了0.15。方案7(RGB-NIR-NDVI-RVI-CLCM-LBP)的识别效果位居第二,OA 为96.25%,Kappa 系数为0.86。在有添加纹理进行辅助识别的方案2—9 中,虽OA 有所变化,但变化不大,都在96%上下浮动,Kappa 系数变化也不明显。从10种方案的整体识别效果来看,加入纹理信息辅助识别的方案与单一光谱指数组合辅助识别的方案1 相比,OA 都有所提高,提高了12.31~14.23 个百分点,Kappa 系数也提高了0.11~0.15。Kappa 系数在0.80~1.00,属于相对一致的结论[38-39]。从识别的结果来看,加入纹理特征的识别方案的Kappa 系数都大于0.80,表明试验提取的结果可信度较高。
从总体上看,MLC 对番茄的识别效果优于SVM,MCL 中的各种组合方案的UA 与Kappa 系数都略高于对应的SVM 组合方案。综上,利用多特征辅助识别组合方案在MLC 中提取效果较好,且使用RGB-NIR-NDVI-RVI-GLCM-LBP 的组合方案识别番茄作物的效果最佳。
番茄由于营养价值高且经济效益高,在元谋热区农业发展中占据着重要的作用。对于小尺度特色农作物的遥感监测与识别,国内外的研究还较少。本研究以元谋热区的番茄为研究对象,对GF-2 影像的光谱、纹理和植被指数等信息采用基于对象的思想,构建了多种识别组合方案,探索了基于GF-2 遥感影像对元谋番茄信息提取的最佳识别方案,并有效地提取了番茄信息。主要结论如下:
通过添加纹理特征辅助识别,番茄的识别效果显著提高,其中基于MLC 的方案7(RGB-NIRNDVI-RVI-GLCM-LBP)识别效果最好,其总体分类精度为97.20%,用户精度为93.31%,Kappa 系数高达0.91,表明该组合方案对于番茄的识别效果最佳,相比于其他组合方案总体分类精度提高0.06~12.18 个百分点,Kappa 系数提高0.01~0.16,用户精度提高0.45~16.43 个百分点,表明使用该方案识别番茄信息最有效。在SVM 中,构建的方案2(RGBNIR-NDVI-RVI-GLCM)识别精度最高,总体分类精度为96.44%,用户精度为88.23%,Kappa 系数为0.87。其他方案对于番茄识别精度差距不大。但由于算法差异,相对于MLC 来说,识别精度上存有一定的差距。就分类器识别番茄信息的效果来看,MLC总体的识别效果优于SVM,并且采用MLC中的方案7(RGB-NIR-NDVI-RVI-GLCM-LBP)能够较有效地提取番茄信息。就试验结果来看,综合利用光谱指数以及多种纹理组合辅助识别的方法能够提高单一特征识别番茄信息的精度,且该方法与结果具有较高的可行性与可信度。而基于对象的分类,避免了“椒盐”现象的发生,能够提高识别番茄的精度,具有一定的优势。