基于改进SVM算法的典型作物分类方法研究

2020-08-04 09:12贾银江苏中滨孔庆明张萧誉施玉博
东北农业大学学报 2020年7期
关键词:植被指数分类器白菜

贾银江,姜 涛,苏中滨,孔庆明,张萧誉,施玉博

(1.东北农业大学电气与信息学院,哈尔滨 150030;2.国网哈尔滨供电公司,哈尔滨 150000)

传统农作物种植结构提取主要以统计报表和抽样调查为主,存在主观性强、时效性差、作业效率低等问题[1-2]。遥感技术为大区域农作物种植结构提取提供技术手段,具有宏观、快速特点,特别是卫星遥感具有独特优势,可提供不同时间、空间和光谱分辨率影像数据,国产GF-1卫星与其他卫星如Landsat、Sentinel-2等相比具有更高空间分辨率及更短重访周期,在农作物种植结构提取方面应用前景广阔[3-4]。

作物在物候期不同时段内遥感影像差异明显,基于作物在遥感影像上光谱值随时间变化特性,实现作物类别分类提取[5]。植被指数在作物分类及长势监测等方面广泛应用,研究表明,基于时序植被指数作物遥感分类方法可实现作物对象有效区分。汪小钦等以Landsat系列影像为数据源,构建NDVI和第一主成分时间序列反映物候差异,采用时间加权动态时间规划法对香梨、小麦、辣椒和棉花等作物分类,分类精度为82.68%[6]。Singha等利用MODIS数据识别水稻种植区,分类精度为84.4%[7]。刘佳等以HJ-1 A/B卫星为数据源,利用时序影像获取NDVI时间序列作为分类特征,对春玉米、夏玉米、棉花和冬小麦等作物分类,分类总体精度达90.9%[8]。常布辉等以GF1-WFV影像为数据源,构建NDVI时间序列,利用谐波分析法对NDVI时间序列平滑处理,采用DT和SVM结合方法作耕地提取,整体精度达到92.24%[9]。以上研究多采用单一植被指数序列作为分类特征,对多个植被指数结合使用较少,地物区分难度较大,易出现漏分、错分情况;分类算法方面多采用传统SVM、RF、DT等算法,分类精度较低。

黑龙江省哈尔滨市阿城区域内主要作物为玉米和水稻,也少量种植大蒜和白菜,大蒜是阿城区特色作物,与玉米交叉混种现象极为普遍,除以上作物外,研究区还有建筑用地、水体、草地、林地、灌丛等对象,其中,建筑用地和水体与作物植被指数差异明显,易实现区分,但草地、林地、灌丛等对象仅利用单一植被指数分类难以取得理想效果。

为此,本文选用NDVI、NDWI、EVI、RVI植被指数结合方式,以GF1-WFV影像为数据源构建植被指数时间序列,采用SVM分类器[10-11],对研究区内主要作物分类并评价分类结果。针对SVM算法参数选择主观性较强问题,引入AMPSO算法优化SVM,提升SVM分类器分类精度,为作物遥感监测及农业精准管理提供参考。

1 研究区及数据源

1.1 研究区概况

研究区为黑龙江省哈尔滨市阿城区,地处东经 126°40'~127°39',北纬 45°10'~45°50',总面积2 452 km2,南北最大距离为84 km,东西最大距离为75 km,城区面积28.85 km2,研究区域概况如图1所示。阿城区为半山区,地势东高西低,属于寒温带大陆性季风气候,一年四季变化明显。春季升温快伴有大风天气,发生干旱;夏季时间较短较炎热且降水较多;秋季温度回落快,易出现霜冻现象;冬季时间较长且寒冷。年平均气温为3.4℃,7月份最热,平均气温为22.7℃,最高气温为36.5℃,1月份最冷,平均气温为-19.8℃,最低气温为-34.2℃。年日照时间约2 550 h,活动积温2 300~2 600℃,年降水量580~600 mm,无霜期日数162 d。

1.2 数据源

1.2.1 卫星遥感数据

高分一号(GF-1)卫星是国产第一颗高分辨率对地观测卫星,搭载4台宽幅多光谱相机(WFV)幅宽可达800 km,WFV传感器共设置4个波段,包括 蓝(0.45~0.52 μm)、 绿(0.52~0.59 μm)、 红(0.63~0.69 μm)、近红外(0.77~0.89 μm),空间分辨率达到16 m,重访周期为4 d。研究对象主要为水稻、玉米、大蒜、白菜等作物,为观测作物生育期影像变化,选择2018年4月~10月GF-1/WFV遥感影像为研究数据,剔除云层遮挡无法使用影像数据,共获取9景遥感影像数据(见表1)。

表1 研究区卫星影像数据Table 1 Satellite image data in the study area

1.2.2 实地样本数据

2018年6月~7月,在研究区开展外业实地调查,结果发现,研究区内地物主要有建筑用地、林地、灌丛、草地,作物主要有水稻、玉米、大蒜、白菜和少量其他作物。该地区大蒜4月上旬开始种植,7月上旬收割,7月中下旬在原大蒜种植区域种植白菜,10月收割,实地样本数据仅采集到大蒜样本点,虽缺少白菜样本数据,但由于大蒜与白菜在空间位置重叠,7月28日后影像中,白菜位置坐标可用大蒜样本标识。由于大蒜和白菜2种作物总物候期与玉米、水稻物候期大致相同,故本文将大蒜和白菜在时间上作为两种作物,而在空间上作为一种作物讨论,后文将以“大蒜/白菜”表示。

根据研究区内作物种植特点,本文主要提取玉米、水稻和大蒜/白菜分类数据,其他作物在研究区内分布面积较小,归并到其他植被类。因此,本研究中将地物类别分为水稻、玉米、大蒜/白菜、水体、建筑用地和其他植被6类。实地数据采集时采用华测导航HCE320对研究区地物定位标记,同时记录分类对象类型并拍摄照片。共采集样本数据1 244个,各地物类别及样本数量如表2所示。

表2 实地样本数据Table 2 Samples data in the field

2 研究方法

将选取黑龙江省哈尔滨市阿城区域GF-1/WFV遥感影像作预处理,计算特征变量后构建特征变量数据集,结合实地采集数据样本集输入至SVM分类器和基于AMPSO改进SVM分类器中作分类识别,得出分类结果,并根据验证集作分类精度评价,具体流程如图2所示。

2.1 遥感影像预处理

遥感影像预处理工作在ENVI5.3软件中实现。主要处理步骤包括几何粗校正、辐射定标、大气校正和几何精校正。几何粗校正,根据GF-1/WFV影像自带 RPC(Rational polynomial coefficient)文件对时间序列每幅原始影像加以几何粗校正;辐射定标,依据资源卫星应用中心提供辐射定标系数将图像数字量化值转化为辐射亮度值;大气校正,利用ENVIFlaash模块实现大气校正,获取地物真实光谱反射率数据信息;几何精校正,根据地面实测控制点数据,采用二次多项式模型予以几何精校正,再利用精校正影像对其他影像校正,校正误差控制在1个像元以内,以满足影像处理要求。

2.2 植被指数选择与计算

光谱植被指数广泛应用于农作物分类与识别、长势监测与产量估算等方面,本文根据研究区内作物特征及光谱反射率情况,选择可反映植被覆盖度归一化植被指数NDVI,对水体信息比较敏感归一化水指数NDWI,反映作物绿度情况比值植被指数RVI,具有校正土壤背景和气溶胶散射影响增强植被指数EVI,作为研究区内主要作物分类特征指数并构建时间序列。根据预处理后得到影像光谱反射数据,计算4种植被指数,计算公式如下。

式中,ρNIR、ρRED、ρBLUE、ρGREEN分别为近红外波段、红波段、蓝波段、绿波段反射率;G为增益因子,取值为2.5[12];C1、C2分别为大气修正红光、蓝光校正参数,取值为6和7.5[12];L为土壤调节参数,取值为1[12]。

2.3 植被指数时间序列构建

根据9景GF-1/WFV时序影像光谱数据,分别计算NDVI、NDWI、EVI、RVI 4种植被指数值,每种植被指数生成9景影像,结合实地采集研究区作物样本数据,将每景植被指数影像中各类作物样本点对应值求和后取平均值,得到各时期各地物4种植被指数值,构建研究区4~10月整个物候期内植被指数时间序列。

2.4 地物分类

使用SVM分类器对作物分类提取,SVM分类器已广泛应用于遥感影像分类和作物种植结构提取研究,是一种广义线性分类器,引入结构风险最小化原理和最优化理论在样本空间寻找超平面,引入核函数后,可将非线性数据映射到高维空间线性划分,具有适应性强、全局优化和泛化性能优良等优点。

SVM分类器核函数参数和惩罚因子选取直接影响分类器分类精度,而对遥感影像分类时不易确定最优核函数参数和惩罚因子,针对此情况,引入AMPSO算法优化SVM分类器。AMPSO算法克服粒子群算法早熟收敛,易得到局部最优解缺陷,通过变异操作,改变粒子前进方向,跳出局部最优点,可找到全局最优解[13]。将SVM分类器中核函数参数和惩罚因子设为AMPSO优化算法中粒子,即可找到最优参数值,提升SVM分类器分类效果。

将生成4种植被指数9个时间序列共计36景影像融合,在获取1 244个实地采集样本中,根据各地物样本数量,随机按照7∶3比例[14],将样本点分为训练集和验证集,其中训练集样本870个,验证集样本374个,将融合后影像与训练集样本分别输入优化前后SVM分类器中分类,得到分类结果。

2.5 精度评价

遥感分类精度评价一般通过比较分类图像与参考图像一致性反映分类结果。混淆矩阵是最为常用一种精度评价方法,在混淆矩阵中精度评价参数主要包括总体分类精度、制图精度、用户精度和Kappa系数[15-16]。本文基于实地采集数据划分验证集,通过混淆矩阵验证分类精度。

总体分类精度为正确分类像元数与总像元数比值;制图精度为像元被正确分为某类数量与该类总像元数之比;用户精度为正确分到某类像元数与分类器将像元分为该类像元总数之比;Kappa系数是基于混淆矩阵衡量精度方法,计算公式如下:

其中,k为kappa系数,P0为实际一致率,Pe为理论一致率。

3 结果与分析

3.1 作物植被指数变化分析

基于GF-1/WFV影像数据,结合研究区域作物物候特征,构建4种植被指数时间序列变化曲线,如图3所示。玉米与水稻播种期在4月末至5月中旬,因此4月4日和4月28日玉米种植区域4种植被指数值接近裸地状态,由于水稻插秧前需对稻田灌水,因此NDVI、EVI值略有下降;大蒜播种期是4月上中旬,同期大蒜种植区DNVI、EVI值略高于玉米和水稻。5月19日玉米处在出苗期,水稻处于插秧期,4种植被指数值变化差异细微;此时大蒜处于分瓣期,NDVI、EVI值缓慢上升,NDWI值缓慢下降。6月12日玉米开始分叶,水稻进入分蘖拔节期,NDVI、EVI值开始上升,水稻EVI值上升速度明显高于玉米,可有效区分两种作物;大蒜进入蒜薹伸长期与鳞茎膨大期,NDVI值也开始上升,但NDWI值开始下降,与水稻和玉米时序曲线差异明显,可实现与玉米和水稻有效区分。7月28日玉米处于抽雄吐丝期,水稻处于抽穗期,两种作物NDVI、EVI、RVI值迅速上升,NDWI值迅速下降,此时水稻RVI值明显高于玉米,可通过该植被指数区分水稻和玉米两种作物;由于大蒜在7月上旬已收割,7月中下旬时,该地区接茬白菜,因此在7月28日影像中,NDVI、EVI和RVI值明显低于玉米和水稻,NDWI值高于玉米和水稻。8月22日,水稻处于杨花灌浆期,其NDVI、EVI、RVI值开始回落,NDWI值开始回升;玉米到达灌浆期,4种植被指数趋势与水稻大致相同,但回落速度明显慢于水稻,其中EVI、RVI最为明显,可以此区分这两种作物;此时接茬大蒜白菜处于生长发育期,植被指数呈上升趋势,但NDVI、RVI值明显低于玉米和水稻,可以此区分白菜。9月19日玉米和水稻均处于灌浆成熟期,玉米NDVI、EVI值明显高于水稻,而白菜EVI、RVI值均明显高于玉米和水稻,几种作物可实现有效区分。10月1日白菜NDVI值与EVI值达到最高,明显高于其他作物,而其他几种作物植被指数值均呈迅速回落趋势。10月18日几种作物均到收获时节,植被指数值较接近,差异较小。

此外,对其他几种非作物地物分类时,水体与植被差异很大,可由NDVI、NDWI、EVI明显区分。建筑用地在整个物候期时序曲线整体变化趋于稳定,也可通过几种植被指数区分。其他植被,主要包括林区、草地和小面积其他作物等,其中林区分布较为集中,除作物生长高峰期外,其他时期几种植被指数值均高于作物,易区分;而草地和其他作物分布较零散,可通过NDVI对低植被覆盖具有增强作用和EVI对高植被覆盖具有高敏感性特点,实现与大面积种植主要作物有效区分。

3.2 分类结果

将植被指数融合后影像与训练样本集分别输入至SVM分类器和AMPSO-SVM分类器中,根据样本集NDVI、EVI、RVI、NDWI 4种植被指数对研究区作物分类提取,利用ArcMap软件对4种分类器分类结果制图,研究区内地物空间分布如图4~5所示。

对比图4和图5可见,分类器分类结果与当地实际数据具有较高吻合度。阿城区东部为山区,基本被林地覆盖,道路两旁开辟出少量耕地,且由于水源和地势限制仅种植玉米,玉米呈零星分布。作物种植区主要集中在西部平原地区及城区周围,水稻种植一般分布于河流沿岸,阿城区水稻种植于阿什河两岸,如图中蓝色带状区域,大多与玉米相邻;大蒜/白菜大多集中分布在城中区东南部,少量与玉米混种在其他区域;种植量最大作物为玉米,其中混有少量其他作物。

3.3 精度评价

本研究中使用实地采集374个样本点对SVM分类器和AMPSO-SVM分类器分类结果实施精度验证。验证样本点包含玉米108个、水稻99个、大蒜/白菜71个、水体23个、建筑用地44个和其他植被29个。计算得到2种分类器混淆矩阵见表3~4。

由表3可见,SVM分类器已取得较为理想分类结果,在选取374个验证样本集中,被正确分类样本个数为340个。玉米验证样本总量为108个,其中有96个被正确分类;水稻验证样本总量为99个,91个被正确分类;大蒜/白菜验证样本总量为71个,61个被正确分类;水体验证样本总量为23个,22个被正确分类;建筑用地验证样本总量为44个,均被正确分类;其他植被验证样本总量为29个,26个被正确分类。最终总体分类精度为90.91%,Kappa系数为0.8851。水稻制图精度和用户精度均超过90%,玉米制图精度和用户精度均低于90%,大蒜/白菜制图精度仅有85.92%。

由表4可知,使用AMPSO算法优化SVM分类器后,玉米验证样本正确分类个数增加5个、水稻验证样本正确分类个数增加4个、大蒜/白菜验证样本正确分类个数增加4个。从优化前后精度对比结果可见,优化后分类器总体分类精度比优化前SVM分类器提升3.48%,Kappa系数提升0.0436,玉米制图精度和用户精度分别提升4.36%和3.77%,水稻制图精度和用户精度分别提升4.04%和2.15%,大蒜/白菜制图精度提升5.63%。对于作物玉米和水稻而言,优化后模型得到分类地块完整程度明显更高,避免误分现象。

对比图4~5分类结果与表3~4混淆矩阵计算结果可见,水稻整体分类效果最好,仅少量被误分为玉米和其他植被;大蒜/白菜部分误分到玉米中,因与玉米混种,在交界处形成混合像元造成误分,少量误分到建筑用地中,或因7月上旬大蒜收割后,未及时接茬白菜,导致相应区域植被指数值接近裸地,造成误分;玉米种植面积最大,且与其他植混种较多,故玉米主要被误分入大蒜/白菜和其他植被。

表3 SVM分类器地物识别混淆矩阵Table 3 Confusion matrix of crops recognition based on SVM classifier

表4 AMPSO-SVM分类器地物识别混淆矩阵Table 4 Confusion matrix of crops recognition based on AMPSO-SVM classifier

4 结论

本文以黑龙江省哈尔滨市阿城区为研究区域,以多景GF-1/WFV遥感影像为数据源,构建覆盖作物完整生长期NDVI、NDWI、EVI、RVI共4种植被指数时间序列,结合实地采集样本数据,采用SVM分类器对研究区作物分类识别,并提出使用自适应变异粒子群算法优化SVM分类器,构建AMPSO-SVM分类器,探索改进后分类器分类效果。

a.基于GF-1/WFV遥感影像计算得到4种植被指数NDVI、NDWI、EVI、RVI可描述研究区内不同作物不同时期生长状态,4种植被指数时间序列组合,准确表达各地物动态变化过程,有效识别研究区内各地物。

b.玉米和水稻生育期与大蒜/白菜差异较大,植被指数时间序列曲线差异明显,容易区分;玉米与水稻生育期接近,光谱信息相似,区分难度较大,但光谱指数增长与回落趋势不同,借助NDVI、RVI和EVI可实现有效区分。

c.使用SVM分类器对研究区作物分类,分类结果较为理想。表明基于GF-1/WFV遥感影像构建4种植被指数时间序列混合使用可作为分类器分类特征,实现作物较高精度分类。SVM分类器总体分类精度为90.91%,Kappa系数为0.8851,表明SVM分类器适用于大区域遥感影像作物分类。

d.采用自适应变异粒子群算法优化SVM分类器,构建AMPSO-SVM分类器,分类效果得到明显提升。确定当核函数参数为0.135,惩罚因子为221.67时,分类效果最佳,总体分类精度达到94.39%,Kappa系数为0.9287,对比优化前SVM分类器,分类精度提升3.48%,Kappa系数提高0.0436。

e.GF-1/WFV影像具有宽覆盖特征,幅宽高达800 km,同时具有较高空间分辨率及较短重访周期,使用其影像数据作为分类数据源,可达到理想分类精度,为大区域作物分类提供数据支撑,具有参考价值。

猜你喜欢
植被指数分类器白菜
白菜长黑点还能吃吗?
学贯中西(6):阐述ML分类器的工作流程
基于无人机图像的草地植被盖度估算方法比较
开水白菜
羊与白菜
基于朴素Bayes组合的简易集成分类器①
基于动态分类器集成系统的卷烟感官质量预测方法
一种自适应子融合集成多分类器方法
小象种白菜
植被指数监测绿洲农区风沙灾害的适宜性分析