郑西方
(河南理工大学测绘与国土信息工程学院,河南 焦作 454003)
为能及时准确统了解计农作物种类、空间分布、种植面积等信息,以及如何实时监测其生长状况,为其及时精准提供最佳生长条件以便优化其种植结构、精准化智能化生产管理,是当今智慧农业研究的主要课题,所以进行农作物精细分类具有重要意义[1]。由于传统农作物精细分类完全依赖于传统形态学和生物学调查法[2],其虽有较高精度,但需投入大量的人力物力财力,已满足不了现代“智慧农业”的需求。其次在传统遥感技术方面,主要基于星载或机载的多光谱影像进行精细分类识别研究[3-6]。但由于多光谱影像空间分辨率低、波段范围短且数目少,往往致使农作物精细分类受到较大局限性,尤其针对一些小区域、“同谱异物”的农作物。而高空间分辨率遥感影像数据获取成本高,且需要一种能够精准捕捉地物光谱信息的技术。于是高光遥感技术在近年来发展成为一种新技术,高光谱遥感具有“空谱合一”、波长范围广、波段数目多、光谱曲线完整、信息量丰富等特点。当前已有许多学者基于高光谱遥感技术对农作物精心精细化分类并取得了一定成果[7-8]。但又因普通星载或大型机载高光谱影像存在低空间分辨率、数据获取成本极高等问题受到了局限。紧接一种新型无人机高光谱遥感技术被推向高潮,其技术不仅操作简单、数据获取成本低等优势,而且能将高空间分辨率与高光谱分辨率做到真正地有机结合并实现了“空-谱合一”。目前已有部分学者基于无人机高光谱遥感技术对农作物信息进行了提取[9-15],为农作物估产、生长监测等提供了有力依据和保障。
于是本文针对农作物弱类特征精细化分类问题同时响应国家农业精细化智能化号召,将基于无人机高光谱遥感技术对试验田典型农作物冬小麦通过引入主成分分析和最大噪声分离两种降维变换进行特征提取。并基于典型机器中的支持向量机和集成学习法中的随机森林分类模型进行精细分类研究,以期能为农作物精细管理提供有力支持。
本文以河南省武陟县冬小麦研究基地为实验区,地理位置约为:N:35°07′59″~35°08′0.822″,E:113°15′26.91″~113°15′28″,平均海拔为92m 且属于温带季风气候。于2018 年10 月份人工设计90 个小区块且每个小区块面积为4mx3m,共播种六种冬小麦。其呈18 行5 列,且每3 行5 列播种同一品种,如图1。
图1 研究区
高光谱传感器采用的是德国Cubert 公司研发的Cubert UHD185 型成像高光谱仪,其传感器主要技术参数为:光谱范围450~950/nm、光谱分辨率8/nm、光谱采样间隔4/nm、光谱通道数125 个、Cube 分辨率/像素1000×1000、数字分辨率12/bit 等。传感器搭载平台为大疆M600 六旋翼无人机,具有动力充足稳定性极佳特点。
1.3.1 高光谱数据获取及预处理
于2020 年05 月份(小麦拔节孕穗期),选在无云无风且天气晴朗的正午11:30-12:10 进行遥感作业。其中行高、航向重叠、旁向重叠设计为100m、90%、85%。且作业之前需利用黑白板对相机辐射定标。并利用A4 纸质制作像控制点均匀布设在测区,再基于RTK 实测其点位信息。无人机获取的高光谱数据处理主要包括辐射校正、影像融合、影像拼接3 部分组成。根据UHD185 型成像光谱仪中心波长和波长半幅宽在Matlab 环境设计的辐射定标系统,完成由影像DN 值到地表反射率的辐射校正[16]。其拼接技术流程如图2 所示。
图2 拼接技术流程
1.3.2 高光谱数据降维处理
由于高光谱数据相比多光谱数据,其数据量大,信息丰富、高维度等,但同时也带来了信息冗余,处理效率低下、存储困难等问题,因此需要对其进行降维处理[17]。于是本文实验基于降维变换中常用的主成分分析变PCA 变换、最小噪声分离MNF 变换分别对高光谱影像数据进行变换。并通过变换结果特征值拐点进行波段特征选择,其变换直方图如图3 所示。因特征值较大且拐点之前的波段富含特征信息量丰富,而拐点之后波段分量信息基本为零。可知前几个波段特征值变换速度较快且所蕴含有用信息多,而后面的波段特征值变换缓慢且噪声较多,最终选择前10(PCA)、20(MNF)个主分量分别作为数据降维后的光谱特征。
图3 光谱波段降维变换
1.3.3 分类模型
本文实验基于经典机器学习分类中的支持向量机(Support Vector Machine,SVM)和基于决策树分类器集成的随机森林(Random Forest,RF)分类模型分别对研究对象精细化分类实验。并对其试验结果采用整体分类精度(Overall Accuracy)、Kappa 系数指标加以评价。
在SVM 分类中为避免分类结果受其他参数的影响,均采用一致参数,如均选取径向基核函数(Radial Basis Function,RBF)作为核函数。在RF 分类中为方便本次实验并查阅相关文献,将决策树取为500 棵[21],特征数量为特征数量的平方根且节点不纯度由Gini 系数决定。最终分类结果与精度评价如图4、表1 所示。
图4 各分类模型分类结果图
表1 各分类模型分类结果精度表
由图4、表1 可知:在基于SVM 分类结果中,未经降维处理分类精度较均未达到50%,而经PCA/MNF 降维处理后分类精度均在74%以上,且远优于未降维变换分类精度约30%。对全波段影像先作降维变换处理后分类,其不仅可降低数据量提高了运算效率,还较大程度地提高了分类精度。在降维变换后,无论基于何种分类模型,都表现出基于MNF 变换分类效果均优于PCA 变换分类,且基于MNF 变换分类精度约高于基于PCA 变换分类精度3%左右。在对原始影像同种降维变换后分类中,RF分类模型均略优于SVM 分类模型,其中MNF-RF 变换模型组合的精度最高,其整体精度Overall Accuracy 和Kappa 系数分别为78.1289%、0.7455。由此可见针对无人机高光谱影像精细分类问题,首先先降维变换处理再进行分类不失为一种有效方案。从各分类模型分类结果图中可知:未经降维变换的分类效果中,存在大量的错分、漏分现象和严重的“椒盐”现象,尤其是1 号类、2 号类、3 号类和6 号类。而经降维变化处理后分类效果中,此现象都得到较大程度地缓解。且各号类冬小麦分类效果均远优于未降维变换分类效果。但仍存在个别顽固性的“椒盐”错分混分类别现象,如2 号类、3 号类与5 号类相对严重。在以上多组分类结果中,均存在各分类块的小麦阴影部分或多或少地被误划分为本地块冬小麦类别之中,且块与块之间的田埂没有被较好地分类识别出来。经研究分析:在采集研究对象数据时正出于拔尖孕穗期,而且田埂上生长中杂草未清除,使得部分杂草光谱与小麦光谱极为相似和造成部分混合像元现象,以致于田埂未能被较好地分类出。而针对降维后仍存在个别类别混分现象,其原因在于各其类别冬小麦光谱极为相似,属于典型弱类间特征差问题,一直给予其精细化分类研究带来巨大挑战。
针对弱类特征冬小麦精细分类问题,本文基于无人机高光谱遥感技术进行了数据采集、拼接和降维变换处理等研究工作,并引入经典机器学习中的SVM 和集成学习法中的RF 分类模型进行了精细化分类实验,得出:
3.1 对于无人机高光谱影像精细化分类时,需进行降维变换处理。经过降维变换分类精度远优于未经降维变换分类精度30%左右,降维变换不仅可减少数据量提高运算速度,还能较大程度地提高分类精度。
3.2 本文在MNF 和PCA 变换分类中,其中MNF 变换相比PCA 变换更具有优势。且在降维后基于SVM 和RF 模型分类效果中,MNF-RF 变换分类法具有更优的分类效果,其总体分类精度和kappa 系数分别达到了78.1289%、0.7455。
3.3 针对弱类特征农作物精细分类问题,无人机高光谱遥感技术对其分类研究应用将具有巨大潜力,是未来研究发展的重要方向。