邹昆霖,张若宇,江英兰
(石河子大学机械电气工程学院/农业部西北农业装备重点实验室,新疆 石河子832003)
棉花是关系国计民生的战略物资,对国民经济和社会发展有着重要影响[1]。准确测量棉花种植面积和空间分布,对棉花田间管理,精确测量棉田单产,优化棉花种植格局具有重要意义[2]。
目前作物种植面积和空间分布测量主要依靠遥感方法进行。张芳等[3]基于遥感图像进行农田判别分类和面积计算取得了良好的效果;Cong Ming 等[4]提出了一种评价无监督遥感图像分类输入参数的初步分析方法,该方法能自动确定无监督图像分类的适当初始簇数及其对应的中心,在不需要先验知识的情况下,可以有效地实现无监督图像的分类,获得准确的分类结果;李晓东等[5]采用多时相遥感数据分类计算农田,通过地表植被时序变化过程结合印象纹理等多维空间数据对水田和旱田进行了分类;潘影等[6]利用遥感影像采用决策树算法将背景农业地表覆盖进行多种类别的划分,共划分出39类农业地表类型,采用归一化植被指数计算了北京地区裸露农田的面积,为利用遥感图像检测棉田信息起到了指导作用;李敏等[7]采用卫星遥感影像通过物候历分析和主要农作物的光谱特征,确定了棉花识别的最佳时相,并建立了识别模型;辛海强等利用遥感影像提取了包括棉花种植面积、棉花长势、病虫害等信息,为棉花遥感检测研究和棉田精细化管理打下了基础。
上述方法中遥感数据获取的时间周期长,由于空间分辨率受限,采用遥感手段获取作物信息的精度也有待进一步提高[8]。
无人机近地面成像因其空间分辨率高、成本低、周期短和可重复性强等特点[9],在土地和作物信息监测等方面逐步得到应用[10-12]。无人机低空成像分类主要有2 种。第1 种是基于光谱图像以各类植被指数为基础的分类方法。田振坤等[13]以冬小麦为研究对象,利用农作物的波谱特征和植被指数NDVI变化阈值,对作物分类方法进行研究,结果表明该方法对农作物分类具有较高的准确性和普适性;高林等[14]研究对比分析了无人机高光谱数据计算的红边参数和光谱指数与冬小麦叶面积指数的相关性,结果表明多种光谱指数与植物信息具有较强相关性,为利用无人机高光谱遥感数据开展相关研究积累了经验。第2 种是采用可见光相机以各类纹理特征为基础的分类方法。如李宗南等[15]利用小型无人机采集可见光图像并计算图像纹理特征,研究了基于该特征的玉米倒伏面积的提取方法,取得了较高精度;韩文霆等[16]提取了27 项玉米田的纹理特征设计了玉米种植信息提取算法,结果表明该方法面积计算的误差控制在20%以内;郭鹏等[17]对比了可见光下植被指数和纹理特征在棉花、玉米、葡萄作物分类方法,结果表明基于色彩与纹理特征提取方法优于色彩指数的提取方法,总体精度较高,但未尝试对两类特征的联合。
本文在现有研究基础上分别对脱叶机采棉田、未脱叶手采棉田、冬小麦田、裸地的色彩、植被指数和农田纹理特征进行计算和分析,对比色彩、植被指数和纹理特征在农田作物分类提取中的特点,整合各类特征的优势,实现了棉田精确提取和面积估测,进而为棉田精细化管理以及棉田产量精确估测提供一定的支撑。
研究区域位于新疆维吾尔自治区石河子垦区,地理坐标是北纬43°26′-45°20′,东经84°58′-86°24′,平均海拔高度450.8 m,处天山北麓中段,古尔班通古特大沙漠南缘;该地区属于温带大陆性气候,冰冻期长,夏季炎热。
该地区作物种植制度为一年一熟,主要种植经济作物棉花;棉花以机采棉为主,少部分为手采棉,机采棉在9月前后两次喷施脱叶剂,10月收获,手采棉不喷施脱叶剂,进行人工采收。
图1 研究区域示意图Fig.1 Sketch map of study area
本研究数据于2017年9月17日在石河子大学农田实验站内实验获得。实验选用F450 机架配合PIXHawk 飞控(PIXhawk 2.4.6,权盛电子科技股份有限公司,中国)作为低空成像载具,该无人机为4 轴无人机,采用垂直起降方式。该机机身重量282 g,起飞重量800-1200 g,对称电机轴距450 mm;根据该机载荷,选用鹰眼飞萤6S 可见光运动相机(飞萤6S,鹰眼航拍科技有限公司,中国)进行数据采集实验;其飞行高度100 m,采用悬停垂直向下方式拍摄,纵向重复度大于80%,横向重复度大于60%。实验当天天气晴朗,最高气温29 ℃,无风。
无人机所拍摄图像由Agisoft Photoscan 软件(PhotoScan X64,Agisoft 股份有限公司,俄罗斯,http://www.agisoft.ru)进行正射影校正和拼接。在软件中选择高对齐精度和高精度密集点云模式拼接航拍图像获得正射影图像。影像共包含1706×4096 图像源,图像横向分辨率为0.12 m/pixel、纵向分辨率为0.12 m/pixel,面积约为163.32 亩(0.10888 km2)。由于部分影像涉及居民区等因素,为避免对棉田判别算法造成影响,本研究选取了位于研究区域南部的部分地区作为感兴趣区域。感兴趣区域被单独划分出来,面积34 m2,图像大小为784×458,共359072个像素,数据格式为.tif,RGB 三个通道,8 字节存储,亮度范围0-255。
1.3.1 图像特征分析
本研究将感兴趣区域中包含多种地面物体的图像划分为脱叶棉田、未脱叶棉田、冬小麦田、裸地4种类型,每种类型选取3 块区域样本作为训练样本,每个样本区域大小为81×68,共66096 个像素点作为训练集(图2),其余292976 个像素点作为测试集,选取4 种地物特征的典型图像,并提取颜色、植被指数、纹理特征进行分析,从而评选出适于区分不同地物类型的关键特征作为棉田像素判别提取的依据。
图2 各类型地区典型样本Fig.2 Typical sample of fields
1.3.2 特征提取
选用的可见光相机仅采集可见光下红、绿、蓝3个通道的信息,无近红外等其他波段图像的信息。为解决图像分类特征量较少的问题,通过色彩空间变换、植被指数计算、纹理分析等方法进行图像增强得到了更多特征。
植被指数是指利用绿色植被对不同波段的光照敏感性不同的特点,对不同波段进行组合运算,增强图像信息。它本质上是综合考虑各有关光谱信号,把多波段反射率做一定的运算,使有效图像信息增强,同时过滤无效信息[18]。胡勇等[19]研究者选取归一化绿红差异指数[20]、归一化绿蓝差异指数[21]、红绿比值指数[22]、蓝绿比值指数[23]、过绿指数[24]、过红指数[20]、标准植被指数[20]、超绿超红差分指数[25]、植被颜色指数[26]、红绿蓝植被指数[27]、可见光波段差异植被指数[24]等植被指数,各植被指数计算公式如表1所示。同时,图像的色调、饱和度、明度和红、绿、蓝通道值也可作为单一输入变量的植被指数。
计算植被指数以及图像的色调、饱和度、明度和红、绿、蓝通道值,得到共计18 项植被指数特征。
表1 植被指数计算公式Tab.1 Calculation formula of vegetation index
纹理是由灰度分布在空间位置上反复交替变化而形成的,所以在图像空间中相隔某距离的两个像素间存在一定的相关,即图像中灰度的空间相关特性[28]。
灰度共生矩阵是一种比较常见的、区别能力强的描述纹理特征的方法,通过由图像灰度值之间二阶联合条件概率密度所构成的矩阵来反映图像中任意两点间灰度的空间相关特性[29]。
本文对RGB 色彩空间3 通道灰度值采用13×13 的窗口大小,步长取1,移动方向取0°进行纹理特征提取,得到多尺度纹理。
描述纹理特征的统计量采用RGB 各通道均值、方差、协同性、信息熵、二阶矩、相关性。本文得到共计18 项纹理特征。
使用ENVI4.8 软件中的统计功能,选择3 处脱叶棉田、3 处未脱叶棉田、3 处冬小麦田和3 处裸地(图2),计算这些区域36 项特征值。
1.3.3 棉田像素判别和面积估算
主成分分析(PCA)方法是在各个变量之间相关关系研究的基础上,用一组较少的、互不相关的新变量代替原来较多的变量,并使这些新变量尽可能多地保留原来复杂变量所反映信息的一种数据分析方法,具有较好的降维去噪能力[30]。
本文先采用PCA 算法对分别对植被指数和纹理18 个特征进行主成分分析,输出主成分个数为18 个,分别采用2 至18 个主成分为特征进行最大似然分类[31]法判别棉田像素;再采用PCA 算法对全部色彩与纹理特征共36 个特征进行主成分分析,输出特征数为36 个,分别采用2 至36 个主成分为特征进行最大似然分类法[31]判别棉田像素。
统计分类结果中脱叶棉田和未脱叶棉田的像素数量,两类棉田总面积为棉田总面积,如式1 所示,依据空间分辨率计算棉田面积。
以人工目视提取结果为基准计算误差,误差计算方法如式(2)。
式中:S为棉田面积(m2),n为像素点个数,γS为空间分辨率(m2/pixel);
式(2)中:E为误差,S1为人工目视识别棉田的面积(m2),S2为分类算法计算的棉田面积(m2)。
判别中分别基于植被指数特征、纹理特征和综合特征对脱叶棉田、未脱叶棉田、冬小麦田、裸地图像PCA 处理,再采用最大似然分类法判别棉田,分别对脱叶棉田面积、未脱叶棉田面积和棉田总面积与人工目视标记结果进行对比计算误差。
棉田面积计算误差如图3所示,判别结果如图4所示。
图3 棉田面积误差Fig.3 Error of cotton field area
图4 判别结果图Fig.4 Classification results
由图3a 可知:基于植被指数的分类方法主成分个数为6 个时,总面积误差相对较小。该条件下计算的棉田总面积误差为13.11%,脱叶棉田面积误差为12.38%,未脱叶棉田面积误差为13.90%。判别结果如图4a 所示。
由图3b 可知:基于纹理特征的分类方法当主成分个数为5 个时总面积误差最小,但脱叶棉田和未脱叶棉田的误差均较大。由图4b 可见:部分脱叶棉田与未脱叶棉田相互错分,导致了总体误差小于两类棉田各自的分类误差。通过观察图3b 可以发现当主成分个数在2-7 个时,全部棉田的误差与两类棉田误差呈现不规则分布。随着主成分个数的增加,模型分类准确率逐渐提高。当主成分个数在8-18 个分时,全部棉田误差稳定的分布在两种棉田误差之间,同时总体误差趋于稳定。这表明两种棉田相互出错误判别的情况减少,分类误差逐步趋于稳定。在纹理分类方法主成分个数为8-18 范围内,主成分个数为10 个时误差最小,面积误差为1.99%;脱叶棉田面积误差为0.97%,未脱叶棉田面积误差为5.17%。判别结果如图4c 所示。
由图3c 可知:两类特征综合分类方法主成分个数为30 个时总面积误差最小,总面积误差为0.51%;脱叶棉田面积误差为0.32%,未脱叶棉田面积误差为0.72%。判别结果如图4d 所示。
(1)基于植被指数的分类方法在棉田面积判别中的误差为13.11%。由图3a 可知该方法在多数主成分个数条件下(前5 个主成分条件下除外)脱叶棉田的误差较大,而未脱叶棉田的误差相对较小。脱叶棉田误差主要是由于脱叶棉田与裸地在植被指数上差别不够显著,因此该方法判别脱叶棉田的精度较差。
同时,脱叶棉田误差和未脱叶棉田误差始终分布在总体误差两侧,说明在植被指数空间内脱叶棉田与未脱叶棉田混淆的现象不明显,脱叶棉田与未脱叶棉田在植被指数上的差别较为明显。
该方法主成分个数大于6 时,误差随着主成分个数的增加而增大,表明该方法所选特征中有部分特征噪声,干扰棉田面积判别。
(2)基于纹理特征的分类方法在棉田分类中的误差为1.99%,该方法在主成分大于8 个时,对脱叶棉田和未脱叶棉田的判别误差均明显小于基于植被指数特征的判别方法。该方法在主成分小于8 个时,出现脱叶棉田误差与未脱叶棉田误差均大于总体误差的现象。
通过观察图4b 可以发现部分脱叶棉田与未脱叶棉田错分现象,说明脱叶棉田与未脱叶棉田在纹理上的区别不够显著。同时该方法结果中脱叶棉田分类误差小于总体误差和脱叶棉田误差,说明脱叶棉田在纹理特征上与其他地物区别较为明显,该方法对脱叶棉田的判别精度高于未脱叶棉田。
(3)基于综合特征分类方法中的误差为0.51%,较其他两类方法有较为明显的降低。该方法在主成分个数大于15 个时趋于稳定,而且脱叶棉田与未脱叶棉田的误差分布于总体误差两侧,脱叶棉田与未脱叶棉田相互混淆的现象不明显。
表2 不同判别方法结果与误差Tab.2 Results and errors of cotton field area extraction
本文借助无人机低空成像技术的优势,利用可见光相机采集棉田及周边图像,通过对比分析植被指数特征和纹理特征在区分脱叶棉田、未脱叶棉田、冬小麦田、裸地的效果,结果发现:
(1)植被指数特征在区分未脱叶棉田上具有一定优势,纹理特征在区分裸地和脱叶棉田上具有显著优势。
(2)综合两类特征的优势,采用PCA 算法结合两类特征,借助最大似然分类法判别棉田像素,最终得到棉田面积估测误差为0.51%,其中脱叶棉田误差为0.72%,未脱叶棉田误差为0.32%,表明该方法可以比较有效的计算棉田面积,可为收获期棉田面积测量和空间分布分析提供参考。