王蕊,程海龙,黄如兵
1.山东交通学院 交通土建工程学院,山东 济南 250357; 2.中国水电八局有限公司,湖南 长沙 410004;3.中国重型汽车集团有限公司,山东 济南 250101
近年来遥感技术发展非常迅速,应用越来越广泛,其在灾害监测、环境调查、土地利用情况监测等方面发挥着重要作用[1]。原始的土地分类方法(如求积仪法)具有比较高的出错率,精度较低,研究结果主要以纸质的形式体现,研究成果的更新和应用比较困难[2]。而遥感技术有即时、快速、精确、周期短等特点,已成为目前土地分类中高效的技术手段之一[3-6]。
目前基于遥感数据的土地资源分类方法较多,传统的遥感影像分类方法主要有非监督分类和监督分类2种。监督分类包括最小距离法[7]、平行管道法和最大似然法[8]等,非监督分类包括K-Means法和ISODATA法[9-10]。这几种分类法都是基于遥感图像中地物光谱特征的差异进行地物分类,并未考虑到遥感图像中地物的空间信息和几何信息,其地物分类结果精度较低[11-12]。Basrin[13]对多种监督分类法进行比较,并对这些分类法进行分析与评价。朱建华等[14]利用自适应最小距离法对泰吉河流域遥感图像进行分类,分类结果较好。
随着遥感技术的不断发展,从遥感图像中提取信息的方法不断变化,先后分别有目视判读、计算机解译、提取光谱特性、提取光谱与纹理结合特征等方法[15]。虽然遥感数据中有很多信息,但同时也可能存在信息间相互干扰的问题,从而增大分类识别的难度。因此如何实现多类别分类,提高分类精度,成为目前研究的难点[16]。高志强等[17]使用遥感技术和GIS技术,研究分析了我国土地资源的利用情况。贾坤等[18]深入探讨了遥感影像分类方法,分析了其研究现状。
随着遥感图像的广泛应用,随之出现了一些遥感图像分类的新方法。其中,决策树法分类过程直观、快速,且有高准确度等特点,因此其应用非常广泛[19-20]。该分类法以逐级划分的形式,将影像的辅助信息(纹理信息、地形信息等)融入到整体系统中,并且对分支点参数进行逐步优化,从而提高遥感图像的分类精度[21-22]。
本文以安徽省安庆市怀宁县为研究区域,探讨分析不同分类方法的精确性和适用性。以Landsat遥感图像为数据源,分别采用K-Means、最大似然、最小距离、基于专家知识的决策树分类4种分类方法进行该研究区域的土地资源分类,比较和分析各种分类法的结果,评价各种方法的分类精度,从而找出适合该研究区域的土地资源最优分类方法。
安庆市怀宁县位于安徽省西南部、长江下游北岸,该区东临安庆市,西邻潜山和太湖,北邻桐城,南邻望江。县域面积1276 km2。人口70万人,辖20个乡镇。该研究区域属亚热带季风湿润区,具有气候温和、雨热同期、降水适中、光照充足、无霜期长等特点。
本研究数据来自Landsat ETM+遥感图像[23],采用ENVI5.1软件对Landsat ETM+遥感图像数据进行预处理,以消除大气等因素造成的影响,从而获取真实的地表反射率。
预处理包括:1)使用工具箱中的Radiometric Correction→Radiometric Calibration模块辐射定标;2)运用FLAASH校正模块进行大气校正;3)采用ENVI5.1矢量裁剪工具,利用怀宁县矢量边界对遥感图像进行裁剪,得到该研究区域的遥感图像,如图1所示。
图1 研究区域遥感图像
数据处理流程如图2所示,主要包括:Landsat7 ETM+遥感图像数据下载;遥感数据的预处理(辐射定标、大气校正、影像裁剪);K-Means、最大似然、最小距离、基于专家知识的决策树法4种遥感影像分类方法的分类精度评价及结果比较分析。
图2 数据处理流程
以Landsat7 ETM+遥感图像为数据源,利用Arcgis10.2从全国县边界矢量图中提取研究边界矢量数据,利用ENVI 5.1对遥感数据进行处理,采用K-Means、最大似然、最小距离、基于专家知识的决策树法4种不同分类方法,分别对研究区域土地资源利用信息进行提取,再结合研究区域的谷歌地图卫星影像图,对比各种方法的分类结果图,评价各种方法的分类精度。
综合考虑研究区域的情况和Landsat7 ETM+遥感图像的特点,依据国家颁布的分类标准[24],确定该区域的土地利用类型。选取谷歌卫星地图影像数据[25]作为基础参考数据,采用Landsat ETM+遥感图像的543波段组合,最终将该区域的土地资源分为水体、建设用地、农田、林地和裸地5类。
采用K-Means、最大似然、最小距离和基于专家知识的决策树法4种具有代表性的分类方法对研究区域的影像数据进行分类,分类结果如图3所示。
图3 4种方法的分类结果
由图3可知:1)图3a)中,区域土地分成了建设用地、水体、农田(林地)和裸地4类。林地和农田因为波谱特性相近而没有区分开,被分成了一类,裸地与建设用地的区分也不明显,因此K-Means分类法误差相对较大,分类效果差; 2)图3b)、3c)的土地类别划分较清楚,两者对建设用地的划分差距较大,图3b)中建设用地分布较少,图3c)中建设用地分布较多,图3b)与谷歌卫星图较贴近,但两种方法对林地的划分结果都较差;图3各图对水体的分类结果相对来说都比较接近;图3d)最贴近卫星图,各类土地与实际土地类别分布误差较小,即基于专家知识的决策树法的分类结果更准确。
综上分析,4种分类方法中,分类效果最差的是K-Means分类法,最好的是基于专家知识的决策树分类法。
采用混淆矩阵进行精度评价,从混淆矩阵中计算多种精度统计值,具体包括:运行误差(图像的某一类地物被错分到其他类别的百分比)、结果误差(实际某一类地物被错误地分到其他类别的百分比)、用户精度(从分类结果图中任取一个随机样本,其所具有的类型与地面实际类型相同的条件概率)、制图精度(实际任意一个随机样本与分类图上同一地点的分类结果相一致的条件概率)、总体精度(正确分类样本数/总检验样本数)和Kappa系数(该值越高,分类精度也越高),以此来了解各种分类方法的分类精度,确定各分类方法的准确度。利用ENVI5.1软件得到4种分类方法的运行误差、结果误差、用户精度、制图精度及总体精度如表1~4所示。
表1 K-Means法分类精度评价结果 %
表2 最大似然分类精度评价结果 %
表3 最小距离分类精度评价结果 %
表4 基于专家知识的决策树分类精度评价结果 %
由表1~4可知:1)K-Means法精度参数普遍较低,其中裸地的用户精度最高,为80.65%,建设用地的用户精度最低,为8.85%,其他3种方法建设用地的分类精度都达到了80%以上;2)农田和林地的光谱特性有一定的相似性,容易混淆,不易区分,K-Means法将农田和林地分成了一类,最大似然法对农田和林地的分类更精确,农田的用户精度达到82.98%;3)4种方法中,最小距离分类法对裸地的分类精度最低,用户精度为57.90%;4)4种分类方法对水体的分类精度最高,K-Means法的用户精度达到了70%以上,其他3种分类方法都达到了90%以上;5)4种方法的总体分类精度都超过了90%,基于专家知识的决策树分类法总体精度最高,达到了97.23%;6)4种方法的Kappa系数都在0.75以上,K-Means法的Kappa系数最小,为0.76,决策树分类法的Kappa系数最大,为0.92。
综合比较4种分类方法的建设用地、农田、林地、裸地和水体5类土地的分类结果,基于专家知识的决策树方法对该研究区影像的分类结果最好,精度最高。
本文对安庆市怀宁县土地的Landsat ETM+遥感图像进行辐射定标、大气校正和裁剪,分别采用K-Means、最大似然、最小距离、基于专家知识的决策树法4种分类方法对土地进行分类处理,结合谷歌卫星图对4种分类方法的分类精度进行比较。4种分类方法中,K-Means分类法对建设用地、农田、林地、裸地和水体5类土地分类的效果最差,基于专家知识的决策树分类法的分类效果最好,总体精度最高,Kappa系数最大。