陈利军,陈 军,廖安平,何超英
(国家基础地理信息中心,北京100830)
地表覆盖(land cover)是指地球表面各种物质类型及其自然属性与特征的综合体,科学准确地测定其空间分布与动态变化,对于研究地球系统的能量平衡、碳循环及其他生物地球化学循环、气候变化等有着十分重要的意义[1-2]。国际社会十分重视全球地表覆盖及其变化研究。经过多年努力,国际上相继研制了6套全球地表覆盖数据产品,其中4套空间分辨率为1 km,2套空间分辨率为300m。这些产品已在全球变化研究与地球模式模拟中得到了广泛应用。随着遥感技术的快速发展,全球变化研究与地球模式发展对全球地表覆盖数据产品提出了新的需求,期望发展具有较高时空分辨率、更加符合全球变化需要、精度较好的全球地表覆盖数据产品。
30 m分辨率是用于描述全球地表覆盖及其变化的最佳尺度,可以更好地刻画人类活动对陆面过程的影响,提高环境模型模拟过程中参数化的灵活[3]。同时,全球30 m分辨率的遥感数据十分丰富(如 Landsat MSS/TM/ETM+、ASTER、环境减灾卫星、CBERS等),已完成全球范围的多期无缝覆盖,为全球地表覆盖遥感制图提供了数据保障。此外,地物要素的遥感提取算法也得到了很大的发展,为全球地表覆盖遥感制图提供技术保障。
但是,30 m尺度的影像光谱纹理信息比较复杂,空间分辨率的提高使得复杂的地物纹理特征得以显现,复杂的光谱纹理特征又会造成地表覆盖信息方法提取的相应繁杂。在区域尺度上,单一分类算法即可胜任地表覆盖的信息提取;而全球范围内地表复杂多样,光谱差异大,单一的分类算法则缺乏通用性。Lu等[4]对当前分类方法进行分析归纳,并把目前的分类方法总结为子像元分类、像元级分类、对象级分类、基于上下文信息的分类、基于先验知识的分类与多分类器结合分类等6类,分类方法总数达到数十种,但各种方法均有一定的适用范围及缺陷,不能直接运用于全球地表覆盖遥感制图。
鉴于30 m影像上复杂地物直接进行多要素分类存在的种种问题,单要素提取方法逐渐得到快速发展。该方法通过逐一分析影像上每一类地物的特征,逐次完成各类地物的提取,而不求一次性的完成所有地物的提取。目前,单要素提取算法在某些地物类型提取方面已经达到较高的精度。如Xiao等使用MODIS 8天合成的植被指数时间序列数据,利用作物的物候特征分别完成了中国南部、南亚与东南亚地区水田的提取[5];Rosenqvist等使用日本地球资源卫星的雷达数据,完成了全球雨林制图[6];Hasen等使用500 m分辨率的MODIS数据研究全球森林覆盖[7];Hall等使用MODIS数据,利用归一化差值积雪指数进行全球冰雪的提取[8];Frazier等使用 TM数据进行水体要素的提取实验[9];Miyazaki等使用 ASTER 数据,利用局部-全局一致性学习算法(LLGC)完成了全球城市区域的提取[10]。因此,在全球地表覆盖制图过程中采取单要素逐层提取的方式,即层次分类的策略,在一定程度上降低了全球范围内由于区域、时相与地物类型差异造成的分类误差,进一步提高制图效率和精度。本文主要针对中国开展的30 m全球地表覆盖遥感制图工程,初步探索新一代全球30 m地表覆盖遥感制图的总体思路。
全球地表覆盖遥感制图是一项庞大的遥感应用工程,其自动化与智能化水平直接影响着工程效率与产品质量。从遥感影像中提取地物的分类算法,是全球地表覆盖制图精度的关键。目前,利用自动分类结合人工解译仍是进行大尺度遥感分类的主导方法,这种方法具有算法成熟、充分利用人机交互优势的特点,但也存在着用时长,对参与解译分析的人员依赖性强,可重复性低的局限,难以迅速、准确、客观地获取大面积地表覆盖信息。为了提高遥感分类算法的计算效率和自动化程度,30 m全球地表覆盖遥感制图采取层次分类策略的提取思路,即分层、特征提取、多分类器集成与基于专家知识的人工编辑等(见图1)。
图1 层次分类策略示意图
首先,为了降低由于区域差异造成的地物类型复杂性,依据全球地表覆盖分类体系,根据全球地形、土壤、气候、植被及影像光谱等特性所反映的下垫面差异,将全球划分为865个地表覆盖类型差异明显的生态地理区,尽可能地减少每个生态地理分区中分布的地表覆盖类型数量,避免了因大范围区域地物类型复杂多样造成的分类精度低的问题,提高遥感分类的效率和精度[11]。
其次,根据分类算法的需要对30m分辨率影像进行分类前特征向量选择与提取。有文献表明分类过程中特征向量的选择是影响分类成功与否的关键因素[4]。计算分类时所需要的诸多光谱和纹理特征,如植被指数、纹理信息、缨帽变化的湿度、亮度分量、裸地指数、居民地指数等,可以作为分类器的输入向量,提高分类精度。
再次,通过分析比较目前传统单要素分类算法的优缺点,采取了单要素分层掩膜分类方法,即逐次完成单一地类的提取,完成后掩膜继续进行下一类地物的提取,这样有利于减少其他不相关地物对单要素提取算法的影响。具体做法是依次提取水体—水体掩膜—提取湿地—湿地掩膜—提取冰雪—冰雪掩膜—提取人造覆盖—人造覆盖掩膜—提取耕地—耕地掩膜—提取裸地—裸地掩膜—综合提取林灌草类型,各单类型提取采取不同的分类器,如水体和人造覆盖采用决策树的分类方法、耕地采用多源信息融合的方法、林、灌、草、裸地采用基于先验概率的分类方法、冰雪采用自动阈值的分类方法、湿地和苔原采用人工提取的方式等。单类型提取完成后,最终对各分类结果进行集成形成最终的分类结果。
最后,在多分类器集成基础上,基于自主研发的人机交互式编辑软件,利用专家知识和参考资料对自动提取过程中出现错分、漏分等问题,进行人工控制和修改,使分类结果达到最优。
通过层次分类策略的引入,逐步降低全球地表覆盖制图中由于区域、时相与地物类型差异造成的分类误差,可以进一步提高制图效率和精度。
以陕西省为例,采用13景2009年Landsat5 TM影像,分别采用层次分类策略、SVM、J48、RF(Random Forest)和贝叶斯等几种分类方法进行分类,然后采用同样的检验样本进行检验。检验样本为遍布试验区的3291个多边形,计34 462个像元。其结果如表1所示:层次分类策略的总体分类精度为78.56%,Kappa系数为 0.719 8,而其他分类方法中最高的为SVM分类方法,其总体分类精度为73.36%,Kappa 系数为0.608 0。
表1 陕西试验区各种分类方法的精度比较
虽然,总体分类精度相近,但几种分类方法的分类结果迥异。以层次分类策略和SVM为例,从表2、表3的混淆矩阵中可以看出:利用层次分类策略,单个类型的精度都能保障在60%以上;而利用SVM分类方法,除了耕地、森林、水体的精度较高外,其他类型的精度都在60%以下,其中草地仅为6.26%。从错分率和漏分率看,两种分类方法都集中在草地和灌木类型,如错分率分别为72.44%和48.51%,漏分率分别为37.43%和93.74%,但两种分类结果的精度差异较大,草地的分类精度分别为62.6%和6.26%,灌木的分类精度分别为71.5%和56.01%,层次分类策略的分类结果明显要优于SVM的分类结果。
表2 层次分类策略的混淆矩阵、错分与漏分统计表 (%)
表3 SVM分类方法的混淆矩阵、错分与漏分统计表 (%)
从类型所占的面积比例看,两种分类结果除森林、裸地的比例相近外,其他类型相差达3% ~20%不等。如SVM分类方法将耕地错分为耕地、灌木、裸地和人造覆盖的比例高达79.78%、46.55%、43.34%和42.32%(如图2局部实例所示);而采用层次分类策略,耕地错分为草地、灌木、裸地和人造覆盖的比例仅为 10.5%、0、1.34% 和 18.3%。由于层次分类策略采取了单类型分层提取的方式,通过层层控制的方法,能够将错分比例降低到最低,有效地保证了单个类型的分类准确度。
图2 局部区域两种分类结果的比较
为了验证利用层次分类策略提取地表覆盖方法的通用性和结果的精度,除了陕西试验区,在全球范围内又选择了俄罗斯贝加尔湖地区、马来西亚西岛、德国中部、西班牙巴塞罗那地区、北非突尼斯、南非西南部、北美加拿大东南沿海地区、南美巴西亚马逊河流域中游、澳大利亚塔斯马尼亚岛等9个地区,分别采用这些试验区的4-6景TM影像进行了地表覆盖遥感制图的试验。
由表4可以看出,除马来西亚试验区精度较低外,其他试验区总体精度在70.4% ~90.26%之间,Kappa系数在0.622 8~0.851 0之间。而马来西亚试验区精度偏低的原因是该区域常年为厚云覆盖,遥感影像质量不佳所造成。由此可见,基于层次分类策略的地表覆盖信息提取方法可以较好地完成全球不同试验区地表覆盖信息的提取,算法鲁棒性与通用性较强,可以用于30m分辨率全球地表覆盖产品的研制。
表4 10个试验区地表覆盖提取精度情况表
由于全球范围内地表覆盖复杂多样,光谱差异大,单一的分类算法进行遥感制图缺乏通用性,因此,本文以全球地表覆盖遥感制图工作为依托,针对提出的基于“分区—特征提取—多分类器集成—基于专家知识的人机交互”的层次分类策略进行了试验分析。结果表明,层次分类策略要优于传统的分类方法,如SVM、J48、RF和贝叶斯算法等。通过在10个典型试验区的地表覆盖提取试验,除受大面积云影响的马来西亚试验区精度为65%之外,总体分类精度均达到70%以上,具有较强的鲁棒性和通用性,可以用于30m分辨率地表覆盖产品的生产。
[1]FOLEY J.2005.Global Consequences of Land Use[J].Science,2005(309):570-574.
[2]葛全胜,戴君虎,何凡能,等.过去300年中国土地利用、土地覆被变化与碳循环研究[J].中国科学:D辑地球科学,2008,38(2):197-210.
[3]LOVELAND T.Global Land Cover Initiative:A Concept Paper for GEO[R].Sioux Falls:USGSEROSDate Center,2010.
[4]LU D,WENGQ.A Survey of Image Classification Methods and Techniques for Improving Classification Performance[J].International Journal of Remote Sensing,2007,28(5):823-870.
[5]XIAO X,BOLESS,FROLKING S,etal.Mapping Paddy Rice Agriculture in South and Southeast Asia Using Multi-Temporal MODIS Images[J].Remote Sensing of Environment,2006(100):95-113.
[6]ROSENQVISTA,SHIMADAM,CHAPMANB,etal.TheGlobalRainForestMappingProject-aReview[J].InternationalJournalofRemoteSensing,2000,21(6/7):1375-1387.
[7]HASENM,DEFRIESR,TOWNSHENDJ,etal.Global PercentTreeCoveratASpatialResolutionof500Meters FirstResultsoftheMODISVegetationContinuousFields Algorithm[J].ErathInteractions,2003,7:1-15.
[8]HALLD,RIGGSG,SALOMONSONV.Developmentof MethodsforMappingGlobalSnowCoverUsingModerate ResolutionImagingSpectroradiometerData[J].Remote SensingofEnvironment,1995(54):127-140.
[9]FRAZIERP,PAGEK.WaterBodyDetectionandDelineationwithLandsatTMData[J].PhotogrammetricEngineering & RemoteSensing,2000,66(12):1461-1467.
[10]MIYAZAKIH,SHAOX,IWAOK,etal.GlobalUrbanAreaMappinginHighResolutionUsingASTERSatelliteImages[C]∥InternationalArchivesofthePhotogrammetry,RemoteSensingandSpatialInformationScience:XXXVIII(8).Kyoto:[s.n.],2010.
[11]DEFOURNYP,VANCUTSEMC,BICHERONP,etal.GlobCover:A300mGlobalLandCoverProductfor2005 UsingEnvisatMERISTimeSeries[C]∥ ProceedingsofISPRSCommissionVIIMid-termSymposium:RemoteSensing:fromPixelstoProcesses,Enschede:[s.n.],2006.