基于移动窗口Fourier变换的高分辨率遥感影像森林分类研究

2019-01-09 02:12葛宏立于晓辉MulundaChristianIlunga
浙江林业科技 2018年5期
关键词:纹理树种向量

孟 森,葛宏立,于晓辉,Mulunda Christian Ilunga



基于移动窗口Fourier变换的高分辨率遥感影像森林分类研究

孟 森,葛宏立,于晓辉,Mulunda Christian Ilunga

(浙江农林大学 浙江省森林生态系统碳循环与固碳减排重点实验室,浙江 杭州 311300)

以2008年4月获取的浙江省杭州市临安区东部区域分辨率为0.5 m的WorldView-1全色波段影像为数据源,在移动窗口基础上进行二维Fourier变换,构建纹理特征向量,采用不同的分类方法对森林进行分类,以寻找合适的移动窗口尺寸和分类方法。移动窗口按奇数从3×3增大到43×43,共21个不同尺寸的正方形窗口,每个边长窗口产生的纹理特征均采用Fisher判别法、随机森林、支持向量机、夹角余弦和相关系数进行分类,统计分类精度。以森林分类精度为依据,5种分类方法对应的最佳窗口依次为41×41,41×41,23×23,39×39和39×39;在最佳窗口下,5种分类方法区分森林与非森林的精度均在95%以上,总分类精度大小顺序为:Fisher判别法>随机森林>支持向量机>相关系数>夹角余弦,其中Fisher判别法总精度为99.81%,Kappa系数为0.996 3。在提取森林的基础上,进一步对森林树种(组)进行分类,总精度大小顺序为:Fisher判别法>随机森林>支持向量机>相关系数>夹角余弦,其中Fisher判别法总精度为84.86%,Kappa系数为0.814 9。研究结果表明,最佳窗口下Fisher判别法的分类性能优于其他4种分类方法。

移动窗口;二维Fourier变换;纹理特征;Fisher判别法;WorldView-1高分辨率遥感影像

基于遥感影像分类技术提取森林的分布信息是森林资源调查和监测的一个发展方向。高空间分辨率遥感数据具有更多体现细节信息的纹理特征,更有利于森林的识别和分类。纹理特征反映的是地面的粗糙程度和地物之间的结构信息及与周围环境的关系,进而反映出各种地物空间变化的重要信息[1]。不同地物的纹理具有不同的周期规律,对纹理特征进行分析可以识别不同的地物。Fourier变换技术是纹理分析的一个有力工具,被广泛应用于图像的处理和分析[2-3]。Fourier变换先将图像空间信息转化为频谱信息,进而对频谱信息进行分析以获得结果。Zhou等将图像裁剪为8×8的正方形窗口,对Fourier变换系数进行直方图统计和分析来提取纹理特征作为图像检索的依据[4]。Kazemi等利用Fourier变换、小波变换和曲波变换3种方法分别对车辆图像进行识别分析,精度均达到90%以上[5]。Li等利用Fourier变换将掌纹图像变换到频域,在频域中提取特征和描述以此用来索引掌纹数据库[6]。Tasi等利用Fourier变换的功率谱来检测工业原料(砂纸、皮革和铸件)上的纹理缺陷[7]。朱小燕等利用Fourier变换对单字和多字图像进行Fourier周向谱分布关系进行研究,建立了基于Fourier变换的单字和多字图像的识别标准[8]。陈竹修提出一种新的基于Fourier变换的形状上下文描述方法,将全局采样点的信息有机结合到采样点特征描述中去,使匹配更为精准、描述也更为简洁[9]。徐贵力等利用Fourier变换的共轭对称特性,提出长方环Fourier周向谱能量百分比算法提取图像纹理特征[10]。

以上Fourier变换应用的研究对象比较简单,图像尺寸较小、纹理相对单一、信号相对平稳、Fourier变换相对来说容易取得较好的效果。另外Fourier变换通常基于整幅图像。但森林高分辨率遥感影像的纹理复杂,随机性大,区域大,包含的地类和森林树种多样,信号非平稳,基于全局的Fourier变换已不能满足频谱分析需要。为解决Fourier变换不能反映出非平稳信号的局部特征,采用基于移动窗口的Fourier变换技术来体现其局部性,即短时或窗口Fourier变换[11-14];虽然窗口Fourier变换能够规避Fourier变换的局部缺陷,但其窗口过大导致分辨率低,过小引起频谱分析不精准。目前将这种方法用于森林分类研究的鲜有报道。本研究采用移动窗口二维Fourier变换的方法构建频谱特征,然后基于这些频谱特征采用Fisher判别法、随机森林法(Random Forest,RF)、支持向量机法(Support Vector Machine,SVM)、夹角余弦(Included Angle Cosine,IAC)和相关系数(Correlation Coefficient,CC)5种分类方法进行分类和精度分析。窗口的大小从3×3,5×5……43×43,根据精度的比较来确定最佳窗口。

1 研究区概况与研究方法

1.1 研究区概况

杭州市临安区位于浙江省西北部,118°51 ~ 119°52' E,29°56' ~ 30°23' N,地处天目山区。该区域属于亚热带季风区,年均降水量1 613.9 mm,四季分明,地形复杂多样。临安区森林资源丰富,全区森林覆盖率为76.55%;研究区位于临安区的东部(见图1)。研究数据是2008年4月获取的高分辨率WorldView-1全色波段影像,空间分辨率为0.5 m,研究区大小为2 500×2 500个像素。将地物分为森林和非森林,森林包括阔叶林、雷竹‘’林、马尾松林、毛竹‘Pubescens’林、杉木林、针阔混交林;非森林包括道路、农地、水体等3大类9种地类。野外通过GPS定位,选取74个典型正方形样块,用于建模的训练样块和用于精度检验的检验样块各37块,见表1,样块分布见图2。由于地类较为破碎,样块的大小不统一。

图1 研究区域

Figure 1 Location of study area

图2 样块分布

Figure 2 Distribution of sample plots

表1 样块信息

Table 1 Information of sample plots

1.2 研究方法

1.2.1 二维Fourier变换 图像是非连续的信号,即为二维离散数据。对于窗口大小M*N的数字图像其离散Fourier变换(DFT)公式为:

(,)=(,)+(,)

(,)为其实部,(,)为其虚部,频率对应于轴,频率对应于轴,其Fourier变换的振幅谱(或称频谱)为:

1.2.2 基于样块的样本提取 对每一样块用Matlab软件进行如下操作:

(1)读取样块数据;

(2)设定一个边长为的正方形窗口。以=3为例说明过程。在样块上逐行、逐像素移动,每次移动得到一个×的窗口矩阵,如图3A所示,对此窗口进行二维Fourier变换,得其振幅谱,其也是一个×矩阵;

(3)将此振幅谱转化为一维向量,如图3B所示;

图3 窗口移动和数据转换

Figure 3 Window moving and data transfer

(5)将剔除重复数据后的一维数据作为窗口中心像素的纹理特征(样本)向量。

设某个样块的边长与窗口的边长分别和,变换后得到[-2int(/2)]2个样本且每个特征向量有=(2+1)/2个特征,见表2。

表2 样本和特征数量

Table 2 Number of samples and features

1.3 分类方法

用Fisher判别法,RF,SVM,IAC和CC等方法对样本向量数据进行分类,用训练数据进行建模,检验数据进行精度分析。

1.3.1 Fisher判别法 Fisher判别法是通过将多维数据投影到某个方向上,尽可能扩大类间差异,缩小类内差异,利用投影后的数据选择合适的判别规则对未知样本进行分类[16]。Fisher判别模型可以表示为:

1.3.2 随机森林和支持向量机 RF是一种基于组合决策树对样本进行训练并预测的非线性工具,具有很高的预测准确率且对异常值和噪声有很好的容忍度[17-19]。

SVM在解决小样本、非线性及高维模式识别问题中表现出许多特有的优势,其最大特点是依据结构风险最小化原则,最大程度的改善模型的泛化能力[20-22]。

RF和SVM的模型参数设置对分类精度有一定的影响[22],本文通过设置合适的模型参数基于R语言软件实现其分类。

1.3.3 夹角余弦 IAC亦称为相似系数是表征两个随机向量相似程度的指标,用其之间的余弦值表示,其值越大向量之间的相似程度越大,即最小角度原则[23-25]。

用训练样本计算每个类的平均向量作为各自类的参考向量。设第个类的参考向量为s1,s2,……,sn,对某一未知类别的特征向量1,2,……,n(下同),分别计算它与m个类别的夹角余弦值,公式如下:

1.3.4 相关系数 CC是表征两个随机变量或两路信号之间统计关系强弱的指标[26-29]。计算公式如下:

2 结果与分析

2.1 森林树种(组)分类最佳窗口确定

移动窗口的大小与分类精度有关,确定最佳窗口大小是一个重要环节。一般来说,森林与非森林之间因为特征差异明显,区分较为容易,而森林树种(组)之间的特征接近,区分难度较大,故先探讨森林树种(组)之间的最佳分类窗口。

对于6种森林树种(组),基于5种分类方法的21个不同边长(为奇数)的窗口(从3×3到43×43)的分类总精度和Kappa系数变化情况见表3和图4。由表3和图4可知,随着窗口的不断增大,5种分类方法总精度和Kappa系数逐渐提高,其中Fisher判别法和RF在窗口边长=41时总精度和Kappa系数达到最高,分别为84.88%和0.815 2,81.72%和0.775 6;SVM在=23时达到最高,总精度和Kappa系数分别为75.30%和0.696 9,略低于前2种方法;IAC和CC在=39时总分类精度和Kappa系数达到最高,分别为50.63%和0.395 8,51.65%和0.408 6,远远低于前3种方法的分类精度。所有方法在分类精度达到最大值之后趋于平稳或略有降低。

综上所述,Fisher判别法、RF、SVM、IAC和CC最佳窗口分别为41×41,41×41,23×23,39×39,39×39。

表3 不同分类方法和不同窗口大小的森林分类精度与Kappa系数比较

Table 3 Accuracy of forest and Kappa coefficients by different classification methods and different window sizes

注:带*者为相应栏目中的最大值。

Figure 4 Comparison on accuracy of forest and Kappa coefficients by different classification methods and different window sizes

2.2 森林与非森林分类

实际应用中,有时只提取森林而不用对森林树种(组)进一步分类,有时则要求对树种(组)进行分类。一般先提取森林,然后在此基础上进行树种(组)细分。所以不管哪种情况森林提取是一个重要的步骤。将6种森林树种(组)合并后与3种非森林地类进行分类。在相应的森林分类最佳窗口下,5种分类方法的分类结果见表4和图5。

表4 不同分类方法的森林与非森林分类精度和Kappa系数比较

Table 4 Comparison on accuracies of forest and non-forest and Kappa coefficients by different classification methods

注:PA为生产者精度;UA为用户精度。下同。

由表4和图5可知,5种分类方法对森林与非森林的分类精度均在95%以上,其中Fisher判别法的分类精度高达99.81%,比森林内部的分类精度高很多,所以本研究在此基础上,剔除非森林区域,对剩下的森林区域用前面寻找最佳窗口时建立的模型进行6个森林树种(组)的进一步细分。

图5 不同分类方法的森林与非森林分类精度和Kappa系数比较

Figure 5 Comparison on accuracies of forest and non-forest and Kappa coefficients by different classification methods

2.3 森林树种(组)的最终分类结果

在剔除非森林地类的基础上进行6个森林树种(组)细分,结果见表5。

表5 最终森林分类精度和Kappa系数比较

Table 5 Comparison on classification accuracies of forest and Kappa coefficients by 5 methods

因为传递了森林与非森林分类的误差,所以其总精度和Kappa系数与森林内部的分类结果即表3中带*号的数字相比,略有降低,但降低幅度很小,这是因为森林与非森林的分类精度很高。5种方法的相对优劣排序与上文一样,也是Fisher判别法表现最好,总精度和Kappa系数为84.86%和0.814 9(表3中为84.88%和0.815 2)。5种分类方法的最终分类结果见图6。

Figure 6 Classification maps by 5 methods

2.4 不同分类方法的分类效果比较

由表4可知,Fisher判别法森林与非森林总分类精度比RF、SVM、IAC和CC的高,分别高出了0.72%,0.42%,4.17%和4.13%,Kappa系数分别高出了0.014 3,0.007 6,0.079 8和0.079 1。森林与3类非森林地类纹理差异较大,易于区分,故5种分类方法均能取得很好的效果。其中IAC和CC对农地的提取精度较低,生产者精度只有86.71%和87.03%,道路的用户精度仅有35.82%和35.80%,从图6D和图6E可以看出农地和道路分类结果不如前3种方法。

由表5说明,Fisher判别法的森林分类效果最好,总精度为84.86%,比RF、SVM、IAC和CC分别高出了4.16%,9.59%,34.28%和33.30%,Kappa系数为0.814 9,根据Kappa系数的统计意义,分类效果好,比其他的分别高出了0.052 0,0.118 4,0.419 7和0.407 2。RF的分类效果次之。

表5的各森林树种分类精度表明,Fisher判别法和RF各有最高者,生产者精度Fisher判别法占2个,RF占4个,用户精度Fisher判别法占5个,RF占1个。其他方法都没有出现最高的。RF阔叶林和杉木生产者精度仅为43.25%,59.96%,错分多。

SVM的表现处于中间水平,比Fisher判别法和RF的效果差,比IAC和CC的效果好。对阔叶林和杉木错分严重。

IAC和CC的森林分类总精度分别为50.58%和51.56%,Kappa系数为0.395 2和0.407 7,分类效果一般;除了对马尾松与毛竹的提取结果相对较好,其余的结果都很差,其中最主要的原因是阔叶林、雷竹林、杉木林与针阔混交林之间存在较高的误分。另外从图6D和图6E也可以看出,结果图的森林树种分散、破碎化严重,最本质原因是这6种森林树种之间的纹理信息相关或相似度较高,以致个别树种误分严重,这也从侧面折射出IAC和CC对纹理信息不敏感[24]。

通过图6与原遥感影像(图2)目视解译可知,Fisher判别结果图6A与原影像吻合度更高,其余方法整体不如Fisher判别法。

3 结论与讨论

本文以WorldView-1高分辨率森林遥感影像为数据源,采用二维Fourier变换设置21个不同的移动窗口构建9个地类的纹理特征。利用Fisher判别法,RF,SVM,IAC和CC5种分类方法对纹理特征进行分类。在最佳窗口特征下可以得出以下结论:

(1)5种分类方法均能以很高的精度区分森林与非森林,其中以Fisher判别法分类精度最高。

(2)对森林树种(组)的分类,相较于其他4种分类方法,Fisher判别法能够较为准确的区分不同树种。

实验结果表明基于移动窗口二维Fourier变换的纹理特征提取方法,可以用于提取高分辨率遥感影像森林分布信息但是也存在不足之处,随着窗口增大,特征数量激增,易形成“维数灾难”,造成处理数据耗费较大的时间成本[30],需要对特征优化筛选,另外分类时需要对整幅图像进行移动窗口Fourier变换,这个过程计算量巨大,所以大范围研究需要花费很长时间,所以本文仅采用一种遥感影像、在一个区域进行了研究,下一步将采用不同的遥感影像、在不同的区域进行进一步研究;RF和SVM分类模型参数设置,还需要进一步寻找最佳参数组合;本次实验未考虑光谱特征及其他特征等辅助数据,这些还需要进一步验证和分析。

[1] KIEMA J B K. Texture analysis and data fusion in the extraction of topographic objects from satellite imagery[J]. Int J Remot Sens,2002,23(4):767-776.

[2] COOLEY J,LEWIS P,WELCH P. Application of the fast Fourier transform to computation of Fourier integrals, Fourier series, and convolution integrals[J]. IEEE Trans Audio Electroacoust,1967,15(2):79-84.

[3] COOLEY J W,LEWIS P A W,WELCH P D. Historical notes on the fast Fourier transform[J]. Proc IEEE Audio Electroacoust Trans,1967,55(10):1675-1677.

[4] ZHOU F,FENG J F,SHI Q Y. Texture feature based on local Fourier transform[C]. Int Conf Image Proc,2001. Proceedings IEEE,2001,2:610-613.

[5] KAZEMI F M,SAMADI S,POORREZA H R,Vehicle Recognition Based on Fourier, avelet and Curvelet Transforms-a Comparative Study[J]. Int J Comput Sci Network Secur,2007,7:939-940.

[6] LI W X,ZHANG D,UNIVERSITY B,. Palmprint Recognition Based on Fourier Transform[J]. J Software,2002,13:45-51.

[7] TSAI D M,HUANG T Y. Automated surface inspection for statistical textures[J]. Image Vision Comput,2003,21(4):307-323.

[8] 朱小燕,王松. 傅立叶变换在粘连文字图像切分中的应用[J]. 计算机学报,1999,22(12):1246-1252.

[9] 陈竹修. 基于傅里叶变换的形状上下文描述方法[J]. 计算机应用与软件,2007,24(6):140-144.

[10] 徐贵力,毛罕平. 利用傅里叶变换提取图像纹理特征新方法[J]. 光电工程,2004,31(11):55-58.

[11] GAO W,HUYEN N T,LOI H S,Real-time 2D parallel windowed Fourier transform for fringe pattern analysis using Graphics Processing Unit[J]. Optics Express,2009,17(25):23147-23152.

[12] QIAN K. Two-dimensional windowed Fourier transform for fringe pattern analysis: Principles, applications and implementations[J]. Optics Lasers Engin,2007,45(2):304-317.

[13] KEMAO Q. Windowed Fourier transform for fringe pattern analysis[J]. Appl Optics,2008,43(13):2695-2702.

[14] HUANG L,QIAN K,PAN B,Comparison of Fourier transform, windowed Fourier transform, and wavelet transform methods for phase extraction from a single fringe pattern in fringe projection profilometry[J]. Optics Lasers Engin,2010,48(2):141-148.

[15] 肖鹏峰,冯学智,等. 高分辨率遥感图像分割与信息提取[M]. 北京:科学出版社,2012.

[16] 杜靖媛,葛宏立,路伟,等. 基于Fisher判别的层次分类法的森林遥感影像分类[J]. 西南林业大学学报,2017,37(4)175-182.

[17] 方匡南,吴见彬,朱建平,等. 随机森林方法研究综述[J]. 统计与信息论坛,2011,26(3):32-38.

[18] BREIMAN L. Random Forests[J]. Machine Learn,2001,45(1):5-32.

[19] 王书玉,张羽威,于振华. 基于随机森林的洪河湿地遥感影像分类研究[J]. 测绘与空间地理信息,2014,4:83-85.

[20] 田盛丰,黄厚宽. 基于支持向量机的数据库学习算法[J]. 计算机研究与发展,2000,37(1):17-22.

[21] 刘向东,陈兆乾. 一种快速支持向量机分类算法的研究[J]. 计算机研究与发展,2004,41(8):1327-1332.

[22] 黄衍,查伟雄. 随机森林与支持向量机分类性能比较[J]. 软件,2012,33(6):107-110.

[23] 卫俊霞,相里斌,高晓惠,等. 基于K-均值聚类与夹角余弦法的多光谱分类算法[J]. 光谱学与光谱分析,2011,31(5):1357-1360.

[24] 褚忠信,赵骞,黄海挺. 基于相似系数的1种算法在遥感图像分类中的应用[J]. 中国海洋大学学报:自然科学版,2003,33(5):791-794.

[25] 骆玉霞,陈焕伟. 角度分类与距离分类器比较研究——以盐渍土分类为例[J]. 国土资源遥感,2002,14(2):46-48.

[26] 徐维超. 相关系数研究综述[J]. 广东工业大学学报,2012,29(3):12-17.

[27] GIBBONS J D,CHAKRABORTI S. Nonparametric Statistical Inference" 3rd[J]. J R Stat Soc,1986,149(3):93-113.

[28] FISHER R. On the “Probable Error” of a Coefficient of Correlation Deduced from a Small Sample[J]. Metron,1921,4:3-32.

[29] FIELLER E C,PEARSON E S. Tests for Rank Correlation Coefficients: II[J]. Biometrika,1961,48(1/2):29-40.

[30] 张俊,于庆国,朱晓东,等. 面向对象的高分辨率影像特征选择研究[J]. 测绘科学,2011,36(3):141-143.

Classification of Forest on High Resolution Remote Sensing Image by Moving Window’s Fourier Transform

MENG Sen,GE Hong-li,YU Xiao-hui,MULUNDA Christian Ilunga

(Zhejiang Provincial Key Laboratory of Carbon Cycling in Forest Ecosystems and Carbon Sequestration, Zhejiang A & F University, Hangzhou 311300, China)

WorldView-1 panchromatic band data of 0.5 m spatial resolution image of east Lin’an district of Hangzhou, Zhejiang province in April 2008 was used as data source, and two-dimensional Fourier transform based on moving windows was carried out to produce a texture feature vector, and different classification methods were used to classify forests based on feature vectors to find an appropriate moving window size. A total of 21 square windows with odd side lengths from 3×3 to 43×43 were tested. Texture features generated by each side were classified by Fisher discriminant, random forest (RF), support vector machine (SVM), included angle cosine (IAC) and correlation coefficient (CC), and classification accuracy was computed. Based on the forest classification accuracy, the optimal windows corresponding to the five classification methods were 41×41, 41×41, 23×23, 39×39, and 39×39. Under the optimal window, five classification methods had an accuracy of 95% to distinguish forests from non-forests, and the order of the total classification accuracy was as follows: Fisher discriminant> RF > SVM > CC > IAC, the Fisher's discriminant method had a total accuracy and a Kappa coefficient of 99.81% and 0.996 3. Forest tree species were further classified, the total accuracy was Fisher discriminant> RF > SVM > CC> IAC, Fisher discriminant method had a total accuracy and Kappa coefficient of 84.86% and 0.814 9. The results showed that under the optimal window, Fisher discriminant method was the best classification method.

moving window; two-dimensional Fourier transform; texture feature; Fisher discriminant; WorldView-1 high resolution remote sensing image

S757.2

A

1001-3776(2018)05-0051-010

2018-01-18;

2018-05-30

国家自然科学基金项目(41371411)

孟森,硕士在读,从事森林资源遥感监测与信息技术研究;Email:792080043@qq.com。

葛宏立,博士,教授,从事森林数学模型技术、遥感技术在森林资源监测中的应用等研究;Email:jhghlxl@163.com。

10.3969/j.issn.1001-3776.2018.05.009

猜你喜欢
纹理树种向量
向量的分解
聚焦“向量与三角”创新题
基于GC-MS流苏树种子挥发性成分分析
树种的志向
基于BM3D的复杂纹理区域图像去噪
树种的志向
使用纹理叠加添加艺术画特效
常绿树种在新疆的应用现状
TEXTURE ON TEXTURE质地上的纹理
向量垂直在解析几何中的应用