最优分辨率配置下典型湿地生境场景溯源方法

2015-03-26 10:57陈永明何坚强姚志垒
江苏农业学报 2015年6期
关键词:生境分辨率语义

陈永明, 林 萍, 何坚强, 姚志垒

(盐城工学院电气工程学院,江苏 盐城 224051)

中国是世界上湿地生物最丰富的国家之一,也是亚洲湿地类型最齐全、数量最多、面积最大的国家。中国拥有湿地面积6.6×107hm2,约占世界湿地面积的10%,居亚洲第1位,已有30处湿地被列入国际重要湿地名录[1]。湿地生态系统保护的研究工作对于维持区域生态平衡和保护各种湿地物种有重要的意义。其中,湿地生态系统生境场景溯源的研究可以为分析湿地动植物种群生活环境变化,规划生态保护区域范围,约束人类湿地生态区域改造活动,了解湿地生态系统生境功能变化等提供科学分析手段和评判依据[2]。然而,湿地生态系统生境场景溯源研究一直相对滞后,国内外研究文献也相对较少,主要原因是生态系统生境具有多样性、复杂性,造成相关研究工作难度较大,要求研究人员具备丰富的多学科知识[3],但生态保护和研究工作关系人类的生产和生活,因此有必要开展此类研究工作。

研究结果表明,空间包络特征可以用于表述自然场景的5种语义特征,即能反映自然场景具有的纹理区域和起伏轮廓的自然度,能反映自然场景具有的封闭性和广阔性的开放度,能反映自然场景构建组分大小和组织结构关系的粗糙度,能反映自然场景空间梯度的膨胀度,能反映自然场景险峻环境下倾斜的轮廓险峻度[4]。因此,这5类特征可以被用于描述湿地生态系统生境影像中的植物、生物、水文、地理等因素的全局语义特征信息。传统的空间网罗方法使用非正交多尺度2D-Gabor滤波器组,容易造成多尺度滤波器组在空间频率域严重交叠,导致在多尺度空间观测下的湿地生态系统生境场景影像之间产生较多冗余信息输出,导致部分细节特征信息在滤波频带交叠处被覆盖,进而降低后续算法的溯源精度[5]。本研究提出一种新的空频域中最优分辨率配置下空间网罗方法抽取给定的湿地生态系统生境影像中语义特征属性,空频域中最优分辨率配置指多尺度2D-Gabor滤波器组是近似正交配置,即在空间频率域的上半峰幅值相互接触但又不互相重叠,在一定程度上消除原先非正交多尺度滤波器的频带交叠造成的冗余特征输出和部分细节特征信息在滤波频带交叠处被覆盖的影响,进而有助于提升湿地生态系统生境场景的溯源精度。

本研究用中国3类具有代表性的湿地:江苏盐城滨海滩涂湿地[6]、四川若尔盖高原高寒湿地[7]和海南东寨港海岸红树林湿地[8]生态系统生境场景图像对提出的方法进行验证。

1 理论和算法

1.1 最优配置谱函数

全局空间网罗法采用多分辨率滤波器提取湿地生态系统生境场景特征,其中滤波器采用正弦调制的二维带通2D Gabor函数[5],其表达式为:

其中,σx和σy是在空间域中高斯函数的带宽,u0是余弦函数的调制频率,其傅里叶域表达式为:

其中,u和v为空间频率变量,σu=1/2πσx,σv=1/2πσy和λ=2πσxσy。上述2D-Gabor函数是可容许小波,但它并不会产生正交分解,因此基于2DGabor函数的小波变换后的湿地生态系统生境场景图像中会产生冗余信息。

本研究设计一种空间频率域中最优多分辨率2D-Gabor滤波器,即指滤波器在空间频率域的上半峰幅值可以相互接触但又不互相重叠,使得多分辨率下的Gabor滤波器是近似正交的,从而保证滤波器的输出冗余量最小。最优多分辨率2D-Gabor滤波器构建方法如下:把函数g(x,y)作为母小波,通过适当的尺度和旋转变换构建自相似的滤波器组:

其中,x′=am(xcosθ+ysinθ),y′=am(-xsinθ+ ycosθ),a为尺度因子,θ=nπ/N,n∈[0,1,…,N],N为旋转的方向总数。m∈[0,1,…,M],M为在同一旋转方向上的尺度总数。

τ为尺度因子,可以通过如下公式计算:

其中,Umax和Umin分别为最大和最小径向中心频率。变换后的频率坐标(u′,v′)=(ucosθ+vsinθ,-usinθ+vcosθ)。方程(2)中的傅里叶尺度参数σu和σv可以按如下公式计算:

1.2 场景金字塔

将原始场景图像I(x,y)与方程(3)中的最优分辨率配置下的二维Gabor小波函数h′mm(x,y)进行卷积运算,即可以获得空间包络法的金字塔式图像输出:

其中,⊗表示二维空间卷积算子。将金字塔式场景图像按4×4的网格分成16块,计算每一层金字塔函数图像gmn(x,y)在不同方向不同尺度上响应的均值统计直方图:

其中,滤波其方向数为N=8个,尺度数为M= 4个,最终将获得描述湿地生态系统生境场景信息的自然度、开放度、粗糙度、膨胀度、险峻度等512维语义特征向量[4]。多分辨率滤波器下全局空间网罗法提取的金字塔式场景图像和空间包络语义特征向量描述子直方图示意图如图1所示。

图1 湿地场景,场景图像金子塔和空间包络语义特征描述子直方图Fig.1 Wetland scene,scene image pyramid and histogram of spatial envelope semantic feature descriptors

1.3 主成分分析法

接着计算其特征值ξ1≥ξ2≥…≥ξN与其对应的特征向量ψ=ψ1,ψ2,…ψN。利用累计方差达到95%来确定特征子空间的主成分数K:

式中P≤95%。其对应的特征向量为ψNK=(ψ1,ψ2,…ψN),由此可以计算出输入特征在低维子空间中的投影:

1.4 大间隔最邻近算法

其中,大间隔最邻近算法第1个优化的目标是实现输入样本φ()与其目标近邻的平均度量最小化:

由此该优化问题可以综合表达为:

最后,根据每一个输入样本邻近的Ω个目标的核空间间距来确定样本的语义归属[10]。

2 结果与分析

2.1 试验数据

数据库中有900幅包含江苏盐城滨海滩涂湿地、四川若尔盖高原高寒湿地和海南东寨港海岸红树林湿地场景影像样本,其中每类实例各300个样本,数据集被随机划分为建模集和溯源集两部分,其中每类实例的建模集包含270个样本,溯源集包含30个样本。获得的湿地生态系统生境场景影像主要由滩涂、土壤、河流、湖泊、树木、草、苗林、花丛、山脉、道路、动物、天空、阳光、云等生态元素有机构成。如图2所示,图像a、图像b、图像c为江苏盐城滨海滩涂生态系统生境场景,图像d、图像e、图像f为四川若尔盖高原高寒生态系统生境场景,图像g、图像h、图像i为海南东寨港海岸红树林生态系统生境场景。如果缺乏对上述湿地场景影像认知,一般都难于从局部的湿地生态系统生境场景影像中确定这些生态系统生境场景的起源。本研究通过建立湿地生态生境场景影像数据库来建立场景认知,通过湿地生态场景中生态元素的结构和分布特征来溯源未知的湿地生态系统生境场景。

图2 湿地生态系统生境场景Fig.2 The wetland ecological habitat scenes in Hainan province

2.2 数据处理与分析

2.2.1 图像预处理 将获得的湿地生态系统生境场景数据库中所有真彩的RGB图像尺寸大小调整到(250~600)×(250~600)像素之间,然后将这些场景图像转换成强度值为0~255的灰色尺度的图像,转换公式为:

其中:R表示红光强度,G表示绿光强度,B表示蓝光强度。虽然一些研究结果表明,使用颜色特征可以增强算法整体的性能[11],但本研究的研究重点是改进空间网罗法中2D-Gabor滤波器在空间频率域中配置属性来提高溯源算法的精度。

2.2.2 场景建模 湿地生态系统生境场景感知过程分为建模和溯源2个阶段。其中,建模阶段使用空间网罗特征法提取数据库中湿地生态系统生境场景的自然度、开放度、粗糙度、膨胀度、险峻度等的语义特征,接着将这些特征用归一化处理方法进行处理,消除空间网罗特征量纲影响,其次使用数据中心化处理方法来消除空间网罗特征均值漂移的影响,再使用主成分分析法将归一化和中心化处理后的特征投影到低维特征子空间中提取主成分,消除原始空间网罗特征中无关语义特征分量的影响,其中子空间主成分数利用其相应的累计方差达到95%的置信率来确定[9],使用大间隔最邻近算法将低维子空间中特征映射高维特征进行语义相似度计算,消除由于特征的非线性造成的影响,最后在高维特征空间中划分湿地生态系统生境特征的语义归属[10]。湿地生态系统生境场景溯源方法如图3所示。

图3 湿地生态系统生境场景溯源方法示意图Fig.3 Sketch map of the approaches for derivation of the wetland ecological habitat scenes

建模数据集的模型预测精度使用k-fold验证法来估计。试验同时计算了本研究提出的基于正交配置和现有的非正交配置下湿地生态系统生境场景溯源方法获得的建模集精度,结果分别如表1和表2所示。

如表1所示,基于正交配置的溯源方法获得的江苏盐城滨海滩涂湿地、四川若尔盖高原高寒湿地和海南东寨港海岸红树林湿地的建模精度分别为61%、75%和79%,表2中基于非正交配置的溯源方法获得的江苏盐城滨海滩涂湿地、四川若尔盖高原高寒湿地和海南东寨港海岸红树林湿地的建模精度分别为61%、72%和79%,江苏盐城滨海滩涂湿地、四川若尔盖高原高寒湿地和海南东寨港海岸红树林湿地在建模精度上正交配置的方法相对于非正交配置的方法分别提升了0个百分点,3个百分点和0个百分点。使用正交配置的溯源方法和非正交配置溯源方法获得的总体建模集的建模精度分别为72%和71%。因此,使用正交配置的溯源方法获得的总体建模精度提升了1个百分点。通过比较本研究提出的方法与现有的方法可以看出,利用空频域中最优分辨率配置下可容许小波函数可以消除多分辨率空间中滤波频带交叠造成的输出的冗余特征的影响,提升湿地生态系统生境场景的溯源模型的性能。

2.2.3 场景溯源 在溯源阶段,首先使用空间网罗法提取待溯源的湿地生态系统生境场景影像512维空间网罗语义特征,接着将这些特征进行归一化和中心化处理,其次用主成分分析法将预处理后的特征投影到低维特征子空间中提取主成分,再利用大间隔最邻近算法将提取的特征主成分映射到高维特征空间中湿地生态系统生境场景数据库特征类中,计算溯源场景特征与数据库样本特征的语义相似度,然后将场景语义相似度值进行排序,最后根据最大相似度值输出已设定的前N个相应的湿地生态系统生境场景数据库中影像,其中以样本种类中次数出现最多的类型作为溯源样本的参考类别。使用正交配置和非正交配置的溯源方法获得的溯源集精度计算结果分别见表3和表4。

从表3、表4可以看出基于正交配置的溯源方法获得的江苏盐城滨海滩涂湿地和四川若尔盖高原高寒湿地的建模精度分别为58%和83%,基于非正交配置的溯源方法获得的江苏盐城滨海滩涂湿地和四川若尔盖高原高寒湿地的建模精度分别为50%和75%,通过比较可得基于正交配置的溯源方法相应的溯源精度都提升了8个百分点,而海南东寨港海岸红树林湿地溯源相应下降了8个百分点。使用正交配置和基于非正交配置的溯源方法获得的建模集总的溯源精度分别为69%和67%。因此,使用基于正交配置的溯源方法获得的总体溯源精度提升了2个百分点。试验结果显示,使用正交配置溯源方法利用空频域中最优分辨率配置下的谱函数可以消除多分辨率空间中滤波频带交叠造成的输出冗余特征的影响,在高维语义特征空间中定位湿地生态系统生境特征的归属,提升了湿地生态系统生境场景溯源模型的性能。

表1 使用正交配置溯源方法获得的湿地生态系统生境场景建模精度Table 1 The modelling accuracy attained by using the orthogonal-based configuration methods for derivation of the wetland ecological habitat scenes

表2 使用非正交配置溯源方法获得的湿地生态系统生境场景建模精度Table 2 The modelling accuracy attained by using the nonorthogonal-based configuration methods for derivation of the wetland ecological habitat scenes

表3 使用正交配置溯源方法获得的湿地生态系统生境场景溯源精度Table 3 The derivation accuracy attained by using the orthogonal-based configuration methods for derivation of the wetland ecological habitat scenes

表4 使用非正交配置溯源方法获得的湿地生态系统生境场景溯源精度Table 4 The derivation accuracy attained by using the nonorthogonal-based configuration methods for derivation of the wetland ecological habitat scenes

3 讨论

与前人相关研究结果[12]比较可以发现,部分文献场景逻辑属性的识别精度要优于本研究的试验结果,这主要是因为在之前的文献中,识别的场景受限于明显不同的场景类别,如:区分室内和室外场景,城市和市郊场景,城市和乡村场景等。然而,在本研究中识别的对象属性仅仅涉及到湿地类型,不同类型的湿地场景图像具有极为相似的纹理结构和地理空间分布属性特征,因而造成了机器学习算法在特征认知上的困难。

本研究创新之处在于提出了利用最优分辨率配置下空间网罗方法来溯源中国典型湿地生态系统生境场景,利用空频域中最优分辨率配置下谱函数可以消除多分辨率空间中滤波频带交叠造成的输出冗余特征的影响,利用主成分分析法在子空间中消除了无关语义特征分量,利用大间隔最邻近法在高维语义特征空间中定位湿地生态系统生境特征的归属,从而提高了湿地生态系统生境场景的溯源精度。本研究提出的方法可以被用于更精确的感知溯源湿地生态系统生境场景的生态因素、地理环境等信息,并且可以用于分析生物生存环境和感知湿地生态系统生境变化。

[1] 李玉凤,刘红玉.湿地分类和湿地景观分类研究进展[J].湿地科学,2014,12(1):102-108.

[2] WARDLE D A,BARDGETT R D,CALLAWAY R M,et al.Terrestrial ecosystem responses to species gains and losses[J].Science,2011,332(6035):1273-1277.

[3] BAI J,CUI B,CHEN B,et al.Spatial distribution and ecological risk assessment of heavy metals in surface sediments from a typical plateau lake wetland,China[J].Ecological Modelling,2011,222(2):301-306.

[4] 杨 昭,高 隽,谢 昭,等.局部Gist特征匹配核的场景分类[J].中国图象图形学报,2013,18(3):264-270.

[5] WANG Q,ZHANG X,LI M,et al.Adaboost and multi-orientation 2D Gabor-based noisy iris recognition[J].Pattern Recognition Letters,2012,33(8):978-983.

[6] LIU C,JIANG H,HOU Y,et al.Habitat changes for breeding waterbirds in Yancheng National Nature Reserve,China:A remote sensing study[J].Wetlands,2010,30(5):879-888.

[7] XIAO D,TIAN B,TIAN K,et al.Landscape patterns and their changes in Sichuan Ruoergai wetland national nature reserve[J].Acta Ecologica Sinica,2010,30(1):27-32.

[8] XIN K,HUANG X,HU J,et al.Land use change impacts on heavy metal sedimentation in Mangrove wetlands—A case study in Dongzhai harbor of Hainan,China[J].Wetlands,2014,34(1): 1-8.

[9] ABDI H,WILLIAMS L J.Principal component analysis[J].Wiley Interdisciplinary Reviews:Computational Statistics,2010,2 (4):433-459.

[10]HU Q,ZHU P,YANG Y,et al.Large-margin nearest neighbor classifiers via sample weight learning[J].Neurocomputing,2011,74(4):656-660.

[11]VAN DE SANDE K E A,GEVERS T,SNOEK C G M.Evaluating color descriptors for object and scene recognition[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2010,32(9):1582-1596.

[12]OLIVA A,TORRALBA A.Building the gist of a scene:the role of global image features in recognition[J].Progress in Brain Research,2006,155:23-36.

猜你喜欢
生境分辨率语义
枣树适应干旱生境研究进展
语言与语义
EM算法的参数分辨率
原生VS最大那些混淆视听的“分辨率”概念
基于深度特征学习的图像超分辨率重建
一种改进的基于边缘加强超分辨率算法
“上”与“下”语义的不对称性及其认知阐释
金秀瑶族长鼓舞传承的文化生境
不同生境中入侵植物喜旱莲子草与本地种接骨草的光合特性
认知范畴模糊与语义模糊