张 磊,王小龙,刘 畅
(1.中国科学院 空天信息创新研究院,北京 100190;2.中国科学院大学 电子电气与通信工程学院,北京 100049)
合成孔径雷达(Synthetic Aperture Radar,SAR)可以全天时、全天候进行主动式微波成像,已被广泛应用于侦察探测、城市规划等任务中[1]。早期的SAR 图像分辨率偏低,建筑物检测任务侧重于提取简单几何结构、阴影等信息。文献[2]组合近似垂直目标元,设计一种分级检测方案。文献[3]融合光学与SAR 图像,利用主线条与阴影进行辅助判别。文献[4]通过感知编组(Perceptual Grouping,PG)的形式提取建筑物结构信息。文献[5]在传统马尔可夫随机场(Markov Random Field,MRF)分割基础上,结合区域Hough 变换设计L 型结构并提取方案。
随着SAR 图像分辨率的不断提高,建筑物呈现更明显的纹理结构信息,人们逐渐开始倾向于研究基于目标纹理和结构特征的提取算法。文献[6]在分水岭变换的基础上将纹理信息和建筑物特征点结合分析。文献[7]基于YOLOv3 框架,利用K-Means改进先验框尺寸,引入浅层特征融合模块和转置卷积增强细节信息。文献[8]利用复数卷积网络将多尺度多通道信息融合,提升三维建筑物分割精度。然而,深度学习方案计算成本较高,需要大数据样本支撑,且会随SAR 系统差异出现迁移应用受限等问题。在实际应用中,目标区域可能仅能获取一幅SAR 图像,因此,基于传统SAR 建筑物分割方法的研究具备一定的现实意义。
显著性特征与空间关系特征的提取能够有效提升建筑物检测的准确率与效率。文献[9]通过提取形态学显著性特征提取建筑物,但在较复杂场景中,SAR 建筑物目标会呈现出L 型、框型等多种几何结构。文献[10]提出形态学建筑物指数(Morphological Building Index,MBI)算法,采用多方向形态学算子进行白帽重构,适用于矩形建筑物,而线形建筑物数值偏低,经阈值处理可能会出现目标断裂问题。文献[11]在SAR 建筑物分割任务中利用邻域像素距离因子及强度差异改进传统MRF 势函数模型,并提取空间关系特征,该模型能够提升分割性能,但没有充分考虑建筑物目标与邻域像素在特征空间的语义关系,制约了模型的泛化能力。
为有效提取高分辨率SAR 建筑物的显著性特征,本文提出一种多尺度显著性建筑物指数值(Multi-scale Saliency Building Index,MSBI)算法,通过融合不同类型的SAR 建筑物特征获取符合SAR建筑物的显著性信息。为有效表征复杂场景下高分辨率图像中SAR 建筑物目标的空间关系特征,本文将MSBI 特征因子引入到基于改进余弦函数的MRF势函数模型,更加关注邻域像素在特征语义层面的关系,加强势函数模型对复杂SAR 建筑物目标的表征能力。
本文联合高分辨率SAR 建筑物目标的显著性与空间关系特征,提出一种基于建筑物指数相似度距离改进MRF 模型的分割方法。利用MSBI 算法提取SAR 建筑物显著性特征从而进行相似度约束,以改进像素间空间关系,算法流程如图1 所示。
图1 建筑物分割流程Fig.1 Procedure of building segmentation
SAR 独特的成像机制会导致大量斑点噪声的产生,严重影响特征提取的精度。Shearlets 变换[12]通过多尺度多方向的时频分析策略,能够提取局部化特征及采取最佳稀疏表示。相较于传统SAR 图像去噪方案,Shearlets 变换更适合SAR 建筑物这类包含丰富纹理信息的目标,能够更好地保留高频信息。
传统MBI 算法采取多方向(通常为4 个方向)的形态学算子进行多尺度白帽重构,赋予矩形建筑物目标较高的指数,如图2(a)所示。考虑到较复杂场景下SAR 建筑物目标可能呈现多种结构形态的问题,本文基于多尺度滤波重构的思路,通过引入多尺度低通及均值滤波代替形态学滤波降低算法复杂度,提取强度显著性信息。在此基础上,使用基于单演信号特征分析将多尺度局部相位信息融合,提取纹理显著性信息。此外,通过频域对比度分析,引入谱残差权重,提取频谱显著性信息。最终通过多特征融合获取建筑物显著性指数图,如图2(b)所示。
图2 MSBI 算法与MBI 算法的对比Fig.2 Comparison of MSBI and MBI algorithm
1.2.1 强度显著性
形态学滤波重构复杂度较高,考虑到线性滤波具有较低的计算成本,引入均值滤波与高斯低通滤波进行目标重构,主要步骤如下。
步骤1线性滤波剖面生成。对原图O(x,y)利用高斯核G和均值滤波模板Laver(s)分别进行处理,计算公式如式(1)~式(4)所示:
其中:i、j均为整数;Llow_pass和Laver分别代表低通和均值滤波剖面;s代表从初始窗口Smin以步长Δs增加至最终窗口Smax所对应的各阶段窗口尺寸。
步骤2微分线性滤波剖面生成。将相邻Laver依次取差值可得到k-1 个相应的微分图像,计算公式如式(5)和式(6)所示:
其中:k=(Smax-Smin)/Δs+1;Dlow_pass和Daver分别代表高斯低通滤波和均值滤波的微分剖面。
步骤3基于强度信息显著性权重生成。将通过均值滤波和低通滤波获取到的相应k-1 个微分图像进行累加,归一化至[0,1],计算公式Iintensity如式(7)所示:
其中:µ为超参数;Iintensity为区域权重值,强度差异高的区域,该值越大,反之,该值越小。
1.2.2 纹理显著性
高分辨SAR 建筑物目标具有明显的方向性结构信息,纹理特征提取有利于分析不同建筑物目标的细节信息。文献[13]基于单演信号构造的特征具有良好的尺度不变和旋转不变特性,针对图像处理任务,二维单演信号经过Riesz 变换,同时结合原始信号在高维空间进行特征提取与分析。f(x,y)为原信号,单演信号fM(x,y)表达式如式(8)所示:
其中:fRiesz(x,y)为Riesz 变换结果;i 和j 均为虚数。
利用局部相位提取建筑物目标几何结构信息,表示式如式(9)所示:
考虑到图像信号长度受限,在Riesz 变换之前一般采用带通滤波进行预处理。低尺度特征包含SAR建筑物丰富的细节信息,而高尺度建筑物特征具备更强的语义性。因此,通过构造多尺度的局部相位信息,融合处理得到Gphase。
1.2.3 频谱显著性
基于频域的显著性模型能通过提取目标的基本轮廓信息,引入频域显著性信息来辅助增强建筑物目标区域,文献[14]提出的谱残差算法(Spectral Residual,SR)利用图像幅度谱与平均谱之间的差异来提取显著性区域。首先对输入图像进行傅里叶变换得到频域幅度信息,再通过对数运算获取幅度谱,并经过高斯平滑处理得到平均谱取差值,最终进行逆变换获得频谱显著图Ffrequency,处理流程如图3 所示。
图3 谱残差算法流程Fig.3 Procedure of spectral residual algorithm
通过对上述强度、纹理和频谱3 种显著性特征进行融合,获取全局MMSBI值,计算公式如下:
其中:λ1,λ2∈(0,1)。
相比传统算法MBI,MSBI 算法能够对建筑物与背景杂波赋予不同权重,同时加强L 型、框型等建筑物目标的显著度。
MRF 模型通过点集L={l=(a,b)|1≤a≤M,1≤b≤N}描述二维M×N图像,同时定义标签场X={X1,X2,…,Xm},δ={δab:(a,b)∈L,δab∈L}为邻域系统,用以描述像素间的空间状态关系。所有服从二维MRF 分布的变量,其概率值仅与其邻域变量状态有关[15]。
设Y为图像的特征矢量,即已知的观测数据,X为与Y对应的分类标签,分割问题[16]即分类标签X的后验概率分布,其表达式如式(11)所示,其中MRF 分割最优化即求取最大后验概率对应的分类标签,表达式如式(12)所示:
根据Hammersley-Clifford 定理可知,Markov 随机场与吉布斯分布具有同一性。吉布斯分布如式(13)所示:
最优分割求取过程[17]从最大化后验概率转化为寻找使全局能量最低的分类状态。本文使用ICM 算法[18]寻找能量稳定状态,此时的分类标签为SAR 建筑物分割的最优结果。
在标签域传统MRF 模型中对每次迭代的结果利用K-Means 进行初始标签提取,之后利用势函数模型对像素点邻域进行标签概率统计[19]。传统势函数模型如Potts 模型[20]等,对图像中的简单目标结构具有一定的表征能力,计算公式如式(14)所示:
其中:xi代表当前像素;xj为xi的邻域像素。当两者标签一致时,势函数能量为0,标签不同时则为β。
但Potts 模型并未考虑到像素特征语义层面的关系,在SAR 建筑物分割时,由于目标受背景杂波干扰,易产生过分割现象。故本文提出并设计一种改进的MRF 分割模型,命名为BSID-MRF,算法流程如图4 所示。模型主要在标签域利用改进的势函数模型对当前像素点以及邻域像素的MSBI 值进行相似性度量,利用SAR 建筑物在特征语义层面的信息生成新的标签信息,在此基础上与特征域能量信息结合,求取最大后验概率。
图4 BSID-MRF 分割模型的流程Fig.4 Procedure of BSID-MRF segmentation model
将邻域MSBI 因子引入到基于改进余弦函数的势函数模型中,改进后的势函数公式如式(15)所示:
其中:β为初始能量与邻域能量的比值,β∈[0,1];d为相似度距离,代表当前像素点与其邻域在SAR 建筑物显著性特征层面的相似程度,d∈[0,π];α为超参,代表尺度变换,一般取1。势函数变化曲线如图5 所示。由图5 可知,当像素点xa与邻域像素点xb初始分类标签相同时,势函数能量赋值为0;而当分类标签不同时,利用上述改进的余弦函数评估两者间的MSBI特征相似度,在像素空间通过概率形式进行能量约束。相似度距离d取值越小,则归属一类的概率越高;反之,赋予不同标签值的概率越高。
图5 势函数能量与相似度距离的变化关系Fig.5 Change relationship between potential function energy and similarity distance
为验证算法的有效性,本文采用机载和星载2 类不同的SAR 图像开展了不种场景下的建筑物分割实验,如图6 所示。其中,机载SAR 图像为中科院空天信息创新研究院的高分辨率SAR 影像,星载SAR 图像为美国Capella-2 星载高分辨率SAR 图像。此外,为了评估算法性能,传统MRF 模型、MBI 算法以及文献[21]的快速鲁棒模糊C 均值(Fast and Robust Fuzzy C-Means,FRFCM)算法被选用开展对比实验。实验中,由于SAR 场景下同一目标整体强度分布不均,算法分割结果与地面真实值存在一定偏差。
图6 不同平台下原始高分辨率SAR 图像示例Fig.6 Examples of original high-resolution SAR images on different platforms
如图6(a)所示为机载SAR 图像,用于展示本文MSBI 算法相较传统MBI 算法的改进效果。图7(a)~图7(c)分别为原SAR图像、地面真值图和细节放大图;图7(d)~图7(f)分别为MBI 处理结果;图7(g)~图7(i)分别为本文MSBI处理结果。不难看出,MBI算法能将类似矩面结构的建筑物目标赋值较高,而部分L 型、框型建筑物目标指数值偏低,进行阈值处理容易导致L型、框型等建筑物目标出现严重断裂,如图7(f)所示。如果为了防止目标断裂而将阈值设置过低,则会引入过多的虚警目标。MSBI算法能够对线条型建筑物区域进行增强,提取的细节信息如图7(i)所示。综上分析,与传统MBI算法相比,MSBI算法对SAR 建筑物目标的整体结构信息的保留效果更佳,可以有效处理可能出现的目标断裂问题。
图7 MSBI 算法和MBI 算法的效果对比Fig.7 Effect comparison between MSBI and MBI algorithm
针对建筑物空间关系特征提取,传统MRF 算法的分割结果如图8(a)所示,算法过分割现象较为严重,出现较多的误分割区域和冗余连接。BSID-MRF 算法可以在一定程度上避免建筑物目标过分割。FRFCM 算法对L 型、框型等目标断裂较为严重的建筑物,分割效果不理想,如图8(b)所示。本文将邻域MSBI 因子引入改进的MRF 势函数模型中,分割结果如图8(c)所示,BSID-MRF 算法能够更好地提取L 型、框型等建筑物目标,最终的分割结果更有利于后续设计目标、提取规则,提升建筑物检测算法的精度。算法的分割结果中误分割区域较少,有效地去除了大部分建筑物边缘冗余连接,使建筑物目标分割更加精准。
图8 不同算法检测建筑物的性能对比Fig.8 Comparison of building detection performance with different algorithms
如图6(b)所示为机载SAR 图像,用于开展改进MRF 势函数模块的消融实验,并展示改进势函数模型在特征提取中的优势。图9(a)、图9(b)分别为原始图像和地面真值图;图9(c)为传统MRF 算法的分割结果,目标与背景杂波混杂,算法过分割严重。图9(d)为改进MRF 势函数模块的消融结果,基于传统MRF 势函数模型,利用MSBI 算法结果代替初始标签域赋值,并通过迭代进行标签更新。由图9(d)可以看出,引入MSBI 算法能够有效解决大部分背景与目标的过分割问题。但由于单个目标区域灰度分布不均,传统势函数模型无法有效表达目标的结构信息,导致部分矩形建筑物周边存在冗余像素点,目标结构信息丢失。图9(e)、图9(d)为在传统MRF 算法的基础上加入改进MRF 势函数模型的处理结果,即本文完整算法处理结果。对图9(e)、图9(d)进行差值比对,结果如图9(f)所示,可见本文算法通过特征空间约束,能够在一定程度上保留建筑物目标的结构信息,使SAR 建筑物分割更加精准。
图9 改进势函数模型的消融实验结果Fig.9 Ablation experimental results of improved potential function model
图10 所示为MBI 和FRFCM 算法与本文算法的处理结果对比图。如图10(a)和图10(b)所示,前2 种算法均无法同时兼顾虚警率以及漏检率。图10(c)为本文BSID-MRF 算法的处理结果,由于融合了邻域显著性特征约束因子,建筑物边缘区域分割更精准,在一定程度上能够去除部分冗余虚警像素,同时保证其他SAR 建筑物的完整性,目视效果更佳。
图10 针对场景2 下的建筑物分割实验Fig.10 Building segmentation experiment for scene 2
图6(b)为星载SAR 图像,用于展示本文算法在不同SAR 系统图像间的适用性。在该场景中,SAR 建筑物目标结构形态多样,背景杂波主要包括散斑噪声、植被、广场道路等干扰信息,针对此类场景的SAR建筑物提取可以进一步检验本文算法在星载应用中的可行性。图11(a)、图11(b)分别为星载SAR 图像及其地面真值图。传统MRF 算法对SAR 建筑物目标的分割效果良好,如图11(c)所示,但引入了较多类建筑物的虚警目标,漏检率较低但虚警率偏高,致使算法整体检测性能不佳。而如图11(d)、图11(e)所示的MBI 算法和FRFCM 算法的处理结果针对L 型、框型等建筑物目标断裂较为严重,无法完整地提取此类建筑物目标,虚警率较低但漏检率偏高,导致算法检测性能降低。与之相比,本文BSID-MRF 算法能够有效平衡虚警率与漏检率,分割结果如图11(f)所示,整体检测性能优于其他算法。
图11 针对场景3 下的建筑物分割实验Fig.11 Building segmentation experiment for scene 3
本文选用SAR 建筑物提取研究领域广泛使用的分割指标进行定量评估算法性能,Dice 指标[22]能够有效表示2 类样本间的相似性程度,Jaccard 系数[23]为集合间相似性度量指标,mIoU 代表集合平均交并比[24],以上三者系数值越高,代表分割算法的性能越佳。利用漏检率(False Negative Rate,FNR)与虚警率(False Positive Rate,FPR)描述分割算法的特性[25]。这些指标的具体公式如式(16)~式(20)所示:
其中:TTP、FFP、FFN分别为真正例、假正例、假负例;RSeg代表算法实际分割结果;RGT代表地面真实值。
基于不同平台SAR 场景下的几类建筑物分割算法性能的对比情况分别如表1~表3 所示。由表1~表3 可知,相比于其他建筑物分割方法,BSID-MRF 算法能够保持合适的漏检率与虚警率,Jaccard、mIoU 和Dice 指标均高于其它方法,证明了BSID-MRF 算法对于高分辨率SAR 建筑物分割任务的可行性与有效性。
表1 不同算法针对场景1下的建筑物分割性能指标对比Table 1 Comparison of building segmentation performance indexes of different algorithms for scene 1
表2 不同算法对场景2 下的建筑物分割性能指标对比Table 2 Comparison of building segmentation performance indexes of different algorithms for scene 2
表3 不同算法对场景3 下的建筑物分割性能指标对比Table 3 Comparison of building segmentation performance indexes of different algorithms for scene 3
本文提出一种基于建筑物指数相似度的改进MRF 分割算法BSID-MRF。通过强度信息重构、纹理特征构造、谱残差权重统计来提取SAR 建筑物目标不同区域的显著性指数。在此基础上,引入邻域MSBI 因子相似度,利用特征空间语义特性对原始像素空间进行有效约束,提升MRF 势函数模型对建筑物目标结构的表征能力。建筑物分割结果表明,本文所提算法BSID-MRF 相比于传统MRF、MBI、FRFCM 等算法,Dice 指标平均提升4.3~10.7 个百分点,且能够有效平衡虚警率和漏检率,更适用于高分辨率SAR 建筑物分割任务。下一步将通过设计目标提取规则提升SAR 建筑物检测算法精度。