基于改进蜘蛛网局部图像特征的图像配准算法

2020-05-29 02:38:18杨真真杨永鹏许鹏飞

南京邮电大学学报(自然科学版) 2020年2期

杨真真，匡楠，杨永鹏，许鹏飞

(1.南京邮电大学通信与网络技术国家工程研究中心，江苏南京 210003 2.南京信息职业技术学院网络与通信学院，江苏南京 210023)

图像配准［1］是指同一目标的两幅或者两幅以上的图像在空间位置的对准。目前，图像配准作为图像处理的基本步骤，已被广泛应用于医学图像拼接与融合［2］、目标检测与定位［3］、图像分割［4］等领域。

主流的图像配准方法分为两类，基于待配准图像全像素信息［5-7］的配准方法以及基于待配准图像特征信息［8-10］的配准方法。其中，基于待配准图像像素信息的配准方法以图像全体像素信息为依据，建立待配准图像和参考图像之间的相似性度量准则，利用某种搜索算法，寻找出使得相似度量达到最优值的变换模型参数；基于待配准图像特征信息的配准方法只需要提取待配准图像中的点、线、边缘等特征信息，不需要其他辅助信息，在减少计算量、提高效率的同时，能够对图像灰度的变化有一定的鲁棒性。根据选择的特征信息不同，把基于特征的图像配准方法分为三类：（1）基于特征点的配准［11-12］：一般所选取的特征点是相对于其邻域表现出来具有某种奇异性的像素点。特征点往往很容易被提取到，但是特征点所包含的信息相对较少，只能反映出其在图像中的位置坐标信息，所以在两幅图像中寻找匹配的特征点是关键所在；（2）基于特征区域的配准［13-14］：在图像中寻找某些明显的区域信息作为特征区域，然而在实际应用中寻找到特征区域后，采用最多的还是区域的形心点，所以这类算法要求特征区域提取的精度要非常高；（3）基于特征边缘的配准［15-16］：图像中最明显的特征就是边缘，而边缘特征也是最好提取的特征之一。因此给予边缘的匹配方法鲁棒性较强，适用范围很广，但这类方法对特征边缘的提取要求很高，并且要求边缘信息全部用数学语言予以表述也较为困难。

总的来说，基于待配准图像整体像素信息的配准方法精度更高，但计算复杂度高，对图像的灰度变化敏感，抗噪性能较差；基于待配准图像特征信息的配准方法计算复杂度相对较低，但配准性能的好坏很大程度依赖于特征匹配的精度。

本文所采用的配准方法是基于特征点描述子的配准方法，该方法通常需要以下四个步骤：（1）提取图像中的特征点：特征点从总体上说是在图像领域或视觉领域中一些有别于其周围的地方，具有很高的区分度，应当具有可重复性、可区分性、准确性、有效性（特征的数量、特征提取的效率）、鲁棒性（稳定性、不变性）。常见的特征点提取方法有尺度不变特征变换（Scale-Invariant Feature Transform，SIFT）［17］、加速分割检测特征（Features from Accelerated Segment Test，FAST）［18］和加速鲁棒性特征（Speeded Up Robust Features，SURF）［19］等。（2）计算特征描述子：该步骤旨在对上述检测的特征点进行描述，通常对每个特征点采用一维向量进行特征描述，描述子的选取直接决定了图像匹配及配准的性能。（3）根据特征描述子，进行点对点匹配：根据某种搜索算法，确定点与点之间的最优匹配。常见的匹配算法有基于阈值［20］、基于最近邻［21］、基于距离比例最近邻［22］等。（4）根据匹配点对估计图像的变换矩阵：由于可能存在大量误匹配对，故在进行估计图像变换矩阵之前，有必要根据某种准则进行误匹配点对删除。譬如，使用基于随机采样一致性（Random Sample Consensus，RANSAC）［23］算法来去除误匹配特征点对往往效果较好。此外，良好的估计算法一定程度上也对图像配准精度产生一定影响。

为了解决基于特征点描述子配准方法的精度及鲁棒性差等问题，从特征描述子入手，以期改善其性能。

特征描述子的核心问题是不变性和可区分性。在配准中使用图像特征描述子时，通常是为了鲁棒地处理各种图像变换的情况。因此，在构建描述子时需考虑尺度不变性、旋转不变性、平移不变性以及对噪声的不变性。此外，对于除了特定任务中特征描述子需考虑的不变性外，其他性质需尽可能有区分性。譬如，在图像配准中，需要对参考图像及浮动图像中特征点进行匹配，此时不对应特征点描述内容需尽可能不一致，同时保证对应特征点描述内容一致。然而，特征描述子的可区分性的强弱往往和其不变性是矛盾的，一个优秀的特征描述子，需保证在特定任务中要求的特征描述不变性，同时具有很强的区分度。SURF［19］统计特征点圆形邻域的haar小波［24］特征，该描述子通过构建尺度空间及确定特征主方向来保证描述子的旋转不变性和尺度不变性，是一种性能优异的描述子。蜘蛛网局部图像特征（Spider Local Image Feature，SLIF）［25］是一种根据仿生学原理提出的描述子，该描述子在不增加计算量的同时，采样面积更大，且其采样范围和采样点数（密度）根据实际情况可调，其采样模型十分具有借鉴意义。

本文充分考虑了SLIF描述子采样模型的优势，将其用于所提方法的采样模型结构。同时，由于图像配准要求其特征点匹配的精度更高，对其描述子从邻域结构及描述方式两个方向进行改进，以期获得更好的特征点匹配及图像配准效果。在使用SLIF采样结构基础之上，增加了方形、环形、径向邻域信息的描述，对图像空间结构信息的捕捉能力大大增强；此外，不同于SLIF描述子构建方法，本文利用局部区域内物体灰度值具有自相似性的特征构建描述方法，并引入局部图像邻域的标准差作为判断自相似性的自适应阈值。

1 蜘蛛网局部图像特征描述子

蜘蛛网局部图像特征（SLIF）描述子是一种具有尺度和旋转不变性的描述子，该方法的提出者根据仿生学原理提出了一种新型邻域采样结构，在特征点匹配的精度上卓有成效。

1.1 采样模型

SLIF采样模型如图1所示，图示坐标点以（n，m）表示，其中n代表采样模型的螺旋线状坐标位置，m代表采样模型的径向坐标位置。

其节点在笛卡尔坐标系下的表示如下

其中，M和N分别为最大径向采样点数和最大螺旋线上采样点数，需人工指定；坐标向量的第一维为横坐标，第二维为纵坐标。

其中，xi和yi分别为特征点（描述子中心）横坐标和纵坐标，即检测出的特征点位置；σi为特征点尺度因子，该因子由特征点检测算法提供；θi为特征点方向因子，该因子可由特征点检测算法提供，亦可根据文献［25］所提供方法获得；K＞0为一个可调自由变量，该变量决定了特征描述子的作用范围。

1.2 描述子构建方法

2 本文提出的描述子

SLIF采用一种新型的邻域采样模型构建了一种具有旋转和尺度不变性的描述子，在图像匹配领域性能优良，但是由于其描述子从局部来讲为8邻域的LBP描述子，存在对噪声敏感、无法捕捉宏观信息等问题，故将其用于图像配准领域仍存在一定缺陷。本文从描述子构建方法对其做了相应改进，能够同时整合宏观信息和微观信息，使其在相同配准框架下配准精度显著提高。

2.1 基于全局标准差的邻域描述

为了能够捕捉采样模型的整体采样节点信息，首先构建一个基于全局标准差的邻域描述方法，其公式如下所示

2.2 基于径向标准差的径向邻域描述

为了能够捕捉采样模型的径向采样节点信息，构建一个基于径向标准差的径向邻域描述方法，其公式如下

2.3 基于环形标准差的环形邻域描述

为了能够捕捉采样模型的环形采样节点信息，构建一个基于环形标准差的环形邻域描述方法，其格式如下

2.4 特征描述子分析

首先，说明SLIF描述子构建方法存在的缺陷，图2阐述了式（3）的描述子构建方法。

该描述方法试图利用中心点与邻域像素点大小关系构建中心点特征值，能够很好地捕捉区域内与中心点像素值差异较大的像素点信息。但是，大多数图像的邻域像素值往往与中心点像素值差异不大，具有区域块的自相似性。此时，若采用中心点与邻域像素点大小关系构建中心点特征值，其描述方法显得十分不合理。其次，该描述方法很大程度依赖于中心点像素值，若中心点像素值受噪声干扰或其描述领域有光照不均匀等环境噪声，其偏差较大，此时若有一个自适应的误差调整项显得十分必要。

因此，结合如上描述方法的优缺点，采用基于全局标准差的邻域描述、基于径向标准差的径向邻域描述和基于环形标准差的环形邻域描述方法重构采样点描述方法，下面分别以图示的方式阐述式（5）、式（7）和式（9）的描述子构建方法。

图3～5分别直观展示了式（5）、式（7）和式（9）所示方法。图3（a）为邻域范围内原始图像像素大小；图3（b）为邻域像素与其中心像素的绝对值之差；图3（c）为根据阈值最终形成的二值化序列。图3（b）→图3（c）的阈值为图3（a）中全体像素点计算而得的标准差。图3（c）的二值化序列由中心点邻域范围内左上角按顺时针方向组成，记pw（）为25（（00011001）2→（25）10）；图4（c）的二值化序列自底向上组成，记pr（xin，m）为152（（10011000）2→（152）10）；图5（c）的二值化序列由中心点逆时针方向第5个点起按顺时针方向形成，记pc（xin，m）为145（（10010001）2→（145）10）。最终一个特征点在圆蛛网状采样模型下从三种不同结构状态得以描述。

提出的描述子相较于SLIF描述子具有如下优势：（1）在圆蛛网状采样模型下，从三种不同邻域采样模型对采样点周围像素信息加以描述。相较于SLIF仅从采样点周围8邻域范围内像素信息进行编码描述，提出的描述子还从采样点在圆蛛网状模型范围内环形像素点及径向像素点加以描述，其描述内容更加丰富；（2）使用中心采样点与其周围采样点差分像素值的一致性对其邻域进行描述。相较于SLIF描述子仅仅考虑周围采样点与中心采样点的大小关系来构建描述，提出的方法更多地考虑了区域范围内像素信息的一致性与不一致性的区分度，即自相似性。该性质符合大多数图像存在的一致性，即图像中同一物体往往具有相似甚至相同的像素值；（3）使用标准差做自适应阈值作为二值化编码描述子的判断条件。相较于SLIF描述子仅仅依照中心采样点与其周围采样点差分像素值是否大于或者小于0作为二值化编码描述子的判断条件，提出利用参与编码的采样点标准差作为判断邻域采样点是否与中心采样点满足自相似性来构建描述子。该阈值的设计根据周围像素点一致性情况（标准差能很好地反映样本的一致性信息）来自适应调节一致性标准。若样本范围内标准差过大，则适当放宽一致性标准。该设计也是符合视觉直觉的，虽然图像中物体的像素信息较为相似，但很少完全一致，即使完全一致，由于光照不均匀等环境噪声的存在，其拍摄的图像也会存在局部色差。故该设计增强了描述子的鲁棒性。

此外，在设计过程中也汲取了SLIF描述子的优点，在采样点数相同的情况下，其圆蛛网状采样模型采样邻域更广；其次，该采样模型的采样范围、采样点数都是可调的，以适应不同场景的要求（式（2）的参数K调节采样范围，M、N调节采样点的个数）。

3 实验结果与分析

为了测试提出的描述子在特征提取及配准方面有较好的性能，设计了如下实验来证明其有效性。

3.1 旋转平移实验

为了证明所提描述方法在基于特征提取配准方法中有更好的精度，将本文提出的描述方法与SLIF描述子和SURF描述子作对比。不同描述子所采用的特征提取方法及特征匹配准则有差异。考虑到实验的公平性，均采用SURF特征点提取方法及最近邻匹配准则且不采用误匹配点消除策略。其中，本文方法所采用的参数为：K=10，M=0，N=9，SLIF及SURF描述子均采用默认参数。

特征描述及配准图像来自于RIRE［26］中patient-001 CT大脑切片图像，对图像分别进行了旋转及平移变换。其中，表1为旋转图像描述子性能比较，其测试的旋转的范围为［-30°，30°］（旋转中心为图像中心点）。表2为平移图像描述子性能比较，其测试的水平方向及垂直方向位移范围均为［-20，20］像素。表1、表2所示评估指标均为选取12组随机值进行测试的平均值。

表1测试了本文提出的描述子在旋转图像上特征描述及配准的性能。从表1可发现，本文算法的平均召回率为0.492，比SLIF高0.017；与此同时，其平均错误率为0.022，远低于其他算法。由于根据本文提出的描述子得到的匹配特征点误差较小，故得到的配准图像角度偏差也优于SLIF。可见，本文提出的描述子在旋转图像上的性能优于SLIF及SURF。

表1 旋转图像描述子性能比较

表2测试了本文提出的描述子在平移图像上特征描述及配准的性能。从表2可发现，三种算法的召回率相似，但本文算法的特征点匹配的平均错误率最低，为0.022。与此同时，经本文提出的描述子配准的水平方向及垂直方向误差均为最低。可见，本文提出的描述子在平移图像上的性能也优于SLIF和SURF。

表2 平移图像描述子性能比较

3.2 抗噪实验

为了证明所提出的描述方法对噪声具有良好的鲁棒性，且其具有媲美全像素配准方法的精度，选取了基于全像素误差平方和（Sum of Squared Differences，SSD）配准方法［27-28］以及基于全像素互相关（Cross Correlation，CC）配准方法［29-30］作为对比实验。由于基于SLIF特征点描述符配准算法在抗噪声实验方面性能较差［25，31］，所以不把该算法作为对比算法。选取CT大脑图像作为测试数据集，其参考图像均无噪声，浮动图像分别加入高斯、椒盐和泊松噪声。如图6所示，图6（a）为干净的参考图像，图6（b）至图6（d）为经平移的浮动图像，其相对于参考图像的水平偏移量均为24像素，垂直偏移量均为22像素。其中图6（b）加入了均值为0、方差为0.01的高斯噪声，图6（c）加入了椒盐噪声，图6（d）图加入了泊松噪声。

为了使基于本文提出的描述子特征配准算法具有更优越的性能，在使用最近邻算法完成特征匹配后，利用RANSAC算法［23］剔除误匹配特征点，以此提高精度。

下面以图6中参考图像（a）及浮动图像（b）（含高斯噪声）为例，展示本文描述子的特征点匹配及配准效果，图6（e）为特征点匹配效果示意图，经过本文提出的描述子及误匹配点消除算法后，其特征点匹配效果良好。经空间变换矩阵估计的旋转平移变换矩阵得到的配准效果图如图6（f）所示。

本文提出的算法在高斯噪声、泊松噪声及椒盐噪声图像配准的性能指标分别如表3和表4所示。其中表3为仅进行平移的配准实验，表4为仅进行旋转的配准实验，其旋转角度为顺时针方向15°。

表3 不同噪声下平移图像配准性能比较

表4 不同噪声下旋转图像配准性能比较

由表3和表4可以看出，本文算法得到的精度和配准时间均远远好于SSD及CC配准算法。其中，含有椒盐噪声的图像使用基于全像素的SSD算法并不能完成配准。对比表3和表4中各种不同噪声的配准实验，可以发现相对于高斯噪声和泊松噪声，椒盐噪声图像配准精度相对较低，其精确配准难度相对较大。

4 结束语

针对SLIF描述子邻域结构选择过于单一，描述方法过于简单，本文提出了一种改进的SLIF描述子用于图像配准。提出的描述子的描述邻域由原本单一的方形邻域扩展为方形邻域、环形邻域及径向邻域，其描述能力大大增强。此外，利用图像区域内像素点存在相似性的特点，构建了基于像素差分信息的描述方法，并利用邻域范围内的标准差作为自适应阈值来衡量相似度，很好地增强了描述的鲁棒性。实验表明，基于本文提出的描述子的配准方法对比其他基于特征描述的配准方法和基于全像素信息的配准方法，其性能更加优异。