基于NSST-DWT-ICSAPCNN的多模态图像融合算法

2022-05-23 02:22:22王晓娜田妮莉

红外技术 2022年5期

王晓娜，潘晴，田妮莉

王晓娜，潘晴，田妮莉

（广东工业大学信息工程学院，广东广州 510006）

为了增加融合图像的信息量，结合非下采样剪切波变换（Non-Subsampled Shearlet Transform, NSST）和离散小波变换（Discrete Wavelet Transform, DWT）的互补优势，提出了改进的多模态图像融合方法。采用NSST对两幅源图像进行多尺度、多方向的分解，得到相应的高频子带和低频子带；利用DWT将低频子带进一步分解为低频能量子带和低频细节子带，并利用最大值选择规则融合能量子带；采用改进连接强度的自适应脉冲耦合神经网络（Improved Connection Strength Adaptive Pulse Coupled Neural Network, ICSAPCNN）分别融合细节子带和高频子带，并对能量子带和细节子带进行DWT逆变换，得到融合的低频子带；采用NSST逆变换重构出细节信息丰富的融合图像。实验证明，提出的算法在主观视觉和客观评价方面均优于其他几种算法，且能同时适用于红外与可见光源图像、医学源图像的融合。

多模态图像；图像融合；离散小波变换；自适应脉冲耦合神经网络；非下采样剪切波变换

0 引言

多模态图像融合[1]是指从不同模态的源图像中提取重要信息，合成一幅比单一源图像更清晰、内容更全面的图像，便于人眼的观察和计算机的处理。

近年来，随着多尺度几何分析[2]、稀疏表示[3]、深度学习[4]等理论的发展，多模态图像融合技术取得了很大的进展。Bulanon等[5]采用拉普拉斯金字塔变换将源图像中的特征按照不同的尺度分解到不同的分解层上，由此来融合源图像中的显著特征；Zhan等人[6]提出了基于离散小波变换（discrete wavelet transform, DWT）的红外与可见光图像融合方法，虽然DWT在保留图像细节方面具有良好的性能，但缺乏平移不变性，导致融合图像的边界不连续。Liu等[7]提出了一种基于自适应稀疏表示（adaptive sparse representation，ASR）的多模态图像融合算法，融合的高频子带中保留了源图像的结构特征，但融合结果对比度极低、细节丢失严重。文献[8]提出了一种基于卷积神经网络（convolutional neural network，CNN）的图像融合算法，能同时实现显著性水平测评和权重分配，但融合结果中丢失了较多的细节信息。文献[9]提出了一种基于自适应脉冲耦合神经网络（adaptive pulse coupled neural network，APCNN）的非下采样轮廓波变换（non-subsampled contourlet transform，NSCT）域图像融合算法，由于APCNN模型中的连接强度设置为常数影响了融合结果的精度，且NSCT对各向异性的信息表示能力较弱，导致融合图像中丢失了边缘信息，针对此问题，文献[10]将非下采样剪切波变换（non-subsampled shearlet transform, NSST）和APCNN相结合，解决了NSCT方向有限的问题，且具有平移不变性[11]，因此被广泛应用[10-13]。以上算法虽然在一定程度上提高了融合图像的质量，但都存在图像的边缘细节丢失、视觉效果差等问题。

为了增加融合图像中的细节信息，提出了一种基于NSST-DWT-ICSAPCNN的多模态图像融合方法。采用NSST对源图像进行多尺度、多方向的分解得到高频和低频子带图像。考虑到NSST对细节处理精度仍不够高，而DWT在保留图像细节方面具有良好的性能，因此采用DWT进一步分解低频子带，提取源图像中容易被NSST分解忽略的细节信息。此外，为了增强中心神经元受到周围神经元的影响程度，将局部标准差的Sigmoid函数作为连接强度来构建改进型连接强度自适应脉冲耦合神经网络（improved connection strength adaptive pulse coupled neural network, ICSAPCNN），由于APCNN具有全局耦合特性和脉冲同步特性[14]，因此能更好地利用高频子带图像的全局特征。本文结合NSST、DWT、ICSAPCNN的互补特性融合多模态图像，通过实验验证了所提算法的有效性。

1 基本理论

1.1 非下采样剪切波变换

NSST分解过程有两步，第一步采用非下采样金字塔滤波器组（NSPF）对待融合的源图像进行级尺度分解，实现图像的多尺度化。第二步采用剪切滤波器（SFB）实现高频子带的多方向化，第级方向分解个数为2。最终得到＋1个子带图像[11]，即1个低频和个高频子带图像，均与源图像的大小相同。

NSST不仅可以在多方向和多尺度上表示图像，还具有平移不变性，并且其分解过程中没有使用下采样运算，消除了伪吉布斯现象。NSST二级分解过程如图1所示，本文中NSST分解的级数设置为4，方向数设为[8,8,16,16]。

图1 NSST二级分解过程

1.2 离散小波变换

DWT可以将源图像分解成一系列的能量子带和细节子带图像，分解过程使用一组高通、低通滤波器来执行，如图2所示：先对图像a中每行构成的一维数据进行一维小波分解，得到高、低频信息。再对每列构成的一维数据做相同的操作，最终得到4个子带图像：a－1，1－1，2－1，3－1。其中，a－1由行低通、列低通得到，包含图像的近似信息，1－1由行低通、列高通得到，2－1由行高通、列低通得到，3－1由行高通、列高通得到。1－1，2－1，3－1分别包含水平、垂直、对角方向上的边缘细节信息[15]。

图2 DWT分解过程

1.3 自适应脉冲耦合神经网络

APCNN模型是通过模拟猫的大脑视觉皮层中同步脉冲发放现象而建立起来的一个简化模型[16]，它不需要任何的训练过程，而是基于迭代计算，其数学方程描述如式(1)～(5)所示：

F[]＝S(1)

输入图像中的像素点(,)与APCNN模型中的神经元之间存在一一对应的关系[17]，神经元获取外部刺激输入的通道有两个，一个是反馈输入F，由像素点(,)的灰度绝对值S决定，另一个是连接输入L，其中V是放大系数，W为突触连接矩阵。将F和L进行非线性相乘调制后得到神经元的内部活动项U，其中F为反馈输入的衰减时间常数。当U大于动态阈值E时发放脉冲Y，神经元产生一次点火。当神经元点火时，E立刻增大，然后又按照指数逐渐衰减，直到神经元再次发放脉冲，其中E为动态阈值的衰减常数，E为脉冲的放大系数。当迭代结束时，得到点火频率映射图。

2 改进的多模态图像融合过程

基于本文方法的图像融合流程如图3所示，采用NSST对源图像A、B进行分解得到高低频子带；再对低频子带进行DWT分解得到低频能量子带和细节子带，并采用最大值选择规则融合能量子带，利用ICSAPCNN分别对细节子带和高频子带进行融合；对能量子带和细节子带进行DWT逆变换得到融合的低频子带；最后采用NSST逆变换重构出融合图像F。

2.1 低频子带融合规则

本文结合区域能量（RE）和梯度能量（EOG）融合低频系数，选择×区域窗口，具体步骤如下：

Step 1根据式(6)分别计算两幅低频能量子带图像的区域能量RE1和RE2。

Step 2根据式(7)分别计算两幅低频能量子带图像的梯度能量EOG1和EOG2。

式中：L(,)和G(,)分别表示(,)位置的低频能量子带系数值和梯度值。

Step 3 将RE和EOG相乘作为低频的显著性水平度量（ALM），定义如式(9)所示：

上式(6)～(9)中，∈{1,2}。

Step 4根据极大值规则选择ALM较大的点所对应的低频系数作为融合的低频系数F(,)：

2.2 高频子带融合规则

2.2.1 改进的连接强度

连接强度取值范围为(0,1)，调节着神经元之间的相互影响程度。本文利用Sigmoid函数表示APCNN模型的连接强度，避免了将连接强度设置为常数时模型的不灵活性。考虑到人眼视觉神经系统中各个神经元的连接强度不会完全相同，令连接强度由输入图像的局部标准差决定，标准差越大的区域对应的高频子带中包含更多的显著特征，连接强度随之增大，从而增强神经元受到周围神经元的影响程度，提高了ICSAPCNN对高频子带全局信息的利用程度。

2.2.2 融合规则

ICSAPCNN模型中各神经元由某一高频子带刺激后，将得到对应的点火频率映射图，点火次数表征高频系数中包含细节信息的显著程度，次数越大，对应位置所包含的细节信息越丰富。因此选择点火次数较大的点所对应的系数作为融合的高频系数，高频子带和低频细节子带具体的融合步骤如下：

Step 1 初始化ICSAPCNN模型，将输入激励S设为高频子带（低频细节子带）图像像素点(,)的灰度值，并令L[]＝U[]＝Y[]＝E[]＝0。

Step 2根据式(11)计算改进的连接强度，其余参数根据文献[9]设定。

Step 3根据式(13)计算模型每次迭代结束后的点火次数：

Step 4根据式(14)选择融合的高频系数（低频细节子带系数）。

式(13)～(14)中：、分别对应高频子带（低频细节子带）的第层、第个方向。式(14)中A、B分别对应两幅高频子带图像或两幅低频细节子带图像。

3 实验结果与分析

3.1 实验设置

本文所有实验均在Windows10，MATLAB 2019a软件上运行。为了验证本文方法的有效性，实验所用到的多模态图像包括6组红外图像（Infrared）与可见光图像（Visible），8组计算机断层扫描图像（CT）与核磁共振图像（MRI）。与近几年的4种图像融合方法做对比，文献[7]采用基于ASR的融合方法，文献[8]采用基于CNN的融合方法，文献[9]和文献[10]均采用基于多尺度变换和APCNN的融合方法（分别记为NSCT-APCNN、NSST-APCNN），本文实验分析中展示了部分多模态源图像的融合结果。

3.2 客观评估指标

Zheng等人在文献[18]中总结了很多评估融合图像质量的客观指标，本文选取的评估指标包括熵EN，互信息MI，标准差SD，视觉信息保真度VIFF，非线性相关信息熵IE，基于Tsallis的熵TE。对于本文所有的客观评估指标，其值越大，融合后的图像质量越高，融合效果越好。

3.3 仿真结果与分析

本文列出了部分源图像的融合结果，图4(a)和图4(b)分别是“road”可见光和红外源图像，图4(c)～(g)为对两幅源图像应用不同方法得到的融合结果。观察可知：使用ASR和CNN方法的融合结果中能量严重丢失，公路上的行人分辨率极低，视觉效果差；使用NSCT-APCNN和NSST-APCNN方法的融合结果中人物边缘模糊，细节信息丢失；本文利用Sigmoid函数表示连接强度，在两幅高频子带对应位置的标准差相差较小时ICSAPCNN模型也能表现出较好的效果。由局部放大图可知，基于本文方法的结果中人物清晰，辨识度高，保留了源图像中的重要信息。图5(a)和图5(b)分别是“tree”可见光和红外源图像，图5(c)～(g)为对两幅源图像应用不同方法得到的融合结果。观察融合结果可知基于本文方法的融合结果最清晰，融合效果最好。由不同方法融合“road”和“tree”两组红外与可见光源图像的客观评估指标值如表1所示，显然，由本文方法得到的客观评估指标值均较高。由不同方法融合6组红外和可见光源图像的客观评估指标结果的平均值如表2所示，由表2可知，除了SD和TE，其余4个指标EN、MI、VIFF、IE均为最优，与主观视觉效果保持一致，验证了本文方法对于红外与可见光图像融合的有效性。

图4 “road”红外和可见光图像以及融合结果

图5 “tree”红外和可见光图像以及融合结果

表1 两组红外与可见光图像客观评估指标值

表2 六组红外与可见光图像客观评估指标平均值

图6(a)和图6(b)分别为致死性脑卒中CT和MRI源图像，图6(c)～(g)为对两幅医学源图像应用不同方法得到的融合结果。观察仿真结果图可知：使用ASR方法的融合结果亮度较暗，对比度严重丢失，视觉效果差；使用CNN方法的融合结果存在能量丢失现象；使用NSCT-APCNN和NSST-APCNN的融合方法是直接对低频子带图像进行融合，这种做法不能充分提取到源图像的细节信息；本文利用DWT进一步分解低频子带图像，提取源图像中容易被NSST分解忽略的信息，由局部放大图可知，得到的融合结果（图6(g)）中保留了源图像较多的细节信息，且对比度与源图像保持一致，视觉效果最好。图7(a)～(b)分别为脑膜瘤CT和MRI源图像，图7(c)～(g)为融合结果，观察可知，基于本文方法的融合结果细节信息最丰富，融合效果最好。由不同方法融合两组医学源图像的客观评估值如表3所示，显然，由本文方法得到的客观评估指标值均较高。由不同融合方法融合8组医学图像的客观评估指标结果的平均值如表4所示，由表4可知，除了SD，其他5个评估指标均为最优，与主观视觉效果一致，验证了本文方法对于多模态医学图像融合的有效性。

图6 致死性脑卒中CT和MRI图像以及融合结果

图7 脑膜瘤CT和MRI图像以及融合结果

表3 两组医学图像客观评估指标值

表4 八组医学图像客观评估指标平均值

4 结论

为了在融合过程中提取更多的图像信息，提出了一种基于NSST-DWT-ICSAPCNN的多模态图像融合方法。对源图像经NSST分解得到的低频子带图像做DWT分解，解决了部分源图像细节丢失的问题。此外，将低频子带图像的区域能量和梯度能量相结合作为显著性水平度量，有效地保留了图像的能量和边缘细节信息。采用ICSAPCNN获取低频细节子带图像和高频子带图像的点火频率映射图，提高了对低频细节子带和高频子带图像全局信息的利用程度。实验结果显示所提算法相比于其他4种多模态图像融合算法，在主观视觉和客观评估指标方面均表现最优，同时验证了本文方法对于多模态红外和可见光图像与多模态医学图像均有较好的融合效果。下一步将继续研究双树复小波变换（Dual Tree Complex Wavelet Transform，DTCWT）、双密度双树复小波变换（Double Density Dual Tree Complex Wavelet Transform，DDDTCWT）对低频子带图像做进一步分解的效果。

[1] YANG Y, QUE Y, HUANG S, et al. Multimodal sensor medical image fusion based on type-2 fuzzy logic in NSCT domain[J]., 2016, 16(10): 3735-3745.

[2] LI G, LIN Y, QU X. An infrared and visible image fusion method based on multi-scale transformation and norm optimization[J]., 2021, 71: 109-129.

[3] LI X, ZHOU F, TAN H. Joint image fusion and denoising via three-layer decomposition and sparse representation[J]., 2021, 224: 107087.

[4] XU H, MA J. EMFusion: An unsupervised enhanced medical image fusion network[J]., 2021, 76: 177-186. .

[5] Bulanon D M, Burks T F, Alchanatis V. Image fusion of visible and thermal images for fruit detection[J]., 2009, 103(1): 12-22.

[6] ZHAN L, ZHUANG Y, HUANG L. Infrared and visible images fusion method based on discrete wavelet transform[J]., 2017, 28(2): 57-71.

[7] LIU Y, WANG Z. Simultaneous image fusion and denoising with adaptive sparse representation[J]., 2015, 9(5): 347-357.

[8] LIU Y, CHEN X, CHENG J, et al. Infrared and visible image fusion with convolutional neural networks[J]., 2018, 16(3): 1850018.

[9] ZHU Z, ZHENG M, QI G, et al. A phase congruency and local Laplacian energy based multi-modality medical image fusion method in NSCT domain[J]., 2019, 7: 20811-20824.

[10] ZHANG L, ZENG G, WEI J, et al. Multi-modality image fusion in adaptive-parameters SPCNN based on inherent characteristics of image[J]., 2019, 20(20): 11820-11827.

[11] 张蕾. 采用改进平均梯度与自适应PCNN的图像融合[J].计算机应用与软件, 2021, 38(3): 218-223.

ZHANG Lei. Image fusion using improved average gradient and adaptive PCNN[J]., 2021, 38(3): 218-223.

[12] YIN M, LIU X, LIU Y, et al. Medical image fusion with parameter- adaptive pulse coupled neural network in nonsubsampled shearlet transform domain[J]., 2018, 68(1): 49-64.

[13] Diwakar M, Singh P, Shankar A. Multi-modal medical image fusion framework using co-occurrence filter and local extrema in NSST domain[J]., 2021, 68: 102788.

[14] 邓辉, 王长龙, 胡永江, 等. 脉冲耦合神经网络在图像融合中的应用研究[J]. 电光与控制, 2019, 26(11): 19-24.

DENG Hui, WANG Changlong, HU Yongjiang, et al. Application of pulse coupled neural network in image fusion[J]., 2019, 26(11):19-24.

[15] 杨风暴, 董安冉, 张雷, 等. DWT、NSCT和改进PCA协同组合红外偏振图像融合[J]. 红外技术, 2017, 39(3): 201-208.

YANG Fengbao, DONG Aran, ZHANG Lei, et al. Infrared Polarization Image fusion using the synergistic combination of DWT, NSCT and improved PCA[J]., 2017, 39(3): 201-208.

[16] TAN W, Tiwari P, Pandey H M, et al. Multimodal medical image fusion algorithm in the era of big data[J]., 2020: 1-21.

[17] JIANG L, ZHANG D, CHE L. Texture analysis-based multi-focus image fusion using a modified Pulse-Coupled Neural Network (PCNN)[J]., 2021, 91: 116068.

[18] LIU Z, Blasch E, XUE Z, et al. Objective assessment of multiresolution image fusion algorithms for context enhancement in night vision: a comparative study[J]., 2011, 34(1): 94-109.

Multi-modality Image Fusion Algorithm Based on NSST-DWT-ICSAPCNN

WANG Xiaona，PAN Qing，TIAN Nili

(Faculty of Information Engineering, Guangdong University of Technology, Guangzhou 510006, China)

To increase the information of the fused image, this paper proposes an improved multi-modality image fusion algorithm that combines the complementary advantages of the non-subsampled shearlet transform (NSST) and discrete wavelet transform (DWT). NSST was used to decompose the two source images in multiscale and multi-direction to obtain the corresponding high-frequency and low-frequency sub-bands. The low-frequency sub-bands were further decomposed into low-frequency energy sub-bands and low-frequency detail sub-bands by the DWT, and the low-frequency energy sub-bands were fused by the maximum selection rules. An adaptive pulse-coupled neural network with improved connection strength (ICSAPCNN) was used to fuse the detailed sub-bands and high-frequency sub-bands, and the energy sub-bands and detailed sub-bands were fused by inverse DWT to obtain the fused low-frequency sub-bands. The NSST inverse transform was used to reconstruct the fusion image with rich details. The experimental results verified that the proposed algorithm is superior to the other algorithms in both subjective vision and objective evaluation and can be applied to the fusion of both infrared and visible source images and medical source images.

multi-modality images, image fusion, discrete wavelet transform, adaptive pulse coupled neural network, non-subsampled shearlet transform

TP391

1001-8891(2022)05-0497-07

2021-09-02；

2021-11-24.

王晓娜（1997-），女，硕士研究生，主要研究方向为图像处理、模式识别。E-mail：717057123@qq.com

潘晴（1975-），男，副教授，主要研究方向为图像处理、信号处理、模式识别等。E-mail：pangqing@gdut.edu.cn

国家自然科学基金项目（61901123）。