基于多尺度知识学习的深度鲁棒水印算法

2022-11-08 12:42樊缤李智高健
计算机应用 2022年10期
关键词:先验鲁棒性特征提取

樊缤,李智,高健

(贵州大学 计算机科学与技术学院,贵阳 550025)

0 引言

随着医学影像技术的不断发展,医学图像成为医生诊断患者病情的重要依据。弥散加权成像(Diffusion-Weighted Imaging,DWI)是一种新型的功能磁共振成像技术,通过检测活体组织内部水分子无规则的扩散运动,反映机体组织在生理状态下水分子扩散的情况,间接地反映细胞密度、组织结构等方面的信息[1]。该技术是目前唯一可以无创地观察活体组织内部水分子运动的方法,对大脑分割、肿瘤检测等重大疾病诊断具有巨大的临床应用价值。为了给患者提供更为准确的临床诊断和最佳的治疗方案,基于医学图像的远程共享和专家远程诊断技术已经成为重要的诊疗方式。伴随远程的医疗共享、诊断技术的不断发展与普及,也让越来越多的原本在医院单机上存储和使用的医学图像数据需要通过网络进行传输。可是未被保护的医学图像在远程传输过程中极易遭受窃取、非法使用、恶意攻击或篡改,严重影响医学专家的正确诊断。为有效保护医学图像信息的完整性,向远程专家提供准确的医学图像,以及限制未授权用户的使用,基于医学图像的数字水印技术成为解决上述问题的有效手段。

对医学图像进行数字水印保护时:一方面要遵循医学图像所具有的分辨率高、边界模糊、灰度和纹理度分布不均衡、语义明确和结构固定等特点;另一方面不能破坏原始医学图像的灰度信息而影响医生的诊断,所以基于医学图像的可逆水印算法成为研究者们关注的重点[2-9]。但当前大多数可逆水印面对各种有意或无意的攻击时,几乎不具备鲁棒性。因此一些医学图像信息保护领域的学者们探索和尝试将鲁棒水印算法的思想应用于医学图像版权信息保护中[10-14]。文献[10]中对医学图像的非感兴趣区域进行离散小波变换并根据视觉熵原理选择合适的中频子带进行舒尔变换获得特征矩阵,然后将无损压缩后的水印结合经过粒子群细菌觅食优化算法计算出的阈值T嵌入到特征矩阵中。该算法引入粒子群细菌觅食优化算法平衡水印鲁棒性与视觉质量,迭代寻找最佳阈值T,避免人工寻找阈值所面临的局限性。文献[11]中提出将医学图像分为多个子块,对熵值最大的子块进行非下采样轮廓波变换、冗余离散小波变换与奇异值分解得到奇异矩阵,再将经过混沌加密的水印嵌入到奇异矩阵中。该算法结合了轮廓波变换具有多尺度、多方向信息,混沌加密具有伪随机特性的优点,使水印的鲁棒性、安全性都达到医学图像的要求。文献[12]中提出将水印嵌入医学图像经离散小波变换与奇异值分解后的奇异矩阵中,加入汉明码以减少图像在网络传输中的噪声带来的损失。文献[13]中提出结合最大类间方差算法与面积控制阈值法确定DWI图像的待嵌入区域,计算该区域经整数小波变换后的低频子带的统计直方图,最后根据直方图的相邻簇的比值关系嵌入水印。该算法在DWI 图像的纤维参数改变量极小的情况下,对几何、噪声攻击都具有较高的鲁棒性。文献[14]中对经过离散小波变换与舒尔变换后的医学图像分块,以最小化图像失真程度与提高水印鲁棒性为目标,通过萤火虫优化算法在图像块的中频子带中迭代寻找最佳的嵌入位置。

虽然传统的鲁棒水印算法在水印的不可感知性和鲁棒性方面具有一定的优势,但传统的启发式算法需要根据图像的各种特性和专门的噪声攻击设计不同的水印保护方法[15]。文献[15]中利用神经网络在噪声攻击下的高鲁棒性,突破了传统方法的局限性。文献[16]中通过增加对抗训练和信道编码进一步提高水印的鲁棒性。文献[17]中在嵌入水印的过程中结合多尺度的上下文特征重构图像,使含水印图在纹理细节区域与原图保持高度相似。与传统的启发式算法相比,神经网络算法的关键优势在于它只需要在训练过程中加入新的噪声,而不需要为新的噪声攻击设计专门的算法。然而,现有的深度水印算法都是针对数字图像嵌入水印,面对只有少量数据集、对视觉质量要求较高的DWI 图像时,无法满足医学图像的临床诊断要求,更不能达到DWI 图像的视觉质量要求。为了解决以上问题,本文针对DWI 图像提出一种端到端的基于多尺度知识学习的具有对抗结构的深度鲁棒水印算法。

本文的主要工作如下:

1)为从少量样本中重构出高视觉质量的含水印DWI 图像,本文提出一个具有多尺度结构的水印嵌入网络,微调预训练网络以多尺度的方式充分提取DWI 图像及其先验领域知识获得用于图像重构的局部以及全局特征。通过融合多尺度的重构特征,使重构得到的含有水印信息的弥散加权图像的视觉质量和弥散特征满足临床诊断要求。

2)为提高水印对噪声的鲁棒性,本文提出一个基于金字塔特征学习的水印提取网络,从含有水印信号的弥散加权图像的不同尺度的上下文中提取水印信号,从而有效学习水印信号的分布相关性,提高算法的鲁棒性。

1 基于知识的DWI图像特征提取

1.1 DWI图像特点

如图1 所示,与一般数字图像不同,DWI 图像数据不仅包含明显的边界和纹理信息,还有具有高维数据结构。DWI图像是一个四维的医学影像序列。其中,前两个维度代表器官的切片,第三个维度代表断层距离,第四个维度代表扩散梯度方向。由于DWI 图像具有精度高、结构固定、纹理丰富、对失真容忍度低以及样本数量稀少等特点,使现有的基于深度学习的水印算法不能严格满足临床诊断中DWI 图像的视觉质量和扩散参数的要求。

针对DWI 图像精度高、结构固定、纹理丰富的特点,本文将先验领域知识引入算法中,不仅利用图像的语义特征重构图像,还在重构过程中加入DWI 图像的边缘、纹理、频域特征,使神经网络在反向传播的过程中能自适应地整合多种先验知识重构图像。最近的研究表明,迁移学习被证明在少量样本的医学图像重建中具有潜力[18-21],多尺度特征可以充分表达数据的全局信息与局部信息,从而提高模型的拟合能力,提高重建图像的质量[22-23]。基于以上启发,本文提出一个基于多尺度知识学习的鲁棒水印算法。

1.2 边缘特征提取

利用神经网络对DWI 图像进行重构,图像的边缘信息会随着神经网络的加深而逐渐失真甚至消失。Canny 算子[24]通过结合高斯滤波与双阈值检测边缘,能从高精度的DWI 图像中去掉图像噪声引起的伪边缘,精确定位DWI 图像的结构边缘。针对DWI 图像具有固定结构、边缘明显的特点,本文以高斯标准差为1.5 的Canny 算子提取的纹理特征作为部分先验知识。计算步骤包括:1)对DWI 图像进行高斯滤波;2)使用一阶偏导有限差分计算图像的梯度与方向;3)对梯度幅值进行非极大值抑制;4)采用双阈值算法检测、连接边缘。

1.3 纹理特征提取

以多尺度的方式对DWI 图像进行重构时,虽然不同尺度的特征能充分表达图像的语义信息,但跨尺度采样会丢失图像的纹理细节特征。本文充分考虑算法的空间与时间复杂度,采用等价局部二值模式(Local Binary Pattern,LBP)算法[25]提取图像的纹理特征。特征提取过程包括以下3 个步骤:1)遍历所有像素点,选取每个像素点的3×3 邻域;2)对于每个邻域,以中心点为阈值,与周围8 个点进行计算形成8 位二进制序列;3)计算二进制序列的“01”或“10”的跳变次数,若跳变次数小于3,则该二进制序列对应的十进制即为纹理特征值;否则以邻域集内的采样点个数作为纹理特征值。

1.4 频域特征提取

仅从单一的空间域重构图像会产生结构性、非局部的伪影。频域特征作为描述图像灰度变化剧烈程度的指标,对于减少重构图像的伪影具有一定的优势[26]。为避免重构图像的伪影对临床诊断造成影响,本文对原始图像进行二维快速傅里叶变换[27],提取其频域特征作为部分先验知识。图2 分别展示了原始图像及其边缘、纹理与频域特征。本文组合这三种特征作为先验领域知识并引入神经网络的训练中,通过多种知识正则化网络,重构出在视觉质量上与原始图像高度相似的含水印图。

1.5 算法流程

本文算法的流程如图3 所示,水印的嵌入与提取过程包括5 个阶段:

1)特征提取。提取原始图像Io的纹理、边缘、频域特征组成先验领域知识Inf。

2)水印嵌入。水印嵌入网络结合先验领域知识Inf重构原始图像Io,并在该过程中嵌入水印Wo,生成含有水印的图像Iw。

3)噪声攻击。噪声攻击模块对含水印图像Iw添加噪声,生成噪声图像In。

4)水印提取。水印提取网络从噪声图In中提取水印Wd。

5)视觉增强。对抗网络缩小含水印图Iw与原图Io的视觉质量差距。

1.6 基于多尺度知识学习的水印嵌入

现有的神经网络方法[15-16]使用单一尺度的方式重构图像,信息获取不充分限制了网络捕捉特征的能力,从而导致重构的DWI 图像在边缘细节处较为平滑,纤维走向不能与原图保持一致。根据香农容量定理[28],信息冗余性是鲁棒性的必要条件。基于以上分析,本文提出在图像特征提取阶段,首先对原始图像及其先验领域知识进行多尺度特征提取,分别获得不同尺度下的图像语义特征和图像先验知识特征;接着在图像重构阶段,利用跳转连接融合多种尺度的图像特征以此对图像进行重构,并在该过程中冗余地嵌入水印信息,获得含有水印信息的DWI 图像,使重构的含水印图的边缘、纹理区域与原图高度相似,满足DWI 图像的可视质量以及弥散特征要求。整个水印嵌入过程分为特征提取阶段与图像重构阶段,本文定义特征提取阶段的第i层的提取特征为Feextr_i,图像重构阶段的第i层的重构特征为Fereco_i,分别由式(1)与式(2)计算得到:

其中:Infi表示DWI 图像的先验知识特征(i=1,2,…,N,N为多尺度采样的次数),Inf1由原始DWI 图像的纹理、边缘、频域信息按通道拼接而成;Fk(·)表示级联一个3×3 卷积与下采样操作对先验知识特征进行提取;Wi表示水印矩阵,W0为未扩展的二值水印序列;E(·)表示将长度为L的二值水印序列扩展为通道数为L,长与宽与第i层重构特征相同的水印矩阵;Feextr_1为Io,Fereco_1为Iw;Extrconv与Recoconv分别为本文定义的特征提取运算(式(5))与图像重构运算(式(6)):

其中:Convk(·)表示感受野为k的卷积运算;Sdown(·)与Sup(·)分别表示下采样与上采样;Convpre_i(·)表示利用预训练网络的第i个卷积模块提取特征;{·}表示特征通道拼接;Zi(·)表示级联一个上采样或下采样操作与1×1 卷积将输入特征的尺寸调整至与第i层重构特征相同大小;SE(·)表示利用通道注意力模块[29]对特征进行通道权重变换。图4 展示了水印嵌入的全过程。在图4 左侧的特征提取路径上,通过级联多个特征提取运算(图5),获得多个不同尺度的提取特征。

特征提取运算首先使用预训练网络与下采样操作对原始图像的语义特征进行提取,同时利用一个3×3 卷积与下采样操作对图像的先验知识进行特征提取,接着将提取的语义特征与先验知识特征进行特征通道拼接,最后利用一个1×1卷积对特征通道进行压缩。在图4 右侧的图像重构路径上,级联多个图像重构运算(图6)将不同尺度的提取特征与重构特征融合。

具体地,每层图像重构运算对上一层输出的重构特征进行上采样与1×1 卷积,对同一层的提取特征进行1×1 卷积,对下一层的提取特征进行下采样与1×1 卷积,通过对以上三种相邻尺寸的特征进行空间尺度变换后获得相同尺寸的特征图,接着将以上特征进行3×3 卷积并与经过扩展的水印矩阵进行通道拼接形成带有水印的重构特征。为了平衡水印特征、重构语义特征、重构先验知识特征之间的权重,本文添加一个通道注意力模块让图像重构运算自适应地学习各个特征通道之间的相关性。最后,再利用一个3×3 卷积来降低多尺度特征融合所造成的伪影效应[30]。在整个水印嵌入过程中,上采样采用步长为2 的双线性插值,下采样采用步长为2、感受野为3 的最大池化,预训练网络采用残差网络(Residual Network,ResNet)[31],每个卷积模块包含一个卷积运算、批量归一化(Batch Normalization,BN)层、线性整流激活函数(Rectified Linear Unit,ReLU)。为提高含水印图与原图的语义相似度,本文在训练过程中利用感知损失[32]来缩小两者之间的语义差距。

1.7 基于金字塔特征学习的水印提取

当医学图像受到有意或无意的攻击时,隐藏在图像中的水印的相关性会被改变。为了提高所提算法的水印鲁棒性,需要充分考虑水印的分布特征。由于神经网络方法自适应地将水印嵌入到整个图像中,可能导致不同数量的水印信号被嵌入到相同大小的空间中。在这种情况下,传统的自上而下的卷积难以充分学习水印的分布信息。因此,本文提出一个基于金字塔特征学习的水印提取网络来解决上述问题。如图7 所示,所提网络由多个金字塔特征提取模块(Pyramid Feature Extraction Module,PFEM)和金字塔下采样模块(Pyramid Downsampling Module,PDM)以及一个最大池化操作与全连接运算组成。PFEM 并行使用采样步长分别为1、2、3 的3×3 扩张卷积[33]提取每个空间位置在不同尺度上的水印信号特征,结合不同范围的特征使神经网络充分学习水印信号在局部区域的分布相关性。图8 展示了不同采样步长的扩张卷积所对应的感受野,D为采样步长,R为特征感受野。在感受野范围相同的情况下,扩张卷积具有更少的模型参数,能有效提高计算速度。之后,本文级联一个1×1 卷积进行特征压缩,并通过跳跃连接融合压缩后的水印信号特征与原始水印特征以此避免网络退化。在PDM中,本文并行利用感受野为3 和5 的最大池化运算压缩水印特征的空间信息,相较于平均池化与卷积下采样,最大池化能充分保留纹理细节区域的梯度相关性[34],使网络更容易从灰度变化幅度更大的区域学习水印的相关信息。接着使用一个1×1卷积与通道拼接运算对多尺度的池化特征进行融合,并级联一个3×3 卷积拟合特征。在整个水印提取过程中,卷积模块包含一个卷积运算、BN 层、ReLU 激活函数。最后,二值交叉熵(Binary Cross-Entropy,BCE)损失(式(7))用来提高水印的正确率:

其中:Wd是从最后一个PFEM 中提取的水印;Wo是原始水印。水印嵌入与提取过程的损失函数如式(8)所示:

其中:λ1、λ2、λ3为平衡各损失函数的权重值;Lbce为水印损失;Lpercep为文献[32]中的图像感知损失;LG为文献[35]的图像对抗损失。

1.8 噪声攻击

针对医学图像在公网传输时可能遭受的有意与无意攻击,本文在训练过程中分别对含水印图Ie进行旋转、裁剪、像素替换、高斯噪声以及JPEG 压缩。其中,旋转攻击以图像的中心点为轴旋转一定的角度,通过旋转角度θ衡量旋转强度;裁剪攻击随机裁剪Ie的某一区域,通过(裁剪像素数量-Ie像素数量)与Ie像素数量的占比p控制裁剪强度;像素替换攻击将Ie的像素随机替换为其他图像的像素,像素替换攻击有2 种替换方式:一种是在全图范围选择像素点替换,一种是随机选择图像内的一个矩形块替换。通过替换像素数量与Ie像素数量的占比q控制替换强度。前三种方法都会引起像素点缺失,进而造成水印信息丢失;高斯模糊减少图像在网络信道传输过程中受到的高斯噪声的影响,使图像变得平滑,但由于减小了图像的灰度变化的幅度,隐藏于图像的水印也会受到影响,本文通过高斯核宽度σ控制高斯噪声强度;JPEG 压缩在量化过程中会丢失图像信息,隐藏于像素点中的水印也会随之丢失,本文通过质量因子Q控制压缩强度。

图9 可视化了DWI 图像遭受常规的噪声攻击时,噪声图与原图之间的视觉差异。

2 实验与结果分析

本文在公共DWI 数据集[36]上进行训练,并与一个基准算法HiDDeN(Hiding Data with Deep Networks)[15]相比,证明所提算法的优越性。通过降低数据的维度,得到约24 000 幅二维切片图像,选取19 000 幅切片作为训练集,选取5 000 幅切片作为测试集。为保证对比实验的公平性,本文将DWI图像的尺寸裁剪成128×128,水印由长度为32 位的二进制随机序列组成,采用Adam 优化器,学习率为0.000 1,200 个epoch。

2.1 多尺度学习的有效性

本文的多尺度学习从两个方面体现:一是多尺度采样,即在重构过程中通过多次下采样和多次上采样的方式获得不同尺度的重构特征,尺度较小的特征图能表征局部范围更大的图像语义信息,而尺度较大的特征图更注重图像的纹理、细节信息;二是多尺度融合,即在图像重构路径上,通过融合不同尺度的特征图,使神经网络既能学习图像的语义特征,又能学习图像的细节特征。本文以1.6 节所提网络为基础框架,通过调整框架结构证明以上两个方面都能提高网络的特征拟合能力。具体地,在重构过程中删除最大池化与双线性插值算法来取消多尺度采样,删除跳跃连接来取消多尺度融合。实验结果如表1 所示,对于没有多尺度采样与融合的实验1,其网络结构类似于自上而下地堆叠步长为1 的卷积运算,平均峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)达到46.12 dB;对于只有多尺度采样的实验2,其结果相较于无多尺度采样的实验1 有所提高,证明多尺度采样所得到的特征能有效提高网络的重构能力。对于实验3,在多尺度采样的基础上,融合了不同尺度的特征,平均PSNR 进一步提高,达到48.17 dB,充分说明多尺度采样以及多尺度融合对图像重构具有良好的性能提升。值得一提的是,因为多尺度融合的前提是多尺度采样,因此删除上、下采样,保留跳跃连接不属于“无多尺度采样,有多尺度融合”的情况。

表1 多尺度学习对图像视觉质量的影响Tab.1 Influence of multiscale learning on image visual quality

2.2 迁移学习的有效性

在图像重构过程中,本文在特征提取路径上加入迁移学习以从少量样本中提取图像语义特征,表2 展示了不同的预训练模型对重构图像视觉质量的影响。其中,实验1 采用无预训练的VGG16 网络[37]作为骨干网络解码图像。表2 第三列的64↗表示特征提取运算最开始的特征通道数为64,通道数量随着特征提取运算的叠加而增加一倍。64→表示每个特征提取运算的特征通道数量都为64。在该实验中,本文按表1 中实验3 的结构设计实验,即特征提取运算采用预训练网络提取不同尺度的特征,卷积通道数随着特征提取运算的叠加而增加一倍;图像重构运算融合多尺度的图像语义特征,卷积通道数随着图像重构运算的叠加而减少一半。结果如表2 所示,实验1~5 证明利用预训练模型提取语义特征都能不同程度地提高重构图像的视觉质量,ResNet18 具有最好的视觉效果,平均PSNR 达到54.20 dB。由于结合多尺度的特征重构图像具有庞大的模型参数,为了轻量化模型,提高计算效率,本文补增实验6~13,将每个图像重构运算的特征通道数控制为64 以及128 来探究特征通道数量对重构图像质量的影响。横向对比实验2、6、10、实验3、7、11、实验4、8、12、实验5、9、13 可知,轻量化模型后,DenseNet(Densely Network)[38]的PSNR 出现先下降后上升的情况。SqueezeNet(Squeezed Network)[39]与ResNet18 的PSNR 随着通道数的减少而增加,在通道数固定为64 的时候取得最高值,PSNR 分别达到52.75 dB 与54.88 dB。VGG16 在通道数固定为128时取得最高值,PSNR 达到54.17 dB。分析减少参数量能提升PSNR 的原因是:高级语义特征是图像的抽象表示,过多的高级语义特征对重构图像的细节纹理是不利的。基于以上分析,本文增加实验14~17,通过控制特征通道数量随着图像重构运算的叠加而减少一半来探究减少高级语义特征对重构图像视觉质量的影响。观察实验2、6、10、14、实验3、7、11、15、实验4、8、12、16、实验5、9、13、17,减少高级语义特征后所有模型的PSNR 都出现下降。分析其原因是:高级语义特征作为图像的抽象表示,能定位图像的结构边缘,这对于结构固定、拥有感兴趣区域的医学图像来说尤其重要,过少的高级特征不利于图像重构。综上所述:过多的高级语义特征对图像重构来说是冗余的,过少的高级语义特征不能清晰重构医学图像。当对视觉质量要求较高时,可选择PSNR最高的实验9 的结构作为水印嵌入网络;当对计算效率要求较高时,可选择更轻量化的实验10 的结构作为水印嵌入网络。

表2 迁移学习对图像视觉质量的影响Tab.2 Influence of transfer learning on image visual quality

2.3 先验知识的有效性

设计消融实验探究不同先验知识对提高重构图像视觉质量的有效性。该部分实验以表2 中实验9 的模型为水印嵌入网络的骨干框架,实验2~8 在实验1 的基础上加入不同类型的先验知识重构图像。对比实验1~4 可知,基于先验知识的重构结果优于单一的空间域重构结果,因为先验知识提供了更多的空间域无法充分学习的纹理、边缘以及全局语义特征。为进一步提高神经网络的泛化性,本文补充实验5~8,通过组合不同类型的先验知识让神经网络充分学习重构特征。其中,结合三种先验知识进行重构具有最优结果,PSNR达到57.82 dB。

表3 先验知识对图像视觉质量的影响Tab.3 Influence of prior knowledge on image visual quality

2.4 重构图像视觉质量

为了验证所提算法的优越性,本文引入PSNR 与结构相似性(Structural SIMilarity index,SSIM)来评价重构图像的视觉质量。前者衡量图像失真,是目前使用最广泛的一种图像评价标准;后者考虑人眼的视觉识别感知特性,评价结果与人的主观感受一致。如图10 所示,相较于基准算法HiDDeN[15],本文算法在DWI 图像的感兴趣区具有更高的视觉质量,平均PSNR 达到57.82 dB,而HiDDeN 的平均PSNR仅有39.08 dB,比本文算法低18.74 dB。对于平均SSIM,本文为0.991,而HiDDeN 只有0.934。从第三列的差值图可以看出,由本文算法生成的重构图像的纹理和边缘信息与原始图像几乎相同,而HiDDeN 重构出的图像在大脑的边缘区域具有更明显的差异,这说明HiDDeN 没有充分学习到DWI 图像的结构特征,无法满足DWI 图像的可视质量要求。不论从图像的失真程度,还是从人的主观感受评价,本文算法生成的DWI 图像都更接近于原始图像。

2.5 水印鲁棒性

本文训练组合模型与单一模型比较本文所提算法与HiDDeN 算法对噪声的鲁棒性。前一种模型在训练中随机加入前文所述的六种噪声攻击,而后一种模型只在训练中加入某一种特定的噪声攻击。在训练过程中,本文同HiDDeN 一样使用近似微分JPEG-Mask 代替JPEG 压缩攻击。如图11 所示,对于单一模型,即使在裁剪强度为0.1、高斯核宽度为4、旋转角度为45°的极端情况下,所提算法能达到90%以上的水印正确率,而HiDDeN 只能达到70%左右。本文算法面对极端攻击仍具有高鲁棒性的原因在于:1)在重构阶段冗余地嵌入水印到多尺度的重构特征中,神经网络能从少量的原始图像信息中提取水印;2)基于金字塔特征学习的水印提取网络不仅从DWI 图像的局部特征中寻找隐藏于图像中的水印信息,还能结合感受野更大的上下文特征与局部特征的相关性来进一步提高所提水印的正确率。对于组合模型,当DWI图像受到各种轻微噪声攻击时,例如裁剪强度小于0.7,像素替换强度小于0.4,高斯核宽度小于1,JPEG 质量因子大于70,旋转角度小于15°,本文水印正确率可以保持在95%以上。即使在高强度的噪声攻击下,如JPEG 压缩强度为50,裁剪强度为0.5,像素替换强度为0.5等,所提算法的水印正确率仍能达到90%以上。而HiDDeN 面对极端的JPEG 压缩、高斯模糊、局部像素替换、裁剪攻击、旋转攻击,水印正确率仅为50%。

2.6 弥散特征

为验证嵌入水印的DWI 转换为弥散张量成像(Diffusion Tensor Imaging,DTI)后不受影响(DWI 与DTI 的相关定义与计算过程在文献[40-44]中有详细介绍,本文不再赘述),不改变水分子的弥散特性和组织结构,满足临床诊断要求,本文需要计算常用的3 个参数——平均弥散率(Mean Diffusivity,MD)、各项异性(Fraction Anisotropy,FA)和张量椭球(Tensor Ellipsoid,TE)用于临床诊断参考。实验选择16个方向的DWI 图像进行拟合并嵌入水印。图12 显示了本文算法与HiDDeN 算法嵌入水印后的MD、FA、TE 及其与原始图像的差异。

图12(a)显示了本文算法对FA、MD 的改变量基本为0,在人眼视觉上含水印图与原图的TE 保持高度一致。图12(b)显示了基准算法HiDDeN 所生成的含水印图在FA、MD、TE3 个指标上都与原图有明显的差异。值得一提的是,本文算法可以选择更少的含水印DWI 图像来拟合DTI 图像,通过降低水印容量来达到更高的视觉质量。

3 结语

本文提出一个适用于弥散加权图像的基于多尺度知识学习的深度鲁棒水印算法。首先,以迁移学习的方式提取DWI 图像的重构语义特征,在重构过程中加入先验领域知识,以此从少量样本中重构出满足DWI 视觉质量的含水印图。其次,将水印以多尺度的方式嵌入重构特征中,通过增加水印的冗余性来提高水印的鲁棒性。最后,提出一个具有金字塔结构的水印提取网络,从含水印图的不同尺度的上下文中充分学习水印的分布特征,进一步提高水印鲁棒性。实验结果表明,本文重构出的含水印图的PSNR 达到57.82 dB,弥散特性参数改变数量极少,完全满足DWI 医学图像的张量成像要求。在常见的针对医学图像而实施的旋转、裁剪、像素替换、高斯噪声、JPEG 压缩攻击下,本文算法具有较高的水印鲁棒性,能有效保护DWI 图像的版权信息。

猜你喜欢
先验鲁棒性特征提取
康德定言命令的演绎是一种先验演绎吗?——论纯粹知性与实践理性在先天原则证成方面之异同
基于暗通道先验的单幅图像去雾算法研究与实现
武汉轨道交通重点车站识别及网络鲁棒性研究
先验想象力在范畴先验演绎中的定位研究
空间目标的ISAR成像及轮廓特征提取
基于Gazebo仿真环境的ORB特征提取与比对的研究
基于特征提取的绘本阅读机器人设计方案
微动目标雷达特征提取、成像与识别研究进展
一种基于三维小波变换的鲁棒视频水印方案
电子节气门非线性控制策略