基于DeepLabv3 的随机褶皱防伪图案识别研究*

2021-03-09 08:07陈雨，陈桂雄，周雄图，2，张永爱，2，林志贤，2，吴朝兴，2，郭太良，2

网络安全与数据管理 2021年2期

陈雨，陈桂雄，周雄图，2，张永爱，2，林志贤，2，吴朝兴，2，郭太良，2

(1.福州大学物理与信息工程学院，福建福州350116；2.中国福建光电信息科学与技术创新实验室，福建福州350116)

0 引言

市场中假冒产品的存在会对国家、社会和个人带来巨大经济损失，防伪成为应用广泛的反制技术。由于整个防伪市场不规范，防伪技术产品水平偏低，妨碍了市场的健康发展，公众对防伪产品的信任度在降低。目前，许多被开发的防伪标签具有物理上不可克隆的特征，如散射表面的随机图案、随机分布的纳米颗粒图案和液晶纹理等。褶皱图案是自然界生物体和工程材料领域常见的特殊现象，是一种微观的随机地形，拥有着广泛而不可复制的信息，在防伪技术上有广泛的应用前景。

通常，在聚合物衬底受热膨胀的状态下，在其表面上沉积一层与之热膨胀系数差异较大的薄膜，在冷却过程中，表面上的薄膜受到基底压缩应力作用。当压缩应力超过表面金属薄膜的承受范围，会导致薄膜失稳产生复杂随机的褶皱图案[1]，如PDMS/Au 褶皱图案结构[2]。这种随机褶皱结构具有稳定、不可克隆的防伪标签特性，引起人们广泛研究兴趣。当前国内外常用的褶皱类纹理识别方法有局部二值分类器[3]、多光谱精细纹理提取和识别[4]、K 均值聚类算法[5]、灰度共生矩阵[6]等。这些方法通常需要对防伪标签先进行特征提取，基于热膨胀系数失配形成的随机褶皱图案特征不够明显，往往不利于防伪标签的识别。角度、光线、清晰度等条件会影响部分细节特征提取，降低褶皱图像的正确识别率。同时，现有方法往往存在着检测时间长、识别率低等缺陷，不能满足现实生活中防伪识别的需求。

如今，深度学习已在图像识别、语音识别和自然语言处理等领域获得了广泛的应用。其中，卷积神经网络(Convolutional Neural Network，CNN)已成功应用于像素级的语义分割技术中。在卷积神经网络的基础上，LONG J 等人提出了使用卷积层代替全连接层的全卷积神经网络(Fully Convolution Network，FCN)[7]。 2015 年RONNEBERGER O 等人为解决小数量级样本的分割，提出了编解码结构的U-Net网络[8]。随后，CHEN L C[9]等人提出将空洞卷积代替普通卷积的思想，创建了DeepLab 模型，使用ASPP(Atrous Spatial Pyramid Pooling)模块解决多尺度信息，分别提出了v2[10]、v3[11]、v3+[12]三个版本，不断优化模型和改进训练策略，将语义分割精度提高到新的高度。本文将DeepLabv3 语义分割模型应用于褶皱防伪标签图案的特征提取，并对DeepLabv3 模型进行改写，使优化后的DeepLabv3 网络能够很好地适用于褶皱纹理防伪图案分类识别。

1 识别方法

如图1 所示，利用人眼可初步在宏观尺度上辨别标签图案的真假；采用搭配放大镜的手机对双重防伪标识“笑脸”点阵中的特定点的褶皱图案进行图像获取，采用深度学习图像识别方法，对比商品上的防伪标识褶皱特征信息与数据库中真实褶皱特征信息，实现高级防伪功能。

随机褶皱纹理图案呈个性化条形卷曲迷宫状，细节信息丰富具有不可重复性，但由于不同类别图案均由同一机理制备，会增加识别难度。 K 均值聚类算法对选取初始聚类中心的敏感性较高，会直接影响结果的准确性和稳定性。灰度共生矩阵法提取纹理图像特征可以获得理想的识别结果，但是计算工作量大。对比多种方法后本文选择DeepLabv3 语义分割网络提取出细腻的图像特征，结合后端的全连接层进行图像分类，匹配已有的防伪褶皱纹理图案实现高级防伪识别。

1.1 卷积神经网络

卷积神经网络是一种基于感受野概念的针对二维图像的多层神经认知器。网络结构包括数据输入层、卷积层、池化层和全连接层，其中卷积层和池化层是卷积神经网络的核心功能层，用来自动提取目标特征信息。逻辑回归分类器进而处理特征图的结构，使用全连接层将提取到的图像特征综合以获得最终的图像分类。采用卷积神经网络算法对褶皱纹理图像进行分类，避免了复杂的数据重建，有效减少了自由参数的数量，分类精度得到了显著提高的同时，还避免了过拟合现象。

1.2 ResNet

理论上神经网络的深度与性能之间成正比，然而实际中会造成梯度爆炸和梯度消失的问题。权重参数更新困难，导致准确率饱和甚至下降。深度残差网络(Residual Neural Network，ResNet)最早由HE K 等人提出[13]，利用残差学习原理实现网络的加深以对抗梯度退化问题，将基本的网络单元增加了一个恒等的快捷连接(shortcut connections)，把原始输入信息引到输出层，通过直接学习上层网络输出的残差，有效地简化了学习难度和目标。

图1 双重防伪标识识别方法示意图

1.3 DeepLabv3

Deeplabv3 是以ResNet 为骨干构建的语义分割网络。在使用FCN 实现图像分割后，引入了空洞卷积以获得多尺度的特征信息，通过金字塔结构挖掘更多语义特征信息以提升分类效果。

空洞卷积(Atrous convolution)是指通过设置膨胀率(rate)来对原图进行采样，如图2 所示。当rate=1时，它的作用与标准卷积无异，即全部像素采样。当rate ＞1 时，它将通过膨胀率对卷积核进行扩张，在原图上每隔(rate-1)个像素点进行采样，用零来填充空白，扩大了感受野的范围，在不增加参数量和计算量的条件下提取到更大范围的语义特征。

图2 空洞卷积

空洞空间卷积池化金字塔(Atrous Spatial Pyramid Pooling，ASPP)是指采用不同膨胀率的空洞卷积并行来学习多尺度特征，可以对任意尺度的区域进行更为准确的分类。

DeepLabv3 以ResNet 为网络基础。ResNet 网络共有四个残差块，将第四个残差块复制三次后以级联的方式连接在在残差单元后，残差块4 ～7 采用不同膨胀率的空洞卷积，当输出步长为16 时，残差块4～7 的膨胀率分别为2、4、8、16 来进行采样，保证在卷积过程中图像大小保持不变。同时，采用一个并行的ASPP 结构处理前面输出的特征图，在feature map 的顶部采用4 个不同膨胀率(6、12、18、24)的空洞卷积核，通过全局平均池化层来捕获上下文信息，再将ASPP 结构分支处理好的特征使用1×1 的卷积实现融合。

DeepLabv3 网络模型中采用了编码器-解码器模块(Enconder-Decoder)，其中解码器模块使用了16倍的双线性上采样，恢复图像特征的细节和空间维度，以得到分割结果。本文基于褶皱纹理图案的防伪分类目的，将用于分割的此解码器模块更换为全连接层结构，softmax 为输出层，将每一个神经元都与输出相连，实现对输入图像的分类。本文所用网络结构如图3 所示。

2 试验结果及分析

2.1 随机褶皱防伪标识图案的制备

实验方法采用两种热膨胀系数不同的材料，在冷却过程中产生压缩应力形成随机褶皱防伪标识图案。首先，将PDMS 原液与固化剂以10：1 的比例混合搅拌均匀，放置于负压环境30 min 消除气泡。取干净的玻璃基板，利用酒精、丙酮和去离子水分别超声清洗15 min，通过丝网印刷将PDMS 印刷于玻璃基片上形成宏观防伪标签图案。

采用原子层沉积技术，在PDMS 衬底表面上生长一层Al2O3无机膜层。制备Al2O3的前驱体是三甲基铝(Trimethylaluminum，TMA)和水(H2O)，反应过程中高纯氮气(N2，99.999%)作为载气，沉积温度为90 ℃。单个氧化铝制备循环过程包括：TMA 脉冲0.2 s、N2吹扫6 s、H2O 脉冲0.15 s、N2吹扫10 s。

图3 网络结构图

2.2 数据集采集与扩增

图4所示为实验制备的具有不同亮度的随机褶皱防伪标识图案。随机选择六个防伪褶皱纹理图案来建立防伪“真”图类数据集，在手动采集过程中通过对同一张相同褶皱纹理图案随机移动和改变光照强度，获得每个图案的120 张图像，共720 张“真”图类图像。同时用相同方法随机采集了各不相同的200 张褶皱纹理图案作为“伪”图类数据集。为了降低训练过程中因数据样本过少导致的欠拟合问题，并增强模型的泛化能力和分类精度，本文采用了旋转、翻转的数据增强方法丰富数据集，最终由720 张“真”图类原始数据集扩充至2 800 张，200张“伪”图类原始数据集扩充至800 张。扩增后共获得3 600 张图像作为数据集。

图4 具有不同亮度褶皱图案示例

数据集中3 600 张图像80%作为训练集，20%作为验证集。实验于Linux(Ubuntu18.04)系统上进行，CPU 型号为i7-9700，GPU 为型号GTX1080，基于Pytorch 深度学习框架实现，数据集图像为1 318 像素×1 132 像素大小的防伪褶皱纹理图案。为了保证网络学习效率，防止过拟合，本文网络采用带动量随机梯度下降方法进行训练实验，动量因子为0.9，学习率初始值为0.001，batch_size 为16，权重衰减为0.000 2。

2.3 结果及分析

为了实现对褶皱纹理图案的防伪分类识别，本文将DeepLabv3 语义分割结构的解码器部分更替为全连接层结构，最后使用softmax 激活函数作为分类训练。为了提高网络的识别准确率和实时性，且减少冗余现象，简化模型复杂度，实验将全连接层数量分别设置为一层、二层、三层，神经节点数为1 024，结果如图5、图6 所示。

图5 全连接层数对准确率的影响

图6 全连接层数对损失值的影响

由图5、图6 可知，当全连接层为三层时，识别准确率最高；全连接层数减少为两层时，识别准确率略有降低，但并没有明显变化；当全连接层数继续减少至一层时，识别准确率明显下降。这可能是因为两层或两层以上的全连接层能够有效地解决非线性问题。从稳定性分析，三层全连接层的变化幅度最为明显，当全连接层数为一层时，识别性能多展现出小幅度攀升趋势，从网络整体的变化趋势观察与比较可知，二层全连接层表现出的稳定性最为突出。说明由于全连接层产生大量的参数，容易产生过拟合问题，但全连接层起到的是将学到的“分布式特征表示”映射到样本标记空间的作用[14]，层数过少时导致模型性能下降。所以本文网络选择二层全连接层。

为了进一步提高网络识别准确率，减少网络参数，构建轻量级网络模型，通过调整全连接层神经节点数来确定网络模型最优值。不同神经节点数对网络模型性能影响如表1 所示。

表1 神经节点数对模型训练效果的影响

由表1 可知，神经元节点数过多时可能会造成过拟合现象，空间语义信息丢失，减少全连接层神经元节点数可以精简网络模型结构，在降低计算消耗的提前下提高分类准确率和运算速度。当全连接层神经节点数由4 096 减少至512 时，训练识别准确率提高了0.92%；神经节点数为128 时，比4 096个神经节点的训练耗时节省了0.77 h。尽管全连接层权重值个数占比较大，但由于网络训练的时间开销主要来自于卷积运算，因此减少全连接层神经节点数对网络运算速度的提高是有限的。神经节点数继续减少至64 时，训练耗时不减反增，16 个神经节点时所需的训练时间比128 个神经节点训练所获得的最短耗时4.69 h 增加了0.45 h。综合对比网络识别准确率、稳定性和训练耗时，本文最终采用二层全连接层，将神经节点数确定在256。

为了验证本文所提出的随机褶皱防伪图案识别分类模型的有效性，本文与三种经典方法进行了对比试验，分类效果精度对比如表2 所示。在其他的经典方法中，ResNet 获得较高的识别准确率91.77% ，VGGNet 和 AlexNet 分别获得 85.23% 和83.96%的识别准确率，本文的分类识别模型效果是有效的。

表2 与经典方法的对比

3 结论

综上所述，本文提出一种利用PDMS 聚合物上AL2O3薄膜形成规则有序的褶皱图案来制备宏观及微观双重防伪标识，并构建相应网络的特征提取和识别模块证明其可行性。本文所提供的PDMS/AL2O3 防伪褶皱图案制备方法具有多重防伪、难以伪造、工艺简单和成本低等优势，通过对DeepLabv3网络改进优化，使本实验网络的更好地权衡了运行时间和识别准确率，训练耗时明显缩短，获得了96.58%的训练准确率。试验证明，相较于其他传统的经典方法，本文方法取得了更高的识别准确率，具有一定的实际应用价值。