基于深度学习的二值图像目标轮廓识别算法

2020-09-27 11:22
吉林大学学报(理学版) 2020年5期
关键词:子块二值轮廓

李 菊 霞

(山西农业大学 信息科学与工程学院, 山西 晋中 030801)

图像目标轮廓识别是图像处理及计算机视觉领域的重要研究课题. 图像目标轮廓中包含图像大部分信息特征, 图像目标轮廓的精确识别可辅助图像分析[1], 有效获取图像边界信息. 图像的目标轮廓识别广泛应用于医学、 航空、 地理等领域[2]. 目前, 图像目标轮廓识别算法较多, 杜馨瑜等[3]提出了一种基于深度学习的铁道塞钉自动检测算法, 能自动从候选目标区域逐层提取最能表现塞钉特征的特征图像, 从而实现塞钉的自动定位; Canny算法选取最优化数值方法识别, 通过双阈值设置可较好地检测边缘算子问题, 但识别结果中包含细节过多. 针对上述算法的缺陷, 本文提出一种基于深度学习的二值图像目标轮廓识别算法, 将深度学习算法中应用较广的深度卷积网络应用于二值图像目标轮廓识别中, 利用深度卷积网络实现算法自主识别, 以有效减少待识别图像的背景信息, 准确识别图像目标轮廓, 且可改善上述算法中所识别图像目标轮廓细节过多的缺陷, 可应用于复杂二值图像的目标轮廓识别.

1 二值图像目标轮廓识别算法

1.1 深度卷积网络

深度卷积网络通过描述图像信息的后验概率提升目标轮廓识别精准性[4]. 深度卷积网络主要包括特征提取层和特征映射层. 其中特征提取层又称为卷积层, 卷积层将滤波与图像卷积后获取图像特征图谱; 特征映射层又称为下采样层[5], 通过下采样层的多层结构处理图像信息. 下采样层根据神经网络形式连接各映射层, 其中映射层均为平面, 利用约束神经元共享网络权值使图像经过平移、 缩放及旋转等情形下均保持不变性. 通过全连接方法将多级卷积层与下采样层连接, 最终结果通过输出层输出[6].

深度卷积网络中包括众多卷积层及下采样层, 图像目标轮廓的特征提取主要通过卷积层实现[7], 图像目标轮廓的特征运算主要通过下采样层实现. 深度卷积网络中卷积核下采样过程如图1所示.

深度卷积网络卷积过程中利用可训练的滤波器(卷积核)fX卷积运算输入的二值图像, 通过添加偏置bX获取卷积层CX. 先将二值图像中的每邻域4个像素求平均后合并为一个像素, 先加权WX+1再添加偏置bX+1, 利用激活Sigmoid函数, 形成缩小至1/4的映射图像SX+1为子采样过程. 利用不同的卷积核在卷积过程中可提取差异特征, 且权值共享过程中使目标轮廓识别过程简化[8], 下采样过程的目的为提取二次特征, 降低二值图像维度且增加识别目标轮廓的鲁棒性. 将上述过程重复多次, 即可获取深度卷积网络. 深度卷积网络结构如图2所示.

图1 卷积核下采样过程Fig.1 Down sampling process of convolution kernel

图2 深度卷积网络结构Fig.2 Deep convolution network structure

深度卷积网络中卷积层节点输出公式为

(1)

(2)

(3)

1.2 深度卷积网络代价函数优化

为获取精准的识别特征, 使全搜索缩小至更有利于识别的空间, 将传统神经网络算法应用于深度卷积网络中优化深度卷积网络代价函数[10]. 设二值图像中的样本数为m, 由m个样本组成的样本集为{(x(1),y(1)),…,(x(m),y(m))}, 样本集中包含类别数为n, 样本x(i)对应类别标签用y(i)表示, 可得深度卷积网络基本代价函数为

(4)

其中:W和b分别为各层单元间连接权值和偏置项;hW,b(x(i))表示预测值, 即深度卷积网络最终层输出; 优化网络目标是基于参数W和b获取函数J(W,b)的最小值[11], 通过梯度下降法优化目标函数为

(7)

2 算法设计

通过优化深度卷积网络代价函数, 令深度卷积网络增强图像目标的理解能力, 可较好表示二值图像的目标轮廓特征[13]. 采用深度卷积网络识别二值图像目标轮廓算法步骤如下:

1) 设置二值图像尺寸为M×N, 输入图像与输出图像分别为x和y; 用fsub表示输入图像子块长度; 第一、 二、 三层滤波器长度分别为f1,f2,f3;

2) 将二值图像划分为不重叠的大小为fsub×fsub的子块图像, 当输入的二值图像长度小于fsub的整数倍时, 需将大小小于fsub的子块图像内扩至fsub;

3) 将大小为fsub×fsub的子块图像输入深度卷积网络第一层, 通过大小为f1×f1的滤波器对输入的子块图像进行卷积滤波, 优化后的目标函数作为滤波器参数;

4) 将第一层卷积滤波后获取的结果下采样后发送至第二层, 通过第二层中尺寸为f2×f2的滤波器卷积滤波处理, 优化后的代价函数作为滤波器参数;

5) 将第二层卷积滤波后获取的结果下采样后发送至第三层, 通过第三层中尺寸为f3×f3的滤波器卷积滤波处理, 优化后的代价函数作为滤波器参数;

6) 将第三层卷积滤波后获取的结果下采样后发送至输出层;

7) 所有子块重复上述步骤直到识别结束后, 输出层通过全连接方法将所有子块目标轮廓聚类, 并输出最终二值图像目标轮廓识别结果y.

3 实验分析

为检测本文算法对二值图像目标轮廓识别的有效性, 在CPU为AMD锐龙7 3700X的计算机中, 选取Visual studio 2019作为实验编译工具, 在图像处理标准图像库中选取15幅图像, 将其二值化处理, 采用本文算法识别这15幅图像的目标轮廓, 并将本文算法与Canny算法及目标邻域点边界跟踪算法进行对比.

3.1 信噪比对比结果

利用信噪比评价二值图像目标轮廓识别算法的去噪效果. 信噪比计算公式为

SNR=Sedge/Nnoise,

(8)

其中,Sedge和Nnoise分别表示二值图像目标轮廓数目与非目标轮廓数目. 采用本文算法和Canny算法及目标邻域点边界跟踪算法识别15幅二值图像边缘轮廓的信噪比对比结果列于表1. 由表1可见, 采用本文算法识别二值图像目标轮廓信噪比明显高于Canny算法及目标邻域点边界跟踪算法, 本文算法识别15幅二值图像目标轮廓信噪比平均结果为2.42, 分别高于Canny算法及目标邻域点边界跟踪算法的0.31和0.36, 本文算法识别非目标轮廓现象较少, 识别目标轮廓效果较好, 识别结果较精准.

表1 不同算法信噪比对比结果

在15幅二值图像中选取如图3所示的两幅图像, 通过对原始二值图像与去噪后图像进行对比, 检测本文算法的去噪性能. 本文算法对两幅二值图像进行去噪后的结果如图4所示. 由图3和图4可见, 采用本文方法识别二值图像目标轮廓去噪效果较好, 且去除噪声较准确, 未去除目标轮廓等重要信息, 再次验证了本文算法的去噪效果.

图3 树叶的原始二值图像Fig.3 Original binary images of leaves

图4 树叶的去噪后图像Fig.4 Denoised images of leaves

3.2 目标轮廓识别效果

采用本文算法和Canny算法及目标邻域点边界跟踪算法识别二值图像目标轮廓的精度与识别时间对比结果列于表2. 由表2可见, 采用本文算法识别15幅二值图像的目标轮廓识别精度平均为98.75%, 平均识别时间仅为27.11 ms; 而两种对比算法识别15幅二值图像的目标轮廓识别精度仅为97.16%和96.96%, 识别时间平均高达72.32 ms和59.04 ms, 表明本文算法的识别精度明显高于其他两种算法, 且识别速度较快, 再次验证了本文算法的识别性能.

表2 不同算法的目标轮廓识别效果对比结果

为直观展示本文算法的目标轮廓识别效果, 从15幅二值图像中选取大米、 圆圈、 自行车3幅图像, 其原始二值图像与目标轮廓识别结果分别如图5和图6所示. 由图5和图6可见, 采用本文算法不仅可有效识别简单二值图像的目标轮廓, 对较复杂的, 如自行车图像仍可准确识别, 有效验证了本文算法的识别效果.

图5 大米、 圆圈、 自行车的原始二值图像Fig.5 Original binary images of rice, circle and bicycle

图6 大米、 圆圈、 自行车图像的目标轮廓识别结果Fig.6 Target contour recognition results for images of rice, circle and bicycle

综上所述, 本文将深度学习算法中的卷积网络算法应用于二值图像目标轮廓识别中, 提出了一种基于深度学习的二值图像目标轮廓识别算法, 以有效减少图像背景信息的误识别现象. 实验结果表明, 该算法识别的二值图像信噪比较高、 识别精度较高、 识别效率较快, 可应用于实际图像处理中.

猜你喜欢
子块二值轮廓
基于八叉树的地震数据分布式存储与计算
基于特征值算法的图像Copy-Move篡改的被动取证方案
OPENCV轮廓识别研究与实践
基于两层分块GMM-PRS 的流程工业过程运行状态评价
基于实时轮廓误差估算的数控系统轮廓控制
基于波浪式矩阵置换的稀疏度均衡分块压缩感知算法
面向网络边缘应用的新一代神经网络
基于二值图像数字水印算法研究
基于稀疏表示的二值图像超分辨率重建算法
高速公路主动发光轮廓标应用方案设计探讨