胡松涛
(河南建筑职业技术学院 河南 郑州 450000)
图像分割是提高图像识别效果的关键步骤之一,通过将具有相同或者相似像素特性的子区域进行分类[1],最终以此为基础将图像划分成若干个不同的部分[2]。这不仅对图像信息提取具有重要的现实价值,同时对于图像的特征识别、结构分类也极为重要[3]。但是受图像基础情况的差异影响,图像分割的精确性难以得到保证[4]。特别是对于部分模糊图像而言,像素特征被模糊化,对其的分类难度较高,往往会导致分割结果出现像素的错误划分[5]。为此,诸多学者也进行了相关研究,其中曾艳阳等[6]将方向模糊导数结合直线截距直方图算法,对图像弱光部分进行有效分割,保留图像细节信息,抑制噪声,利用ots 法得到精准阈值分割结果,以此提高图像弱光部分的分割精度,但无法满足现阶段的应用需求。李巧兰等[7]利用最大熵阈值处理算法实施对图像的分割,通过归一化处理图像灰度直方图,采用粒子群算法寻优图像分割阈值实现视频图像分割,该方法提高了分割效率,但效果并不理想。
深度神经网络作为机器学习方式的一种,可以用较少的参数表示复杂的函数,具有学习能力强、覆盖范围广、适应性好、数据驱动效果优及可移植性稳定的特点。深度神经网络具有较多的网络层,可以映射到任意函数,其制定的框架可以兼容很多平台,能够有效解决复杂的图像分割等问题。深度神经网络上限高,数据依赖程度高,当处理的数据数量越大时,其处理表现效果就越优,因此在图像识别、面部识别、NLP 等领域具有突出表现。同时,深度神经网络在寻优方面的优越性对于提高模糊图像像素识别具有重要的应用价值。在此基础上,本文提出基于深度神经网络的模糊图像分割方法研究,并进行了试验测试,分析验证了设计方法的有效性。
模糊图像分割有利于在模糊复杂背景中提取所需目标,提高信息数据采集能力和应用效果。利用空域滤波采集图像的灰度值,采用频域滤波进行傅立叶变换处理,建立图像像素映射关系。根据灰度值数值的特征,完成图像噪声预处理。通过深度神经网络构建多层级的图像分割处理任务层,提取图像整体像素特征,建立目标图像特征映射关系,按照拟合程度实现图像分割处理。模糊图像精准分割,可以有效提取图像的几何、灰度、纹理等特征,根据具体特征内容选择所需信息数据,优化信息应用效果。
模糊图像预处理有利于提高图像目标特征的降噪效果,通过计算灰度值实现图像定量规划,能够实现图像信息应用的延伸。为了实现对模糊图像的精准分割,本文首先对其进行预处理,最大限度降低噪声对图像特征的影响,在具体的实施过程中,也主要采用空域滤波[8]和频域滤波[9]两种计算方式。
首先,采用空域滤波对图像的降噪处理是在图像的像素灰度空间上计算出关键灰度值,其计算方式可以表示为
其中,k 表示图像的关键灰度值,c表示图像模糊系数,也就是在噪声作用下图像像素的混合系数,y(ai)表示原始模糊图像的像素矩阵。通过这样的方式得到的关键灰度值是模糊图像中范围最大的灰度值。
其次,再采用频域滤波对图像进行傅立叶变换处理,这样做的目的是建立图像像素值之间的映射关系,对应的计算方式可以表示为
其中,E(ai)即为图像的傅立叶变换处理后的映射结果,f(*)表示傅立叶函数,κ表示傅立叶变换系数。
通过这样的方式,将得到的关键灰度值作为输入像素值,利用式(2)所示的映射关系实现对图像噪声污染的过滤处理,其计算方式可以表示为
其中,armin(*)表示映射关系函数的最小值。通过这样的处理方式得到的图像,可以有效提高后续图像分割处理的可靠性。
在上述基础上,为了实现对图像的精确分割,本文利用深度神经网络执行该过程。
首先,将模糊图像的灰度值作为训练参数,为了确保对目标分割对象像素特征的有效提取,本文选取目标像素点与八邻域空间的像素点作为特征提取的基础,考虑到由于分割目标在图像中的位置分布不确定,当目标像素点处于图像的4 条边或者4 个角上时,对应的像素点八邻域是不完整的,此时本文默认缺少的邻域点的像素值与对位邻域点的像素值相同。利用得到的参数作为深度神经网络对图像像素进行分割识别的标准。
本文构建的深度神经网络中,除输入层和输出层外,包含2 个卷积层、1 个池化以及1 个softmax 层。
当预处理后的待分割图像像素信息通过输入层输入到深度神经网络中后,第一卷积层通过SPReLU 激活函数执行卷积操作[10],提取图像的整体像素特征,此时对应得到的特征有序数列可以表示为
其中,T表示选取目标的特征参数,T1、T2、T3、T4、T5分别表示图像像素的中值、均值、最小值、均方差以及众数值。需要特别注意的是,由于图像的实际情况不同,在对其特征进行提取的过程中,可能存在m(m>1)个像素出现次数相同且最多,此时,本文将m个像素的均值作为T5的指标参数。
之后将提取到的特征参数输入到池化层,该阶段主要是对其进行压缩处理,以此防止出现过拟合的情况,同时避免冗余信息对最终的分割精度的影响,其计算方式可以表示为
其中,best表示压缩处理后的图像像素特征,n表示压缩倍数,p表示逼近参数,s表示图像纹理信息,amin表示最小响度尺度信息。
经过处理后的图像进入第二卷积层,建立目标图像特征与图像整体之间的映射关系,最后利用SoftMax 层将拟合关系达到分割标准的像素作为最终的目标像素发送到输出层,完成对图像的分割处理。由于不同图像的模糊程度不同,映射关系下特征之间的拟合程度也存在明显差异。为了适应这种印象,需要对SoftMax 层的阈值参数进行个性化设置,本文对其的设计方式可以表示为
其中,γ表示SoftMax 层的阈值参数,从式(6)中可以看出,该参数值与图像模糊系数直接相关,因此可以对分割目标的适应性选择。当图像像素与特征的拟合程度达到γ值时,则将其输出为目标图像,当图像像素与特征的拟合程度小于γ值时,则将其输出背景图像。
通过这样的方式,即可实现对高精度模糊图像的分割处理,提高模糊图像识别效率,降低图像特征提取的识别时间和成本投入,极大程度提升了图像编码、文档图像处理、遥感和生物医学图像分析等方面的应用效果。
为进一步分析提出方法的图像分割效果,本文进行了试验测试。在Image Net(http://image-net.org/)图像识别数据集中,选择模糊图像数据集1 000 个,通过400次训练迭代测试,验证图像几何、灰度、纹理等特征提取有效性。为了能够进一步验证所提方法(基于深度神经网络的模糊图像分割方法)的模糊图像分割有效性,与曾艳阳等[6]方法(基于截距直方图和ots 融合的弱光图像分割方法)和李巧兰等[7]方法(基于最大熵阈值处理算法的视频图像人物分割方法)进行对比分析,对比内容为假阴性率、假阳性率以及相似度测试。
为了实现对图像分割方法的有效分析,本文在模糊图像数据集中随机选取3 组模糊程度不同的图像作为测试数据,具体见图1。
以图1 所示的图像为基础,将中心部位的圆形图像作为目标分割对象,对其进行分割处理及标记。
在此基础上,除了直观地观察判断3 种方法的分割效果外,本文设置了假阴性率、假阳性率以及相似度作为评价指标。其中,假阳性是指背景区域的像素点被分割到目标区,其计算方式为
其中,pr表示假阳性率,xr表示位于背景区域但被分割到目标区域的像素点数量,x表示目标区域的像素点数量。
假阴性是指目标区域的像素点被分割到背景区域,其计算方式可以表示为
其中,pf表示假阴性率,xf表示位于目标区域但被分割到背景区域的像素点数量。
最后,相似度是指分割的目标区域像素的一致性,其计算方式可以表示为
其中,λ表示相似度,xc表示重合部分像素数量。
从上述3 个公式中可以看出,分割结果的假阴性率、假阳性率越低,相似度越高,图像的分割也就效果越好。
在上述基础上,3 种方法分割得到的目标图像见图2。
从图2 中可以看出,对比3 种方法,曾艳阳等[6]方法和李巧兰等方法的分割结果中,边缘存在明显的模糊,相比之下,本文方法更加清晰。这是因为所提方法在对模糊图像进行分割前,通过计算灰度值建立映射关系,实现模糊图像的降噪处理,以此提高了图像边缘清晰度。
对具体的评价指标进行分析,其结果见表1。
表1 不同方法的分割结果对比表 单位:%
从表1 中可以看出,3 种方法的分割结果中,假阳性率和假阴性率均随着图像模糊程度的增加而逐渐提高。对比3种方法,李巧兰等[7]方法的假阳性率和假阴性率最高,最大值分别达到了0.096 和0.080,相比之下,曾艳阳等方法与之相比有所提升,但是评价指标整体也处于相对较高的水平。观察本文提出方法的分割结果,其中假阳性率最大值仅为0.019,假阴性率最高值也仅为0.010,这也与图2 中的测试结果体现出了相同的特征。由于在模糊图像处理中将模糊图像的灰度值作为训练迭代参数,确保目标分割图像几何、灰度、纹理等特征的有效提取,提升了模糊图像分割的精准度。
在此基础上,对分割图像的相似度进行统计,其结果见表2。
表2 不同方法的分割结果相似度
从表2 中可以看出,在3 种测试方法中,李巧兰等方法分割图像的相似度最低,其中,对于图像(c)的分割结果中,相似度仅为0.507,对于模糊程度最低的图像(a)分割后的相似度也仅为0.750,曾艳阳等[6]方法与之相比有明显提升,但是与本文方法相比仍存在一定不足。在本文的分割结果中,相似度始终在0.850 以上,且最大值达到了0.925。这是由于本文方法利用深度神经网络构建多层级图像处理任务层,对图像像素与特征进行拟合,通过拟合程度提高模糊图像分割效果。
综上所述,测试结果表明,本文提出的方法可以实现对模糊图像的准确分割,大大降低了像素模糊对分割带来的干扰。
精确的图像分割方法是实现对图像信息深层分析、深度挖掘的重要基础,对其相关技术展开研究具有重要的现实价值。模糊图像分割有利于提高图像编码、文档图像处理、遥感和生物医学图像的识别和应用效果,体现了图像信息数据使用的核心内容。为了解决模糊图像的特征强度较弱、分割精确度较低的问题,本文提出了基于深度神经网络的模糊图像分割方法研究。通过空域滤波和频域滤波完成模糊图像的降噪预处理,利用深度神经网络提取模糊图像特征,对压缩处理后的模糊图像进行拟合分析,根据图像特征和像素的拟合程度,实现模糊图像分割。测试结果表明,本文方法实现了对模糊图像的高精度分割,大大提高了分割结果的可靠性。通过此次研究,以期为模糊图像处理工作的开展提供有价值的参考。