基于熵率聚类的超像素机器视觉与缺陷检测算法*

2021-03-09 08:07
网络安全与数据管理 2021年2期
关键词:像素点权值集群

李 锋

(广东交通职业技术学院,广东 广州510650)

0 引言

随着智能制造工艺精度的提高,高精度和快速检测成为目前亟待解决的问题。机器视觉与图像识别作为非接触式检测方式,具有检测速度快、精度高的特点,能很好地解决智能制造流水线中的瓶颈,并逐步替代传统人工检测方法。

工业检测对表面缺陷检测要求更严格,传统表面缺陷成像方法,包括线扫描、结构光、面阵相机等已经不能满足精度要求,基于超像素检测算法由此诞生。 表面缺陷检测问题包括图像分类和图像分割两大部分,通过采集大量缺陷与合格产品图像,对比分析图像中缺陷特征,设计相应缺陷检测算法。

在实际的检测成像过程中,检测效果受到检测物品的拍摄角度、拍摄亮度、拍摄像素等因素的影响。 首先,在物体传送过程中会存在运动偏差问题,导致物品图像检测位置的随机性,需要对图像进行修正;其次,在图像检测过程中,存在检测目标与背景差异现象,导致检测目标的不同区域差异、检测效率低等问题。 为此,本文提出一种基于熵率聚类的超像素检测算法以解决上述问题[1]。

1 超像素表面检测

超像素是指由有相似视觉特征的相邻像素组成的像素块[2]。超像素分割即利用像素之间相似性,预先将像素分组,不再用大量单个像素而是用少量像素块表示图像信息,以降低图像后期处理所需时间及空间复杂度。 超像素表面检测生成算法主要分为两类:一类是基于图论方法,另外一类是基于梯度下降方法。

(1)基于图论算法

在基于图论算法中,首先将图像视为无向图,考虑图像中每一个像素点为节点,在相邻像素点间构成相对应的边,像素特征之间所存在差异值作为权值,通过定义图论最小化代价函数对各节点进行划分操作,从而完成对超像素的分割。

(2)基于梯度下降方法

该算法从全部像素点中选取部分初始聚类像素点作为起始点, 依据约束条件定义约束函数,不断迭代更新对应聚类,直到算法收敛为止。

上述两种方法的共同点是将超像素提取看为一种图像分割结果。 此外,伴随超像素技术的运用和发展,其与其他人工智能检测算法相结合,有进一步优化空间[3-4]。

2 新算法思想与改进

新算法基于熵率聚类超像素机器检测算法,需要构建一个能量函数,所设计目标函数包括两部分,第一是图像随机游走熵率,第二是平衡项。 对于随机游走熵率的设立,可利用结构均匀紧凑集群,对图中单一目标仅使用超像素将其覆盖。 对于平衡项设计,根据集群之间存在相似尺寸,降低不平衡超像素数量以提取超像素特征和范围。 下面详细阐述关于熵率聚类超像素优化步骤及原理,步骤如下:

(1)对待检测目标物体,实现有效控制所需切割的块。 根据每个块所包含空间信息不同,将相同类别像素块存放在相同超像素块上,以利于后期处理。此外,针对像素不同的情况,控制所切分的块能有限减少因像素块点的不同而导致的误差。

(2)将每个超像素看作一个整体,判断图像类与类之间边缘子集,并定义为超像素块边缘。

(3)将所分割块数控制在一定范围内,使超像素边缘分割精度控制在更高水平。

具体过程如下:设图像采用带权无向图Gr=(N,E)表示,N 为像素点集,E 为边集,像素点间权值函数关系为:

其中,d(ni,nj)是灰度值之差与空间距离乘积。

目标函数由熵率与平衡项两部分构成。 熵率使超像素只覆盖单一类别,形成结构紧凑集群。 由于平衡项需要约束每个超像素的大小与位置,故构建目标函数为:

其中,NA为固定项;R 为全部节点所分割的超像素集个数;a 是被选择边集合,a⊆E;K(A)表示图像随机行走熵率, 即实际目标图像与位置存在的误差;T(A)是平衡项;μ≥0 是平衡项权重,用以区分同类像素点与其他类像素点。 利用贪婪算法最大化目标函数,则可将图像分割为超像素。

2.1 熵的作用

熵用于权衡随机变量所存在的不确定性,熵率用于量化随机提取特征值过程中F={Fx|x∈X}的不确定性。综合考虑离散随机变量过程,将熵率表示为:

考虑到图像中存在随机游走熵率,熵率项H(F)用于衡量集群紧凑度、均匀度指标,定义无向图Gr=(N,E)上随机游走熵率为:

其中,λi=ui/uc,ui是邻边相连节点之间权重和,uc是边集权值和。

定义pi,j为随机游走转移概率,wi为各像素到相邻像素的权值之和,wi,j为转移概率,ei,j为边界,对于pi,j值可表达为:

通过上式得出,目标函数主要基于熵进行优化,而熵最重要性质在于其最大值出现在概率分布相同的情况下。 由ei,j为边界,通过增加集合A 中所在的边,增加熵率值,挑选最大涨幅的边在一定程度上有利于形成紧凑与均匀的集群,不同熵率下集群紧凑度与均匀度如图1 所示。

图1 熵率对集群紧凑度与均匀度的作用

2.2 平衡项的作用

集群中相似度提升需要使用到的平衡项为:

其中,MA为无向有权图中连通分支个数,YA为集群中像素整体分布。 令边集图像分割为SA={S1,S1,…,SMA},则YA分布为:

结合YA分布推导出不同平衡函数值对集群相似尺寸的作用,平衡函数值越大,集群相似尺寸越小,分割越为均匀,见图2。

图2 平衡函数值对集群相似尺寸的作用

由于随机游走熵率及平衡函数都存在单调性和子模,本算法引入拟阵整体思想,利用贪婪算法优化和确定目标函数。

3 缺陷检测算法

本文提出基于熵率聚类的超像素表面缺陷检测算法,首先建立一个基础图集合,用G=(V,E,W)表示,V 为像素点图节点,E 为相邻像素点所连接形成的边,W 为衡量相邻像素对(Vi,Vj)的相似性权值。 边的构成采用4 邻域和8 邻域。

衡量相似性函数模型有高斯函数和柯西函数,分别为:

熵率聚类步骤如下:首先从邻边集合E 中选取部分邻边构成子集A,A⊆E,再将全部节点划分为k 个超像素。 子集A 的选取通过式(10)实现:

其中,NA为固定项,k 为全部节点所分割的超像素集个数,K(A)为目标函数,M(A)为熵率项,C(A)为平衡项,θ 是平衡项权值。

基于随机游走模型[5-6]计算熵率项K(A),并在邻边集A 基础上生成最小树,计算静态分布概率μ和转移概率pi,j,从而得到:

考虑边界权值所存在的三种情况[7-8]:i ≠j and ei,j∈A、i≠j and ei,j∉A、i=j,从而得到各个像素到相邻像素的权值之和,即:

静态分布概率μ 是各个节点权值之和,即:

通过每个超像素点大小确定平衡项,将其转化为超像素内所包含像素数目|Si|和所有像素数|V|的比值pZA,即:

最后,使用pZA的熵以衡量超像素大小及其分布,定义固定项NA,通过当前邻边集A 确定超像素数量为:

目标函数基于熵整体优化,熵率项H(A)在选择时,会优先选择内部均匀区域,而平衡项B(A)则是更大程度上保证超像素大小和分布的相对一致性。 贪婪启发算法用于求解该目标函数。 求解步骤如下:(1)从空集开始,即A=Ø,没有任何两个像素连接,超像素数目最大为|V|;(2)依次递增增益最大的边,直到超像素数目减小到所设定数目k 为止。

4 实验测试

选取不规则零件进行实验,其实际尺寸为4.261 mm×4.261 mm,实际像素尺寸为3 690 pix×3 690 pix,测试使用高斯函数衡量相邻像素的相似性,定义权值之和w=5,转移概率pi,j=0.2,子集A=100。 超像素提取结果见图3,超像素误差分析见图4。

图3 超像素提取结果图

图4 超像素分割误差分析图

从图3、图4 可知,不同灰度值下超像素都得到很好分割,边缘匀称清晰,超像素边界与检测对象的边界重合,超像素面积分布均匀,平均定位误差为0.034 27 μm,能 满 足 高 精 度 工 业 图 像0.1 μm 精度分割识别需求。

5 结束语

本文提出基于熵率聚类的超像素机器视觉与缺陷检测算法,综合利用超像素的邻边集,建立起包含有熵率项和平衡项的目标函数,最后通过贪婪启发算法优化并求解该目标函数,得到最优的超像素集合,在检测精度上有较大程度的提升,能满足智能制造高精度工业图像分割识别需求。

猜你喜欢
像素点权值集群
一种融合时间权值和用户行为序列的电影推荐模型
CONTENTS
基于局部相似性的特征匹配筛选算法
海上小型无人机集群的反制装备需求与应对之策研究
基于5×5邻域像素点相关性的划痕修复算法
一种无人机集群发射回收装置的控制系统设计
基于canvas的前端数据加密
Python与Spark集群在收费数据分析中的应用
基于权值动量的RBM加速学习算法研究
基于逐像素点深度卷积网络分割模型的上皮和间质组织分割