基于量子衍生理论和Grabcut的图像分割方法

2021-04-20 02:23席亮
电子技术与软件工程 2021年2期
关键词:子图高斯比特

席亮

(上海开放大学普陀分校信息工程系 上海市 200062)

1 引言

近年来量子信息处理技术得到了较多关注,将量子力学理论中的假设和基本思想作为一种数学工具,引入到经典计算机中与现有算法相结合,可在特定领域中提供一种崭新的解决方案,称之为量子衍生算法。例如文献[1]提出了量子衍生神经网络、文献[2]介绍了量子遗传算法。Eldar 等率先提出了量子衍生信号处理算法[3],Tseng 等将量子衍生理论用于数字图像处理领域,设计了图像边缘检测、图像加密等量子衍生图像处理算法[4]。文献[5]-[6]介绍了用量子比特来表示数字图像的方法,并基于此设计了量子衍生自适应中值滤波和图像边缘检测等算法,本文作者在文献[7]-[9]中实现了量子衍生图像融合以及量子半色调算法。

图像分割是数字图像处理学科研究的一个重要问题,目前图像分割技术被广泛应用于卫星遥感图[10]、医学影像分析[11]、道路交通监控等领域。基于图论的图像分割方法是近年来图像分割领域研究的热点,基本思想是把数字图像转化为图,然后用图的最小割算法实现图像的分割。Boykov 等人提出了著名的图割算法(GraphCut)[12],Rother 等人对GraphCut 算法做出改进,提出了GrabCut 算法[13],取得了较好的分割效果。本文基于量子衍生图像处理方法和Grabcut 算法,设计了一种新的图像分割方法,仿真实验表明该方法在没有人工控制的情况下,能够实现图像的有效分割,且耗时较少。

2 图像的量子表示及关联分解

2.1 图像的量子表示

传统的计算机是建立在比特的概念之上,每一个比特位都处于0 或1 的状态,量子计算则是建立在量子比特概念之上。量子比特也是一个状态,但它是由两个基态|0〉和|1〉的线性组合构成,可称之为量子线性叠加态。一个量子比特|ψ〉可表示为如下形式,其中|〉称为狄拉克符号:

式(1)中的a 和b 是两个复数,分别是基态|0〉和|1〉的概率幅。如果对量子比特|ψ〉进行测量,那么得到状态|0〉的概率为|a|2,得到状态|1〉的概率为|b|2,并且满足归一化|a|2+|b|2=1。

可以用如下方法将数字图像表示成量子比特的形式:先将一幅灰度图像f(m,n)做归一化处理,f(m,n)∈[0,1]表示图像在(m,n)处的灰度值,假设f(m,n)为点(m,n)处灰度值为1 的概率,1-f(m,n)为点(m,n)处灰度值为0 的概率,可以利用量子信息理论中的|0〉和|1〉对应数字图像的灰度值0 和1,即数字图像中的黑和白。由此可将一幅灰度图像表示成量子比特的形式:

2.2 量子关联分解

量子力学中的复合量子系统理论为数字图像处理提供了一种新的思路,由于复合量子系统遵循量子态叠加的规律,若干个量子比特叠加组成了一个复合量子关联系统,基于此量子叠加态,数字图像f(m,n)中(m,n-1),(m,n),(m,n+1)三点的灰度值可表示成f(m,n-1),f(m,n),f(m,n+1),也可简记成fm,n-1,fm,n,fm,n+1,图像中这三个相邻的像素形成了一个小邻域灰度关联系统,可看作是由三个量子比特构成的关联系统,其状态可由张量积表示:

其中ωi是态矢量|i〉的概率幅,它的平方是每一个可能状态的概率,并满足以下等式以ω2为例,对应的态矢量为|010〉,代表(m,n-1),(m,n),(m,n+1)三个相邻点的灰度值出现黑、白、黑的概率,ω6对应态矢量|110〉,代表三个相邻点的灰度值出现白、白、黑的概率,其它可类推。可以认为此复合量子系统表示了相邻像素点之间的灰度关联。式(4)可称为量子比特图像的关联分解,其中八个态矢量系数的平方就是八个子图的灰度值。

根据量子力学中的测量及坍缩理论,对公式(4)中表示的三量子位关联系统的第二个量子位,即中间量子位进行测量,测得为1 的概率为并且测量后这个三量子位关联系统坍缩为一个新的状态:

显然经过测量后,八个子图坍缩为四个子图,设为f1(m,n)、f2(m,n)、f3(m,n)、f4(m,n),这四个特征子图的灰度值分别为|010〉、|011〉、|110〉、|111〉四项对应系数的平方,具体可以写为:

经过关联分解和测量坍缩后形成的四个子图,均有特定意义。第一个子图的灰度值是|010〉项对应系数的平方,可看作(m,n-1),(m,n),(m,n+1)三个相邻像素出现黑白黑的可能性。第二个子图对应|011〉项对应系数的平方,可看作(m,n-1),(m,n),(m,n+1)三个相邻像素出现黑白白的可能性,可体现出图像在(m,n)点产生灰度正跳变的程度,同理第三个子图表示三个相邻像素出现白白黑的概率,可反映在(m,n)处出现灰度负跳变的程度。因此上述三个子图均表示在(m,n)处发生灰度跳变的程度,也就是图像的边缘信息。而第四个子图可看作(m,n-1),(m,n),(m,n+1)三个相邻像素出现白白白的可能性,反映的是图像灰度局域分布的情况。

3 Grabcut算法

Grabcut 算法是对Graphcut 方法的改进,先将数字图像表示成图的形式,V 是指所有顶点的集合,E 是指所有边的集合。图像中的每一个像素点均是该图的一个顶点,任意两个相邻的像素点相连接对应一条边,记作n-links。然后再增加了两个特殊的顶点S 和T,图像中的每一个像素点均与它们连接也构成边,这种边称为t-links。

如图1所示,实线的边是n-links,虚线的边是t-links,分别表示普通顶点连接的边和普通顶点与新增顶点S、T 相连接的边,边的权值可以看成是分割的代价。将图中的一部分边断开,图的顶点划分为两个不相交的子集s 和t(s∪t=V),即完成了图像的分割。这个子集就是一个割,若分割后所有的边权值之和最小,就是图的最小割。可通过构建能量函数来确定边的权值。图1中的实线边之权值是边界平滑能量项,虚线边是区域能量项。对背景与目标都采用包含K 个高斯分量的混合高斯模型构建能量函数,使用一个向量记录每个像素采用哪个高斯分量。整个图像的能量可记为区域能量项与边界能量项的和[14]。

区域能量项U 表示一个像素分配背景标签或目标标签的惩罚,即该像素属于标签0 或1 的概率。显然若给像素分配为概率最大的标签,此时能量最小,所以一般取属于背景或目标的概率的负对数。若图像所有像素均被正确划分至对应的背景区域或者目标区域,则能量是最小值。

取负对数之后则变成:

混合高斯模型的参数θ 有三个,分别是每个高斯分量的权重π、均值向量μ 和协方差矩阵∑,背景模型和目标模型的三个参数都需要通过学习确定。

边界能量项V 表示相邻像素之间不连续的惩罚,若两相邻像素差异很小,则很可能同属于背景或目标,反之若差异很大,则属于背景和目标的边缘,即被分割的可能性很大。差异越大,能量越小。

式(15)中参数β 取决于图像的对比度,若对比度较低则乘以一个较大的数放大差异,反之则乘以一个较小的数减小差异。经过多次迭代,背景GMM 和目标GMM 的参数不断被优化,图像分割的效果也更好。

4 本文方法

Grab cut 算法引入了RGB 三通道的混合高斯模型(GMM),通过不断进行参数学习和分割估计的迭代达到目标分割,虽然减少了人工交互,但仍然无法完全摆脱人工的干预,并且存在收敛较慢的缺点,本文基于量子衍生理论改进Grabcut 算法实现图像的自动分割。

根据2.1 和2.2 的介绍,将灰度图像归一化后转化为量子比特的形式,然后对其做量子关联分解,根据量子测量和量子坍缩理论,得到四幅特征子图。这四幅特征子图分别具有特定的意义,第一幅子图的灰度值表示原图中三个相邻像素出现黑白黑的概率,第二幅子图表示原图中三个相邻像素出现黑白白的概率,第三幅子图表示原图中三个相邻像素出现白白黑的概率。这三幅子图反映了图像中灰度值发生跳变的情况,记录了图像的边缘信息。第四幅子图表示相邻像素出现白白白的概率,反映了图像灰度局域分布的信息。通过这四幅特征子图也可以还原出原图[7]。

分别用含K 个高斯分量的全协方差混合高斯模型来对背景和目标建模,将四幅子图代入四通道混合高斯模型,每个高斯分量的均值向量μ 为四元素向量,协方差矩阵为4×4 矩阵。背景和目标GMM 模型一旦有了部分样本集后就可以得到参数的估计值,根据隶属于某个高斯分量的像素个数与总的像素个数的比值可得到该高斯分量的权值。为减少人工干预,本文采用了文献[15]的微分计盒算法生成目标的矩形轮廓。把轮廓外的部分看作背景,轮廓内的部分看作前景。经过若干次迭代,计算模型的每个参数,包括权重、均值向量和协方差矩阵。然后把分割得到的背景和目标像素再代入,训练优化模型的参数。

迭代过程会使能量逐渐递减,并趋于收敛,从而不断优化GMM 模型的参数和分割结果。由于经过量子关联分解和量子测量、坍缩的特征子图分别反映了原始图像中灰度跳变和局域分布的信息,从而大大提高了能量函数收敛的速度,一般通过三到四次迭代即可得到精准的目标,从而实现图像的自动分割。

图1:原始图像转化为图

算法的具体流程如下:

(1)将归一化后的灰度图像转化为量子比特的形式,经量子关联分解和量子测量、坍缩后得到四幅特征子图。

(2)运用微分计盒算法得到目标的精确矩形轮廓,以此作为类似graph cut 和grab cut 算法中需要手工干预的目标框。

(3)分别建立背景和目标的四通道混合高斯模型GMM,对每一个背景和目标像素分配高斯分量(将像素的灰度值代入对应的背景或目标模型中的每一个高斯分量,选取概率最大的分量)。

(4)计算混合高斯模型的参数,得到两类边的权值,使用最大流/最小割算法实现图像分割。

(5)重复步骤(3)和(4),直到收敛。每次迭代后,混合高斯模型的参数和分割结果都将得到优化。

5 仿真实验

表1:两种方法耗时及误差比较

为了验证本文提出算法的有效性,本文在公开标准数据集MSRA1000 中选择了100 幅图像进行仿真实验,并将本文方法的分割结果与普通GrabCut 算法进行比较。仿真实验环境的硬件为配备Intel i5-7300U 中央处理器以及8G 内存的普通PC 机,软件为Matlab7.0。对于每一幅图像,分别用本文提出的算法和普通Grab cut 算法进行目标分割。普通Grab cut 算法必须由人工绘制矩形框,本文提出的算法则无需人工干预。经过实验测试,本文方法总体有效率达到97%,从主观视觉感受上,本文方法与普通Grabcut 算法分割的结果非常接近。在100 幅图像中仅有3 幅背景较为复杂的图像未能达到理想的分割效果,这三幅图像用普通Grabcut 算法分割效果也不佳。因此增强复杂背景下图像分割的有效率将是后续研究的方向之一。

为了客观评价使用本文方法进行分割的效果,选择了其中三幅图像采用Photoshop 软件进行手动分割作为客观评价的标准图,分别计算两种方法分割结果的误差。误差的计算公式为:

I 是手动分割后得到的标准图,I0是使用算法自动分割得到的结果,M×N 是图像的像素个数[16]。图2是三幅图像分别用本文方法和普通Grabcut 算法分割后的结果,其中图2(a)是原始图像,图2(b)是本文方法分割后的结果,图2(c)是普通GrabCut 算法分割后的结果。

图2

表1中的数据是两种分割方法所花费的时间以及利用公式(16)计算得到的误差。表1中的实验结果显示本文提出的方法行之有效,准确分割出了目标对象,在实现整体分割的同时,几乎能够留存目标对象的全部信息。在没有人工干预的情况下,分割效果略优于Grab Cut 算法,且消耗的时间更少。

6 总结

本文借助量子衍生理论和Grabcut 算法,设计了一种的图像分割方法。将灰度图像转化成量子比特的形式,通过量子关联分解和量子测量、坍缩生成四幅特征子图,分别构建背景和目标的四通道混合高斯模型,通过迭代不断优化模型参数和图像分割的结果。该方法不需要人工干预,能够实现图像的自动分割,扩大了传统Grabcut 算法的使用范围。实验表明该算法不仅能够实现目标图像的准确分割,由于特征子图反映了图像的边缘信息和局域分布情况,模型迭代的次数相对较少,提高了图像分割的速度。基于量子衍生理论的数字图像处理技术属于新兴交叉学科,在边缘检测、图像融合、数字半色调等方面的应用证明了其有效性,后续研究将关注于提高复杂背景下目标对象的分割效果以及显著性目标的检测。

猜你喜欢
子图高斯比特
天才数学家——高斯
临界完全图Ramsey数
比特币还能投资吗
比特币一年涨135%重回5530元
基于频繁子图挖掘的数据服务Mashup推荐
有限域上高斯正规基的一个注记
不含2K1+K2和C4作为导出子图的图的色数
多个超导磁通量子比特的可控耦合
频繁子图挖掘算法的若干问题