基于最大熵阈值处理算法的视频图像人物分割方法

2021-09-22 09:36李巧兰卢荣辉卢永祥

蚌埠学院学报 2021年5期

李巧兰，卢荣辉，卢永祥

(武夷学院信息技术与实验室管理中心，福建龙岩 354300)

图像分割是图像处理领域内的经验研究方向，更是计算机视觉中的关键技术之一。对视频图像中的人物进行分割对于视频监控、事件推断等许多任务都很重要，因为人类是人们感兴趣的日常活动的主要参与者[1]。视频图像人物分割的精准度关系到图像识别的有效性，受到了学者们的高度重视。

现今，关于视频图像人物分割的研究很多，并取得了一定的成果。视频图像人物分割方法主要分为三类：基于边缘的视频图像人物分割方法[2]、基于区域的视频图像人物分割方法[3]以及基于Canny算子的视频图像人物分割方法[4]。使用频率最高的是基于阈值的视频图像人物分割方法，该方法的关键是如何确定阈值，阈值的选取直接决定着图像分割的精确度。

为了满足计算机视觉的需求，寻找最佳阈值，提出基于最大熵阈值处理算法的视频图像人物分割方法研究。最大熵阈值处理算法是基于分割后图像熵最大化来确定最佳阈值，符合视频图像人物分割的需求，能够提升图像分割的精准度。

1 基于最大熵值处理的视频图像人物分割

1.1 图像灰度直方图获取

在视频图像人物处理的过程中，直方图是一种简单有效的手段，是对图像像素的一种统计表达，包含着非常丰富的信息。灰度直方图只对像素灰度值大小进行统计，与图像像素间的相关性无关，因此不同图像可能存在着相同的灰度直方图[5]。

设图像尺寸为M×N，灰度级为0，1，…，L-1，像素点(m，n)对应的灰度值采用f(m，n)表示，则邻域平均灰度值表示为：

(1)

式(1)中，g(m，n)表示邻域平均灰度值；N1表示邻域D中像素点数量，邻域D通常取像素点(m，n)周围3×3、5×5或者7×7的区域；(m1，n1)表示邻域D内的某一像素点；f(m1，n1)表示像素点(m1，n1)的灰度值。

图像灰度直方图直接利用像素灰度统计，获取公式为：

(2)

式(2)中，z的取值范围为0，1，…，L-1；δ()表示灰度级判断函数。

依据上述流程获取视频图像人物的灰度直方图，如图1所示。

图1 灰度直方图

分析图1可知，图像中不同灰度级出现的次数存在着较大的差异，并且并没有铺满整个灰度级。图像灰度直方图容易受到噪声的干扰，导致直方图波形、数值的改变，从而影响最佳阈值的计算[6]。为此，均衡化、归一化处理图像灰度直方图，具体处理过程如下。

均衡化处理是将图像划分为多个区间子图像，分别求取每个区间像素的映射灰度值，计算公式为

f′=flower+(fupper-flower)*Cz[flower，fupper]

(3)

式(3)中，f′表示像素映射灰度值；flower与fupper分别表示映射区间内灰度的最小值与最大值；Cz[flower，fupper]表示z级灰度值在[flower，fupper]区间内的累积概率密度。

为了进一步保障图像灰度直方图处理前后的稳定性，归一化处理灰度直方图，对图像的每个像素灰度值乘以一个偏移系数，计算公式为：

(4)

式(4)中，O(m，n)为归一化处理后的灰度直方图；mi与mo分别为均衡化处理前后的图像灰度均值。

1.2 图像总熵值计算

以上述获取的视频图像人物灰度直方图为基础，设定未知阈值为t，计算图像总熵值[7]。

假设视频图像人物中像素值共有Q个，依据信息熵的概念，每个像素点对应的信息熵表示为：

(5)

式(5)中，H表示像素点对应的信息熵；pz表示各灰度级z在视频图像人物中出现的概率；qz表示灰度值为z的像素数量。

对于待分割的视频图像人物来说，设定未知阈值t将图像划分为A与B两部分，视频图像人物划分示意图如图2所示。

图2 视频图像人物划分示意图

如图2所示，每个区域内各个像素点的概率分布情况如公式(6)所示：

(6)

则区域A与区域B信息熵总和计算公式为：

(7)

式(7)中，HA(t)与HB(t)分别表示区域A与区域B信息熵的总和。

将公式(7)中的结果相加则得到视频图像人物的总熵值，表示为：

(8)

通过上述过程完成了视频图像人物总熵值的计算，为下述最佳阈值的求解做了准备。

1.3 最佳阈值求解

以上述图像总熵值公式为依据，以图像总熵值H(t)的最大值为目标，求解的阈值t即为视频图像人物分割的最佳阈值[8]。由此可见，最佳阈值的求解过程相当于函数优化问题，存在着计算过程复杂的特点，为了简化最佳阈值的求解过程，引入粒子群算法，求解视频图像人物分割的最佳阈值[9]。

通过研究发现，粒子群算法能够解决连续优化问题，并具备较高的精准度与效率，可以极大地减少计算最佳阈值消耗的时间，提升视频图像人物分割方法的性能[10]。

基于粒子群算法的图像分割最佳阈值求解步骤如下所示：

步骤一：初始化粒子群算法参数。粒子群算法参数包括粒子个数、粒子最大迭代次数、粒子飞行速度最大值、粒子飞行速度最小值、粒子移动位置边界值等；

步骤二：将最大熵阈值处理算法得到的视频图像人物总熵值公式(公式(8))作为粒子群算法的适应度函数，在搜索区域内随机初始化粒子位置xi，将其作为粒子i的最佳位置，记为Pij；

步骤三：依据公式(8)计算每个粒子的适应度值，选取最大适应度值Pgj作为粒子群算法的全局最优解；

步骤四：将粒子位置适应度值与上一次迭代最佳位置适应度值作比较[11]，若粒子当前适应度值较大，更新粒子位置，将粒子当前位置作为粒子最佳位置；

步骤五：将每个粒子最佳位置与全局最优位置Pgj的适应度值作比较，若当前粒子最佳位置适应度值较大，更新全局最优位置；若Pgj适应度值较大，保持全局最优位置；

步骤六：依据位置更新公式、速度更新公式迭代更新；

步骤七：判断算法是否达到最大迭代次数。若达到最大迭代次数，算法结束，输出全局最优解；若未达到最大迭代次数，返回步骤二；

步骤八：步骤七搜索得到的全局最优解即为视频图像人物分割的最佳阈值，以此为基础，分割视频图像人物。

2 图像分割质量实验分析

2.1 图像分割质量评价指标选取

为了衡量视频图像人物分割方法的优劣，选取适当的图像分割质量评价指标。实验所用数据库为PASCAL VOC 2012 dataset 图像数据库，选取100张含有人物的图像进行仿真实验。此研究选取区域间对比度、区域内一致性以及图像分割合理性作为评价指标，具体指标定义如下所示。

2.1.1区域间对比度

对于原始视频图像人物来说，通过分割可以得到若干个区域，不同区域之间的特征存在着较大的差异，通过对比区域间的对比度大小即可判断方法分割图像质量的好坏，从而衡量方法的优劣。

区域间对比度定义为：

(9)

式(9)中，GC表示相邻区域之间的灰度对比度；f1与f2分别表示相邻两个区域各自的平均灰度值。

常规情况下，区域间对比度值越大，表明区域之间差异更明显，图像分割质量越好。

2.1.2区域内一致性

依据图像分割定义可知，分割后图像是若干个具备相似特征的区域，可以用各个分割区域内部特征的均匀程度描述图像分割质量，即区域内一致性。

区域内一致性测度定义为：

(10)

式(10)中，UM表示区域内一致性测度值；C表示归一化参数；f(x，y)表示原始视频图像人物；A1表示Ri区域内像素数量；Ri表示分割后图像的第i个区域。

常规情况下，区域内一致性测度值UM越大，表明分割后图像目标区域与背景区域内部一致性越好，设定的标准值为4.00，则图像分割质量越好。

2.1.3图像分割合理性

图像分割所得目标数目与实际存在目标数目的差值可以在一定程度上评价图像分割方法的优劣。

图像分割合理性测度定义为：

(11)

式(11)中，F表示图像分割合理性测度值；α与β表示尺度参数；Tn表示原始图像目标数目；Sn表示分割所得图像目标数目。

2.2 区域间对比度分析

区域间对比度取值范围为[0，1]，标准值为0.61。该评价指标容易受到高斯噪声的影响，为了衡量视频图像人物分割方法的优劣，在无噪与加噪两种情况下，分别进行10次视频图像人物分割实验，得到的区域间对比度结果如表1与表2所示。

表1 无噪情况下区域间对比度结果表

表2 加噪情况下区域间对比度结果表

表1与表2数据显示，图像加噪后，阈值搜索时间大幅增加，在第1次和第7次实验中，阈值出现较大的偏差，区域间对比度也呈现下降的趋势。无噪情况下，区域间对比度范围为0.79-0.89；加噪情况下，区域间对比度范围为0.69-0.79，均大于标准值0.61。

2.3 区域内一致性分析

区域内一致性测度取值范围为[0，10]，标准值为4.00。该评价指标也会受到高斯噪声的影响，为了衡量视频图像人物分割方法的优劣，在无噪与加噪两种情况下，分别进行100次视频图像人物分割实验，得到的区域内一致性测度结果如图3与图4所示。

图3 无噪情况下区域内一致性测度结果

图4 加噪情况下区域内一致性测度结果

图3与图4显示，偏离区域内一致性测度平均值曲线的测度值为异常测度值，计算过程中需要将其删除。通过对比研究发现，无噪情况下区域内一致性测度平均值均高于加噪情况，并普遍高于标准值4.00，说明该方法的区域内一致性测度结果。

2.4 图像分割合理性分析

通过实验得到图像分割合理性测度值结果如表3所示。

表3 图像分割合理性测度结果

表3数据显示，图像分割合理性测度平均值为0.8，本文方法在归一化处理灰度直方图的基础上，为后续图像总熵值的计算及最大阈值的求解提供了支撑，提高了该方法图像人物分割的合理性。

2.5 图像分割质量对比

为了进一步验证本文提出方法的视频人物图像分割质量，将文献[2]方法(神经网络与边缘检测相结合的人体前景分割算法)与文献[3]方法(基于区域信息主动轮廓模型的图像分割)作为实验对照组。在上文提出的图像数据库中随机选取三幅人物图像，利用三种方法对图像进行人物分割，获得的实验结果如图5所示。

图5 图像分割质量

由图5可知，文献[2]及文献[3]方法人物分割结果存在划分边界模糊、划分区域偏差较大的问题，而本文提出方法可以较为精准地划分图像人物，可以有效区分人像与物体之间的边界，并且人物的边缘细节保留得更完整。因为本文引入粒子群算法简化了最大阈值求解过程，可以对分割过程进行连续优化，从而提高了图像的分割质量。

3 结论

本研究提出的基于最大熵阈值处理算法的视频图像人物分割方法，利用信息熵理论计算图像总熵值最大值，引入粒子群算法寻找图像分割最大阈值，依据最大阈值进行图像分割。实验证明，该方法在图像加噪与无噪的情况下，图像人物的分割合理性测度值均符合标准。对比传统方法的图像分割质量，本文方法的人物分割效果更佳，可以为计算机视觉技术的发展提供有力的支撑。