覃小素, 黄成泉, 雷 欢, 陈 阳, 彭家磊, 周丽华
(1 贵州民族大学 数据科学与信息工程学院, 贵阳 550025;2 贵州民族大学 工程技术人才实践训练中心, 贵阳 550025)
作为民族文化和精神的重要载体之一,民族服饰与国家的发展和传承密不可分。 民族服饰也体现了不同民族之间的文化差异和多样性,具有重要的历史、文化和艺术价值。 随着时间的推移,民族服饰不断演变,原材料、风格、颜色以及制作工艺和图案等方面的变化,都能够反映出相应民族文化的历史演变和发展轨迹[1]。 而苗族服饰是传统民族服饰的代表之一,具有独特魅力和多元性,有利于不同民族之间文化的传播与交流,也是其民族的身份象征和文化符号,对于传承民族精神和提升民族自信心具有重要作用。 苗族服饰具有纹理图腾复杂、色彩缤纷等特点,随着时间的推移,服饰受环境和噪声等多种因素的影响,导致部分图案和纹理变得模糊不清。 因此,及时保护和传承民族文化意义非凡。
图像分割是将图像按照一定的规则划分为若干个具有相似特征(如亮度、色彩、纹理、密度等等)区域的技术和过程。 信息化时代,图像分割技术已广泛应用于各个领域,在医学和遥感领域尤为常见。传统的模糊C 均值(FCM)是一种简单高效的算法,这个算法对于无噪声图像,具有分割准确率高和速度快的优势[2]。 但处理含噪声图像时效果不佳,无法充分体现其分割准确率高的优势。 为了提高算法对噪声的鲁棒性,许多研究者不断的对FCM 算法进行改进,Ahmed 等[3]提出具有空间约束的改进算法(FCM with Spatial constraints, FCM-S),充分考虑像素的邻域信息,从而提高算法对噪声的鲁棒性,但是在算法运行的过程中,需要一次次计算像素点的邻域信息,导致计算成本高;Chen 等[4]引入两个变量来替换FCM-S 中的邻域信息,即均值滤波(FCMS1)和中值滤波(FCM-S2),旨在提前计算空间邻域信息,降低了计算成本;Krinidis 等[5]定义了一种新的模糊因子(Fuzzy Local Information C -Means,FLICM),来抑制迭代过程中的噪声;高云龙等[6]提出簇间可分的鲁棒模糊C 均值聚类(Robust Fuzzy C-Means Clustering Integrating Between - cluster Information,RBI-FCM)算法,利用像素的稀疏性,提高簇之间的分类;Zhang 等[7]提出具有邻域信息约束的偏差稀疏模糊C 均值(Deviation-Sparse Fuzzy C-means With Neighbor Information Constraint,DSFCM-N),基于像素的邻域信息,对测量值与理论值之间的偏差施加稀疏性来降低算法噪声的敏感性。 然而苗族服饰图像的纹理复杂、色彩鲜艳、图案丰富,经过长期保存的服饰图像存在折痕、磨损等现象。 尽管改进后的算法在一定程度上能够提高对苗族服饰图像的分割效果,但并没有考虑到像素边缘点对算法的影响,对于存在折痕、磨损、色彩差异大的苗族服饰图像分割效果仍有待进一步提高。
由于传统FCM 算法对噪声敏感,无法有效分割具有折痕、污渍、色彩差异大的苗族服饰图像,本文提出了可靠性模糊局部信息C 均值聚类算法的苗族图像分割(Dependable Fuzzy Local Information Cmeans, DFLICM)算法,构造一个模糊因子来度量空间信息和灰度信息的相似性,既不需调节参数也可以自动确定空间约束项,旨在平衡噪声和细节;使用一个不确定性聚类模型进一步降低噪声点和边缘点的影响。 实验结果表明,本文所提算法对噪声具有鲁棒性,对于边缘点分割效果较好,能较完整的分割出苗族服饰图案。
传统的FCM 是一种基于模糊逻辑的无监督聚类算法,通过一个迭代的最小化过程将n个被测量的像 素 划 分 为c个 类[6]。 FCM 的 目 标 函 数JFCM(U,V) 如式(1)所示:
其中,X ={x1,x2,…,xn}为图像的像素集;n为像素的个数;xi为图像中第i像素的灰度值;c为划分X的类别数(c >1);m为模糊加权指数,决定聚类的模糊性, 在实际应用中,m通常取为2;V =和U ={uki |1 ≤k≤c,1 ≤i≤n}分别为聚类中心矩阵和模糊隶属度矩阵,其中隶属度满足=1 约束条件,‖xi - vk‖2为像素xi与聚类中心vk的欧氏距离。
利用拉格朗日乘子法对JFCM(U,V) 进行迭代更新,实现最小化目标函数,获得隶属度uki和聚类中心vk更新,式(2)和式(3):
但是传统的FCM 算法对噪声较敏感,对具有折痕、污渍、色彩差异大的苗族服饰图像分割效果难以令人满意。
像素具有明显和非明显的特征,对于非明显特征的像素,无法定义其类别属性时称为像素的模糊不确定性。 对于属性不明确的像素,基于当前的聚类结果,仅用距离来度量不确定性的大小。 当一个像素距离交叠的簇越远时,像素的模糊不确定性就越小,反之越大[8]。
像素i的模糊不确定性模型如式(4)所示:
其中,q为不确定性因子。
在像素聚类的过程中尽可能的使不确定性最小,即不确定性的聚类模型,式(5):
基于式(5),分析像素的可靠性。 对于隶属度值大的像素,具有明显的特征,可以确定像素类别;而对于距离交叠簇较远的噪声点和边缘点,像素的隶属度特征不够明显,其大小只与像素点到聚类中心的距离有关,距离交叠簇越远,像素的模糊不确定性越小,则对应δi的权重较小,从而降低了噪声点和边缘点的影响。
传统的FCM 算法对噪声较为敏感,分割的苗族服饰图像的效果难以令人满意。 本文考虑像素的局部空间信息和灰度信息,在目标函数中使用一个模糊因子来自动确立空间约束项,并通过降低像素之间的不确定性来进一步提高算法对噪声点和边缘点的鲁棒性,获得DFLICM 算法的目标函数,式(6):
其中,α为不确定性模型的占比系数;Ni为xj周围窗口中的邻域像素;Gki为模糊因子,满足式(7):
用拉格朗日乘子法对式(6),即目标函数构建辅助函数,式(8):
对式(8)中的隶属度uki求偏导,并基于隶属度的约束条件得到式(9):
对式(8)中的聚类中心vk求偏导,式(10):
求解式(10)得到式(11):
算法实现的步骤:
(1) 设置加权模糊指数m、聚类的个数c、窗口N、不确定性因子q,不确定性比例系数α、阈值ε和最大迭代次数Tmax;
(2)初始化聚类中心v(1)和隶属度,设置迭代次数Tnums =1;
(3) 根据式(4)计算δi;
(4) 根据式(8)计算隶属度;
(5)根据式(10)计算聚类中心;
(6)运行过程中满足‖J(Tnums+1)- J(Tnums)‖<ε,或者Tmums >Tmax 这两个条件中的一个,则停止迭代。 均不满足条件时,令Tnums =Tnums +1,转到第三步,继续下一轮迭代。
将本文算法(DFLICM)与FCM、FCM-S1、FCMS2、FLICM 和RBI-FCM 算法在苗族服饰图像上进行对比,旨在验证本文算法的优势。 数据集来源于北京服装学院民族服饰图像博物馆(http:/ /www.biftmuseum.com/),实验中部分参数设置:模糊加权指数为2,窗口为3,阈值为10-5,聚类数为2,最大迭代次数为100,不确定性因子为2。
实验环境:MATLAB R2018b,Intel(R) Core(TM) i7-3770 CPU @3.40 GHz,8.00 GB 内存。
本文选用两个客观评价指标即划分系数(Partition Coefficient,Vpc) 和 划 分 熵(Partition Entropy,Vpe) 来验证DFLICM 算法的优势。Vpc和Vpe的值在0~1 之间波动,Vpc的值越接近于1,效果越好;Vpe的值越接近于0,模糊聚类越紧凑,分割效果越好。 指标的定义如式(12) 和式(13):
实验一选取3 张蜡染图像,由简单的色彩组成,但是图像中存在磨损、折痕、污渍的现象。 本文对这类苗族服饰图像添加5%高斯和5%椒盐混合噪声,增加算法的分割难度,旨在验证DFLICM 算法的优势,实验结果如图1 和表1 所示。 由图1 和表1可知,FCM 和RBI-FCM 算法分割的图像不同程度地受到噪声的影响,部分像素出现错分和漏分的现象,图像中仍有磨损和折痕。 FCM-S1 和FCM-S2算法能去掉大部分噪声点,分割效果较好,但是分割的图像边缘部分还存在稀疏的噪声点;FLICM 算法分割的图像轮廓和背景划分较为明确,消除大部分噪声点的影响,但是分割的蜡染图中边缘部分被模糊掉。 FCM、RBI-FCM、FCM-S1、FCM-S2 和FLICM算法难以分割具有磨损、折痕、污渍的苗族服饰图像。 DFLICM 算法不仅能分割出完整的图腾,而且边缘部分也较为清晰,DFLICM 算法获得最高的Vpc值和最低的Vpe值,说明DFLICM 算法分割蜡染图像的效果较理想。
表1 不同算法分割含有5%混合噪声的苗族服饰图像的Vpc 和Vpe(%)值Tab.1 Vpc and Vpe (%) values of 5% mixed noise image segmentation by different algorithms
图1 不同算法分割含有5%混合噪声的苗族服饰图像Fig.1 Segmentation results on Miao clothing images containing 5%mixed noise from different algorithms
实验二选取3 张色彩差异大的苗族服饰图像,对这一类苗族服饰图像添加10%高斯和10%椒盐混合噪声,进一步验证DFLICM 算法的分割性能,实验结果如图2 和表2 所示。 由图2 和表2 可知,FCM 和RBI-FCM 算法的分割效果较差,图像的轮廓与背景大部分混在一起,出现虚假分割的情况,不同颜色的像素分割不够准确,RBI-FCM 算法的Vpc和Vpe值部分高于FCM 算法,由于RBI-FCM 算法考虑到了簇之间的关系,一定程度上抑制了噪声点,增强像素的可分性。 FCM-S1 和FCM-S2 算法对于色差大的图像分割效果略好,但是Vpc均低于其他算法,而Vpe值又高于其他算法。 从指标上分析,FCM-S1和FCM-S2 算法的分割性能较差。 FLICM 和DFLICM 算法分割的图案清晰明亮,但是FLICM 算法边缘部分的噪声点仍不能有效消除,DFLICM 算法的Vpc值最高,Vpe值最低,DFLICM 算法的分割质量佳,分割性能优于对比算法。
表2 不同算法分割含有10%混合噪声的苗族服饰图像的Vpc 和Vpe(%)值Tab.2 Vpc and Vpe (%) values of 10% mixed noise image segmentation by different algorithms
图2 不同算法分割含有10%混合噪声的苗族服饰图像Fig.2 Segmentation of Miao clothing images containing 10%mixed noise of different algorithms
针对传统FCM 算法对含噪的苗族服饰图像分割质量不佳的问题,本文提出了可靠性模糊局部信息C 均值聚类算法。 考虑到像素的空间邻域信息,在FCM 的目标函数中构造一个模糊因子,结合空间信息与灰度信息,提高算法对噪声的鲁棒性,并自动调节算法在去噪声和保留细节之间的关系;除此之外,根据几何意义,对像素点进行可靠性分析,在聚类的过程中,降低像素的不确定性,进一步降低了噪声点和边缘点的影响。 实验结果表明,DFLICM 算法对具有折痕、污渍、色彩差异大的苗族服饰图像分割效果好,既能去噪,又能完整的分割出苗族服饰图案。 但是DFLICM 算法也存在不足,每次运行均需要计算局部信息,耗时、计算成本高;参数大小影响着实验结果,一定程度上存在不稳定性,调参过程也较困难;实验对象比较局限,没有对图腾复杂、纹理细小、背景与图案差异小的服饰图像进行研究,存在部分漏分割的现象。