均值漂移聚类法在传统服饰图像提取中的应用

2022-04-27 05:11芬,黄
毛纺科技 2022年4期
关键词:滤波均值聚类

王 芬,黄 力

(广西科技大学 艺术与文化传播学院, 广西 柳州 545001)

传统服饰不仅使人类文化体系更加丰富和完整,而且对现代文化艺术产业具有重要的指导意义[1]。中国传统服装风格对现代时尚的发展有着积极的影响,许多中国文化元素启发着时尚潮流的设计。服装图像一般由3种颜色组成:底色(主色)、辅助色和装饰色。服装图像的底色是服装形象的主色调,从主色调可以辨别出传统服装来自何时何地。内部结构线中的辅助色起着连接主色的作用,这些颜色的种类非常之多,有多达几十种颜色。3种颜色组成了一套色彩鲜艳的服装。其中,主色调是服装形象中最重要的部分。

在色调的识别研究中,曾德文等[2]分析了大量图片的颜色信息,在此基础上建立了颜色直方图模型,提取了图像主色的4个特征信息,并建立BP神经网络模型,对图片主色的浓度进行了识别。闻武等[3]根据图像色彩提出一种基于色彩特征的无参考彩色图像质量评价模型,在对彩色图像质量进行评价中,考虑了色调、色饱和度和色彩熵等色度特征的影响。罗微等[4]针对木材图像,将色调量化为若干个非等间隔区间,并在此基础上采用主色调的方法,对颜色分量进行合成,从而进行相似性检索。黄化入等[5]针对复杂多样的图像背景,提出了一种改进的可能性C均值聚类方法,通过该方法能够实现子图像的分割。裴晨等[6]针对常见分区域图像修复算法中,提出一种基于改进K均值聚类的图像修复方法,该方法对于分离效果较差的图像具有较好的修复效果。李勇等[7]提出一种基于遗传算法的K均值聚类分割法,通过将彩色图像转换到Lab颜色空间,同时结合步进和遗传算法的方式,搜索最佳聚类中心个数和聚类中心,进而达到图像分割的效果。张莲等[8]针对容易受干扰的红外图像,结合最大最小距离法与改进模糊C均值聚类算法,提出了一种新的图像分割方法,该方法在抗噪能力方面具有较强的优势。傅艺扬等[9]使用密度峰聚类算法实现了提花织物纹样的自动分割与提取,提高了提取的准确性。Zheng等[10]利用结构特征和区域信息对颜色区域进行分割,为了提高图像质量,采用结构-纹理分解的方法从服饰图像中提取主要结构,该方法还可以从不同的织物结构(如机织、针织和刺绣结构)中提取织物颜色区域。Wang等[11]在图像处理中,采用中值滤波和双边滤波对织物纹理进行平滑处理,该方法对机绣图像的分色精度较高。

这些方法虽然能够从织物中提取或分离出颜色,但由于辅助色、装饰色对颜色聚类或区域分割结果产生负面影响,无法准确地识别服装图像中的主色。本文研究在前人研究的基础上,针对中国传统服装图像,提出了一种主色调识别方法,采用中值滤波去除服装图像中的噪声,根据背景颜色将目标服装与背景分离,利用均值漂移聚类算法对服装颜色进行分类,并从分类结果中提取传统服饰图像的主色调。根据实验结果表明均值漂移聚类算法的带宽设置为0.05时,能够能很好地提取服装图像的主色调,提取的服装图像主色与实际颜色基本一致,且计算成本低。

1 研究方法

1.1 研究框架

研究的框架如图1所示。其步骤为:①利用单反相机获取服装图像。②对3个颜色通道中的子图像进行中值滤波进行去噪处理。③将3个颜色通道中的子图像进行组合,重构滤波后的图像[12],并将其从RGB颜色空间转换到CIE Lab颜色空间。④在背景颜色基础上,利用Ostu方法[13]对滤波后的图像进行分割。⑤利用均值漂移聚类算法对颜色图像进行分类。⑥根据人工输入的聚类数提取服装图像的主色调。

图1 研究框架Fig.1 Research Framework

1.2 研究方法

1.2.1 中值滤波法

图2 3×3滤波模板实例Fig.2 An example of filter template of 3×3

(1)

1.2.2 颜色空间变换

CIE Lab 颜色空间是国际通用的与设备无关的均匀颜色空间,L*表示颜色亮度,a*表示从绿色到红色的颜色,b*表示从蓝色到黄色的颜色。与RGB模型相比,CIE Lab颜色空间的颜色系统更接近人类视觉,更追求感知的一致性,CIE 色彩模式对不同色彩能够以数学方式来表示颜色,其色彩模式不依赖特定的设备,不同设备创建的图像中,其颜色模型产生的颜色均能保持一致性。事实上,传统的RGB度量坐标是非线性的,在分割模型中,L*、a*、b*更便于通过高斯函数表示纹理的变化。实验过程中通过采用Lab颜色模型,对服装图像进行主色分离。将服装图像的RGB转换到Lab颜色空间中的转换方程如下所示。

①RGB到XYZ颜色空间:

(2)

式中r、g、b分别表示RGB颜色空间中3个通道的灰度值。

②XYZ到Lab颜色空间:

(3)

(4)

式中:Xn、Yn、Zn是供参考的RGB激励值。转换后,L*、a*、b*的值将分别在0~100、-128~128、-128~128的范围内变化。

1.2.3 均值漂移聚类法

均值漂移聚类算法是一种基于增加梯度密度的非参数迭代方法,它是一种爬坡算法,涉及到将核迭代地转移到更高密度的区域直到收敛。每一个位移都由一个平均位移向量来定义,它总是指向密度最大增加的方向。在每一次迭代中,核被转移到质心或其中点的平均值。计算平均值的方法取决于核的选择。均值漂移聚类算法的突出优点是计算量小,算法简单,易于实现。它能显著减少基本图像实体的数目,并且由于良好的不连续性,能够保留图像的显著特征。假设在C处有一个圆形窗口,以半径h为中心。给定一组N个数据点xi,i=1,2,…,N,且xi∈Ω,x的概率密度可以从点密度估计得到:

(5)

K(x-xi)通常由均匀函数或高斯函数给出,高斯函数如下:

(6)

则密度函数的梯度变为:

(7)

其中g(‖x-xi)/h‖2)=-k/(‖x-xi)/h‖2),假设所有x∈[0,∞),存在内核配置文件k的导数,h是调整xi和x之间差异分辨率的带宽。加权平均数和核中心之间的差值称为“均值偏移”,均值漂移算法中,均值漂移向量m(x)迭代地移动特征空间中的每个数据点x,直到平均值收敛到设定的范围。平均移位向量m(x)可以定义为:

(8)

基于式(8)的分析,可以得到均值漂移聚类算法。首先,图像被分割为p维向量的二维(2D)晶格,其中p>3表示多光谱图像,p=3表示彩色图像,p=1表示灰度图像,这里需要通过控制核的大小来选择决定分辨率的带宽参数h。

2 实验过程

2.1 服装图像采集

采用佳能EOS500 d数码单反相机拍摄中国传统服饰图像,选择线光源(LL068)作为照明源,为成像提供高强度、无闪光的照明环境,获得均匀颜色为[L*,a*,b*]=[20,-0.8,-2.4]的背景作为背景。本文研究选用斗篷作为实验对象,斗篷具有中国传统服饰色彩和图案的基本特征。如图3所示为1 991像素×2 010像素的服装图像1,由于中国传统服装的实际尺寸较大,采用了双线性插值的方法对服装图像进行压缩,对主色不会产生影响,且能够减少计算时间。原始图像和压缩图像之间的比例为4∶1。

图3 服装1的原始图像Fig.3 Original image of clothing 1

2.2 服装图像滤波

为了消除长期磨损引起的色斑,对R、G、B 3个颜色通道的子图像进行中值滤波,以提高图像质量。使用5像素×5像素模板对子图像的滤波过程和结果如图4所示,顶部为原始图像,底部滤波图像。从图4可以看出,服装表面的污渍得到了有效的消除,颜色信息也得到了完整的保留。

图4 服装1的原始图像和过滤图像Fig.4 Original and filtered clothing 1 images

2.3 服装图像分割

通过式(2)~(4)将RGB颜色空间中的滤波图像传输到CIE Lab颜色空间。去除均匀背景,提取目标服装进行颜色检测。服装图像分割通过以下步骤进行:

①服装图像中背景色和像素颜色之间的距离映射d由实验室颜色空间中的欧几里德公式计算:

(9)

式中:p表示图像的第i行和第j列中的像素,其CIE Lab值为(li,ai,bi);q表示背景色,其CIE Lab值为(lc,ac,bc),处理后的图像如图5(a)所示。在图5(a)中,蓝色到黄色的变化表示d越来越大。这意味着背景的L*、a*、b*值与输入值更接近,而背景的L*、a*、b*值与目标服装有很大的差异。因此,可以将距离值作为分割信息。

②采用Ostu方法[12],根据距离图自动确定分割阈值。分割结果如图5(b)所示,白色像素表示目标,而黑色像素表示背景。

图5 服装1处理后的图像Fig.5 Processed image of costume 1. (a) Euclidean transformed image; (b) Binary image

2.4 均值漂移聚类

基于CIE Lab颜色空间的颜色特征,采用均值漂移聚类方法对目标服装中的像素进行分类。从服装图像中自动分离出底色、辅助色、装饰色等多种颜色。因此,可以从这些聚类颜色中提取主色。带宽h是均值漂移聚类方法的一个重要参数,它对聚类性能和计算时间有很大的影响。带宽h设置为0.05时,服装图像的RGB空间中的聚类结果如图6所示。

图6 服装1图像聚类结果Fig.6 Clothing 1 image clustering results

2.5 主色提取

通过对每个颜色簇的像素数进行排序来提取主色。提取主色时,需要输入主色的数量N,选择最大像素数的群集的色心作为主色。从图3中提取的主要颜色如图7所示。在图3中,可以看出服装有3种主要颜色,因此选择第1到第3大像素数作为主色,如图7(b)~(d)所示,与原始服装图像相比,该方法具有较好的提取效果。

图7 提取3种主色Fig.7 Three dominant colors extracted.(a) Clothing 1 image clustering; (b) Main color 1; (c) Main color 2; (d) Main color 3

3 结果与讨论

3.1 参数选择

3.1.1 中值滤波模板大小的影响

为了获得最佳的图像滤波效果,选择3×3、5×5、7×7 3种不同模板尺寸的中值滤波器,进行去噪处理。不同模板尺寸和相同带宽的过滤结果、分割结果和聚类结果如图8所示。

图8 不同模板大小下的滤波、分割和聚类结果Fig.8 Filtering, segmentation, clustering results of median filters with different template sizes

可见不同模板尺寸的结果是不同的。尽管分割结果中的孤立点随着模板大小的增加而减少,但聚类结果中的聚类数目也减少了。为了减少分割结果中的孤立点,保持聚类结果中颜色的个数不变,选择K=5的模板大小对服装图像进行滤波。

3.1.2 均值漂移聚类方法中带宽h的影响

带宽h是均值漂移聚类方法的一个重要参数,它对聚类性能和计算时间有很大的影响。为了获得最佳的聚类结果,从图3中的服装测试了不同的带宽,以提取3种主色。用于评估自动和手动检测的主色之间的色差。不同带宽下聚类结果的CMC(2∶1)值(ΔE)和计算时间如表1所示。

表1 ΔE和不同带宽下的计算时间Tab.1 ΔE and computing time with different bandwidths

提取的目标服装由93 200个像素组成,输入均值漂移聚类算法。在表1中,计算时间随着h的线性增加而逐渐减少,当h>0.07时,聚类数小于3。另外,当h=0.01时,计算时间过大。因此,h的值应在0.02~0.08之间。

此外,由表1可知,随着h的线性增加,3种主要颜色的ΔE先增大后减小,ΔE与颜色相似性呈反比关系,ΔE越小,2种颜色之间的颜色相似性越高。为了进一步确保最佳值,计算3个ΔE的总和,其中h=0.04、0.05和0.07,3种带宽的计算结果分别为1.86、1.60、2.28。当h=0.05时,ΔE之和为最低限度,因此选取0.05作为服装图像聚类的最佳值。

3.2 实验结果应用

为了进一步验证所提出方法的适用性,根据上述的分析结论,本文实验对另外4幅服装图像进行了处理,其中滤波模板大小K取5,带宽h为0.05。通过手动获取的原始图像及其主色如图9所示,这4幅服装图像的颜色聚类和主色提取结果如图10所示。主色自动提取和手动提取结果的比较如表2所示。

图9 手动获取的原始图像及其主色Fig.9 Costume images and its dominant colors acquired manually.(a) Clothing 2; (b) Clothing 3; (c) Clothing 4; (d) Clothing 5

从图10和表2中,可以看出自动和手动获取的主色之间存在很小的色差。ΔE的值在0.02~1.35之间,人眼很难分辨主要色差。因此,本文提出的基于均值漂移聚类算法的服装图像分色方法具有良好的效果。

图10 4幅图像的主色提取结果Fig.10 Dominant color extraction results of four images. (a) Clothing 2; (b) Clothing 3; (c) Clothing 4; (d) Clothing 5

表2 自动和手动获取主要颜色提取结果比较Tab.2 The comparison between dominant color extraction results automatically and manually

此外,该方法在不同情况下采用另外3种不同的中国传统服饰进行测试,以验证所提方法的鲁棒性,颜色聚类和主色提取结果如图11所示。实验中,根据3.1中的分析步骤,采用人工预识别背景颜色,将滤波模板大小K设置为5,带宽h的取值如上节所述方法,此处获取的h也为0.05。图11(a)~(c)服装图像的主色提取数分别为5、4和4。此外,图11显示了不同主色的百分比。蓝色、暗红色和紫红色分别构成图11(a)(b)(c)中的主色。结果表明,该方法在不同情况下具有很强的鲁棒性。

图11 服装图像的主色提取结果Fig.11 Dominant color extraction results. (a) Original clothing image; (b) Color clustering results; (c) Extract main color

4 结 论

针对中国传统服装主色调的智能提取提出了一种有效的颜色聚类方法,将数码单反拍摄的服装图像分解为R、G、B 3个颜色通道,对3个颜色通道中的子图像分别进行中值滤波。在实验室颜色空间中,根据背景颜色对滤波后的图像进行分割,将目标轮廓与背景分离。利用均值漂移聚类算法对服装图像中的所有像素点进行聚类,并从聚类结果中提取主色成分。实验结果表明,当选择K=5的模板进行滤波,带宽设置h=0.05时,从服装图像中提取的主色与实际颜色基本一致,且计算量小,表明该方法能有效提取服装图像主色成分。

猜你喜欢
滤波均值聚类
一种傅里叶域海量数据高速谱聚类方法
基于HP滤波与ARIMA-GARCH模型的柱塞泵泄漏量预测
基于改进自适应中值滤波的图像降噪方法*
基于数据降维与聚类的车联网数据分析应用
基于模糊聚类和支持向量回归的成绩预测
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
基于非下采样剪切波变换与引导滤波结合的遥感图像增强
均值不等式的小应用
合成孔径雷达图像的最小均方误差线性最优滤波