基于稀疏字典学习的羊绒与羊毛分类

2022-04-24 03:00孙春红丁广太
纺织学报 2022年4期
关键词:羊绒羊毛字典

孙春红, 丁广太,2, 方 坤

(1. 上海大学 计算机工程与科学学院, 上海 200444; 2. 上海大学 材料基因组工程研究院, 上海 200444)

羊绒与羊毛纤维鉴别一直是国内外毛纺织行业的研究重点。目前,纺织行业对纤维的识别主要基于显微镜方法[1-2],这种方法要求检测人员具备极强的判断能力和辨别经验。受环境、饲养方式以及地理环境的影响,纤维变异形态逐渐增多,需要检测人员不断更新经验,重视和关注纤维结构变化及其多样性。人工检验不可避免地会受到人的主观判断的影响,工作强度大,鉴定效率低,无法满足日益增长的工业需求;因此,高效、准确地识别羊绒与羊毛纤维,并鉴定其品质,是纺织行业的不懈追求,与之相关的技术和数据分析算法研究具有重要的实际应用价值。

基于图像的稀疏字典学习[3-4]是机器学习和计算机视觉研究领域的热点方法之一,其应用在图像分类以及识别领域效果较好[5]。文献[6]提出了一种基于稀疏表示的人脸识别算法,即SRC(sparse representation based classifier),是稀疏字典学习的早期重要工作之一。该算法从数据集中提取部分数据样本作为字典,基于字典对数据的稀疏编码进行优化,之后计算数据样本与其稀疏表示的残差,取最小残差对应的类别作为待分类样本。该算法简单易用,但使用原始图像数据构造字典,图像质量问题如图像噪声、计算误差会传导到字典中,且当原始图像较大时,算法的计算量也随之变大。

为克服SRC方法直接将数据集中部分数据样本作为字典这一不足,针对特定领域的字典学习问题,研究者们寻找各种方法构造具有较高辨别能力的过完备字典(over-complete dictionary),以充分表达数据之间的关联性。贺兴时等[4]根据尺度不变特征变换(SIFT)对光照、表情、姿态的鲁棒性和稀疏表示,分析噪声因子的稳健性及其优越的分类性能, 提出基于SIFT的稀疏表示人脸识别算法。Tiep等[7]通过分离对象的特殊性和共性,构建低秩的共享字典和特定类别字典用于图像分类。

近年来,人们发现稀疏编码除能够表示原始数据的特性,也具有一定的类型判别性,即学习到的稀疏模型不仅是一个重构模型,也是一种有辨识能力的判别模型。利用共享字典和多类决策函数,Julien等[8]对属于不同类别的信号进行稀疏表示,以构建具有辨识能力的稀疏模型。Jiang等[9]提出了一种用于学习稀疏编码判别字典的标签一致K均值奇异值分解(K-SVD)算法,将标签信息与每个字典项相关联,以在字典学习过程中增强稀疏编码的可辨识性。

为实现羊绒与羊毛纤维的自动分类,本文基于稀疏字典学习方法对实际应用中的算法问题进行研究。提取原始图像的局部二值模型(LBP)纹理特征构建更紧凑的字典表示,使用基于K-SVD的稀疏字典学习算法对字典和稀疏编码同时进行优化,在更好地表达图像特征的同时增强类别的可辨识性。

1 基于稀疏字典学习的鉴别方法

本文提出了一种基于稀疏字典学习(SDL)的羊绒与羊毛分类和鉴别方法,通过稀疏字典学习方法获取关联特征——字典,并利用字典实现对羊绒与羊毛纤维的自动分类。为获取更好的分类结果,突出目标,分别基于光学显微镜(OM)和扫描电子显微镜(SEM)照片进行实验。

基于稀疏字典学习思想设计的羊绒与羊毛分类和鉴别算法,主要分为以下4步:1)对羊绒与羊毛纤维图像进行图像预处理;2)提取每张图像的纹理特征,并将特征集转化为代表整个数据集的多维特征矩阵;3)对特征矩阵进行字典学习,获取字典及其稀疏编码,并对稀疏编码进行优化;4)利用字典和稀疏编码实现羊绒与羊毛纤维的分类和鉴别。

1.1 图像预处理

本文使用的羊绒和羊毛原始图像(鄂尔多斯羊绒集团提供)如图1所示。

图1 羊绒和羊毛原始图像Fig.1 Original images of cashmere and wool. (a) Cashmere optical microscope image(×500); (b) Wool optical microscope image(×500); (c) Cashmere SEM image(×1 000); (d) Wool SEM image(×1 000)

在使用显微镜获取原始羊绒与羊毛纤维图像时,难免会存在干扰,如光照、阴影等,以及如图1(a)、 (b)中的气泡与可见杂质。为降低干扰对实验的影响,首先使用中值滤波、暗通道先验去雾算法[10]去雾、去噪,使模糊的原始图像更加清晰,结果如图2(a)、(b)所示。由于在扫描电镜图像中纤维数量过多,为突出纤维部分,将图像剪切成12个部分;对光学显微镜图像不进行剪切处理。之后,为防止实验结果过拟合以及丰富图像信息,使用随机水平翻转、随机竖直翻转、图像旋转、随机水平偏移、随机竖直偏移5种方式实现数据增广,每张图像增加10个样本。图像数据增广后如图2(c)、(d)所示。

图2 图像预处理样例Fig.2 Image samples after preprocessing. (a) Wool SEM image after denoising; (b) Wool optical microscope image after denoising; (c) Cashmere augmentation image 1;(d) Cashmere augmentation image 2

1.2 多维特征矩阵的获取与处理

对显微镜图像进行图像预处理后,本文使用LBP特征实现羊绒与羊毛纤维纹理特征参数的提取。由于图像的多样性,SIFT特征等基于关键点的特征提取方法提取出的关键点数量不同,会导致获取的特征向量维度不易统一,不便于字典学习过程的实施,因此,本文利用LBP特征获取固定的特征维度,保证图像信息的统一性。多维特征矩阵的获取通过如下2个步骤实现。

1)提取图像的LBP特征。

LBP特征提取方法步骤如下:首先对图像中所有像素进行遍历;对当前像素(xc,yc)进行LBP编码[11],如式(1)所示。

(1)

式中:gc表示当前像素的灰度值;gi表示(xc,yc)的8邻域里第i个元素的灰度值,i=0,1,2,…,7;s(x)是式(2)定义的符号函数。

(2)

基于LBP(xc,yc)最终形成一个8位二进制码作为当前像素(xc,yc)的LBP值,计算过程如图3所示。然后对整张图像的LBP值进行直方图统计,获取图像的LBP特征向量

y=[a1,…,ai,…,am]T

式中:ai表示该直方图中的第i个统计数据;m表示该直方图中的数据个数,也就是该图像的LBP特征向量的长度。

图3 LBP特征提取示例图Fig.3 Example diagram of LBP feature extraction

2)构建图像矩阵向量。

对每张图像进行特征提取,获得图像的LBP特征向量y后,将其规范化(主要是统一其长度,取m=256), 形成该图像的m×n维的特征矩阵Y,Y表示具有n张图像的LBP特征向量矩阵,如式(3)所示。

Y=[y1,…,yk,…,yn]

(3)

式中,yk表示第k张图像所对应的m维LBP特征向量,k=1,2,3,…,n。

1.3 稀疏字典学习

稀疏字典学习即从庞大的样本中找出最具代表性的字典,用字典中的原子对样本进行稀疏表示。稀疏字典学习的形式化表达式为

Y=DX

(4)

式中:D=[d1,d2,…,dK]∈Rm×K,表示通过字典学习得到的具有K个原子的字典(K为字典项数)。X=[x1,x2,…,xn]∈RK×n,表示Y中的样本稀疏编码由n个K维列向量组成。

稀疏字典学习过程由如下3步完成:字典和稀疏编码构建,稀疏编码的优化,利用字典与稀疏编码实现羊绒与羊毛显微镜图像分类。

获取图像特征矩阵Y后,通过K均值奇异值分解(K-SVD)[5]算法获取字典D和稀疏编码X,即

s.t.∀i, ‖xi‖0≤T0

(5)

式中:‖xi‖0表示矩阵X中的第i个列向量xi的非零分量个数;T0为选定的阈值,本文将其设置为每次训练时字典矩阵中列向量的最大非零分量个数。

字典D和稀疏编码矩阵X的获取步骤如下[5]:

1)初始化字典D。提取原始训练数据的特征矩阵Y中K列数据作为初始字典D0,令D=D0。首次训练选取训练集中图像数的大约1/4作为K值。

2)根据D和Y,使用正交匹配追踪算法(OMP)取矩阵方程(4)的一个广义解X0,初始化稀疏矩阵X,即X=X0;设置算法计算的误差ε以及迭代次数iter。

(6)

随后,根据Ej中与index相对应的列构成残差矩阵Eindex,运用SVD算法对Eindex进行分解,如式(7) 所示。

全域旅游发展的新观察和新思考 主持人:厉新建 全域旅游发展的若干思考 王昆欣 / 大力发展全域旅游,满足人民对美好旅居生活的需求 李柏文 / 如何看待和发展“全域旅游” 宋 瑞 / 全域旅游战略的需求侧视角 厉新建 贾 然 傅林峰 01(72)

Eindex=USVT

(7)

4)字典全部更新一次后,基于式(8)计算误差e;若误差e<ε,则停止迭代,输出稀疏矩阵X和字典D;否则,重复步骤3),直到达到迭代次数iter。

e=‖Y-DX‖2

(8)

5)输出稀疏矩阵X和字典D。

1.3.2 稀疏编码的优化

庞大的数据集使数据维度升高,获取的字典D与稀疏矩阵X一般无法达到稀疏表示的算法需求。为使稀疏编码X在表达数据集时更具稀疏性,获取字典D以及稀疏编码X后,对稀疏编码进行LASSO (最小绝对值收敛和选择算子)优化,目标函数如式(9) 所示。式中,λ=0.01。

(9)

1.3.3 羊绒与羊毛图像分类

利用训练得到的字典D和稀疏矩阵X对测试集(或待分类数据集)中的图像进行分类。具体方法为,基于测试数据Ytest和字典矩阵、稀疏编码矩阵由式(10)计算残差,取最小残差代表的类别作为测试数据的类别[6]。

(10)

式中:DI代表第I类图像的字典矩阵;XI代表字典DI相对应的稀疏编码矩阵。

2 实验过程与结果

2.1 实验过程

本文数据集主要由光学显微镜和扫描电子显微镜图像组成。光学显微镜纤维图像由鄂尔多斯羊绒集团提供;扫描电子显微镜图像部分为鄂尔多斯羊绒集团提供,为获取更多不同的纤维形态,部分图像来自GB/T 14593—2008《山羊绒、绵羊毛及其混合纤维定量分析方法 扫描电镜法》中。

获取图像数据集后,通过上文所述流程进行实验。首先,对显微镜图像进行预处理。经过图像预处理后,光学显微镜数据集情况如表1所示,扫描电镜图像数据集情况如表2所示,并按照表1、2所示将图像分为训练集和测试集。对所有图像提取图像LBP特征,形成多维特征矩阵作为稀疏字典学习的输入;之后,基于稀疏字典学习和训练集,获取山羊绒和绵羊毛的字典矩阵和稀疏编码获得分类器;最后,利用测试集验证本文算法对山羊绒与绵羊毛的分类效果,具体步骤如图4所示。

表1 光学显微镜数据集Tab.1 Optical microscope data set

表2 扫描电子显微镜数据集Tab.2 Scanning electron microscope data set

图4 基于稀疏字典学习的羊绒羊毛分类方法步骤Fig.4 Steps of cashmere and wool classification based on sparse dictionary learning

2.2 分类指标

设S表示测试集中全部分类正确的样本,NUM表示测试集样本的总数,c表示测试集中某个样本的类别(绵羊毛或山羊绒),T表示通过分类算法将样本类别正确预测为c的样本数量,Q表示数据集中所有预测为c的样本数量,Z表示数据集中所有标签为c的样本数量。本文将2种显微镜图像测试集的山羊绒和绵羊毛的类别与分类后的类别进行准确率A、召回率R、查全率P和F1-Score共4类指标计算[12]。其中:准确率为A=S/NUM;查全率为P=T/Q;召回率为R=T/Z;F1-score值为F1-score=2PR/(P+R)。本文主要基于准确率判断算法分类效果。

2.3 实验结果分析

2.3.1 不同字典项个数K对实验的影响

稀疏字典学习中字典中原子的数量影响着最后的分类结果,本文对不同的字典项个数K进行测试,结果如表3所示。为能够使用更少的数据表现更多的特征,首先使用训练集的1/4数量进行测试,然后按1 000个字典项数逐次增加。在表1所示的光学显微镜图像数据集下,使用本文方法后的分类结果除召回率R以外,其他分类指标均随着字典项数逐渐升高,召回率最高可达92%左右,准确率可达87%左右,查全率可达90%左右,F1-score可达86%左右,准确率还有待提高。

表3 SDL方法在不同字典项个数下的分类结果Tab.3 Classification results of SDL method under different number of dictionary items

2.3.2 与其他分类器对比

为评估本文所提出的方法的准确性,在表2所示的扫描电子显微镜数据集下进行对比实验。在相同图像预处理的前提下,提取图像的LBP特征,采用不同的分类器对山羊绒和绵羊毛进行分类。将采用支持向量机(SVM)分类器、基于K-SVD的SVM分类器、文献[6]中的SRC方法,以及本文SDL方法作为分类器进行实验,结果如表4所示。

表4 分类结果对比Tab.4 Comparison of classification results

在表4方法2中,通过K-SVD字典学习获取字典后,将其用于训练支持向量机,进而实现分类器功能,可以看出分类结果与方法1相比有了明显提升,准确率升高了1.7%,查全率提升了5%左右,F1-score 提升了45%左右。

基于表2所示的扫描电子显微镜数据集下进行的分类实验结果可知,本文SDL方法的准确率比方法1和2高10%左右,比基于稀疏字典学习的分类算法(SRC) 高8%左右,F1-score也是所有方法中最高的。综上所述,该方法的分类准确率可提高5%~10%,分类准确率最高可达91%,因此,说明经过字典学习后的数据明显能够取得更好的分类效果,稀疏字典能够更好地表达羊绒与羊毛纤维图像之间的相关信息。

3 结 论

本文研究了一种基于稀疏字典学习的羊绒与羊毛分类方法,通过学习多形态纤维图像之间的关联特征,构建字典和稀疏编码矩阵实现分类。本文方法通过稀疏字典学习有效缩减了关键特征的数量与维度,大大减少了计算量,且与其他分类器相比,分类效果较好。面对日益多变的纤维形态,如何快速准确地对羊绒与羊毛纤维进行量化与等级评定仍然是未来研究的重点。

猜你喜欢
羊绒羊毛字典
羊绒鼯鼠新物种被发现
新西兰不仅有羊毛,更有教育
薅羊毛是一种享受
字典的由来
Golden fleecers
摸羊毛
大头熊的字典
羊绒
正版字典
绵羊不产绒 “绵羊绒衫”从何来