基于改进3E-LDA的织物图像分类算法

2024-06-20 08:22:47靳文哲吕文涛郭庆徐羽贞余润泽
现代纺织技术 2024年6期
关键词:图像分类织物

靳文哲 吕文涛 郭庆 徐羽贞 余润泽

DOI: 10.19398j.att.202308003

摘  要:针对训练样本数太少(训练样本数量小于数据维数)导致的模型分辨能力下降问题,提出了一种基于正则化改进3E-LDA的织物图像分类算法(I3E-LDA算法)。首先利用类加权中值代替样本均值计算类内散点矩阵,削弱离群值和噪声的影响,以此作为非参数加权特征提取法对类内散点矩阵进行正则化。然后利用目标组合的方法,通过引入平衡参数对目标函数进行正则化,来保留更具判别性的特征数据。通过不同织物图像间更具判别性的特征数据可以更好地对其区分。结合改进的零空间法解决类内散点矩阵奇异性和小样本问题,从而提高分类准确率。在阿里天池织物数据集和花色织物图像上进行训练和测试,将图像按照正常图像和非正常图形(瑕疵图像)进行区分。实验结果表明,I3E-LDA算法有效实现了织物图像分类,且对于较少的训练样本(20%~40%的样本用于训练)提升了分类精度。

关键词:线性判别分析;织物;图像分类;正则化;小样本

中图分类号:TP181

文献标志码:A

文章编号:1009-265X(2024)06-0089-08

收稿日期:20230831

网络出版日期:20231102

基金项目:国家自然科学基金项目(U1709219, 61601410);浙江省科技厅重点研发计划项目(2021C01047,2022C01079);2021年产业技术基础公共服务平台项目(2021-0174-1-1)

作者简介:靳文哲(1998—),男,河北张家口人,硕士研究生,主要从事计算机视觉方面的研究。

通信作者:吕文涛,E-mail:alvinlwt@zstu.edu.cn

在过去的几十年中,纺织行业发展十分迅速。在纺织工业生产过程中,织物图像分类有着十分重要的地位[1]。依靠人工检测和分类耗时且费力,无法满足如今高质量的织物生产要求。因此使用高效准确的计算机视觉方法来代替传统的人工检测法实现织物图像分类对于纺织行业的发展有着十分重要的作用[2]。

线性判别分析(Linear discriminant analysis, LDA)是一种考虑样本类别信息的有监督分类算法[3],通过计算得到最优判别矩阵,将高维数据映射到低维子空间中,使得样本点之间的类内距离最小化、类间距离最大化[4],以此来对目标进行分类。然而,传统LDA在分类过程中存在以下缺点:a)在散点矩阵和目标函数的计算中采用了L2范数,会放大异常值的影响[5];b)忽略了样本集的局部几何信息[6];c)当样本数远小于数据维数时会出现小样本[7]问题。使得类内散点矩阵变成奇异阵。为了抑制异常值的影响,Li等[8]提出了一种基于F范数的二维线性判别分析法(F-norm two-dimensional linear discriminant analysis, F-2DLDA),通过无平方的F范数抑制了异常值和噪声的影响。针对复杂和多模态数据,高云龙等[9]提出了一种动态加权非参数判别分析方法(Dynamic weighted nonparametric discri-minant analysis, DWNDA),通过对边缘样本点的局部散布度进行分析,突出了边缘样本点对的可分性,有效抑制了异常值和噪声的影响。

为了保留数据的局部几何信息,陆荣秀等[10]提出了改进的自权值LDA算法,利用样本对之间的权值代替样本间的距离来区分样本间的差异性。Huang等[11]提出了无参数局部判别分析(Parameter-free local linear discriminant analysis, Pf-LLDA),无需设置近邻数,通过权重和变换矩阵的自适应迭代更新得到数据的低维局部结构。Nie等[12]提出了子流形保持判别分析(Sub-manifold preserving discriminant analysis),利用自优化的K近邻(KNN)图提取数据的局部子流形结构。

为了解决小样本问题,梁志贞等[13]提出了基于KL散度不确定集和混合范数的线性判别分析法,采用广义Dinkelbach算法避免了矩阵求逆,克服了小样本问题;采用混合范数有效地抑制了异常值。Yu等[14]提出了一种稀疏逼近判别投影法(Sparse approximation to discriminant projection learning,SADPL),利用F范数和L2,1范数生成稀疏子空间,采用稀疏投影矩阵取代了传统的Fisher准则,从而避免了类内散点矩阵奇异性的问题。

以上方法只针对传统LDA在分类过程中的一个或两个缺点做出改进,为了同时解决传统LDA的三个缺点,Li等[15]提出了3E-LDA算法,采用加权中值代替样本均值以抑制异常值;建立了新的散点矩阵,以嵌入局部几何信息;通过改进的零空间法计算矩阵零空间中的投影向量,克服了小样本问题,得到了较好的分类结果。但是如果训练样本太少,模型的分辨能力就会受到影响,最终会影响分类精度。

因此本文提出了一种基于正则化改进3E-LDA的织物图像分类算法,称为I3E-LDA算法,用于解决训练样本数小于数据维数时导致的模型分辨能力下降问题。该算法首先利用加权中值计算类内散点矩阵,通过正则化方法[16]作为NWFE方法来解决类内散点矩阵奇异性的问题。然后采用目标组合的方法利用加性原理[17]对目标函数进行正则化。以此保留更具判别性的样本数据,增加了样本的可分性。在阿里天池织物数据集和花色织物图像上进行训练和测试,将图像按照正常图像和非正常图像(瑕疵图像)进行分类,以验证该算法在较少的训练样本的情况下能够得到更高的分类准确率。

1  3E-LDA的理论基础

1.1  LDA简介

设样本集为:X=[x1,x2,…,xn]T∈Rn×m,其中xs为m维向量,s=1,2,…,n,n表示样本总数。设样本集中包含C个类。 xij表示第i类的第j个样本,i=1,2,…,C,j=1,2,…,ni,其中ni表示第i类的样本总数,则n=∑Ci=1ni。

第i类样本的均值定义为:μi=1ni∑nij=1xij,数据集的均值定义为:μ=1C∑Ci=1μi。由此可以计算出类内散点矩阵Sω、类间散点矩阵Sb,分别如式(1)—(2)所示:

Sω=∑Ci=1∑nij=1(xij-μi)(xij-μi)T(1)

Sb=∑Ci=1ni(μi-μ)(μi-μ)T(2)

因此可以通过式(1)—(2)计算出最优判别矩阵q,如式(3)所示:

q=argmaxqJ(q)=argmaxqqTSbqqTSωq(3)

最后对式(3)求导,可以将其转化成S-1ωSbq=λq的特征值求解问题,其中λ=J(q)为标量。

1.2  3E-LDA简介

针对传统LDA的3个缺点,3E-LDA提出了如下改进。

1.2.1  利用加权中值处理异常值

设第i类第j个样本的权重向量为:wij=[abs(xij-μim)+β]-1。其中abs(·)表示给定向量在每个维度上的绝对值, β是一个补偿因子向量,和向量xij齐次, μim是第i类所有样本的中值。 xij样本的权重向量wij跟xij和μim之间的距离成反比。因此可以得到第i类样本的加权中值如式(4)所示:

μ~i=∑nij=1wij⊙ xij.∑nij=1wij(4)

1.2.2  保留局部几何信息

3E-LDA提出了新的散点矩阵框架:

a)类内散点矩阵Siω。设xij和xik是第i类的两个样本,若xik是xij的K近邻之一,则xij可以用xik近似线性表示为:x^ij=∑Kk=1wjkxik。将x^ij和加权中值μ~i代入到式(1)中,得到Siω,如式(5)所示:

Siω=∑Ci=1∑nij=1x^ij-μ~ix^ij-μ~iT(5)

b)类间散点矩阵Sib。由式(2)可以看出:若μi-μ的值越大,则第i类样本在Sb中起主导作用,会导致具有相似距离的类重叠。因此可以对式(2)进行改写:

Sb=∑Ci=1ni(μi-μ)(μi-μ)Τ

=∑C-1i=1∑Cj=i+1ninjn(μi-μj)(μi-μj)T。

其中:ni和nj分别表示第i类和第j类的样本总数。惩罚项设置为:cij=(μi-μ2+ε)-1。将加权中值μ~i和惩罚项cij代入到式(2)中,得到Sib,如式(6)所示:

Sib=∑C-1i=1∑Cj=i+1ninjncij(μ~i-μ~j)(μ~i-μ~j)T(6)

1.2.3  解决小样本问题

采用改进的零空间法来处理小样本问题以及类内散点矩阵奇异性的问题:若Siω的秩r小于原始数据空间V的维数m,则必然存在一个子空间(零空间)V0V,使得V0=span{vi|Sωvi=0,i=1,2,…,m-r}。对Siω进行奇异值分解,得到V=[v1,…,vr,vr+1,…,vm],其中:V1V,V1=[vr+1,…,vm]。因此最优判别矩阵q为V1VT1Sib(V1VT1)T在V0中的最大特征值集合;否则根据Fisher准则进行求解。

因此,3E-LDA的完整目标函数可用式(7)所示:

argmaxJ(q)=qTSibqqTSiωq,r=m

qTV1VT1Sib(V1VT1)Tq,r

其中最优判别矩阵q∈Rm×(C-1)。

2  改进的3E-LDA算法(I3E-LDA)

在3E-LDA算法中,分类的结果往往比较依赖训练样本的数量。如果训练样本较少,模型的分辨能力易受影响,最终会降低分类精度。基于此,本文提出了一种新的3E-LDA算法(I3E-LDA),通过引入正则项来改进3E-LDA,以确保对于少量训练样本所得到的分类准确率有一定的提升。I3E-LDA算法的改进主要有正则化引入、算法模型、算法流程3部分。

2.1  正则化引入

在利用LDA进行分类时,如果样本数n远远小于数据维数m就会导致类内散点矩阵变得奇异。在这种情况下,参数估计可能会不稳定,从而产生高方差。通过应用正则化的方法可以减少这种方差,但是在计算时可能会因此产生新的偏差,从而影响最终的分类精度。这种偏差变化的平衡通常是由一个或多个平衡参数进行调节的,这些参数控制着对样本数据的偏置强度。正则化可以减少模型的测试误差,目的是让模型在面对复杂数据或高模态数据时也能表现出优异的性能。如果模型的参数过多就会导致模型变得复杂,容易产生过拟合现象,从而会影响模型的泛化能力,所以需要引入正则项来改善此现象。

因此对于LDA来说,通过引入正则项,实现的是对类内散点矩阵更好的估计,并且最好使其达到无偏的结果。通过正则化可以削弱不太重要的特征向量,尽可能在所有特征向量中提取到最重要的(最具判别性的),由此可以更有效的计算出最优判别矩阵,从而提高模型的分类性能以及泛化能力。

2.2  算法模型

在许多实际应用当中,通常会出现小样本问题,并且图像数据受噪声和异常值影响较大,从而影响分类准确率。为了抑制异常值并解决小样本问题,提出了如下算法模型。

设定样本集为:X=[x1,x2,…,xn]T∈Rn×m,其中:xs表示每张图像的特征数据向量,维度为m,s=1,2,…,n, n表示织物图像总数。样本集的原始标签定义为L0∈Rn×1。假设样本集包含C个类,xij表示第i类的第j个样本,i=1,2,…,C,j=1,2,…,ni,其中:ni表示第i类的样本数,且有n=∑Ci=1ni。设第i类X的样本集为:Xi=[xi1,xi2,…,xini]T∈Rni×m。

设训练集比例为τ,测试集比例为1-τ。将样本集X和原始标签L0按比例τ分成训练矩阵Xtrain∈Rn·τ」×m,训练标签Ltrain∈Rn·τ×1,其中

·」表示向下取整;测试矩阵Xtest∈R「n·(1-τ)×m,测试标签Ltest∈R「n·(1-τ)×1,其中「·表示向上取整。

2.2.1  类内散点矩阵正则化

在图像处理中最常用的分类准则是基于正态分布的,如式(8)所示:

fk(X)=(2π)-p2∑k-12e-12(X-μk)T∑-1k(X-μk)(8)

其中: μk为均值向量,协方差矩阵为∑^k=1NkSk=1Nk∑(xi-μ-k)(xi-μ-k)T。设样本集的维度为m,在进行分类时若类样本量Nk小于样本集的维度(Nk

针对此问题可以通过正则化的方法来改进。引入正则化参数α,取值范围0≤α≤1。设样本总数为N,且S=∑Kk=1Sk,N=∑Kk=1Nk,∑^k=1NkαSk(α)。其中:Sk(α)=(1-α)Sk+αS,Nk(α)=(1-α)Nk+αN。α控制收缩的程度即单类协方差矩阵估计值向总体估计值的收缩程度。一般情况下,即使很小的正则化也可以消除十分剧烈的不稳定性。

结合上述正则化方法,在这里不直接使用Siω,而是采用式(9)来计算类内散点矩阵Siω,作为NWFE方法用来解决类内散点矩阵奇异性的问题:

Siω=0.5Siω+0.5diag(Siω)(9)

式(9)相当于给正则化参数α赋值0.5进行正则化。

2.2.2  目标函数正则化

传统LDA的目标函数式可以拆分成两个目标函数相除的形式,因此可以对式(7)添加正则化参数γ,用于平衡分别包含两个散点矩阵的目标函数。其中γ是一个非常小的常数,在这里设置为1×10-5,以防qTSiωq=0。因此,新的目标函数式如式(10)所示:

J~(q)=qTSibqqTSiωq+γqTSibq(10)

根据式(10)可以对最优判别矩阵q进行求解,求解过程如下:

dJ~(q)dq=(qTSiωq+γqTSibq)·d(qTSibq)-qTSibq·d(qTSiωq+γqTSibq)=0

(qTSiωq+γqTSibq)·2Sibq-2qTSibq·(Siωq+γSibq)=0

Sibq-qTSibqqTSiωq+γqTSibq·(Siω+γSib)q=0

Sibq=J~(q)·(Siω+γSib)q

(Siω+γSib)-1·Sibq=J~(q)q

令λ=J~(q),则根据(Siω+γSib)-1Sibq=λq可以得出λ是(Siω+γSib)-1Sib的特征值矩阵。所以最优判别矩阵q的解为(Siω+γSib)-1Sib的特征值对应的特征向量组成的矩阵。

因此最优判别矩阵q可以转换成如式(11)所示的特征值求解问题。

(Siω+γSib)-1Sibq=λq(11)

最后根据式(11)和Fisher准则将tr[(Siω+γSib)-1Sib]最大化就可以得到最优判别矩阵q。但是由于类内散点矩阵Siω奇异性的问题,这里为了避免直接计算(Siω+γSib)-1Sib的特征向量,采用3E-LDA中改进的零空间算法来进行求解。

综上所述,I3E-LDA的完整目标函数可用式(12)表示:

argmaxqJ~(q)=qTSibqqTSiωq+γqTSibq,r=m

qTV1VT1SibV1VT1Tq,r

式中:r为类内散点矩阵Siω的秩。

2.2.3  分类实现

将训练矩阵Xtrain代入式(4)中计算出加权中值μ~i,并将μ~i和训练矩阵Xtrain中的xij通过式(5)和式(9)计算出正则化后的类内散点矩阵Siω。然后将每一类训练样本的加权中值代入式(6)中计算出类间散点矩阵Sib。最后将Siω和Sib代入式(10)—(12)中计算出最优判别矩阵q。

将训练矩阵Xtrain和测试矩阵Xtest分别和最优判别矩阵q相乘得到更新后的训练样本Ytrain=Xtrain·q∈Rn·τ」×(C-1)和测试样本Ytest=Xtest·q∈R「n·(1-τ)×(C-1)。对Ytrain和Ytest中的样本数据进行最近邻分类。

首先计算出每个测试样本中的数据点跟训练样本各行对应位置数据点之间的距离并求和,距离和即为每个测试样本和训练样本之间的距离。以此生成距离矩阵记为D∈R「n·(1-τ)×n·τ」,其中D的每一行数据代表一个测试样本和每个训练样本之间的距离值。然后对距离矩阵中每行数据排序并筛选出距离最小的K个点。最后将测试样本点归入K个点中占比最高的一类,从而生成最终的测试标签,记为Lfinal∈R「n·(1-τ)×1。计算Lfinal与Ltest标签的重复率即可得到最终的分类准确率。

2.3  算法流程

算法1:I3E-LDA

输入:样本集X和原始标签L0。

步骤1:将样本集按比例τ分为训练集Xtrain和测试集Xtest,将原始标签L0按比例τ分为训练标签Ltrain与测试标签Ltest;

步骤2:利用训练矩阵Xtrain计算类加权中值μ~i;

步骤3:计算类内散点矩阵Siω并进行正则化改进;

步骤4:计算类间散点矩阵Sib;

步骤5:根据加性原理对式(7)进行正则化改进,得到J~(q);

步骤6:如果类内散点矩阵Siω的秩r等于样本维数m(r=m),则最优判别矩阵q为(Siω+γSib)-1Sib的最大特征值所对应的特征向量组成的矩阵;否则执行 a)。

a)如果类内散点矩阵Siω的秩r小于样本维数m(r

b)对Siω进行奇异值分解:Siω=U∑VT,得到:V=[v1,…,vr,vr+1,…,vm];

c)得到:V1=[vr+1,…,vm],V1V,V0=span{vi|Siωvi=0,i=1,2,…,m-r}, V0为Siω的零空间;

d)计算S~ib=V1VT1Sib(V1VT1)T;

e)计算S~ib的最大特征值集对应的最优判别矩阵q。

步骤7:利用Xtrain和Xtest以及最优判别矩阵q计算更新后的训练样本Ytrain和测试样本Ytest;

步骤8:对Ytrain和Ytest进行最近邻分类。

输出:分类准确率。

3  实验

为了评估所提出的I3E-LDA算法的分类性能,本文将I3E-LDA算法在素色织物和花色织物图像上进行实验,并将其与3E-LDA算法进行比较。

3.1  数据集

阿里天池织物数据集分为正常图像和瑕疵图像,图像尺寸为2560×1920像素。本次实验选取48张正常图像和48张瑕疵图像作为实验数据集,对正常图像和瑕疵图像进行分类。

将图像处理成.mat文件保存图像数据,其中每行数据代表一张织物图像的特征数据,行数代表图像数量,共计96,维度降为600。织物图像样本集记为X,大小为96×600,如式(13)所示。原始标签即为L0∈R96×1。

X=[x1,x2,…,x96]T∈R96×600(13)

其中:xs表示每张图像的特征数据向量,s=1,2,…,96,大小为1×600的行向量。所有图像均为素色织物图像。选取了部分图像如图1所示,其中第一行为瑕疵图像,第二行为正常图像。

由于素色织物均为简单图像,为了验证算法的有效性,因此补充了几类同等数量的花色织物图像用于实验。花色织物同样分成正常图像和瑕疵图像,如图2所示。其中第一行为瑕疵图像,第二行为正常图像。

本文将素色织物和花色织物图像合成一个数据集进行实验,对于检测出的正常织物图像算作第一类,对于非正常图像即有瑕疵的图像算作第二类,以此对织物图像进行区分。

3.2  实验环境

本文的实验操作系统为Windows,显卡为NVIDIA GeForce RTX 3060 Laptop GPU,显存大小为6 GB。CPU为AMD Ryzen 7 5800 HZ,系统内存为16 GB。编译环境为MATLAB 2017b。在上述实验环境下对素色织物和花色织物图像进行训练和测试。

4  结果与分析

本文利用素色织物和花色织物图像生成样本集X,将样本集分别按照20%、30%和40%的比例生成训练矩阵Xtrain和测试矩阵Xtest。按照2.3节I3E-LDA的算法流程计算出最终的分类准确率,并将其与3E-LDA算法得到的分类准确率进行对比。为了评估所提出的I3E-LDA算法的分类性能,在实验中列举了不同训练样本比例下两种算法的分类准确率,所有实验重复15次,取平均结果如表1所示。

表1给出了素色织物和花色织物图像在不同训练样本比例下每种算法的分类准确率。可以看出,随着训练样本比例的增加,两种算法的分类性能都有所提高。本文提出的I3E-LDA算法在20%、30%和40%的训练样本下的分类准确率相比3E-LDA算法分别提高了2.30%、2.55%以及3.68%。由此可以看出,通过式(9)—(12)对类内散点矩阵和目标函数的改进效果十分明显,I3E-LDA算法的分类准确率相比3E-LDA算法有了显著的提升。

为了更直观的看到I3E-LDA算法的分类结果,在15组实验中挑选了4组不同训练样本比例下两种算法的分类准确率进行对比,结果如图3所示。

由图3可以更直观看出与3E-LDA算法相比,本文所提出的I3E-LDA算法在较低比例(20%~40%)训练样本的情况下能够得到更高的分类准确率。实验结果很好地印证了式(9)—(12)所采用的正则化方法的合理性和有效性,其效率和性能是不言而喻的。

综上所述,I3E-LDA算法不仅获得了较高的分类准确率,而且很好地保留了样本点的局部几何信息。实验结果表明,I3E-LDA算法在素色织物和花色织物图像上达到了更好的分类精度,所有的实验结果都可以合理地观察到I3E-LDA算法是一种有效的分类算法。

5  结论

本文提出了一种基于正则化改进3E-LDA的织物图像分类算法。借鉴3E-LDA算法,用类加权中值μ~i代替样本均值,增强了模型的鲁棒性,抑制了异常值的影响;通过改进的零空间算法解决类内散点矩阵Siω奇异性的问题以及小样本问题。I3E-LDA算法采用正则化方法得到新的类内散点矩阵Siω以及目标函数式J~(q),有效的实现了织物图像分类。结论如下:

a)与3E-LDA算法相比,I3E-LDA算法通过正则化方法平衡了计算最优判别矩阵时的偏差,有效的解决了小样本问题以及类内散点矩阵Siω奇异性的问题。同时保留了样本的类间和类内局部几何信息,且保留了样本更具判别性的特征,可以更好地对样本进行分类,提高了模型的分类性能和泛化能力。

b)在素色织物和花色织物图像上进行实验对比。实验结果表明,I3E-LDA算法对于较低比例(20%~40%)训练样本的分类准确率以及算法稳定性等方面都优于3E-LDA算法。

参考文献:

[1]吕文涛,林琪琪,钟佳莹,等.面向织物疵点检测的图像处理技术研究进展[J].纺织学报,2021,42(11):197-206.

L Wentao, LIN Qiqi, ZHONG Jiaying, et al. Research progress of image processing technology for fabric defect detection[J]. Journal of Textile Research, 2021, 42(11): 197-206.

[2]田宸玮,王雪纯,杨嘉能,等.织物瑕疵检测方法研究进展[J].计算机工程与应用,2020,56(12):8-18.

TIAN Chenwei, WANG Xuechun, YANG Jianeng, et al. Research progress on fabric defect detection methods[J]. Computer Engineering and Applications, 2020, 56(12): 8-18.

[3]YIN W, MA Z. High order discriminant analysis based on Riemannian optimization[J]. Knowledge-Based Systems, 2020, 195: 105630.

[4]LU R, CAI Y, ZHU J, et al. Dimension reduction of multimodal data by auto-weighted local discriminant analysis[J]. Neurocomputing, 2021, 461: 27-40.

[5]HU X, SUN Y, GAO J, et al. Probabilistic linear discriminant analysis based on L1-norm and its Bayesian variational inference[J]. IEEE Transactions on Cybernetics, 2022, 52(3): 1616-1627.

[6]CHANG W, NIE F, WANG Z, et al. Self-weighted learning framework for adaptive locality discriminantanalysis[J]. Pattern Recognition, 2022, 129: 108778.

[7]YAN C, CHANG X, LUO M, et al. Self-weighted robust LDA for multiclass classification with edge classes[J]. ACM Transactions on Intelligent Systems and Technology, 2020, 12(1): 1-19.

[8]LI C N, QI Y F, ZHAOD, et al. F F-norm two-dimensional linear discriminant analysis and its application on face recognition[J]. International Journal of Intelligent Systems, 2022, 37(11): 8327-8347.

[9]高云龙,王志豪,丁柳,等.动态加权非参数判别分析[J].控制与决策,2020,35(8):1866-1872.

GAO Yunlong,WANG Zhihao, DING Liu, et al. Dynamic weighted nonparametric discriminant analysis[J].Control and Decision, 2020, 35(8): 1866-1872.

[10]陆荣秀,蔡莹杰,朱建勇,等.基于自权值线性判别分析算法的图像处理研究[J].华东交通大学学报,2020,37(3):135-142.

LU Rongxiu, CAI Yingjie, ZHU Jianyong,et al. Application of self-weight linear discriminant analysis in dimension reduction[J]. Journal of East China Jiaotong University, 2020, 37(3): 135-142.

[11]HUANG Libo, LING Yongquan. A parameter-free local linear discriminant analysis method[J]. Computer Science and Application, 2021, 11(4): 1042-1052.

[12]NIE F, ZHAO X, WANG R, et al. Fast locality discriminant analysis with adaptive manifold embedding[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 2022, 44(12): 9315-9330.

[13]梁志贞,张磊.面向Kullback-Leibler散度不确定集的正则化线性判别分析[J].自动化学报,2022,48(4):1033-1047.

LIANG Zhizhen, ZHANG Lei. Regularized linear discri-minant analysis based on uncertainty sets from kullback-leibler divergence[J]. Acta Automatica Sinica, 2022, 48(4): 1033-1047.

[14]YU Y F, REN C X, JIANG M, et al. Sparse approximation to discriminant projection learning and application to image classification[J]. Pattern Recognition, 2019, 96: 106963.

[15]LI Y, LIU B, YU Y, et al. 3E-LDA:Three enhancements to linear discriminant analysis[J]. ACM Transactions on Knowledge Discovery from Data, 2021, 15(4): 1-20.

[16]GAO J, LI L. A robust geometric mean-based subspace discriminant analysis feature extraction approach for image set classification[J]. Optik, 2019, 199: 163368.

[17]ZHENG N, GUO X, TIE Y, et al. Incremental genera-lized multiple maximum scatter difference with applications to feature extraction[J]. Journal of Visual Communication and Image Representation, 2018, 55: 67-79.

Fabric image classification algorithm based on improved 3E-LDA

JIN Wenzhe1, L Wentao1, GUO Qing2, XU Yuzhen2, YU Runze3

(1.Key Laboratory of Intelligent Textile and Flexible Interconnection of Zhejiang Province, Zhejiang Sci-Tech University,

Hangzhou 310018, China; 2.Zhejiang Technical Innovation Service Center, Hangzhou 310007, China;

3.China Mobile Group Design Institute Co., Ltd. Zhejiang Branch, Hangzhou 310012, China)

Abstract:

Textiles are one of the three physical elements of clothing. In recent years, with the development of computer technology, the classification and recognition of fabric images and intelligent manufacturing have played a very important role in the textile field. In the process of production, traditional manual detection methods are still widely used for fabric defect detection, which is time-consuming and laborious, and the efficiency is very low. It is easy to cause false detection and missed detection due to fatigue, and it will also affect the quality and price of textiles. Therefore, the use of digital image processing technology to complete the recognition and classification of fabric images has become a hot issue in recent years.

Relying on machine vision, spots, pits, scratches, color differences and defects on the fabric surface can be detected. Lineardiscriminant analysis (LDA) is a supervised dimensionality reduction and classification algorithm that can effectively classify fabric images. LDA classifies by calculating the optimal discriminant matrix to minimize the intra-class distance and maximize the inter-class distance. However, LDA is sensitive to outliers, ignores local geometric information and small sample size (SSS), which affects the classification accuracy. The 3E-LDA (three enhancements to linear discriminant analysis) algorithm improves the above three problems on the basis of LDA and improves the classification accuracy. However, when the number of training samples is smaller than the data dimension, it will reduce the model's resolution ability and ultimately affect the classification accuracy.

A fabric image classification algorithm based on improved 3E-LDA, called I3E-LDA algorithm (Improved 3E-LDA), was proposed to address the problem of reduced model resolution caused by training samples being smaller than the data dimension. Firstly, the nonparametric weighted feature extraction (NWFE) method was used to regularize the intra-class scatter matrix, and then the goal combination method was used to introduce equilibrium parameters to regularize the objective function, so as to weaken the influence of outliers and noise, retain more discriminative feature data, and rely on these feature data to better classify fabric images. It is necessary to combine the improved null space learning method to solve the singularity and small sample problems of intra-class scatter matrices and improve classification efficiency, and to train and test on the Alibaba Tianchi fabric dataset and pattern fabric images to distinguish between normal and abnormal patterns (defect images). The experimental results show that the I3E-LDA algorithm effectively achieves fabric image classification, and improves classification accuracy for a small number of training samples (20%-40% of the samples are used for training).

Keywords:

linear discriminant analysis; fabric; image classification; regularization; small sample size

猜你喜欢
图像分类织物
无Sn-Pd活化法制备PANI/Cu导电织物
《丝绒织物》等103项纺织行业标准发布
《纺织品织物折痕回复角的测定》正式发布
竹纤维织物抗菌研究进展
基于数据挖掘的图像分类算法
基于云计算的图像分类算法
基于锚点建图的半监督分类在遥感图像中的应用
一种基于引导滤波和MNF的高光谱遥感图像分类方法
软件导刊(2016年9期)2016-11-07 22:19:22
基于最大似然法的南京市土地利用类型分类研究
商(2016年22期)2016-07-08 14:32:30
抓取柔软织物多指灵巧手的建模与仿真