王军庆,马佩佩,李保荣,朱乐乐
(西安工程大学 纺织科学与工程学院,陕西 西安710048)
山羊绒是名贵的特种动物纤维之一,在当今国际市场上统称为“开士米”(Cashmere),被人们誉为“纤维宝石”、“软黄金”。其制品集轻、暖、宽松、手感柔软等其他动物纤维的优点于一体,深受消费者喜爱[1-3]。由于羊毛与山羊绒价格相差较大,市场上经常出现羊毛混入山羊绒的现象,损害了消费者的利益,因此能够快速正确地区分羊毛和山羊绒纤维是非常必要的。目前纤维识别方法主要有光学显微镜法[4]、扫描电子显微镜法[5]、近红外光谱法[6]、力学性能分析法[7]、溶液法[8]、染色法[9]、DNA 鉴别法[10]、生物芯片技术[11-12]等。
近年来,数字图像处理、计算机视觉和机器学习等技术发展迅速。许多研究人员开始利用光学显微镜和扫描电镜采集图像,使用相关算法对山羊绒和羊毛纤维的纹理或形态特征进行分析,以更好地识别羊毛和山羊绒纤维。综述了近几年基于图像处理的羊毛/山羊绒鉴别方法研究现状,重点介绍了利用数字图像处理和计算机视觉结合不同的识别分类器(支持向量机、贝叶斯模型、决策树和人工神经网络等)对羊毛/山羊绒纤维进行鉴别。
支持向量机(SVM)的基本原则是最小化其训练经验风险,训练样本数越大其经验风险越小。通过纤维图像预处理、纤维识别特征提取等处理,可获取羊毛羊绒纤维的特征数据,建立合适的纤维特征样本,进行SVM 训练从而得到识别羊毛羊绒纤维的SVM 分类模型。
沈巍等[13]将在HSV 颜色模型下的山羊绒与羊毛混纺纱线的切片图进行初步的背景分离,通过特征数据取样,应用SVM 对图片进一步精确分离,从而使提取目标完整地从原图中分离出来,这种支持向量提取的方法为应用图像处理方法测试山羊绒羊毛混纺比提供了可行性。马彩霞等[14]测量了羊毛和山羊绒纤维的8个特征参数,选择SVM 作为监督分类的分类器,该方法的识别精度接近89.0%。Zhong等[15]将羊毛和山羊绒纤维的显微图像转化为投影曲线。为了揭示投影曲线的数值特征,比较了3种不同的方法,包括离散小波变换、直接几何描述和递归量化分析。将数值特征输入ANN、SVM 和核岭回归3种分类器,进行有监督分类。试验表明,递归量化分析和SVM 的结合达到了最佳的精度。焦明艳等[16]将纤维图像中的鳞片模式看作一种纹理,并使用灰度共生矩阵描述图像中的纹理特征。从每副纤维图像的灰度共生矩阵中提取了5个特征并使用SVM 作为分类器进行有监督的分类识别。使用澳洲细羊毛和山羊绒作为样本进行试验,识别率超过90%。
朱俊平[17]获取样本中山羊绒和羊毛纤维的光学显微镜图像,使用图像处理和计算机视觉技术提取图像特征,使用这些特征描述纤维图像。选用SVM 作为分类器,提取的特征作为分类器输入,对图像进行分类,从而达到纤维鉴别的目的。Lu等[18]采用光学显微镜采集图像,对图片进行预处理以增强特征提取局部特征并生成视觉单词,再依据视觉单词对纤维图像进行分类,采用SVM 作为分类器,得到识别结果。利用扫描电镜对羊毛和山羊绒纤维进行了图像分析,提取了快速鲁棒的光纤图像特征,并将每幅光纤图像视为特征向量的集合。将向量输入SVM 进行有监督学习。扫描电镜图像的结果表明,该方法是有效的,对2种纤维的大范围混合比例,识别率都在93%以上[19]。柴新玉[20]利用电子显微镜采集图像,用图像处理技术对图片进行预处理,之后进行特征的提取,再将大量SURF特征聚类并转化为直方图向量的形式,最后使用SVM进行分类鉴别。陶伟森等[21]采用螺旋相位相衬显微镜采集并突出羊毛与山羊绒纤维表面纹理特征,利用图像处理技术对交叉纤维的处理分割单根纤维,提取纤维形态特征和纹理特征,结合SVM 分类鉴别羊毛与山羊绒纤维,正确率达到93.1%。
贝叶斯分类是一类分类算法的总称,这类算法均以贝叶斯定理为基础,故统称为贝叶斯分类,该算法能运用到大型数据库中,而且方法简单、分类准确率高、速度快。
石先军等[22]根据羊毛和山羊绒纤维的形态结构差异,利用显微成像系统获取山羊绒及细羊毛的显微图像,采用图像技术提取2类纤维的4个特征参数:细度、鳞片高度或密度、鳞片边界周长和鳞片显示面积作为比对指标。在样本数据库上基于4个比对指标的统计假设建立辨识细羊毛与山羊绒纤维的贝叶斯分类模型。该模型对山羊绒纤维的鉴别准确率达83%,对细羊毛纤维则达90%。Shang等[23]利用图像处理方法得到最终二值图像的基础上提取了纤维直径、尺度高度、尺度投影宽度等6个特征,并利用贝叶斯模型对纤维图像进行分类和识别。山羊绒和羊毛的识别效果最好,识别率高达99%;对山羊绒和拉伸羊毛的识别结果,识别率高达81.06%。
谢瑾仁等[24]利用数字显微成像系统在不同照明方式下采集的图像质量存在差别,通过图像处理和特征提取表征山羊绒和羊毛纤维的5个参数指标特征参数:直径、鳞片高度、鳞片周长、鳞片面积、径高比。对各参数的相关系数分析,构建识别山羊绒和羊毛纤维的贝叶斯分类模型。Xing等[25]利用自行研制的光学显微镜和数码相机系统采集原始光纤图像,使用图像处理技术处理图片提取鳞片高度、纤维直径及其比例等3种形态特征并进行分析,在对3种形态特征进行统计假设的基础上,建立了识别羊毛和山羊绒纤维的贝叶斯分类模型,该方法的识别精度可达94.2%。
决策树是数据挖掘中一种简单、经典且广泛应用的分类技术。它是使用树结构算法对数据进行分类预测的方法。山羊绒与羊毛纤维的识别是利用单根纤维上的多元指标作为分类研究的特征属性来判断所测试样。
蒋高平等[26]先通过光学显微镜获得羊毛与山羊绒的图像,然后经过图像处理得到羊毛与山羊绒的表面信息,获得羊毛与山羊绒表面所对应的谱线并对其进行分割和特征提取,对其单元宽度值、单元峰值及离散系数等参数分析并确定判别界限,利用决策树方法对其进行鉴别。季益萍等[27]提出采用图像处理技术提取单根纤维上的多个指标(细度、鳞片高度和径高比)作为分类研究的特征属性,利用4种不同的决策树算法对羊毛和山羊绒纤维之间进行分类和识别,试验发现每种算法的平均相对误差都小于6%,且C5.0算法比其他算法更为精准和稳定。
人工神经网络是微观结构与功能上对人脑神经系统模拟而建起来的一类模型,其数学理论的本质是非线性的。它处理和解决问题时,不需要精确的数学模型,而是通过自学习能力和结构的可变性,逐步适应外部环境各因素的作用,不断修改自身行为,以达到最终解决问题的目的。
Zhang等[28]从纤维表面提取纹理特征,对羊毛/山羊绒纤维进行分类。然后构造了一个人工神经网络对这2种纤维进行分类。Yuan等[29]将CCD 数码相机采集的显微图像作为纹理图像进行预处理,利用改进的Tamura纹理特征对最终的纹理图像进行分析得到的6个纹理特征参数。通过大量的样本,利用神经网络进行数学建模,并用该模型自动进行识别。邢文宇等[30]通过光学显微镜及数码相机进行图像采集,利用灰度共生矩阵算法与水平集中轴线算法相结合的方法提取纤维的纹理(能量、熵、惯性矩、相关)与形态(直径)特征,最后将纹理及形态特征参数融合成多维数组并通过K 均值算法进行聚类识别,该算法平均识别率可达到95.25%。
石先军等[31]用偏光显微镜和海鸥CDD 获取图像,用测量软件进行图像处理并提取鳞片纹图参数。山羊绒鳞片纹图基因码的数字特征表明其鳞片更似方形或窄矩形,而细羊毛的则更似宽矩形。2类纤维其他纹图基因码部分重叠,据此可建立具有最小识别误差的纤维辨识标准,获得了山羊绒纤维最大识别概率为88.8%,羊毛最大识别概率为92%。
李桂萍等[32]利用图像处理技术把光学显微镜图片转化为纹理灰度图像继而投影为谱线图。通过分析羊毛和山羊绒谱线图并在其上提取6项参数指标,分析6个特征参数的特征值概率分布图以及相关性,用横向平均值和纵向离散度特征建立识别函数,识别山羊绒和羊毛的混合样本。
王飞等[33]使用山羊绒与羊毛的光学显微镜图像,借助计算机卷积网络技术中的特征提取及特征描述方法,将纤维鉴别问题转化为图像分类问题。通过改进采用低维度的CW-Net提取纤维图像表面特征,采用sigmoid分类器分类图像鉴别山羊绒与羊毛,得到的最优准确率达92.1%。
目前利用数字图像处理和计算机视觉结合不同的识别分类器(支持向量机、贝叶斯模型、决策树和人工神经网络等)对羊毛/山羊绒纤维鉴别进行了大量的研究,并取得了一定的研究成果,但仍然存在很多问题需要研究者去解决,例如图片的采集方式和质量、图像处理的方案、识别特征的提取、识别的分类器选择和成本等。未来基于图像处理的羊毛/山羊绒鉴别的可能主要是向着高效、高准确率和低成本的方向发展,使其能够快速应用到人们的实际生活中,为人们的生活提供便利。