高光谱反射、透射和反透射成像模式的皮棉杂质检测方法研究

2019-01-14 02:51刘巍史勇田海清郭俊先李雪莲黄华石砦
现代纺织技术 2019年5期
关键词:识别光谱棉花

刘巍 史勇 田海清 郭俊先 李雪莲 黄华 石砦

摘 要:建立了3种高光谱反射、透射和反透射模式成像系统用于分析皮棉杂质,对比不同成像模式下皮棉和杂质区域的光谱类型识别率。反射、透射和反透射的高光谱图像均采用固定阈值分割和形态学膨胀填充方法,确定皮棉和杂质的区域,提取该区域的平均光谱。光谱经预处理,然后进行主成分分析,利用支持向量机模型识别方法建立皮棉和杂质区域光谱类型识别模型,验证不同预处理方法对识别效果影响;同时,预处理后的光谱进行波长筛选,筛选后的波长建立判别分析模型。结果表明,反射、透射和反透射成像模式下皮棉和杂质区域光谱识别率分别为90.63%、95.78%和88.47%,其中,透射成像模式光谱类型识别率最高。

关键词:高光谱图像;棉花;识别;光谱;波长筛选

中图分类号:S526

文献标志码:A

文章编号:1009-265X(2019)05-0044-06

Abstract:3 imaging systems including hyperspectral reflection, transmission and reflection-transmission modes were established to analyze ginned cotton impurities and compare spectrum type recognition rate of ginned cotton and impurity area under different imaging modes. For the hyperspectral images of reflection, transmission and reflection-transmission, fixed threshold segmentation and morphological expansion filling method were used to confirm the region of ginned cotton and impurities, and extract the average spectrum of the region. The spectra were pre-treated, and principal component analysis was conducted for the pre-treated spectra. The support vector machine model recognition method was utilized to establish spectrum type recognition model of ginned cotton and impurity region, and verify the influence of different pretreatment methods on the recognition effect. Meanwhile, wave length screening was performed on pre-treated spectra, and the discrimination analysis model was established for the screened wave length. The results showed that the spectrum recognition rates of ginned cotton and impurity region under reflection, transmission and reflection-transmission imaging modes were 90.63%, 95.78% and 88.47% respectively, of which the transmission imaging pattern had the highest recognition rate.

Key words:hyperspectral imaging; cotton; recognition; spectrum; wavelength screening

棉花是世界上最主要的农作物之一,是重要的经济作物,也是纺织行业的主要原料[1]。棉花杂质对棉花的质量和价格有着直接影响,对于提高棉花价格和加工质量非常关键[2]。冯显英等[3]开展了机器视觉的异性纤维检测。Pai等[4]基于模糊逻辑方法分析微断层X光原棉图像。Bhmer等[5]建立线扫描CCD照相机检测棉花中聚丙烯和聚乙烯杂质。Hogan[6]应用荧光光谱进行棉花杂质分类。郏东耀等[7]利用多波段光谱信息融合成像检测技术,对棉花中异性纤维杂质能够有效识别。郭俊先等[8]采用近红外光谱对皮棉杂质含量预测和分类。Zhao等[9]采用數字图像处理技术对原棉进行杂质和缺陷检测。采用以上这些技术只能够有效检测棉花中颜色较浅、面积较大以及含有荧光物质的杂质,对于表面面积较小、颜色较浅、透明、白色以及棉花内部的杂质不能有效检测[10]。

高光谱技术是遥感技术中一部分,后被应用于农业和生态环境等方面的检测[11]。高光谱具有高分辨率、波段信息丰富、波长覆盖范围宽等优点,能够有效应用于农畜产品品质检测。高光谱成像模式多种,其中高光谱反射成像模式的设备结构简单其应用最为广泛[12],另外,透射和反透射模式也开始得到广泛应用[13]。由于高光谱反透射模式设备结构较为复杂,和其他模式相比应用较少,但是反透射能够携带待测样本更多的内部信息[14]。郭俊先等[15]采集梳棉内部多种杂质高光谱图像,确定杂质检测过程中的关键波长。张航等[16]对混入棉花中地膜应用高光谱技术进行检测。魏新华等[17]采用高光谱技术和最小噪声分离分析方法对籽棉表层多类难捡异性纤维的图像进行研究,结果表明识别率达到91%。高光谱技术可以有效针对棉花表面和内部的杂质进行检测。

针对棉花中难检杂质,本研究构建高光谱反射、透射和反透射(反射和透射交互作用)成像系统对皮棉中存在的杂质进行检测、识别和分析。对反射、透射和反透射成像模式下皮棉和杂质区域的光谱数据进行提取并预处理,通过支持向量机方法选择最佳的预处理,基于相关系数法对预处理后的光谱数据进行特征波长筛选,然后利用判别分析识别该区域是杂质或棉花,并比较反射、透射和反透射成像模式下杂质识别效果。

1 材料与方法

1.1 试验材料

1.1.1 皮棉的梳棉处理

皮棉采自新疆自治区沙湾县商户地乡蘑菇湖村和石河子市143团棉花厂。利用棉花开松机(新疆农业大学机电工程学院农业工程重点实验室)对皮棉充分开松,开松棉网制成210 mm×297 mm、厚度为6~8 mm的样本,开松前剔除棉网中的异性纤维,只保留普通植物性杂质。高光谱图像采集时,一部分样本不放置异性纤维,一部分样本将异性纤维切断成不同大小和长度随机撒落在梳棉表面和内部。

1.1.2 雜质样本制备

棉花杂质共分为普通杂质(NCT,natural cotton trash)包括叶子、茎杆、铃壳、棉籽壳等,异性纤维包括浅灰色(GPP,gray PP fibers)、白色(WPP,white PP fibers)和透明丙纶丝(TPP,transparent PP fibers),黑色人发(BHH,black human hair),黑色(BPH,black pig hair)和白色猪毛(WPH,white pig hair)及透明聚乙烯地膜碎片(TPM,transparent PE mulching film)。将普通杂质和一些异性纤维按照细分类随机放置在梳棉样本表面。制备高光谱反射、透射和反透射的采集样本各65个,其中高光谱反射图像分割后获得子图像113个、透射获得子图像207个、反透射获得子图像121个。随机3∶1划分为校正集和验证集。

1.1.3 高光谱像反射、透射和反透射成像系统

搭建的高光谱反射、透射和反透射成像系统见图1。该系统采用内蒙古农业大学机电工程学院的高光谱成像系统,该系统包括Specim公司的Hyper-Spectral Camera光谱相机,光谱相机imspector成像光谱仪modelV1OE、配套相机(Imperx:IGV-B1620,分辨率1 600×1 200)、镜头(Specim: OLE23,焦距:23 mm,C接口镜头)、电动位移平台、卤素灯光源、数据获取平台、计算机和暗箱。

1.2 高光谱图像采集和采集参数设置

高光谱图像采集时将样本放置于位移平台玻璃载体上,调节载物台移动速度和成像系统曝光时间等参数,数据采集之前预热相机,摘下镜头预热30 min以上,增强光源强度稳定性和减少温度对实验影响,从而获得高质量的高光谱图像。高光谱反射、透射和反透射成像模式参数设置如表1所示。

1.3 数据处理

1.3.1 数据处理软件

高光谱图像和光谱数据处理采用ENVI51(The Environment for Visualizing Images)、Matlab2014a(Version 8.3.0, the Math-Works, Natick, MA)软件。

1.3.2 光谱提取

由于原始高光谱图像数据冗余,采用ENVI51软件裁剪原始高光谱图像,减少冗余的数据容量,剔除多余的背景信息。裁剪后反射、反透射的光谱范围和波段数分别为935.51~2 539.17 nm和256,透射的光谱范围和波段数分别为382.24~2 539.17 nm和428。对提取的棉花波段图像进行阈值分割、噪点剔除和区域填充,对比几种典型阈值分割和填充方法,初步确定固定选择阈值分割和形态学膨胀填充方法,得到杂质的实际区域二值图像。根据杂质和棉花的实际区域二值图像,基于已存储的波段信息提取棉花和杂质的光谱信息。如图2所示为采集得到的皮棉样本高光谱3D立方体示意图,图2中横纵坐标x和y表示图像像素信息,λ表示波长信息。高光谱图像既可以对皮棉样本表面杂质进行光谱分析,又可以对空间一部分感兴趣区域进行光谱分析,实现皮棉杂质的空间可视化检测。

1.3.3 光谱预处理

因为高光谱图像采集和光谱信息提取过程中受系统噪声、背景信息等原因的影响,提取的光谱数据含有大量的无关信息和噪声,通过预处理减少光谱曲线中存在的部分噪声干扰[18]。对获得的反射、透射和反透射光谱分别进行标准正态变量交化SNV、多元散射校正MSC、移动窗口平滑、归一化预处理光谱数据。

高光谱图像获取的光谱数据量巨大和共性问题,导致计算困难和信息冗余大,因此对提取的光谱数据进行降维非常必要[19]。高光谱图像中降低冗余度最常用的方法是主成分分析[20],对预处理后的光谱数据进行主成分分析,用于建立不同预处理的识别模型。

支持向量机主要目的是找到将两类样本进行正确分类并且使得具有最大分类间隔的最优超平面,是一种基于统计学习理论的识别方法[21]。光谱经光谱预处理和主成分分析后,利用支持向量机模式识别的方法对棉花光谱提取的不同主成分模型建立杂质识别模型,确定3种采集模式下提取的光谱最佳的预处理方法。

1.3.4 特征光谱波长筛选

高光谱图像的数据因为巨大和共性问题,所以必须对数据进行降维,找到包含大部分信息的特征波长[22]。筛选特征波长可以简化校正模型、减少建模时间,增强模型的预测能力和稳健性[23]。相关系数法是将棉花样本光谱阵中每一条波长吸光度向量x与分类识别模型参数y进行相关性计算,得到波长-相关系数R图。其中R绝对值越大对应的波长所含信息越多。因此,可给定阈值,选取相关系数绝对会大于此阈值的波长参与模型建立。相关系数R计算如式(2):

R=∑ni=1(xi-)(yi-)∑ni=1(xi-)2∑ni=1(yi-)2(2)式中:=(∑ni=1xi)/n,=(∑ni=1yi)/n,n为校正集的样品数。

2 结果与分析

2.1 光谱预处理

为了验证不同预处理方法,对棉花杂质识别效果的影响,分别建立不同预处理方法的识别模型。棉花杂质识别模型建立中,需要对提取的特征信息进行归一化处理,经过不同预处理方法和主成分选择,建立良好的杂质识别模型,提取不同主成分作为模型输入特征,利用支持向量机模式识别方法建立棉花杂质的识别模型,通过对识别率高低判断,用于对棉花杂质识别效果优劣进行评价。如图3为皮棉样本的杂质原始反射平均光谱及光谱各种预处理后的结果。从图3(a)可以看出,原始光谱不光滑,存在噪音;由图3(b)可知,移动窗口去噪后光谱曲线整体平滑。由图3(c)可知,归一化后可以有效消除冗余信息变量,放大光谱特征信息。由图3(d)可知,抑制了基线的漂移,提高了光谱信噪比。由圖3(e)可知,提高了原始光谱的集中性。

对梳棉样本提取的棉花和杂质的光谱进行预处理后,并经过主成分分析,随着主成分数不断增加,累计贡献率也不断增加。当主成分数为9时,高光谱反射、透射和反透射模式下提取的棉花和杂质的光谱数据经主成分分析后的累计贡献率均达到95%以上。说明这9个主成分因子已经能很好的反应光谱的总体信息。因此,可以由这9个主成分因子建立模型。如表2所示为不同光谱预处理方法对应的主成分累计贡献率。

支持向量机建立识别模型优先解决的问题是核函数的选择,用径向基作为支持向量机的核函数。如表3所示为光谱经预处理后,反射、透射和反透射光谱的杂质识别率。反射、透射和反透射光谱经几种不同光谱预处理后,借助主成分分析,通过支持向量机得到不同主成分因子数对应的杂质识别率。对比确定皮棉样本反射、透射和反透射光谱经多元散射校正预处理后,杂质识别率最好,对应杂质识别率分别为89.57%、95.32%和88.34%。

2.2 特征波长的预测模型

皮棉样本光谱预处理后,利用相关系数法对预处理后的光谱进行波长筛选,表4为相关系数法筛 选的杂质特征波长,利用相关系数波长筛方法选筛选出的波长用于建立反射、透射和反透射成像模式下皮棉样本光谱的判别分析识别模型,选择皮棉样本中杂质识别率最高的成像模式作为最终结果。表5为反射、透射和反透射成像采集模式下的棉花样本光谱杂质判别分析结果。

由表5可知高光谱反射、透射和反透射模式下的棉花和杂质光谱数据经光谱预处理和波长筛选后,建立判别分析模型,其中,透射成像模式下提取的光谱数据杂质识别率达到最高,透射光谱相比其他两种光谱包含更多的棉花杂质信息,这可能是因为部分杂质分布在皮棉样本内层原因,透射光谱可以较好地反应皮棉样本内层特征。由于反射光谱不能够有效反应皮棉内部信息,导致反射光谱杂质识别率不如透射光谱。反透射光谱可能受到反射光的干扰,导致携带的内部信息不如透射光谱。

3 结 语

构建了高光谱反射、透射和反透射成像分析系统,提取高光谱反射、透射和反透射模式下皮棉样本中杂质和棉花区域的光谱数据,对光谱数据进行预处理,借助主成分分析,建立支持向量机模式识别区域的棉花或杂质属性,确定反射、透射和反透射成像模式下提取的光谱数据对应最佳预处理方法。对反射、透射和反透射光谱预处理后,采用相关系数法筛选波长,筛选出3种成像模式下各7个特征波长。利用筛选的波长建立区域光谱的判别分析类型,结果显示反射、透射和反透射成像模式杂质区域识别率分别为90.63%、95.78%和88.47%,透射成像模式杂质区域的识别率最高。

参考文献:

[1] 郭俊先.基于高光谱成像技术的棉花杂质检测方法的研究[D].杭州:浙江大学,2011.

[2] 郭俊先,李雪莲,黄华,等.基于可见短波近红外高光谱图像的梳棉杂质关键波长的优选[J].新疆农业科学,2016,53(2):352-358.

[3] 冯显英,任长志,黄燕云.基于机器视觉的异性纤维检测系统[J].山东大学学报(工学版),2006,36(4):5-08.

[4] PAI A, SARIS H, HEQUET E F. Recognition of cotton contaminants via X-ray microtomographic image analysis[C]// Industry applications Conference, 2002. Ias Meeting. Conference Record of the. IEEE Xplore, 2002,1:312-319.

[5] BHMER S, BUDZIER H, KRAUSE V, et al. Two channels NIR camera system to detect foreign matter in raw cotton[C]//Proceedings of 8th Quantitative InfraRed Thermography(QIRT), Padova, Italy, 2007:53-59.

[6] HOGAN H. Spectroscopy focus: tracking cotton trash via fluorescence[J]. Photonics Spectra, 2007,41(8):98-99.

[7] 郏东耀,丁天怀.棉花中异性纤维的多光谱检测[J].清华大学学报(自然科学版),2005,45(2):193-196.

[8] 郭俊先,饶秀勤,成芳,等.近红外光谱用于皮棉杂质含量预测和分类的研究[J].光谱学与光谱分析,2010,30(3):649-653.

[9] ZHAO X N, DENG Z M. Research and application of defects and impurities detection method of raw cotton[J]. Progress in Textile Science & Technology,2013,59(6):26-28.

[10] 郭俊先,應义斌,成芳,等.皮棉表面多类异性纤维的高光谱图像检测[J].农业工程学报,2010,26(10):355-360.

[11] 滕安国,高峰,夏新成,等.高光谱技术在农业中的应用研究进展[J].江苏农业科学,2009,2009(3):8-11.

[12] YANG Y C, SUN D W, PU H, et al. Rapid detection of anthocyanin content in lychee pericarp during storage using hyperspectral imaging coupled with model fusion[J]. Postharvest Biology & Technology, 2015,103:55-65.

[13] 胡孟晗,董庆利,刘宝林.基于高光谱反射、透射和交互作用成像模式的蓝莓硬度和弹性模量预测的比较[J].光谱学与光谱分析,2016,36(11):3651-3656.

[14] OFARRELL M, WOLD J, HY M, et al. On-line fat content classification of inhomogeneous pork trimmings using multispectral near infrared interactance imaging[J]. Journal of Near Infrared Spectroscopy, 2014,18(2):868-76.

[15] 郭俊先,应义斌,李俊伟,等.梳棉内部杂质高光谱图像检测中波长选择的初探[C]//2012中国农业机械学会国际学术年会.2012.

[16] 张航,乔曦,李振波,等.皮棉中地膜的高光谱图像分割方法[J].农业工程学报,2016,32(13):161-167.

[17] 魏新华,吴姝,徐来齐,等.基于最小噪声分离的籽棉异性纤维高光谱图像识别(英文)[J].农业工程学报,2014,30(9):243-248.

[18] 库静.不同高光谱成像方式的马铃薯内外部品质检测方法研究[D].武汉:华中农业大学,2016.

[19] WOLD J P, JAKOBSEN T, KRANE L. Atlantic salmon average fat content estimated by near-infrared transmittance spectroscopy[J].Journal of Food Science, 1996,61(1):74-77.

[20] MANOLAKIS D G. Dimensionality reduction of hyperspectral imaging data using local principal components transforms[J]. Proceedings of SPIE-The International Society for Optical Engineering, 2004,5425:393-401.

[21] 谭琨,杜培军.基于支持向量机的高光谱遥感图像分类[J].红外与毫米波学报,2008,27(2):123-128.

[22] 张航,乔曦,李振波,李道亮.皮棉中地膜的高光谱图像分割方法[J].农业工程学报,2016,32(13):161-167.

[23] 褚小立,袁洪福,陆婉珍.近红外分析中光谱预处理及波长选择方法进展与应用[J].化学进展,2004(4):528-542.

猜你喜欢
识别光谱棉花
棉花是花吗?
郭守敬望远镜获取光谱数破千万
雪白的棉花堡
浅析光谱技术在200 nm以上和以下尺度范围内的不同
光谱、能级和能级图的理解和应用
论犯罪危险人格的识别
不可思议的棉花糖小村(上)
心中的“棉花糖”