张慧,张文伟,张永毅,李士静,申佳瑜,朱均燕,谢小芳,温永仙*
基于高光谱与纹理融合的烤烟分类方法研究
张慧1,2,张文伟3,张永毅3,李士静1,2,申佳瑜1,2,朱均燕1,2,谢小芳4,温永仙1,2*
1 福建农林大学计算机与信息学院,福建 福州 350002;2 福建农林大学统计及应用研究所,福建 福州 350002;3 南平市烟草公司延平分公司,福建 南平 353000;4 福建农林大学生命科学学院,福建 福州 350002
【】为提高烤烟的分类正确率。【】利用高光谱成像系统采集烤烟样本,采用Savitzky-Golay卷积平滑法(SG)、多元散射校正(MSC)、一阶导数法(FD)的组合方法对数据进行预处理。通过连续投影算法(SPA)选择特征波长,利用灰度共生矩阵(GLCM)选择烤烟的纹理特征,将纹理特征与光谱特征归一化处理后进行融合,利用邻近算法(KNN)、随机森林(RF)、支持向量机(SVM)、朴素贝叶斯(NB)验证烤烟分类效果。【】预处理后的全波长数据分类正确率较预处理前有所提升;利用SPA选择特征波段进行分类,正确率下降;高光谱融合纹理特征后进行分类,分类效果显著提升。【】基于高光谱与纹理融合可准确、有效地对烤烟进行无损分类,为量化烤烟分类提供了可行方法。
烤烟分类;高光谱成像;纹理特征;机器学习;分类算法
烟草作为我国重要的经济作物之一,对其进行客观识别与分类十分重要[1]。目前烤烟的分类依据国标GB2635—1992标准[2]。该标准通过人的视觉、嗅觉、触觉进行判别,容易受到温度、湿度、人为感官的影响,导致烤烟分类不够准确、客观[3]。
在烟草检测研究方面,部分研究人员将高光谱数据与化学计量方法相结合,探究烟草中化学元素的含量情况。郭婷[4]利用高光谱遥感数据检测烟草大田生长状况并监测氮磷钾含量。杨艳东等[5]通过对烤烟光谱数据提取,建立一元、多元回归等模型对叶片中的氯密度进行预测。
在烟草分级研究方面,近年来国内外研究人员尝试采用光谱相关无损检测与机器学习相结合的方法对烤烟进行分类。1968年McClure等[6]首次利用近红外光谱技术(Near Infrared,NIR)对烟草的透射率特征进行分析,宾俊等[7]利用NIR与极限学习机算法(Extreme Learning Machine,ELM)实现烤烟的自动分类。相较于红外光谱技术,高光谱成像可同时反映光谱信息与图像信息[8],更加准确把握不同物质、不同光谱之间的差别[9]。张龙等[10]通过对高光谱数据预处理,结合SVM对卷烟中的金属、塑料等杂质进行识别分类,提高卷烟产品质量。贾方方等[11]研究表明不同水分处理的烟草叶片之间光谱反射率差异明显。部分研究人员利用图像检测技术对烟叶形态、纹理特征进行研究。陈朋[12]通过提取烟叶形态特征,包括烟叶长度、宽度、破损率等对烟叶进行分级。李海杰 等[13]利用HSV空间图像颜色特征与Gabor小波提取烟叶的纹理特征,通过SVM进行分类。
在高光谱分类中,全波长光谱众多,存在大量冗余信息,需要先降维再进行分类。但降维后,分类正确率会随之降低。将降维后的高光谱数据与烤烟纹理信息融合,有利于改善分类效果[14]。许多研究人员对于高光谱与图像信息融合分类进行了探究。赵鹏等[15]为了提高木材树种的分类正确度,提出一种基于I-BGLAM的融合纹理与高光谱特征的分类方法。路江明等[3]利用光谱特征、纹理特征以及融合特征的SVM进行识别分类,改进了龙井茶快速无损评估技术。
目前,基于高光谱与纹理特征融合对烤烟无损识别分类的研究相对较少。因此,本研究探究通过预处理、特征提取等方式,提高烤烟无损分类的正确率。
利用高光谱成像系统获得烤烟光谱数据,如图1所示。高光谱成像系统由高感度EMCCD相机(Raptor EM285CL)、成像光谱仪(Imspector V10E)、稳定输出卤素灯光源(IT 3900,21V,150W)以及计算软件(Spectral-image)构成。
本研究烤烟光谱数据均在室内采集完成,高光谱成像系统同时配备暗箱、位移平台及光谱图像分析软件。通过高光谱成像系统采集数据时,各个参数设置情况如表1所示。
图1 高光谱成像系统
表1 高光谱成像系统参数设置情况
Tab.1 Parameter setting of hyperspectral imaging system
供试烤烟品种为翠碧一号(CB-1)(福建省烟草专卖局烟草科学研究所提供),烟叶等级为C2F、C3F、C4F(福建省烟草专卖局烟草科学研究所专家鉴定)。收集各等级呈展开形态(图2a)和自然卷曲状态(图2b)的烤烟叶片,共274片(表2)。
采集数据过程中,样本光谱信息受到光源、电流等因素干扰,从而产生噪声。为了减少实验误差,通过黑白校正提高准确度。在实验过程中,首先关闭光谱相机镜头,收集反射率为0的全黑标定图像。再打开镜头,扫描白板,采集反射率为99%的全白标定图像[16]。通过公式(1)处理,得到黑白校正高光谱数据。公式如下:
图2 烤烟叶片展开与自然卷曲状态
表2 烤烟样本情况
Tab.2 Flue-cured tobacco sample
其中为未校正的高光谱图像信息,为全黑标定图像,为全白标定图像,为校正后的高光谱图像信息。
对高光谱进行预处理,减少原始光谱偏差[17]。根据预处理的效果进行分类,可以分为:平滑处理、散射校正、基线校正[18]。
SG卷积平滑法的基本假设是光谱数据含有白噪声,多次计算求平均值可以降低噪声。MSC假定在光谱的所有波长中散射系数相同,将噪声与光谱有效信息进行分离。FD采用直接差分求导的方法,迅速确定光谱拐点、最大、最小反射率波长位置。
SPA是一种特征选择算法,通过共线性最小化的向前选择,消除光谱数据中的冗余信息,降低数据维度,通过投影的方式寻找最具有代表性的波长代替全波长光谱数据[19]。
本研究在烤烟光谱信息分类中,加入图像纹理信息。GLCM是一种描述图像的常用方法,用于计算相邻像素之间不同灰度值的组合数目,从而反映图像在指定方向上的梯度信息[20]。将灰度图转为固定级数的图像,对图像分别从0°、45°、90°、135°4个方向计算灰度图的能量、熵、惯性矩和相关性。将4个角度的平均值作为各参数的纹理信息[21]。
为弥补单一特征的缺陷,提高分类正确率,将SPA选择后的光谱特征与纹理特征进行融合。若直接进行融合,数值大的数据会对数值小的数据产生影响,影响分类效果。因此,需要在数据融合之前,对两组数据进行归一化处理[23]。
使用最大最小值归一化方法,将样本的光谱特征数据与纹理特征数据缩放至区间[0,1]。
式中,为样本特征数据,X、X分别表示样本特征值中最大值和最小值,表示归一化处理后的数据。
1.8.1 分类算法
利用分类算法对烤烟光谱数据进行分类,分类算法对分类的正确率产生影响。目前基于高光谱领域分类算法常用的有KNN、SVM、RF、NB。
KNN是数据挖掘中最简单的分类方法之一,是通过测量不同特征值之间的距离进行分类[17]。RF是由多棵树集成的分类算法,最终会选择输出多棵树分类结果的众数作为随机森林算法结果。SVM是监督型学习模型,通过构造分割面将数据进行分类。NB是一种应用基于独立假设的贝叶斯定理的简单概率分类算法,假设每个特征都不相关,依靠精确的自然概率模型,在有监督学习的样本集中能获得好的分类效果[19]。
1.8.2 分类正确率
分类正确率(Accuracy)是最为常见的评价指标,表示分类过程中预测正确的个数与总数的比值[22]。
其中,表示被模型分类正确的正样本,表示被模型分类错误的正样本,表示被模型分类错误的负样本,表示被模型分类正确的负样本,表示样本总数。
采用ENVI 5.0软件提取感兴趣区域(Region of Interest,ROI),在光谱图像中提取各样本光谱数据。采用MATLAB R2018a完成光谱数据的预处理与纹理特征提取,采用Spyder(Python 3.6)进行烤烟分类。
通过ENVI 5.0软件提取ROI,对每片实验样本沿着烤烟烟叶中间叶脉两侧提取10个50×50像素的感兴趣区域,将感兴趣区域内所有像素点的平均光谱值作为一个样本的光谱数据,对每个样本提取高光谱数据,最终共收集274个400~1000 nm波长范围内的全波长光谱数据,由于光谱波长两端的噪声大,故最终保留443.35~813.41nm共147段光谱。全波长光谱数据如图3所示。从图中可以看出烤烟烟叶吸光度趋势相似,在部分波长存在重合,光谱曲线之间存在基线漂移、散射等问题,故需要对光谱数据进行预处理。
通过KNN、RF、SVM、NB结合交叉验证法,建立烤烟全分类模型[24]。其中SVM采用线性核函数(Linear Kernel),其惩罚因子c默认为1。将带标签的原始数据随机打乱,25%作为测试集,75%作为训练集,结合分类算法对烤烟进行分类,在不同预处理下,将100次测试集平均值作为分类正确率。分类正确率及标准差如表3所示。
图3 烤烟全波长高光谱
表3 不同预处理方法和分类算法下分类正确率
Tab.3 Accuracy under different preprocessing methods and classification algorithms %
由表3可知,SVM方法在不同预处理的方法中,平均正确率达到84.82%,而KNN、RF、NB的分类正确率在63%~69%之间,说明SVM的分类效果明显优于其他分类算法。在分别使用SG、MSC、FD预处理方式的分类中,使用SG的平均正确率最高,达到75.9%,可见SG平滑处理有效降低曲线噪声,提高分类正确率。对比发现,SG、MSC、FD结合的预处理方式达到最高的平均正确率83.08%,且在SVM分类算法下达到最小偏差1.98%。
采用SG+MSC+FD方式对烤烟光谱数据进行预处理。光谱数据预处理后结果如图4所示。首先采用SG卷积平滑法(图4a),设定平滑点数为7,平滑项数为3[25],降低光谱噪声。用MSC方法(图4b),消除光谱散射影响[26]。采用FD消除基线漂移和其它背景的干扰(图4c),差分宽度为1,FD预处理后曲线较原始数据产生明显波动,局部反射率大幅提高,出现多个明显的波峰波谷,FD预处理能突出不同类别烤烟的细微差异,提升分类正确率。
图4 预处理后的光谱曲线
采用SPA对全波长预处理后146段光谱数据进行光谱特征选择,如图5所示。当选择25个特征波段时,均方根误差为0.4008,且均方根误差下降幅度逐渐缓慢(图5a),选择波段情况(图5b)。通过SPA自动选择25个波段,对应波长如表4所示。
图5 SPA结果
表4 基于SPA特征波段选择结果
Tab.4 The features selection results based on SPA
SPA共提取了25个特征波段,读取该25个波段下的灰度图。选择其中一个最为清晰,亮度均匀的617.64 nm下灰度图,进行GLCM纹理提取。为减少计算量,对每个样本图像的灰度图进行压缩,转换为64级灰度图,处理窗口为8×8,提取GLCM中能量、熵、对比度、相关性4个参数,分别对0°、45°、90°、135°4个方向进行提取,最终提取4×4个纹理特征,共16维。以一片烤烟样本为例,45°方向下能量(图6a),熵(图6b),对比度(图6c),相关性(图6d)图像情况如图6所示。纹理特征各方向各类别样本的能量、熵、对比度、相关性的均值及标准差如表5所示。
图6 GLCM提取参数图像
表5 纹理特征
Tab.5 Texture features
在对烤烟数据不同处理方法下,KNN、RF、SVM、NB结合交叉验证法,对烤烟进行分类,正确率及标准差如表6所示。
表6 不同分类算法的分类正确率
Tab.6 Accuracy of different classification algorithms %
将全波长未预处理的数据与预处理后数据的正确率进行比较,预处理后的分类正确率更高。未预处理数据的光谱维度是147段,KNN、RF、SVM、NB测试集的正确率在51%~65%之间。进行SG+MSC+FD预处理后,光谱维度是146段。测试集正确率在73%~96%之间。表明预处理后的正确率较预处理前有明显的提升。
通过SPA降低光谱数据维度,分类正确率随之下降。此时光谱维度是25段,降维后,减少数据计算复杂度,提高效率。降维后测试集正确率在74%~91%之间。
对GLCM提取的烤烟纹理特征数据进行分类,分类效果不如光谱特征。纹理特征维度为16段,测试集正确率在66%~72%之间。
纹理特征与光谱特征融合的分类达到最好分类效果。此时数据维度为41段,包含光谱特征25段和纹理特征16段。各分类算法正确率均高于90%,测试集标准差在1.7%~2.8%之间,较其他处理方法偏差更小,更稳定。其中SVM的分类效果最佳,训练集正确率达到99.12%,测试集正确率达到97.53%。烤烟纹理特征与光谱特征融合的数据,既降低了数据维度,又提高了正确率。
将数据集中烤烟叶片自然状态、叶片展开下收集的数据分离,分别计算他们在各处理方法下SVM分类正确率,如表7所示。在两种不同状态下烤烟的纹理特征与光谱特征融合下的分类正确率均高于95%,达到较好水平。比较两种状态下的烤烟分类正确率,自然卷曲状态的正确率在不同操作水平下均高于叶片展开下的分类正确率。
表7 烤烟叶片自然卷曲状态与展开状态下SVM的分类正确率对比
Tab.7 Comparison of classification accuracy of SVM in natural state and unfolded state of flue-cured tobacco %
数据预处理可以提高烤烟分类正确率,本研究发现利用SG、MSC和FD的组合预处理方式能达到较好分类正确率。选择特征光谱可降低数据维度,避免数据冗余,本研究利用SPA选择烤烟特征光谱提高分类算法工作效率。图像纹理特征可弥补光谱特征缺陷,基于GLCM提取的烤烟纹理特征,融合光谱特征,可提高烤烟的分类正确率。
本研究发现分类过程中自然卷曲状态下烤烟分类正确率高于叶片展开状态。推测可能是由于展开叶片取点范围较大,特征值有更大区间,而自然卷曲下提取ROI更集中,导致自然卷曲的烤烟正确率更高。且烤烟在烤制过程中烤烟逐渐卷曲,卷曲层内部和外部的湿度等因素可能不同,将叶片展开,会造成一定误差。
因此,本研究采用SG、MSC、FD组合方法对光谱数据进行预处理。采用SPA选取特征光谱波长,采用GLCM提取纹理特征,融合高光谱信息和纹理特征后,利用KNN、RF、SVM、NB对烤烟数据进行分类,可准确、有效地对烤烟进行无损分类,为量化烤烟分类提供了可行方法
[1] 方世诚. 基于光谱与色度的烤烟分类方法研究[D]. 贵阳:贵州大学,2016.
FANG Shicheng. Study on classification method of flue cured tobacco based on spectrum and chroma[D]. Guiyang: Guizhou University,2016.
[2] 中华人民共和国国家质量监督检验检疫总局. 烤烟:GB2635- 1992[S]. 北京:中国标准出版社,1992.
General administration of quality supervision, inspection and quarantine of the People’s Republic of China. Flue-Cured Tobacco: GB 2635-1992[S]. Beijing: China Standards Press,1992.
[3] 陆江明,范婷婷,穆青爽,等. 融合光谱与纹理特征的龙井茶等级无损识别[J]. 现代食品科技,2021, 37(3):301-307, 249.
LU Jiangming, FAN Tingting, MU Qingshuang, et al. Nondestructive identification of longjing Tea Grade by fusing spectral and textural feature[J]. Modern Food Science and Technology, 2021, 37(3):301-307, 249.
[4] 郭婷. 不同钾水平和成熟度烟草高光谱特征及其品质估测模型研究[D]. 长沙:湖南农业大学,2019.
GUO Ting, Hyperspectral characteristics and estimating model of leaf quality content in tobacco based on potassium and maturity treatments[D]. Changsha: Hunan University,2019.
[5] 杨艳东,贾方方,刘新源,等. 烤烟叶片氯密度高光谱预测模型的建立[J]. 河南农业科学,2019,48(5):155-160.
YANG Yandong, JIA Fangfang, LIU Xinyuan, et al. Construction of hyperspectral prediction model for chlorine density of flue-cured tobacco leaves[J]. Journal of Henan Agricultural Sciences, 2019, 48(5):155-160.
[6] McClure W F. Spectral characteristucs of tobacco in the near infrared region from 0.6-2.6 microns [J]. Tobacco Sci, 1968(12): 232-235.
[7] 宾俊,周冀衡,范伟,等. 基于NIR技术和ELM的烤烟烟叶自动分类[J]. 中国烟草学报,2017,23(2):60-68.
BIN Jun, ZHOU Jiheng, FAN Wei, et al. Automatic grading of flue-cured tobacco leaves based on NIR technology and extreme learning machine algorithm[J]. Acta Tabacaria Sinica, 2017, 23(2): 60-68.
[8] 赵凡,闫昭如,薛建新,等. 高光谱无损识别野生和种植黑枸杞[J]. 光谱学与光谱分析,2021,41(1):201-205.
ZHAO Fan, YAN Zhaoru, XUE Jianxin, et al. Identification of wild black and cultivated goji berries by hyperspectral image[J]. Spectroscopy and Spectral Analysis, 2021, 41(1):201-205.
[9] 刘立新,李梦珠,赵志刚,等. 高光谱成像技术在生物医学中的应用进展[J]. 中国激光,2018,45(2):214-223.
LIU Lixin, LI Mengzhu, ZHAO Zhigang, et al. Recent advances of hyperspectral imaging application in biomedicine[J]. Chinese Journal of Lasers, 2018,45(2):214-223.
[10] 张龙,马啸宇,王锐亮,等. 高光谱成像技术在烟叶和杂物分类中的应用[J]. 烟草科技,2020,53(8):72-78.
ZHANG Long, MA Xiaoyu, WANG Ruiliang, et al. Application of hyperspectral imaging technology to tobacco leaf and foreign matter sorting[J]. Tobacco Science & Technology, 2020, 53(8): 72-78.
[11] 贾方方,马新明,李春明,等. 不同水分处理对烟草叶片高光谱及红边特征的影响[J]. 中国生态农业学报, 2011, 19(6): 1330- 1335.
JIA Fangfang, MA Xinming, LI Chunming, et al. Effect of water condition on hyperspectral and red-edge characteristics of tobacco leaf[J]. Chinese Journal of Eco-Agriculture,2011,19(6):1330-1335.
[12] 陈朋. 烟叶纹理表面的视觉检测技术研究与应用[D]. 贵阳:贵州大学,2017.
CHEN Peng. Research and application of visual inspection technology for texture of tabacco surface[D]. Guiyang: Guizhou University, 2017.
[13] 郑守国,翁士状,刘瑜凡,等. 融合高光谱成像多类特征的名优牛肉种类鉴别[J]. 激光杂志,2021,42(8):57-61.
ZHENG Shouguo, WENG Shizhuang, LIU Yufan, et al. Identification of famous beef species using multiple futures of hyperspectral imaging[J]. Laser Journal, 2021,42(8):57-61.
[14] 李海杰. 基于机器视觉的烟草异物检测和烟叶分类分级方法研究[D]. 南京:南京航空航天大学,2016.
LI Haijie. Research on methods of tobacco foreign material detection and tobacco leaves grading based on machine vision[D]. Nanjing: Nanjing University of Aeronautics and Astronautics,2016.
[15] 赵鹏,韩金城,王承琨. 基于I-BGLAM纹理和光谱融合的高光谱显微成像木材树种分类[J]. 光谱学与光谱分析, 2021, 41(2): 599-605.
ZHAO Peng, HAN Jincheng, WANG Chengkun. Wood species classification with microscopic hyper-spectral imaging based on I-BGLAM texture and spectral fusion[J]. Spectroscopy and Spectral Analysis,2021,41(2):599-605.
[16] 黄蒂云,李景彬,尤佳,等. 基于高光谱技术融合图像信息的脱绒棉种品种分类检测研究[J]. 光谱学与光谱分析,2018, 38(7): 2227-2232.
HUANG Diyun, LI Jingbin, YOU Jia, et al. The classification of delinted cottonseeds varieties by fusing image information based on hyperspectral image technology[J]. Spectroscpy and Spectral Analysis, 2018, 38(7):2227-2232.
[17] 何嘉琳,乔春燕,李冬冬,等. 可见近红外高光谱成像技术对灵武长枣VC含量的无损检测方法[J]. 食品科学,2018,39(6): 194-199.
HE Jialin, QIAO Chunyan, LI Dongdong, et al. Non-destructive detection of vitamin c content in “lingwu changzao” jujubes using visible near infrared hyperspectral imaging[J]. Food Science, 2018, 39(6): 194-199.
[18] 张晟翀,李宇海. 红外高光谱数据鉴别技术研究[J]. 光电技术应用,2019, 34(2): 27-33.
ZHANG Shengchong, LI Yuhai. Research on infrared hyperspectral data identification technology[J]. Electro-Optic Technology Application, 2019, 34(2): 27-33.
[19] 孟庆龙,张艳,尚静. 光纤光谱结合模式识别无损检测苹果表面疤痕[J]. 激光技术,2019, 43(5): 86-90.
MENG Qinglong, ZHANG Yan, SHANG Jing. Nondestructive detection of apple defect combining optical fiber spectra with pattern recognition[J]. Laser Technology, 2019, 43(5): 86-90.
[20] 芦兵,孙俊,杨宁,等. 基于荧光透射谱和高光谱图像纹理的茶叶病害预测研究[J]. 光谱学与光谱分析, 2019, 39(8): 2515- 2521.
LU Bing, SUN Jun, YANG Ning, et al. Prediction of tea diseases based on fluorescence transmission spectrum and texture of hyperspectral image[J]. Spectroscopy and Spectral Analysis, 2019, 39(8): 2515-2521.
[21] 孙婷,田建平,胡新军,等. 基于高光谱成像技术的酿酒高粱品种分类[J]. 食品与发酵工业,2021,47(05):186-192.
SUN Ting, TIAN Jianping, HU Xinjun, et al. Classification of liquor sorghum varieties based on hyperspectral imaging technology[J].Food and Fermentation Industries, 2021, 47(5):186- 192.
[22] 高蕊. 随机森林算法改进及其在医疗诊断系统中的应用[D]. 南京:南京邮电大学,2020.
GAO Rui. Improvement of random forest algorithm and its application in medical diagnosis system[D]. Nanjing: Nanjing University of Posts and Telecommunications, 2020.
[23] 王靖会,程娇娇,刘洋,等. 基于高光谱成像技术鉴别大米品种[J]. 中国农业科技导报,2021, 23(9): 121-128.
WANG Jinghui, CHENG Jiaojiao, LIU Yang, et al. Identification of rice variety based on hyperspectral imaging technology[J]. Journal of Agricultural Science and Technology, 2121, 23(9): 121- 128.
[24] 王智宏,刘杰,王婧茹,等. 数据预处理方法对油页岩含油率近红外光谱分析的影响[J]. 吉林大学学报(工学版),2013, 43(04): 1017-1022.
WANG Zhihong, LIU Jie, WANG Jingru, et al. Influence of data preprocessing on NIRS analysis for oil yield of oil shale[J]. Journal of Jilin Univesity (Engineering and Technology Edition), 2013, 43(04): 1017-1022.
[25] 王阳. 基于朴素贝叶斯的高光谱矿物识别[D]. 长春:吉林大学,2014.
WANG Yang, Mineral identification by hyperspectral based on data mining[D]. Changchun: Jilin University, 2014.
[26] 刘爽. 小麦赤霉病高光谱信息多循环提取及组合式识别研究[D].长春:中国科学院大学(中国科学院长春光学精密机械与物理研究所),2019.
LIU Shuang. Research on multi-cycle extraction and combination identification of hyperspectral information of fusarium head blight in wheat[D]. Changchun:University of Chinese Academy of Sciences (Changchun Institute of Optics,Fine Mechanics and Physics), 2019.
Research on classification method of flue-cured tobacco based on fusion of hyperspectral and texture features
ZHANG Hui1,2, ZHANG Wenwei3, ZHANG Yongyi3, LI Shijing1,2, SHEN Jiayu1,2,ZHU Junyan1,2, XIE Xiaofang4, WEN Yongxian1,2*
1 College of Computer and Information Science, Fujian Agriculture and Forestry University, Fuzhou 350002, Fujian, China;2 Institute of Statistics and Applications, Fujian Agriculture and Forestry University, Fuzhou 350002, Fujian, China;3 Yanping Branch of Nanping Tobacco Company, Nanping 353000, Fujian, China;4 College of Life Sciences, Fujian Agriculture and Forestry University, Fuzhou 350002, Fujian, China
The purpose of this paper is to improve the classification accuracy of flue-cured tobacco.A hyperspectral imaging system was used to collect flue-cured tobacco sample. The combination method of Savitzky-Golay(SG) smoothing filter, multiplicative scatter correction (MSC) and the first derivative (FD) was used to preprocess the data of flue-cured tobacco. Feature wavelength was selected through successive projections algorithm (SPA). The texture features of flue-cured tobacco selected by gray-level co-occurrence matrix (GLCM), and then the texture features and spectral features were normalized and fused. The classification effect of flue-cured tobacco was verified by using k-nearest neighbor(KNN), random forests (RF), support vector machine(SVM) and naive bayes(NB).The results showed that the classification accuracy of full-band hyperspectral data after preprocessing was improved compared with that before processing. 25 features bands were selected by SPA, and the classification accuracy using features bands was decreased. After the fusion of hyperspectral and texture features, the classification effect was improved significantly.The proposed method can accurately and effectively classify flue-cured tobacco without damage through fusion of hyperspectral and texture, which provides a feasible method for quantifying the classification of flue-cured tobacco.
flue-cured tobacco classification; hyperspectral imaging; texture feature; machine learning; classification algorithm
Corresponding author. Email:wen9681@sina.com
中国烟草总公司福建省公司科技项目“烟草收购全程质量追溯管理模式构建与应用”(闽烟司[2022]5号);中国烟草总公司福建省公司科技计划项目“鲜烟成熟度智能化检测技术研究(2019350000240137);福建省烟草公司南平市公司科技计划项目“翠碧一号烟叶挂灰机理研究及其防控技术研究”(NYK2021-10-03)
张慧(1997—),主要研究方向:统计信息技术与数据挖掘,Tel:0591-13358216295,Email:392019334@qq.com
温永仙(1966—),教授,主要研究方向:统计信息技术与数据挖掘,Email:wen9681@sina.com
2021-08-16;
2022-04-20
张慧,张文伟,张永毅,等. 基于高光谱与纹理融合的烤烟分类方法研究[J]. 中国烟草学报,2022,28(3). ZHANG Hui, ZHANG Wenwei, ZHANG Yongyi, et al. Research on classification method of flue-cured tobacco based on fusion of hyperspectral and texture features[J]. Acta Tabacaria Sinica, 2022, 28(3). doi:10.16472/j.chinatobacco.2021.T0139