基于机器视觉的梨品种识别研究

2023-08-17 10:31孙海霞王林杰张淑娟苏立阳
农产品加工 2023年13期
关键词:酥梨香梨特征值

孙海霞,王林杰,张淑娟,苏立阳,任 锐

(山西农业大学农业工程学院,山西 晋中 030801)

梨被誉为百果之宗,可口多汁、营养丰富,含有多种维生素和纤维素,有降火、清心、润肺等功效[1]。不同品种梨的口感和品质完全不同,消费者对不同品种梨的喜好程度不一。由于山西梨品种繁多,目前,梨品种区分主要依靠人工分选,人工效率低且劳动强度大,限制了梨产业的大规模分选和推广。目前对梨的保鲜、营养成分和品质分级研究较多,但对梨的品种分选较少。因此,迫切需要一种自动化、智能化的技术解决梨品种分类问题,对梨产业的发展具有重要的生产意义和经济价值。

随着计算机技术的发展,基于机器学习的图像处理技术运用于农产品品种分选中[2]。余游江等人[3]以新疆地区5 个品种的红枣为研究对象,提出以卷积神经网络为基学习器的Stacking 模型融合方法进行分类,模型的分类准确率为92.38%。耿磊等人[4]建立了不同品种苹果的数据集,提出了基于融合注意力结构的苹果品种自动鉴别模型EBm-Net,充分提取了外形轮廓和颜色纹理特征,增大了各品种苹果的类间差异,总体分类准确率为96.78%。李秀昊等人[5]通过提取稻谷图像的形状特征和颜色特征,构建了(Support Vector Machines,SVM) 和BP 神经网络识别模型,基于特征融合所建SVM 模型的识别准确率(99.50%) 最高且时间(0.165 s) 最短,可满足稻谷在线识别与质量检测的精度和实时性要求。

以玉露香梨、酥梨和雪花梨为研究对象,利用机器视觉技术采集样本的图像信息,通过连续投影法优选特征值,利用偏最小二乘回归法和最小二乘支持向量机建模分析,优选特征值和模型,为今后的梨品种在线检测提供理论参考。

1 材料和方法

1.1 试验材料

玉露香梨、酥梨、雪花梨样本,采集自山西农业大学(山西省农业科学院) 果树研究所,采摘带柄、成熟度一致、无虫害、无机械损伤的梨。利用Kennard-Stone(K-S) 算法[6]按3 ∶1 划分训练集(312 个) 和预测集(132 个)。其中,酥梨样本中训练集85 个,预测集36 个;雪花梨样本中训练集132 个,预测集56 个;玉露香梨样本中训练集95 个,预测集40 个。

1.2 图像采集装置

图像采集系统是由暗室、2 条LED 灯条、发光板和升降台、带有USB 接口的摄像头(晟悦SY8031) 组成,感光元件为CMOS,焦距为35 mm,摄像头连接笔记本电脑中进行采集图像。

图像采集装置见图1。

图1 图像采集装置

1.3 数据处理方法

利用MATLAB 进行图像的特征值提取,从RGB、HSI、Lab 颜色空间中分别提取颜色特征值,利用灰度差分统计法和灰度共生矩阵提取纹理特征值。采用连续投影法(Successive Projections Algorithm,SPA) 优选特征值,利用偏最小二乘法(Partial least squares,PLS) 和最小二乘支持向量机(Least Squares Support Vector Machine,LS-SVM) 建立识别模型。

2 结果与分析

2.1 特征值提取

由于不同品种的梨之间有颜色和纹理的差异,针对采集的图像进行特征值提取。颜色特征描述图像区域所对应的目标物表面性质[7]。RGB 颜色空间是最基础的模型;HSI 颜色空间接近于人眼视觉特性;Lab 颜色空间是范围最大的色彩模式。从RGB、HSI、Lab 颜色空间中的分别提取R、G、B、H、S、I、L、a、b 颜色特征值的均值和方差,共18 个特征值。纹理特征是对图像区域内灰度级变化进行量化,该研究利用灰度差分统计法和灰度共生矩阵[8],提取能量、熵、惯性矩、相关性、逆差距的4 个方向(0,45,90,135 °) 的特征值[9],共20 个特征值。

2.2 优选特征值

通过提取出312 幅图像,每幅图像38 个特征值。由于特征值提取数据量大,每组特征值对不同品种梨的识别能力不同,因此需要提取影响效果显著的特征值,进行建立识别模型。

SPA 是一种使矢量空间共线性最小化的前向变量选择算法,能够消特征中冗余信息,可用于特征参数的筛选[10]。

SPA 优选特征值见图2。

图2 SPA 优选特征值

在RMSE 为0.353 86 时,共优选出15 个特征值。图2(b) 中选择的变量需与38 个特征值相对应,对横坐标为i 时,则表示优选到的特征值为第i 个特征值。15 个优选特征值依次为90 °的相关性、45 °的逆差距、45 °的相关性、S 分量均值、90 °的逆差距、G 分量均值、0 °的惯性矩、90 °的熵、0 °的逆差距、90 °的惯性矩、G 分量方差、H 分量均值、135 °的熵、0 °的熵、S 分量方差。

2.3 品种识别模型的建立

PLS 是一种多元统计数据分析方法[11]。LS-SVM是基于SVM 的改进算法,采用非线性映射将训练样本从低维特征空间映射到高维特征空间,将SVM 的二次规划问题转化为线性方程组的求解问题[12]。基于全特征值和SPA 方法优选特征值,采用PLS 和LS-SVM 分别建立识别模型。

模型的判别结果见表1,模型预测集的判别结果见图3。

表1 模型的判别结果

图3 模型预测集的判别结果

由于模型预测出的结果非整数型,因此将0.5 作为最大偏离值,预测类别值和假设类别值相差小于0.5 的判定为此类样本。由表1 可知,PLS 模型的判别结果好于SPA-PLS 模型,酥梨的判别结果较差。由图3(a) 和(b) 可知,酥梨和雪花梨之间判别错误的样本较多。利用LS-SVM 方法所建模型的判别结果(判别准确率为83.33%~100.00%) 优于PLS 所建模型(判别准确率为66.67%~100.00%)。结合图3可知,LS-SVM 和SPA-LS-SVM 模型中酥梨和雪花梨之间判别错误减少,酥梨的判别准确率得到明显提升。SPA-LS-SVM 模型的判别结果好于LS-SVM模型。SPA-LS-SVM 模型对酥梨、雪花梨、玉露香梨的判别准确率分别为83.33%,98.21%,100.00%。因此,SPA-LS-SVM 通过SPA 方法优选特征值简化了模型,提高检测精度和效率,整体判别准确率达到94.70%。

3 结论

基于机器视觉技术对梨的品种进行识别。采集玉露香梨、酥梨、雪花梨的图像信息,基于38 个全特征值和15 个SPA 优选特征值,采用PLS 和LS-SVM 方法建立了识别模型。SPA 提取特征值可以剔除无用信息和降低数据维度,提高建模速度和稳定性,SPA-LS-SVM 模型的识别结果最优,识别准确率为94.7%。因此,SPA-LS-SVM 方法实现了梨品种的分类,为进一步实现梨品种自动化分类提供技术参考。

猜你喜欢
酥梨香梨特征值
玉露香梨“赛美人”
夏季管得好 酥梨更优质
一类带强制位势的p-Laplace特征值问题
单圈图关联矩阵的特征值
转变生产方式,促进库尔勒香梨提质增效
砀山选“酥梨王”
香梨:瀚海的果实
蒲城酥梨
基于商奇异值分解的一类二次特征值反问题
安徽·砀山贮藏酥梨价格上涨