基于可见/近红外光谱西葫芦硬度的无损检测模型的建立

2020-02-27 17:01邢书海张淑娟孙海霞陈彩虹李成吉
山西农业科学 2020年1期
关键词:西葫芦校正预处理

邢书海,张淑娟,孙海霞,陈彩虹,李成吉

(山西农业大学工学院,山西太谷030801)

近红外光谱技术作为一种高效、无损、易操作、可实时在线检测的新型检测技术,已被广泛应用于果蔬检测中,并取得了显著成果,在水果品质检测方面应用广泛[1]。SIRISOMBOON等[2]使用近红外光谱技术检测番茄的力学性状,采用多元散射校正(MSC)对光谱进行预处理,建立的校正模型相关系数为0.95,最低标准误差为0.35,偏差为0.19。KAVDIR等[3]运用可见光和近红外光谱技术测量不同品种酸黄瓜的硬度、表皮和果肉的颜色、干物质含量,采用偏最小二乘法(PLS)建立校正预测模型,结果得到了酸黄瓜的硬度、表皮颜色、果肉颜色和干物质含量最好的PLS校正模型,决定系数分别为0.70、0.89、0.34、0.65。目前,国内已有学者利用近红外光谱技术对西瓜、苹果、梨、鲜枣等[4-11]进行研究,但未见对西葫芦的研究。

西葫芦是人们爱吃的蔬菜之一,其果实呈圆筒形,果形较小,果面平滑,以采摘嫩果供菜用。西葫芦皮薄、肉厚、汁多和富含水分,受到广大消费者的喜爱。温室大棚种植西葫芦已成为一些地区农民增加收入的一项重要来源。目前,西葫芦的品质检测和分级分选还是依靠人工来完成。硬度是反映果蔬品质的重要指标[9,12],也是西葫芦在收购、流通、销售过程中需要关注的重要指标。因此,研究针对西葫芦的快速、方便、无损硬度品质检测技术是非常必要的。

本试验应用可见/近红外反射光谱技术快速获取西葫芦漫反射近红外光谱,对西葫芦硬度品质进行检测,为今后在线快速无损检测果蔬硬度提供理论依据。

1 材料和方法

1.1 仪器设备

本研究的光谱数据采集采用美国ASD(Analytical Spectral Device)公司生产的ASD FieldSpec3型光谱仪,采样波段范围为350~2 500 nm,光谱采样间隔为1 nm,扫描次数30次,分辨率3.5 nm,光纤探头视场角度为30°。采用漫反射方式进行西葫芦样品光谱信息采集。光源采用与光谱仪配套的14.5 V的卤素灯。

1.2 试验材料与光谱数据采集

所有试验样品采摘于山西省太谷县范庄温室大棚蔬菜生产基地。选取大小均匀、表面无机械损伤的西葫芦样本200个,在室温下贮藏。西葫芦采集光谱数据时,随机抽取进行编号、标记和光谱数据采集,在自制的暗室内进行光谱采集(图1),运用ASDFieldSpec3型光谱仪按编号顺序采集样品的漫反射光谱数据,光谱分辨率为3nm(350~1000nm),扫描波长范围为 350~2 500、1 000~2 500 nm,采样间隔设置为1.4nm(350~1000nm)和2nm(1000~2 500 nm),数据间隔为1 nm。样品的纵轴(果柄-果蒂轴)与操作台平行,每个正常西葫芦样品都以纵轴为转轴旋转180°采集2次,每次采集扫描30次,然后取平均值作为该样品的实测光谱信息。采集的原始光谱信息如图2所示。

1.3 硬度测定

西葫芦硬度测定采用美国FTC公司生产的TMS-PRO型食品物性分析仪(质构分析仪),检测精度为0.015%,选用P/2n针状探头,选取西葫芦赤道部位向阳面和背阴面分别测定,进行3次穿刺试验,保证刺入点位置与光谱采集位置一致,记录并取平均值作为果实硬度数据。设置测前速度5 mm/s,贯入速度 1 mm/s,测后速度 6 mm/s,最小感知力5 g,穿刺深度4 mm。硬度计算公式如下。

其中,F为硬度值(N);p为物性分析仪测量值(g);g为重力加速度,取 9.8 N/kg。

1.4 光谱数据预处理与建模分析

为了消除光谱采集过程中来自高频随机噪音、基线漂移、样本不均匀和光散射等的影响,对采集的光谱数据进行预处理。卷积平滑法[13](S-G)是一种常用的光谱数据处理方法,可以消除采集光谱时产生的随机误差,减少噪声。多元散射校正[14](MSC)主要用来消除由于散射与颗粒尺寸以及分布不均匀带来等因素的影响,它可以提高对有用信息的提取,获得较优的光谱。标准正态变换[15](SNV)主要是对光谱数据进行标准正态化处理,消除采集光谱数据的散射光所产生的误差。采用卷积平滑法进行光谱预处理,此时能很好滤除各种因素产生的高频噪音,再进行多元散射校正(MSC)、标准正态分布(SNV)和卷积平滑法(S-G)以及几种方法相结合对光谱数据进行处理。之后,再应用主成分回归(PCR)、逐步多元线性回归(SMLR)和偏最小二乘回归(PLSR)建模方法分别对西葫芦硬度品质进行建模分析。

1.5 模型评价

通过建模样本均方根误差(RMSEC)与预测样本均方根误差(RMSEP)来评价所建模型的精确性。当校正集和验证集的相关系数越接近1和均方根误差越接近于0时,并且校正集和验证集的均方根误差越接近,表明所建模型较优。

2 结果与分析

2.1 硬度测量结果分析

由表1可知,样品硬度最小值为3.06 N,最大值为4.79 N,平均值为3.89 N。运用SPXY法以3∶1的比例划分校正集和预测集,最终选取校正集样本136个,预测集样本44个。

表1 样本硬度测量结果

2.2 不同预处理硬度预测模型的建立与分析

采用不同的方法对原始光谱进行预处理,应用偏最小二乘回归PLSR的建模算法会产生不同的效果。通过运用PLSR算法对经过平滑处理、SNV、MSC预处理的光谱数据进行建模分析,以确定最好的建模模型(表2)。

表2 PLSR多种预处理建模分析结果

由图3可知,运用原始光谱数据经平滑处理与标准正态变换(SNV)处理的光谱数据建立的PLSR预测模型,校正集相关系数为0.979,预测集相关系数为0.976,较其他模型建模最优。使用多元散射校正(MSC)和标准正态变换(SNV)来消除西葫芦果实表面纹理、大小以及均匀度等因素的影响[16]。2种校正方法进行对比,SNV作为光程校正效果更好,校正的相关系数较高。

2.3 不同建模模型的比较与确定

为了验证不同建模算法优劣,运用PCR和SMLR分别对 SNV、MSC、S-G+SNV 以及 S-G+MSC预处理的光谱数据进行建模分析比较,进行最优硬度检测预测模型确定(表3)。

表3 PCR和SMLR对光谱数据建模结果

2.4 模型验证

通过对比分析不同预处理和不同建模方法在350~2 500 nm全波段光谱数据建模,应用PLSR对经过S-G+SNV预处理的光谱数据进行建模的效果最好。采用PLSR建模效果最好,原因在于PLSR算法适用于复杂分析体系的全波段光谱数据,数据矩阵分解与回归相互结合,使得特征向量直接与样品性质相关,所建预测模型更为稳健。为了验证模型的可靠性和准确性,运用模型对44个验证样本进行预测,结果如图4所示,预测相关系数为0.886,预测均方根误差为0.126。

3 结论与讨论

本研究在350~2500nm光谱范围内利用可见/近红外漫反射光谱技术对西葫芦的硬度指标进行检测,建立了基于可见/近红外漫反射光谱检测西葫芦硬度指标的方法和模型。试验共研究了180个西葫芦样品,采用主成分回归(PCR)、逐步多元线性回归(SMLR)和偏最小二乘回归(PLSR)进行模型建立,对比光谱平滑处理、SNV、MSC处理建模结果的影响,通过对比不同处理方法建模后的效果,结果表明,PLSR进行建模的模型最优。预测模型得到西葫芦硬度真实值和预测值的相关系数达0.886。本研究表明,可见/近红外漫反射光谱可作为一种快速无损的检测技术来评价西葫芦硬度指标,并对西葫芦在线无损检测的进一步研究有借鉴意义。

猜你喜欢
西葫芦校正预处理
KR预处理工艺参数对脱硫剂分散行为的影响
求解奇异线性系统的右预处理MINRES 方法
阳台变成小农田
西葫芦为什么徒长
延秋西葫芦种植 掌握关键技术
污泥预处理及其在硅酸盐制品中的运用
劉光第《南旋記》校正
基于特征分解的方位向多通道SAR相位失配校正方法
一种具有自动校正装置的陶瓷切边机
基于在线约束限制的飞行器预测校正制导