吴莎莎,王振杰,江梦薇,兰维杰,屠 康,李 晏,袁栋栋,潘磊庆,*
(1.南京农业大学食品科技学院,江苏南京 210095;2.江苏福瑞斯农业有限公司,江苏宿迁 223725)
阿森泰克苹果(Malus domesticaBorkh.cv.Aztec Fuji)是在新西兰选育的富士浓红型芽变品种,一般在10 月中旬成熟。在不套袋栽培条件下品质表现优良,果型端正、果实大,平均着色面积80%以上,甜脆多汁,糖含量达14%以上,耐贮藏[1]。目前阿森泰克苹果的栽培面积不断扩大,在陕西千阳、甘肃宁县、江苏宿迁等地均有种植,市场逐渐扩大。现有研究发现阿森泰克苹果相比于Mollie's Delicious苹果具有更高的可溶性固形物含量(soluble solid content,SSC),但可滴定酸含量(titratable acid,TA)较低[2];与富士6629、富士Suprema 相比硬度(firmness,FI)较高[3]。上述研究已证明商业成熟的阿森泰克苹果品质与传统富士存在较大品质差异性,但对于不同成熟阶段的阿森泰克苹果品质研究报道较少。
目前,苹果理化品质特性分析测定主要依靠一系列破坏性检测技术,如质构仪、糖度计、色谱质谱等,虽然检测精度高,但前处理较复杂、具有时滞性,无法实现快速在线检测。近年来,可见-近红外光谱(visible and near-infrared,Vis-NIR)和近红外光谱(near-infrared,NIR)技术,依靠快速无损、易于自动化的优势,已被成功应用于苹果SSC、TA、FI 等重要理化指标的快速检测[4-6]。Yao 等[7]利用Vis-NIR光谱技术有效实现了山东烟台等产地的富士苹果SSC预测,其预测集决定系数(determination coefficient of prediction,Rp2)为0.87、预测集均方根误差(root mean square error of prediction,RMSEP)为0.7%。姚亚楠[8]基于富士苹果在NIR 波段下的14 个筛选特征波长构建了TA 的反向传播神经网络模型,Rp2为0.74,RMSEP 为0.02%。Fan 等[9]研究表明基于Vis-NIR光谱和二阶导数预处理建立的偏最小二乘(partial least squares,PLS)模型能够实现红富士苹果FI 的有效预测,Rp2为0.81,RMSEP 为0.53 kg/cm2。这些研究展示了Vis-NIR 和NIR 光谱技术对于富士苹果品质特征的良好评价潜力,但现有报道模型对于阿森泰克苹果品质的评价潜力还有待研究。
上述研究仅集中于商业成熟度下苹果近红外光谱品质模型的构建与优化。同时,苹果在收获时的成熟度极大地影响果实的口感风味,是影响采后贮藏品质变化的关键因素[10]。成熟度过低时,苹果果实淀粉含量高、糖含量低、口感较差,成熟度过高则会导致果实变得绵软,不耐贮藏[10]。不同生理阶段的果实,其物理特性、化学成分可能有所不同,这些特性会影响光学特性[11]。因此,应将多个收获期的果实进行建模,提高模型的适应性。Sharabiani 等[12]基于200~1100 nm 光谱数据预测不同成熟阶段嘎啦苹果的SSC,所建立的混合人工神经网络模型Rp2为0.92,RMSEP 为0.17%。Pourdarbani 等[13]在400~1000 nm范围内研究应用近红外光谱检测不同成熟度富士苹果TA 的可行性,建立人工神经网络预测模型,模型Rp2为0.86。这些研究均考虑了果实成熟阶段对模型性能的影响,且说明近红外光谱对苹果成熟阶段品质检测具有一定可行性,然而基于Vis-NIR 和NIR光谱对阿森泰克苹果在不同成熟阶段品质的预测暂无报道。
因此,本研究以四个不同成熟阶段的阿森泰克苹果果实为研究对象,测定其在400~1000 nm、900~2500 nm 范围内的反射率和理化指标,分析成熟过程中果实漫反射光谱差异和理化指标变化。最后利用化学计量学方法建立融合不同成熟度阿森泰克苹果品质的定量预测模型,实现对阿森泰克苹果成熟过程中品质的快速无损检测,以期为预测阿森泰克苹果的质量参数提供理论依据与实际指导。
供试材料为阿森泰克苹果 采摘自江苏省宿迁市江苏福瑞斯农业有限公司,果实商业成熟期在十月中旬,分四个阶段进行收获,分别为M1(2022 年9 月25 日)、M2(2022 年10 月5 日),M3(2022 年10 月15 日)和M4(2022 年10 月25 日)(图1)。每个阶段40 个苹果样本,采集样本后,筛选大小相对一致,表面没有疤痕的样本。样本置于室温(20 ℃左右)24 h 后用纯水擦拭样品表面并自然晾干、编号。在每个样本沿赤道方向每120°进行标记,共三个标记位置,作为光谱扫描及检测取样点。
图1 不同成熟度的阿森泰克苹果Fig.1 Aztec apples at different levels of maturity
CR-13 便携式色差计 日本美能达公司;PAL-1 手持式糖度仪 日本爱拓公司;Easy ACID F5 酸度计 日本爱拓公司;TMS-Pro 质构仪 美国FTC 公司;LC-20A 高效液相色谱(配有蒸发光散射检测器) 日本岛津公司;可见-近红外光谱采集系统:PG2000-Pro 光谱仪、FIB-600-L-UV 直通光纤、FIB-Y-600-L(2)-UV 光纤、FVA-UV 光纤可调衰减器 上海复享光学股份有限公司;LS-HA 卤素光源台湾超微光学;近红外光谱采集系统:NIR2500 近红外光谱仪、FIB-Y-600-L(2)-NIR 光纤 上海复享光学股份有限公司;ASBN-100-L 卤钨光源 美国Spectronics 公司。
1.2.1 理化指标测定 用CR-13 型色差仪测定苹果果实标记部位(沿赤道方向每120°),测量亮度(L*)、红度(a*)、黄度(b*),测定结果取平均值;硬度(firmness,FI)测定采用质构仪[14],使用直径为6 mm的圆柱形探头在标记区域进行穿刺,触发力为0.3 N,检测速度为120 mm/min,穿刺距离为8 mm,回程速度为200 mm/min,测定结果用牛顿(N)表示;可溶性固形物测定采用手持式糖度计,将标记区域的果肉用无菌纱布包裹挤汁进行测定,测定结果用白利糖度(°Brix)表示;可滴定酸测定采用酸度计[15],对标记区域的果肉挤汁,测定结果用百分比(%)表示;水分含量(moisture content,MC)测定参考GB 5009.3-2016,采用直接干燥法测定,取约5 g 果肉在105 ℃下烘干至恒重,测定结果用百分比(%)表示;干物质含量(dry matter content,DMC)采用烘干法测定,取约8 g 果肉在60 ℃下烘干48 h 至恒重,干重与鲜重的比值为干物质含量,测定结果用百分比(%)表示;果糖、葡萄糖、蔗糖含量测定参考You 等[14]报道的方法,采用高效液相色谱法测定,总可溶性糖含量用葡萄糖、果糖和蔗糖的总含量表示[14],测定结果用mg/g 表示。
1.2.2 可见-近红外、近红外光谱检测 实验室搭建的近红外光谱检测系统如图2 所示,主要由光源、Y 型光纤、光谱仪和计算机组成。将光源和光纤衰减器通过直通光纤连接,Y 型光纤的六孔端连接光纤衰减器的另一端,单孔端连接光谱仪,光谱仪的另一端通过USB 与计算机连接。光谱数据可直接通过软件Morpho 3.2 采集获得。三个标记部位各进行一次光谱采集,获得的3 次光谱信息取平均值作为该样本的漫反射光谱,共采集160 个不同成熟度的阿森泰克苹果的光谱信息。按照2:1 的比例划分建模集与预测集。
图2 光谱采集系统图Fig.2 Spectrum acquisition system
光谱采集参数:可见-近红外波段(400~1000 nm):积分时间为45 ms,平均次数为10,窗口平滑为5。近红外波段(900~2500 nm):积分时间为5 ms,平均次数为10,窗口平滑为5。
光纤探头直接对准标准白板或样品进行光谱信号采集。首先对光谱进行校正,通过关闭和打开光源来采集标准白板的反射光谱,然后分别作为用于参考的暗光谱和光源光谱。每个样品的光谱反射率按照公式(1)进行计算:
其中:R 是相对于标准白板的样品光谱反射率;R0是样品光谱反射率;RD是暗光谱反射率;RW是光源光谱反射率。
1.3.1 光谱预处理 由于环境、仪器、人为操作等影响,光谱可能会受到噪声的干扰,有必要在建模之前需要对原始光谱进行预处理[16]。标准正态变量变换(standard normalized variate,SNV)是较为常用的预处理方法之一,用于光散射校正,减少光程的变化对光谱信息的干扰[17]。因此本研究对所有原始光谱数据进行SNV 预处理。
1.3.2 特征波长筛选 为了消除原始光谱中无用变量,提高模型性能,加快模型检测速度,对光谱进行特征波段筛选。连续投影算法(successive projections algorithm,SPA)是一种前向变量选择算法,消除原始光谱矩阵中的冗余信息,最小化光谱中变量的共线性[18]。竞争性自适应重加权算法(competitive adaptive reweighted sampling,CARS)算法是一种基于PLS 和达尔文进化论原理“适者生存”的变量选择算法,通过绝对回归系数大小筛选波长,剔除权重小的变量带[19]。无信息变量消除法(uninformative variable elimination,UVE)算法是基于PLS 回归系数,将随机噪声变量加到光谱数据后,通过交叉验证去除无关变量[20]。因此,本研究采用SPA、CARS 以及UVE 这3 种算法对光谱进行特征波段筛选。1.3.3 模型建立与性能评价 PLS 广泛用于定量分析,该方法能够结合矩阵的分解与回归,同时考虑浓度矩阵Y(品质参数)和光谱矩阵X[21]。支持向量机(support vector machine,SVM)是基于非参数内核的学习算法,将问题从低维空间映射到高维空间,并使用线性算法在高维空间中寻找最优超平面,可以解决原始特征空间中的非线性关系[22]。本研究为预测不同成熟度阿森泰克苹果的理化指标,采用PLS、SVM算法建立预测模型。
模型的性能用校正集决定系数(determination coefficient of calibration,Rc2)、校正集均方根误差(root mean square error of calibration,RMSEC)、预测集决定系数、预测集均方根误差以及相对预测偏差(relative percent deviation,RPD)来评估。RPD 值大于2.50 表示模型稳健性很好,介于2.00 和2.50之间表示模型具有较好的稳健性,小于2.00 表明模型稳健性较差[23]。
使用数据处理软件OriginPro 2022b 绘制各种理化指标的变化趋势、相关性分析、主成分分析(principal component analysis,PCA),使用IBM SPSS Statistics 20.0 软件进行方差分析(P<0.05)和线性判别分析(linear discriminant analysis,LDA)。使用MATLAB R2016a 中PLS toolbox 7.5 工具箱对光谱数据进行预处理、特征波段挑选并建立定量模型。
由图3 所示,与成熟后期相比(M3 到M4),在成熟前期(M1、M2)阿森泰克苹果的物理指标(L*、a*、b*值和FI)变化程度更剧烈。色泽是评价果实外观品质的重要指标,随着苹果不断成熟,苹果果皮的L*值逐渐降低,表明果皮亮度降低(图3a)。a*值不断升高(图3b),b*值逐渐降低(图3c),表明阿森泰克苹果果皮逐渐退绿而呈红色,主要是由于果实细胞中叶绿素分解,花青素、类胡萝卜素等含量增加[24]。M3、M4阶段的果实L*、a*、b*值均没有显著性差异(P>0.05),表明成熟后期果实的色泽较为稳定,这与Iglesias等[3]对阿森泰克苹果的研究结论一致。在成熟过程中,随着苹果果实成熟,果皮细胞间的果胶分解,细胞壁中的原果胶在果胶酶的作用下逐渐降解为可溶性果胶,FI 开始下降[25]。阿森泰克苹果的FI 从29.69 N显著降低至24.44 N(P<0.05)(图3d),下降率为17.68%,这明显低于张猛胜[26]在不同成熟度的富士苹果研究中FI 的下降率(21.26%)因此,相较于富士,阿森泰克的硬度变化更小。
图3 不同成熟阶段(M1、M2、M3、M4)阿森泰克苹果的理化指标Fig.3 Physical and chemical indicators of Aztec apples at different maturity levels (M1, M2, M3 and M4)
此外,阿森泰克苹果在不同成熟阶段的化学指标(SSC、TA、MC 和DMC)也存在明显变化。SSC和TA 是影响苹果口感的重要因素,随着阿森泰克苹果 成 熟,SSC 从13.5°Brix 显 著 上 升 到16.5°Brix(图3e),TA 则从0.50%显著降低到0.30%(P<0.05)(图3f)。张猛胜[26]发现富士苹果在成熟过程中SSC 从12.69%增加到14.62%,TA 从0.28%下降到0.22%,其变化幅度均明显低于阿森泰克苹果,这表明阿森泰克苹果与富士苹果在成熟过程中的SSC和TA 的差异性。MC、DMC 是判断水果成熟度的重要指标,如图3g 所示,随着成熟度增加,苹果果实MC 整体呈下降趋势,M1、M2 和M3 组阿森泰克苹果的含水量具有显著差异(P<0.05)。这是由于苹果成熟过程中,SSC 积累,且细胞分裂,纤维素、半纤维素等不溶性固体增加,DMC 增加,导致MC 逐渐下降。阿森泰克苹果的DMC 含量在成熟阶段从16.74%显著升至18.91%(P<0.05)(图3h),Vieira 等[27]研究发现富士在成熟阶段DMC 也呈上升趋势,但含量低于阿森泰克,因为DMC 与水果中的淀粉、糖分含量直接相关,阿森泰克的糖含量高于富士。
苹果的可溶性糖主要包括果糖、葡萄糖、蔗糖,属于果糖积累型果实[28]。整体上阿森泰克苹果的可溶性糖呈上升趋势,与李千里[28]研究结论一致。主要是大多数碳水化合物通过糖酵解和三羧酸循环快速代谢,在发育的早期阶段,苹果中糖分积累量低,成熟过程中,淀粉水平开始下降,可溶性糖含量增加,随着有机酸水平的下降,甜度值达到最大[29]。由图4所示,阿森泰克的可溶性糖以果糖为主,约占总可溶性糖的45%左右,其次是葡萄糖,蔗糖最低。而蜜脆、金冠、玉林等品种成熟后蔗糖高于葡萄糖含量,烟富8 号中蔗糖(24.0 mg/g)和葡萄糖含量(22.0 mg/g)相当,但均低于阿森泰克苹果(蔗糖:32.35 mg/g,葡萄糖:42.40 mg/g)[28]。
图4 不同成熟度阿森泰克苹果的可溶性糖含量Fig.4 Soluble sugar contents of Aztec apples at different maturity levels
为了明确阿森泰克苹果成熟过程中各理化指标之间的关联性,对其进行Pearson 相关性分析以及主成分分析,结果如图5 所示。阿森泰克苹果的成熟度等级与所有指标都呈现极显著相关性(P<0.01),与a*值相关性最强,相关系数(correlation coefficient,r)为0.88,与SSC、果糖、总糖呈强正相关,r分别为0.85、0.80 和0.85,与L*值、b*值呈强负相关,r分别为-0.87、-0.84。表明阿森泰克成熟过程中色泽、糖含量变化显著。DMC 与成熟度等级的相关性也较强,r为0.73。通过Pearson 相关性分析发现,在阿森泰克苹果的成熟过程中,色泽、FI、SSC、TA、可溶性糖、DMC、MC 等品质都发生了较大变化。
图5 不同成熟度阿森泰克苹果理化指标相关性分析Fig.5 Correlation analysis of physical and chemical indicators of Aztec apples at the different maturity levels
由图6 所示,第一主成分(PC1)和第二主成分(PC2)累计贡献率达到74.6%,能够表征原始变量的特征差异。PCA 结果显示,处于不同成熟阶段的苹果理化指标在PC1 上呈现有规律的分布,根据PC1 可以实现对不同成熟度阿森泰克苹果的区分(图6a),其中M1、M2 组苹果样品分布在第二、三象限,M3、M4 组的样品分布在第一、四象限。说明不同成熟度阿森泰克苹果在品质上有显著差异。PC1与SSC、a*值呈高度正相关,与L*值、b*值呈高度负相关(图6b)。表明本研究中对阿森泰克苹果样本聚类贡献率较大的是SSC、a*值、L*值、b*值,有助于区分果实的不同成熟阶段。同时PCA 结果中贡献率大的理化指标与上述相关性分析结果较吻合。
图6 不同成熟度阿森泰克苹果理化指标的PCA得分图(a)和载荷图(b)Fig.6 PCA scores plot (a) and loadings plot (b) of physical and chemical indicators of Aztec apples at different maturity levels
由图7a 和7b 所示,各样本的光谱曲线具有相同趋势,但因内部物质含量变化而产生光谱反射率差异,低成熟度苹果的光谱反射率高于高成熟度苹果。Zhang 等[30]观察到不同成熟期富士苹果在Vis-NIR波段也有类似的下降趋势。在Vis-NIR 波段范围内,480~675 nm 范围处,M1、M2 组与M3、M4 组果实光谱差异明显(图7c),因为发育前期阿森泰克的颜色差异大,而后期色泽差异不明显。其中480~605 nm区域的光谱受花青素含量的影响,不同成熟阶段积累的花青素水平存在差异,约675 nm 处的波谷与CH 基团的二级倍频有关,是苹果中叶绿素的吸收峰,980 nm 处为O-H 键拉伸带在水中的第二个泛音,与果实内部的水分变化相关[30]。在NIR 波段范围内,光谱反射率差异主要是成熟过程中阿森泰克的糖含量变化引起的。其中1180 nm 处的吸收峰(图7d),可能是碳水化合物中的C-H 的延伸[31]。在1450 和1950 nm 附近的强吸收峰,主要与C-H 拉伸的第二泛音、O-H 拉伸和弯曲振动有关[32]。2350 nm 附近的吸收峰与糖、有机酸的C-H 有关[33]。
图7 不同成熟度阿森泰克苹果的原始光谱图Vis-NIR(a)和NIR(b)以及平均光谱图Vis-NIR(c)和NIR(d)Fig.7 Original reflectance spectra Vis-NIR (a), NIR (b) and average spectra Vis-NIR (c), NIR (d) of Aztec apples at different maturity levels
分别对不同成熟度阿森泰克苹果Vis-NIR、NIR范围内的全光谱数据进行PCA 聚类分析,在Vis-NIR(400~1000 nm)波段下,PC1 和PC2 的累计贡献率为82.5%(图8a),不同成熟度阿森泰克苹果的光谱信息无法实现良好的聚类效果。图8b 和图8c 分别显示了Vis-NIR 波段下PC1 和PC2 的载荷图,430、515~580、680 和980 nm 波段对PC1 的贡献率最大,620、830 nm 波段对PC2 具有主要贡献,主要是与花青素、类胡萝卜素、叶绿素、水分子的吸收有关[30]。在NIR(900~2500 nm)范围内,PC1、PC2 的累计贡献率为89.3%,M1、M2 组苹果样品主要聚集在PC1的负半轴,M3、M4 组则主要分布在PC1 的正半轴,重叠更明显,且不易区分(图8d)。PC1 中1400、1840、1950~2060、2350 nm 波段的贡献较大(图8e),1130~1230、1475 nm 是PC2 的主要贡献波段(图8f),这些波段主要与水分、糖有关[33]。综上所述,基于各成熟度苹果的光谱信息,PCA 无法区分不同成熟度的阿森泰克苹果。
图8 不同成熟度阿森泰克苹果的光谱PCA 得分图Vis-NIR(a)和NIR(d)以及载荷图PC1(b、e)和PC2(c、f)Fig.8 PCA scores plots Vis-NIR (a), NIR (d) and loadings plots of PC1 (b, e) and PC2 (c, f) of the spectra of Aztec apples at different maturity levels
PCA 无法准确划分各个成熟度的阿森泰克苹果的界限,因此需要有监督模式识别方法。LDA 可提供更好的分类,有助于更好地理解特征数据的分布[34]。对Vis-NIR 波段下光谱信息进行LDA,第一判别因子(F1)、第二判别因子(F2)累计贡献率为90.0%。M1、M2 组苹果样品分布在F1 正半轴,M3、M4 组分布在F1 负半轴,尽管M3、M4 组仍存在少数重叠,但能够明显区分不同成熟度的阿森泰克苹果(图9a)。在Vis-NIR 范围内,F1 与680 nm 处的反射率呈负相关,与510~570 nm 呈现正相关(图9b)。F2与505 nm 附近的反射率呈正相关,与800~1000 nm呈负相关(图9c)。表明阿森泰克苹果在成熟过程中颜色以及水分含量的变化造成Vis-NIR 光谱反射率存在差异。在NIR 范围内,四个成熟度等级的阿森泰克苹果可以实现明显的区分(图9d)。F1 与935、1170~1270 nm 范围附近的反射率呈正相关(图9e),该区域的反射率可能与水分损失和糖含量有关[35]。F2 得分与1430 和1880 nm 附近的反射率呈正相关(图9f),其中1880 nm 可能与O-H 和NH 的组合有关,与2300 nm 附近的反射率呈负相关,对应糖或有机酸C-H 的组合[33]。
图9 不同成熟度阿森泰克苹果的光谱LDA 得分图Vis-NIR(a)和NIR(d)以及关联系数图F1(b、e)和F2(c、f)Fig.9 LDA scores plots Vis-NIR (a), NIR (d) and correlation coefficient plots of F1 (b, e) and F2 (c, f) of the spectra of Aztec apples at different maturity levels
综上所述,基于多成熟度光谱信息,LDA 可以区分不同成熟度的阿森泰克苹果,510~680、1170~1270、2300 nm 是主要贡献波段,为后续定量模型的建立提供依据。
分别在Vis-NIR(400~1000 nm)与NIR(900~2500 nm)波段范围下,经SNV 预处理全波段光谱后,构建了阿森泰克苹果理化指标(L*、a*、b*、FI、SSC、TA、MC 和DMC)的PLS 和SVM 预测模型。结果如表1 所示,除a*值,其余理化指标的PLS 模型的预测效果均好于SVM 模型。这表明不同成熟度阿森泰克苹果品质与光谱信息间存在大量的线性关联,更适合采用PLS 等线性算法进行预测。当预测的苹果成分与叶绿素变化无强相关性时,NIR 范围可以提供比Vis-NIR 范围更多的信息,而Vis-NIR 波段中化学成分键的相对强度较弱[36]。Ignat 等[36]采用NIR 技术预测苹果SSC、TA 和FI 获得更好的结果。本研究中也有相同结论,在NIR 范围内FI、SSC、TA、MC、DMC 的模型性能好于Vis-NIR 范围。
表1 基于Vis-NIR 和NIR 全波段预测阿森泰克苹果品质的PLS 和SVM 模型Table 1 PLS and SVM models for prediction of quality indexes of Aztec apples based on full wavebands in Vis-NIR and NIR
对于色泽(L*、a*、b*)的预测,基于Vis-NIR 范围开发的模型性能更佳。因为Vis-NIR 范围包括叶绿素、花青素等的吸收光谱。其中L*、b*值的PLS 模型性能略优于SVM 模型,其Rp2分别为0.94、0.92。a*值的最优模型为SVM,Rp2为0.96。L*、a*、b*值的模型预测结果很好,RPD 均大于3.00,具有很高的精度与稳健性。李磊[37]在400~1000 nm 范围内预测不同采收期富士苹果的L*值,PLS 模型Rp2为0.86。相比之下,本研究的模型精度更高,可能是由于阿森泰克苹果不套袋种植,颜色变化更大。FI 的PLS 模型Rp2为0.82,而Zhang 等[38]建立包含六个不同成熟阶段富士苹果的FI 预测模型,Rp2为0.86,高于本研究FI 的模型精度,考虑是其研究的成熟期范围更大,扩大样品的成熟度范围可以消除成熟度变化对硬度预测的影响。
SSC 的PLS 预测模型Rp2为0.91,RPD 为3.25。Guo 等[39]分别在Vis-NIR、NIR 波段下预测商业成熟的富士苹果SSC,发现NIR 范围能更好的预测SSC,Rp2为0.81,RPD 为2.27。对比之下本研究模型精度更高,这可以通过所有成熟度中SSC 具有更高变异性来解释,多成熟度模型具有较高预测精度。TA 的预测模型Rp2为0.85,RPD 为2.49。Mcglone等[40]构建含有成熟早期至晚期的皇家嘎拉苹果的TA 预测模型,Rp2为0.38,RPD 为1.54,精度显著低于本研究的模型,可能是数据集的TA 分布非常窄(标准差为0.08%),本研究TA 标准差为0.10%。MC 的最优模型为PLS,Rp2为0.82,相较于Abasi等[41]基于350~2500 nm 范围内光谱构建的PLS 模型(Rp2为0.60),本研究精度更高,这可能与所选择的光谱变量范围(900~2500 nm)有关,减少部分无关信息。DMC 的最优模型为PLS,Rp2分别为0.81,精度高于Zhang 等[42]通过NIR 波段建立的四个成熟度的蜜脆苹果的DMC 模型(Rp2为0.76),因为蜜脆苹果在成熟过程中DMC 的变化小,导致其预测模型精度较低。
为建立快速、准确的预测模型,使用SPA、CARS 和UVE 对Vis-NIR、NIR 波段范围进行特征波长提取,确定与阿森泰克苹果品质相关的特征波长,以提高模型性能,结果如表2 所示。与基于全波段光谱建立的L*、a*、b*、DMC、MC 的最优模型相比,SPA 挑选的特征波段所建立的预测模型效果得到提升。因为SPA 采用简单的投影运算来选择共线性最小的变量,能降低光谱信息维度,剔除冗余信息[18]。
表2 基于SPA、CARS、UVE 算法筛选的特征波段的阿森泰克苹果品质PLS 和SVM 模型Table 2 PLS and SVM models for quality indexes of Aztec apples based on feature bands from SPA, CARS and UVE algorithms
L*、b*值的最优模型为SPA-PLS 模型,Rp2分别为0.95、0.92;a*值的最优模型为SPA-SVM 模型,Rp2为0.97,L*、a*、b*的模型RPD 均大于3.00,表明模型可应用于不同成熟度阿森泰克苹果的色泽预测。由表3 所示,建立的L*、a*、b*值最优模型,筛选出的特征光谱变量主要位于400~680 nm 波段区域,这与2.5 中对Vis-NIR 光谱的LDA 结果一致,500~570 nm 和680 nm 等波段范围的贡献较大,在这些波段下不同成熟度阿森泰克苹果的光谱反射率差异较大。预测FI 时,使用全波长建立的模型效果最好,但模型的变量数过多,FI 的SPA-PLS 预测模型的Rp2为0.80,模型精度与全光谱相比略有降低,主要是由于经过SPA 算法挑选24 个变量,与全波段相比,变量减少90.36%,其中损失部分与硬度相关的有效信息,这可能是导致模型效果略差的原因。
表3 用于构建不同成熟度的阿森泰克苹果品质预测最优模型的特征波段Table 3 Characteristic bands for building optimal prediction models for the quality of Aztec apples at different maturity levels
SSC 的CARS-PLS 预测模型精度与全光谱模型接近,Rp2为0.91,RPD 为3.19,提取的波长数量更少,减少93.57%,模型运行速度更快。所挑选的特征波段主要分布在1450~1840 nm 和1950~2400 nm区域,这些波段与碳水化合物中的C-H 有关[33]。TA、MC 和DMC 的预测最优模型为SPA-PLS 模型,Rp2分别为0.81、0.82、0.83,RPD 均大于2.00,表明模型预测能力较好。SPA 算法挑选的MC 特征波段中970、1480、1930 nm 等与O-H 基团伸缩振动相关,是水的吸收峰[32]。DMC 特征波段与SSC 特征波段有部分处于重叠,如1004、2239、2429、2495 nm,说明干物质与苹果中的淀粉、糖分含量直接相关。
基于算法挑选的特征波段与2.5 中分析的阿森泰克苹果的光谱特征吻合较好,且SPA-PLS、SPASVM 模型能很好地预测不同成熟度阿森泰克的L*、b*、a*值,RPD 高于3.00,CARS-PLS 模型可以很好地预测SSC,RPD 为3.19,FI、TA、MC 和DMC 的最优预测模型SPA-PLS 的RPD 均大于2.00,表明模型具有一定的实际应用价值。
本研究首先通过PCA、LDA 探究了阿森泰克苹果在成熟过程中色泽(L*、a*、b*值)、FI、SSC、TA、MC、DMC 和可溶性糖的变化规律,基于Vis-NIR与NIR 光谱技术结合SPA、CARS、UVE 三种算法进行特征波段挑选,再基于PLS 和SVM 算法建立融合不同成熟度阿森泰克苹果的品质预测模型。结果表明,随着苹果不断成熟,阿森泰克的a*、SSC、DMC、可溶性糖增加,L*、b*、FI、TA、和MC 降低。其中SSC、a*、L*、b*对不同成熟度阿森泰克苹果的聚类贡献率较高,510~680、1170~1270、2300 nm 是相关度较高的特征波段。SPA-PLS、SPA-SVM 模型能很好地预测不同成熟度阿森泰克的L*、b*、a*值,RPD 分别为4.32、3.51、5.34,CARS-PLS 模型可以很好地预测SSC,RPD 为3.19,但FI、TA、MC、DMC的SPA-PLS 模型预测精度相对较低,RPD 分别为2.27、2.21、2.32、2.42。研究结果证明可见-近红外和近红外光谱方法能够预测不同成熟度的阿森泰克苹果品质,避免模型只适用于某种成熟度的阿森泰克苹果,为阿森泰克苹果采收管理与质量安全控制提供技术参考。
© The Author(s) 2024.This is an Open Access article distributed under the terms of the Creative Commons Attribution License (https://creativecommons.org/licenses/by-nc-nd/4.0/).