基于VMD-SVD-MSR模型的樱桃品质信息检测

2022-05-31 14:30王丽侠任丽棉
唐山学院学报 2022年3期
关键词:波段樱桃波长

张 湃,王丽侠,任丽棉

(唐山学院 智能与信息工程学院,河北 唐山 063000)

0 引言

可溶性固形物含量(Soluble Solids Content,SSC)又称为糖度,是评价水果内部品质的关键指标;同时含水率也是评价果蔬品质的重要指标之一,通过检测含水率能够判别果实的新鲜程度以及贮存时间等。近红外光谱技术具有无损检测、耗时短、易操作等特点,近年来被广泛应用于果蔬内部品质检测[1-3]。马本学等[4]在西甜瓜内部品质无损检测中,利用深度学习进行光谱信息解析、建立多特征信息融合的综合评价模型。宋雪健等[5]基于近红外光谱技术对草莓品质进行快速检测研究,其校正集RMSECV为0.713,R2为95.07%,验证集RMSEP为0.037 9,R2为98.75%。罗枫等[6]利用近红外光谱建立樱桃果实脆度校正模型,用于检测冷藏过程中樱桃品质的变化。高升等[7]利用近红外光谱测量红提糖度和含水率,利用无信息变量消除法(UVE)、竞争性自适应重加权算法(CARS)以及联合连续投影算法(SPA)筛选光谱的特征波长,再基于最小二乘支持向量机(LSSVM)建立全局预测模型,经实验证明,该模型的预测集相关系数分别为0.969,0.942。王文霞等[8]通过遗传算法(GA)和优化极限学习机(ELM)建立GA-ELM模型给高光谱数据降维,并结合变量优选和模型来测量干制哈密大枣水分,证明了该模型的有效性,预测结果Rc和Rp分别为0.984 2和0.967 5,RMSECV和RMSEP分别为0.006 1和0.007 9,RPD为3.678 8。

樱桃是一种营养价值高、具有一定保健功效的水果,果实含水量较高且色彩红润、口感脆嫩。现有文献关于樱桃含水率检测的研究较少,SSC检测也多采用传统方法。目前,樱桃含水率检测多采用烘干法,过程较繁琐;SSC检测的传统方法是将樱桃果实挤出汁水,再利用折射法进行测定。另外,现有检测方法大多只能进行抽样检测并需要分别测定,要实现多指标检测就需要建立多个模型,增加了数据处理的复杂性。因此,开发准确、无损、快速的在线检测技术,建立多指标检测模型已成为提高在线检测效率的实际需要。

以上研究证明了应用光谱方法对果蔬的糖度和含水率进行检测是可行的。当前,国内外光谱检测研究中罕有对樱桃品质的在线检测。本文因此以山海关樱桃为样本提出一种樱桃近红外光谱在线检测模型并以山海关樱桃样品为研究对象。考虑到利用变量特征波长选择方法可有效降低光谱数据的冗余,提高模型的预测精度,首先基于变分模式分解(Variational Mode Decomposition,VMD)[9]对近红外反射光谱进行多模态分解,并得到各个固有模态(Intrinsic Mode Function,IMF)层,通过对比各层与SSC以及含水率之间的相关系数大小确定最佳变量特征提取的IMF层;然后采用SiPLS[10]波长筛选方法提取最佳波段,并通过奇异值分解(Singular Value Decomposition,SVD)[11]求得奇异熵,建立多元逐步回归(Multiple Stepwise Regression,MSR)预测模型[12],该模型简称为VMD-SVD-MSR模型。通过该模型可对樱桃的SSC和含水率进行预测,从而实现对樱桃内部品质进行在线快速、无损检测。

1 理论与算法

1.1 变分模式分解

VMD是一种自适应的时频域分析方法,相比于传统经验模态分解(Empirical Mode Decomposi tion,EMD)理论,该算法能够有效克服模态混叠、虚假分量和端点效应等问题。每个IMF层都被认为具有不同的中心频率和有限的带宽。通过交替方向乘子法(Alternate Direction Methodof Multipliers,ADMM)对每个模态及其中心频率进行连续更新,从而使每个IMF层的估计带宽的总和最小化,并以这种方式对各个模态进行解调,得到相应的基频带,实现信号从低频到高频的分解。

(1)

式中,δ(t)为狄利克来函数,uk(t)为IMF函数,k是第k个模式,j是第j个分量,t是时间。

(2)

式中,ωk为IMF层的中心频率。

(3)

式中,∂t表示相对于t的梯度。

针对式(3),引入二次惩罚函数项α和拉格朗日算子λ,将其从约束方程等价为无约束方程进行求解,如式(4)所示:

L({uk},{ωk},λ)=

(4)

采用ADMM算法进行迭代,最终获得各个IMF分量。

1.2 奇异值分解与奇异熵

由于光谱数据量大,因此经由VMD分解后,各个IMF分量仍存在大量冗余和共线信息,导致计算量大和模型复杂,不利于在线检测。鉴于此,引入SVD算法筛选最优变量,以降低数据的共线性和冗余,使构建的模型简化。

通过SVD对数据进行分解得到实数矩阵A∈R(m×n),该矩阵能够被进一步分解为三个矩阵的乘积,即

A=USVT。

(5)

式中,U为单位正交列矩阵;V为单位正交行矩阵;S为对角矩阵,S=[diag(σ1,σ2,…,σm),O],O为零矩阵。

奇异熵用来衡量信号经SVD分解后得到的各信号分量信息量的大小。奇异熵Ek的求解如式(6)所示:

(6)

式中,i为奇异熵所对应的阶次,ΔEi为奇异熵在i阶次时获得的增量,其计算公式为:

(7)

1.3 VMD-SVD变量特征提取步骤

由VMD和SVD联合构建VMD-SVD模型,用于樱桃光谱的信息分析与特征参量反演等。其光谱特征信息提取步骤如下。

(1)VMD分解。对原始樱桃光谱数据进行VMD分解,得到若干IMF层分量。

(2)分量筛选。求解各IMF层分量与SSC及含水率之间的相关系数,通过对比选择能够较好保留原始输入光谱信息的IMF层分量。

(3)特征波段选择。利用SiPLS算法将步骤(2)得到的IMF层分量平均分为几个子间隔,通过所有排列组合建立PLSR模型,根据最低的交叉验证均方差(Root Mean Square Error of Cross-Validation,RMSECV)建立最佳的SiPLS模型,筛选得到相关变量波段作为特征波段进行下一步的处理。

(4)SVD分解。构造特征波段的二维时频矩阵,进行SVD分解,得到奇异值矩阵,并计算对应的奇异熵,作为表征樱桃SSC和含水率的光谱信息分量。

2 实验

2.1 材料

本研究是以山海关产的砂蜜豆樱桃为对象,选择果形匀称、无损伤、无虫害的樱桃共200颗作为样本。单颗果实直径范围在15 ~20 mm,质量范围在10~15 g。将樱桃表面擦拭干净并编号,置于实验室(室温25 ℃)6 h,使样本温度和环境温度达到一致。对同一样本不同区域进行3次近红外光谱采集,取平均值作为样本光谱。利用SPXY将200颗樱桃样本分为140个校正集和60个预测集,用于建模分析。

2.2 仪器设备

实验装置由计算机、光谱仪(Nirquest512,美国海洋)、光源(卤钨灯,30 W,12 V)漫反射光纤、支架等组成。近红外光谱范围为900~1 700 nm,分辨率为3.1 nm。设置积分时间为20 ms,扫描次数为10次。

2.3 实验方法

2.3.1 样本采集

将樱桃单个果实放置于载物台上进行近红外漫反射光谱采集,重复取样并测量3次,取平均值作为原始光谱数据,如图1所示。

图1 樱桃样品的漫反射原始光谱

2.3.2 樱桃SSC和含水率测定方法

样本制备:用小刀从采集完光谱的樱桃样本上切下大约3 g果肉,进行含水率测定;再将剩余的樱桃样本压成汁,用玻璃棒搅拌均匀,立即测定SSC。SSC测定参照NY/T2637-2014《水果、蔬菜制品可溶性固形物含量的测定——折射仪法》进行,含水率的测定依照GB5009.3-2016《食品中含水率的测定》进行。取清洁的铝盒,按国标规定,加热干燥后的铝盒质量为m3,加入樱桃果肉剪切样品,铝盒与样品总重为m1。随后放入电热鼓风干燥箱进行加热,温度设定为105 ℃,得到烘干后样品加铝盒的重量为m2。样品含水率按式(8)计算:

(8)

式中,X为樱桃试样含水率,%。

2.4 变量优选方法

为了降低樱桃光谱数据的共线性和冗余,分别选取本文提出的VMD-SVD算法、SPA算法、CARS算法进行变量筛选。SPA算法是一种前向选择算法,当校正模型的交叉验证均方根误差RMSECV最低时,相应的波长变量集为筛选出的共线性最小的最佳特征波长变量集。CARS算法借助自适应重加权采样技术(Adaptive Reweighted Sampling,APS)、指数衰减函数(Exponentially Decreasing Function,EDP)和十折交互检验确定最优变量子集,可筛选出对樱桃属性较敏感的波长变量,并可以解决变量筛选时的组合爆炸问题。

2.5 建模分析方法与精度评价

分别基于原始光谱和进行变量筛选后的光谱信息建立樱桃SSC和含水率检测的多元逐步回归(MSR)模型。MSR是针对逐步回归模型的改进算法,该算法能够建立多个自变量与因变量之间的关系模型。MSR模型适用于光谱变量数少于理化值数的情况。

回归模型建立后,采用预测集的决定系数R、均方根误差(Root Mean Square Error,RMSE)和相对分析误差(Residual Predictive Deviation,RPD)来对樱桃SSC和含水率的预测模型进行评价。当决定系数R越接近1、均方根误差RMSE越小时,表明模型预测效果越好。

3 结果与讨论

3.1 VMD处理结果与分析

采用VMD对樱桃平均光谱曲线进行分解,得到9个IMF层分量,用h取1-9表征对应的1-9 IMF层分量,如图2所示。

图2 VMD 1-9层分解光谱

从图2中可观察到,IMF1-IMF5能量较大,可认为其携带主要光谱信息,IMF6-IMF9能量较小,且变化剧烈,因此考虑其噪声分量较多。根据模极大值理论,随着分解次数增大,光谱噪声越来越强。为确定各个分量对光谱特征信息提取的贡献率,对IMF1-IMF9与SSC及含水率的相关性进行分析,如表1所示。

表1 SSC及含水率与各IMF层特征光谱相关分析

表1中相关性均通过0.01(阈值为±0.507)的显著性检验。以SSC为例,其中IMF1与SSC之间有89个波段通过显著性检验,IMF1-IMF4所对应的显著波段数呈递增趋势,在IMF4时其波段数量为281个,达到最大,当进行到IMF4时相关系数为0.614,达到最大正相关,从IMF5开始,显著波段数逐渐递减。由于IMF4在有效去除噪声的同时能够最大程度保留原光谱信息,因此选择IMF4分量作为特征提取层并进行后续分析。

3.2 VMD-SVD特征提取算法

为进一步剔除IMF4分量中与SSC及含水率无关的光谱信息,分别采用区间偏最小二乘法(iPLS)、组合区间偏最小二乘法(SiPLS)和移动窗口偏最小二乘法(MWPLS)建立模型并进行光谱特征波段选择,结果如表2所示。

三个模型中SiPLS预测结果最优:在SSC上,Rc和Rp分别为0.851和0.844;在含水率上,Rc和Rp分别为0.832和0.791。因此选定该模型对900~1 700 nm特征波段进行选择。通过对SSC及含水率的6个特征波段对应的IMF4分量分别构造时频域矩阵,并对该矩阵进行SVD分解,构建VMD-SVD模型,最后求取模型的奇异熵并用于分析监测效果。各特征波段对应的奇异熵与樱桃SSC及含水率的关系见表3。

表2 iPLS,SiPLS和MWPLS模型预测结果比较

表3 特征波段的奇异熵与樱桃SSC及含水率的相关关系

由表3可见,通过特征波段1 200~1 389 nm和1 401~1 509 nm计算求得的奇异熵与樱桃SSC及含水率的相关系数分别为0.933和0.927,说明经过VMD分解后的1 200~1 389 nm和1 401~1 509 nm波段对应的IMF4分量均对樱桃SSC和含水率较为敏感。选取相关系数最大的特征波段计算得到的奇异熵分别与樱桃SSC及含水率进行拟合。

3.3 变量筛选对比算法

3.3.1 SPA特征波长提取算法

为了验证VMD-SVD模型在变量波长选择方面的优越性,基于原始光谱分别采用SPA算法和CARS算法筛选最优变量并建立回归模型。首先建立SPA算法的SSC模型,得出22个特征波长作为SPA光谱的输入信息,再以含水率作为输出信息,得出12个特征波长。这12个特征波长可同时反映樱桃SSC和含水率的信息。CARS算法特征波长选择方法操作过程同上。

采用SPA算法提取特征波长,如图3所示。初始设定提取波长变量范围为5~30 nm,提取步长为1。由图3(a)可知,RMSECV值最小时为0.092 5,对应模型中变量的个数为12个,即经SPA算法提取的最优波长点有12个,优选出的波长点的位置在图3(b)的原始光谱索引图中显示,所选波长变量占总波长的1.5%。

3.3.2 CARS特征波长提取算法

利用CARS提取特征波长,设定蒙特卡罗采样为50次,采用5折交叉验证法。由图4可知,当RMSECV值达到最小时,各变量的回归系数位于图4(c)中竖直线位置,设置采样次数为30次。

3.4 模型建立与结果比较

分别利用SPA,CARS和本文提出的VMD-SVD算法进行光谱数据的变量筛选,将分别提取的特征波长与原始光谱信息作为输入量,建立MSR模型,获取樱桃SSC和含水率预测结果。计算每种模型在预测集中SSC和含水率的估算值,结果如表4所示。可以看出,对于樱桃SSC和含水率,VMD-SVD-MSR模型的预测性能都达到最优。其中对于SSC预测,决定系数Rc和Rp分别为0.951和0.925,RMSECV和RMSEP分别为0.069和0.098;对于含水率的预测,决定系数Rc和Rp分别为0.943和0.919,RMSECV和RMSEP分别为0.077和0.102。

(a) (b)图3 SPA特征波长提取图

(a) (b) (c)图4 CARS特征波长提取图

表4 SSC和含水率模型预测结果

4 结论

本文基于VMD和SVD理论提出了VMD-SVD-MSR模型,用于预测樱桃近红外光谱的SSC和含水率。研究结果表明,经VMD得到的固有模态IMF能有效避免模态混叠现象。其中IMF4在有效去除噪声的同时能够最大程度保留原光谱信息;引入SiPLS进行波段选择后,再利用SVD得到奇异熵,在1 200~1 389 nm和1 401~1 509 nm两波段求得的奇异熵与樱桃SSC及含水率的相关系数分别为0.933和0.927,说明这两个波段均对樱桃SSC和含水率较为敏感,选取相关系数最大的特征波段计算得到的奇异熵作为参数,建立MSR模型,分别与樱桃SSC和含水率进行拟合。通过与原始光谱、SPA和CARS特征波长提取算法的预测结果比较,验证了本文VMD-SVD-MSR模型在预测樱桃品质信息方面具有一定的优越性和较好的解释能力,为樱桃品质在线检测提供了一种有效的手段。

猜你喜欢
波段樱桃波长
最佳波段组合的典型地物信息提取
樱桃肉,让年味飘香
一树樱桃带雨红
基于PLL的Ku波段频率源设计与测试
小型化Ka波段65W脉冲功放模块
吃不到的樱桃
基于频域分析方法的轨道高低不平顺敏感波长的研究
日本研发出可完全覆盖可见光波长的LED光源
日常维护对L 波段雷达的重要性
RP—HPLC波长切换法同时测定坤泰胶囊中6个成分的含量