薛书凝,殷 勇,于慧春,袁云霞,马帅帅
河南科技大学食品与生物工程学院,河南 洛阳 471023
香蕉是重要的水果作物,由于香蕉口味极佳,富含维生素等各种营养物质,具有抗氧化性,以及对预防疾病和维持人体健康有巨大的益处,因此在人类饮食中占据特殊地位[1]。 而香蕉作为呼吸跃变型水果,贮藏过程中腐败现象相当严重,造成相当大的浪费。 所以,在香蕉贮藏过程中建立一个行之有效的腐败预警模型对降低香蕉在贮藏中的浪费具有非常重要的现实意义。
高光谱成像技术以其无损、快速、分辨率高而著称,不仅能够获取研究对象内部成分与结构的光谱信息,还能获取其外部形状、表面缺陷的图像信息。 现在,高光谱技术已经在精准农业[2]、医学诊断[3]、军事防御[4]、农产品品质评价[5]及食品质量控制[6]等方面得到广泛使用。 但是,香蕉的高光谱研究主要集中在冷害、成熟度及腐败进程研究,在腐败预警方面研究尚少,并没有建立一个有效的预警体系和腐败标准以实时监控腐败进程。 因此,拟通过对不同贮藏期的香蕉样本进行高光谱信息采集,获取样本的光谱信息,在有效确定腐败基准光谱信息表征向量的前提下尝试运用马氏距离构建香蕉贮藏期间可有效实现腐败预警的判别模型,以便为降低香蕉贮藏过程中因腐败而造成经济损失提供一种预警手段。
新鲜香蕉品种为广东香蕉1号,于2019年4月8日购于当地超市,总重量为600斤。 考虑到贮藏条件仅起到加快或延迟香蕉的品质变化过程,而不影响某一品质等级下的样本光谱信息。 因此,为减少贮藏时间和试验时间,将新鲜香蕉置于贮藏库中常温存放,并对贮藏库的温湿度进行实时监控,温度变化范围为20.07~24.07 ℃、相对湿度变化范围为90.36%~93.55%,每天采集香蕉的光谱信息和色差指标。 其中随机选取10根香蕉进行光谱信息采集,而色差信息是对固定的6根香蕉进行采集的。 根据实际贮藏过程中的感官情况,约在贮藏的第6天开始腐败,但为了确保腐败基准界定时分析数据的完整覆盖性,共采集了8 d的贮藏数据。
高光谱图像采集系统由高光谱成像仪(IST50-3810型,德国Inno-Spec公司,光谱分辨率为2.8 nm)、4个500 W的光纤卤素灯(RK90000420108型,德国Esylux公司)、传送装置以及控制机(自制)构成。 光谱采样范围为371.05~1 023.82 nm,采样间隔为0.51 nm,共采集1 288个波段的光谱信息。
每天从贮藏库中随机选取10根香蕉,从每根香蕉的中部切取薄厚均匀的五片香蕉样本,共计50个样本。 每次试验将一个样本平铺于洁净的培养皿中,将培养皿放置于传送带上进行高光谱数据采集。 采集的参数设置为: 传送带传送速度为1.20 mm·s-1,CCD相机的曝光时间为90 ms,物距为350 mm。
为了更好地避免或减少相机暗电流和光源亮度分布不均匀对试验结果产生的影响,在试验前先对标准白板和全黑图像进行采集,后对采集到的高光谱数据进行黑白板校正[7]。 黑白校正方法为
(1)
式(1)中:R为校正后的高光谱图像;R0为高光谱原始图像;Rw为标准白板标定图像;Rb为全黑标定图像。
能够表征香蕉腐败的指标众多,但色差是香蕉在贮藏过程中反映表皮颜色变化的最直观的指标,能够表征颜色感官差异性,是一种模拟人类眼睛感受颜色变化的指标,但同时以具体数据来反映颜色变化,比人感官评价更准确、具体。 所以,采用了色差作为香蕉腐败进程的理化表征指标。
使用Xrite color i5型色差计测量香蕉表面颜色变化。 色差计在使用前需用标准的白阱和黑阱进行校正。 颜色测定是在固定的6根香蕉的中段位置进行,每个样本均重复3次测量,取平均值作为该样本的色差值,并用亮度L*(从黑到白)、红度a*(从绿到红)、蓝度b*(从蓝到黄)三个基本指标评价香蕉颜色[8]。 根据测定的这三个色差指标可以通过式(2)计算出总色差ΔE[9]。 ΔE作为反映香蕉表面颜色变化的综合指标,可以用于反映香蕉贮藏过程中总体颜色变化。
(2)
样本的高光谱信息提取主要借助ENVI Classic软件。 首先选取样本图像中的感兴趣区域(region of interest, ROI)[10]。 因样本形状不规则,所以根据样本与背景间的光谱差异,将样本从背景中提取出来,如图1所示的红色区域即为所分离出来的感兴趣区域,并提取出该区域的平均光谱曲线。 由于在扫描初始阶段和末尾阶段存在着较大的噪声影响,可应用ENVI软件动态显示各波段图像,分辨出包含信息量较多的波段,除去信噪比较低的371.05~482.60和880.99~1 023.82 nm两个波段,选取483.11~880.49 nm为分析波段(含781个波段)。 虽除去了信噪比较低的波段,但提取的光谱值仍受电流、光线等外界环境的影响而产生不同程度的噪声干扰,故采用Savitzky-Golary卷积平滑法[11](SG平滑)对获取的光谱进行平滑降噪处理,减少噪声的干扰。
图1 香蕉样本图像感兴趣区域的提取Fig.1 Extraction of interest region from banana sample image
为了减少冗余信息,简化计算,将降噪后的高光谱数据进行特征波长的选取。 为此,提出一种基于Wilks Λ统计量的权重系数高光谱特征波长提取方法进行特征波长的选取。 由于Wilks Λ统计量要求变量之间应相互独立[12],所以,首先用主成分分析法(principal component analysis, PCA)对降噪后的高光谱数据进行分析,得到能够包含所有波长下光谱信息的主成分变量。 对获取的主成分数据构建Wilks Λ统计量[13],并用公式(3)得到每个主成分数据下的Wilks Λ值。 Wilks Λ值是表征类别间(同一贮藏日的样本归为1类)差异性的统计量,其值越小说明类别间的差异性越显著。 对各个主成分的Wilks Λ值进行升序排列,选出Wilks Λ值最小的主成分。 将该主成分对应各波长下的权重系数计算出来,画出权重系数图,从而获取能够表征整体光谱信息的特征波长。 值得强调的是,该方法不需要理化指标为依据,仅借助光谱信息进行特征波长提取,使所获得的特征波长不受理化指标的改变而变化,提高了选取结果的鲁棒性。
(3)
式(3)中:D为原始数据经PCA后得到的主成分矩阵中每一列的组内离差阵,T为原始数据经PCA后得到的主成分矩阵中每一列的总离差。
1.6.1 基于色差变化的确定方法
香蕉在贮藏期内品质不断地发生着变化,尤其是表皮颜色变化最为明显,在实验过程中仅肉眼感官即可观测到随着贮藏时间的延长,香蕉表皮逐渐由亮黄色过渡为暗黄色,后逐渐发生褐变,出现褐色斑点,最终整体变为黑褐色。 所以,根据实际贮藏过程中的感官情况,初步确定了腐败基准点为第6个贮藏日,并在第6个贮藏日之后再采集两天的贮藏数据,以确保分析数据的完整覆盖性。 因此,在样本色差与光谱数据采集试验中,共进行了8 d的贮藏试验样本的采集。
根据不同贮藏时间样本的L*,a*,b*值数据,通过式(2)计算反映总体颜色变化的总色差ΔE。 分析样本L*,a*,b*,ΔE值随贮藏时间变化的折线图,根据各指标的变化趋势,找到数据异常点(驻点、拐点等)所在位置,结合感官情况初步确定腐败基准点。
1.6.2 基于高光谱信息的确定方法
为了进一步说明由感官及色差变化所确定的腐败基准的合理性,应用光谱数据作进一步解释。 即在选取特征波长的前提下,作出不同贮藏时间下样本平均光谱反射值曲线,并对曲线最低点与色差数据进行对应分析,进一步确定了腐败基准。
马氏距离[14](Mahalanobis distance, MD)可被认为是计算两个样本之间相似度的一种距离度量,不仅消除了变量之间的相关性干扰还不受量纲的影响。 香蕉在贮藏过程中腐败预警模型主要体现在确定腐败基准的前提下,应用马氏距离方法计算不同贮藏时间的样本与腐败基准之间的距离来表达。 若距基准的距离值越小则说明香蕉越接近腐败。 马氏距离计算公式如式(4)
(4)
实际上,在马氏距离模型构建过程中,最为核心的内容是腐败基准向量的构造和与腐败基准对应的协方差矩阵的确定。 一旦它们被确定,贮藏过程中某个贮藏日到腐败基准的马氏距离即可算出。
图2给出了原始光谱和SG平滑处理后的光谱对比图。 对比发现,原始光谱曲线受噪声干扰,存在许多毛刺,经过SG处理过后的光谱曲线明显平滑了许多,已有效的减少了光谱数据的噪声干扰,为后面预警模型的构建奠定了基础。
图2 香蕉光谱图(a): 香蕉原始光谱图; (b): SG平滑处理后香蕉光谱图Fig.2 The spectra of banana(a): Original spectra; (b): Spectra after SG smoothing
由图2(b)可知,在483.11~559.98 nm波段下,光谱光滑且变化趋势明显,包含了丰富的样本信息,更能反映样本信息的差异性。 而在560.49~880.49 nm波段下,光谱变化平缓且有较大波动,说明该波段反映的光谱信息类同,且存在较大的波动误差,不利于后续数据分析。 为减少波动影响,仅将483.11~559.98 nm波段(151个波长)用作后续分析。
将经过SG平滑处理后的483.11~559.98 nm波段光谱信息经PCA处理,得到各个主成分数据后,运用式(3)计算各主成分变量下的Wilks Λ统计量值,选出Wilks Λ值最小的主成分变量为第3主成分(the 3rd PC),并绘出主成分3的权重系数图,如图3所示。
图3 主成分3的权重系数图Fig.3 The weight coefficients diagram of the 3rd PC
图3给出了主成分3在每个波长(151个波长)下对应的权重系数值变化图,而权重系数的绝对值越大则表明该波长拥有能表征类别间(与不同贮藏日期的光谱信息对应)差异性的信息越多,越有利于判别贮藏过程中香蕉的质量变化情况。 将权重系数图中的波峰、波谷所对应的波长提取出来即为该法提取出的特征波长。 共提取出494.90,499.00,507.71,514.88,522.06,530.77,538.46,550.76和558.95 nm,9个特征波长。
2.3.1 基于色差指标的腐败基准确定
为直观地反映在贮藏期间样本的颜色变化,图4给出样本L*,a*,b*,ΔE值随贮藏时间变化的折线图。
图4 香蕉色差参数变化曲线Fig.4 The variation curve of banana color difference parameters
由图4(b)可知,在贮藏期间香蕉的a*呈上升趋势,但在贮藏的第6天出现最大值,贮藏后期a*基本稳定在8.5左右。 由图4(a)和(c)可以看出在贮藏期间香蕉的L*和b*呈下降趋势,且贮藏第1~5天是呈上切线下降趋势,而在贮藏第6天及以后出现明显的下切线下降趋势,颜色变化出现了拐点。 由图4(d)可以看出,ΔE在贮藏第1~5天是呈下切线趋势上升,而在贮藏第6天及以后出现明显的上切线上升趋势,说明在贮藏的第6天香蕉表皮颜色变化发生了明显的转折。 所以,可初步确定贮藏第6天为腐败基准点。
2.3.2 基于高光谱信息的腐败基准确定
分析各个特征波长(9个波长)下不同贮藏时间样本的平均光谱反射值曲线图,以494.90和550.76 nm为例进行分析。 图5(a)和(b)分别给出494.90和550.76 nm波长下不同贮藏时间样本的平均光谱反射值曲线图。
由图5(a)和(b)可知,平均光谱反射值在贮藏前期呈整体下降趋势,但在贮藏第二天有一个明显的突降,是因为香蕉在入库前并没有进行挑选,且在搬运过程中有磕碰,存在着部分样本损伤现象,导致光谱值存在波动。 而第三天上升是因为香蕉存在着后熟现象,在前两天香蕉因没有完全成熟,表皮颜色还可观察到些许绿色,所以光谱值偏低,在贮藏第三天因为香蕉完全成熟,光谱值出现上升,在贮藏第三天以后,香蕉开始腐败,光谱反射值开始依次下降。 但对比图5(a)和(b)发现,在不同波长下光谱反射值均在贮藏第6天达到最小值,与色差指标分析结果一致,这就进一步确定了腐败基准点即为第6个贮藏日。
由2.3确定腐败基准日为第6个贮藏日,共提取9个特征波长。 由于大样本更能体现统计特征以及反映整体质量属性,且所表征的结果可靠性高。 所以,采用腐败基准日50个样本特征波长下光谱值的平均值作为腐败基准的表征向量。 那么基于腐败基准的特征光谱信息表征向量y和对应的协方差矩阵S可分别给出如下
图5 494.90 nm (a)和550.76 nm (b)波长下香蕉的平均光谱反射值曲线Fig.5 Average spectral reflectance curves of banana at 494.90 nm (a) and 550.76 nm (b) wavelengths
分别计算不同贮藏日下50个样本至腐败基准的马氏距离值,这些值可视为统计意义上的“期望值”。 为直观的反映出随贮藏时间的延长样本的腐败进程,图6给出了这些期望值的变化曲线图。
图6 不同贮藏时间下50个样本与的马氏距离折线图
由图6可以看出,随着贮藏时间的延长,样本与腐败基准的距离越来越接近,说明香蕉也越接近腐败。 而第2个贮藏日至基准的马氏距离有点降低,正是上面所指出的该日样本有损伤的体现,这反而更能充分地说明MD模型计算结果的精准性。 所以,应用光谱信息构建马氏距离腐败预警模型对香蕉贮藏期间的腐败进行预警是可行的。
考虑到实际应用中一般仅测试3~5个平行样本来表征结果,所以,从每天采集的50个样本中随机选取5个平行样本,计算不同贮藏时间下5个平行样本至腐败基准的马氏距离值。 图7(a)和(b)分别给出两次随机选取的计算结果。
图7 不同贮藏时间5个平行样本的马氏距离折线图Fig.7 The Mahalanobis distance curve of 5 parallelsamples with different storage time
由图7可知,两次随机选取的不同贮藏时间5个平行样本至腐败基准的距离变化趋势与“期望值”结果相一致,这充分说明了基准的确定以及对应给出的表征向量和协方差矩阵是合理的与可靠的。 上述结果有力地揭示了应用马氏距离对香蕉贮藏过程进行腐败预警是可行的,也是有效的。
通过对不同贮藏时间香蕉样本高光谱数据的采集,采用SG平滑处理,经基于Wilk Λ统计量的权重系数法提取出了9个特征波长。 根据色差变化和高光谱平均光谱值变化确定了腐败基准,构建了基于特征光谱信息的样本与腐败基准的马氏距离预警模型。 结果表明,提出的基于Wilk Λ统计量的权重系数高光谱特征波长提取方法提高了特征波长提取的鲁棒性,有效除去了冗余信息,简化了运算。 通过分析香蕉样本的色差指标随贮藏时间的变化趋势,初步确定了腐败基准为第6个贮藏日; 通过分析了特征光谱数据下不同贮藏时间样本平均光谱反射值曲线,发现曲线在贮藏第6天存在最低点,进一步证明了腐败基准选取的正确性。 同时,运用马氏距离构建的香蕉腐败预警判别模型能够较好的反映贮藏期间香蕉接近腐败的程度。 因此,给出的腐败基准确定方法及用马氏距离构建的香蕉腐败预警模型对于香蕉贮藏过程中的腐败预警是有效的,为其他样品的腐败预警方法研究提供了参考。