莲子含水率近红外光谱检测模型构建

2021-10-13 11:17崔蕴涵许金钗方智毅叶大鹏翁海勇
食品研究与开发 2021年18期
关键词:决定系数方根莲子

崔蕴涵,许金钗,方智毅,叶大鹏,翁海勇*

(1.福建农林大学机电工程学院,福建 福州 350002;2.现代农业装备福建省高校工程研究中心,福建 福州 350002)

莲子富含蛋白质、脂肪、维生素、矿质元素、氨基酸等基本营养成分,被视为一种营养很高的天然食品[1]。在莲子加工过程中,含水率是衡量其品质的关键指标之一。莲子的含水率检测目前主要是采用传统的热风烘干法,耗时长,结果滞后,在莲子烘干过程中无法达到实时检测的目的。

近红外光谱技术因操作简单、速度快、成本低且无需前处理,在食品质量快速检测中有广泛的应用前景[2-4]。刘洁等[5]探究了近红外光谱技术应用于板栗含水率无损检测的可能性,结果表明,栗仁的建模效果较好,栗壳表面的物理特性会对光谱信噪比造成一定影响。鞠兴荣等[6]借助近红外光谱技术建立了稻谷含水率偏最小二乘(partial least square,PLS)分析模型,验证集决定系数高达0.980 6。Guzmán等[7]发现近红外视觉系统可用于橄榄离线检测和在线分选,可以快速区分不符合最低质量要求的产品。彭云发等[8]采集了南疆红枣近红外光谱数据并建立了PLS模型,结果表明,预测值平均偏差为0.41%,实现了南疆红枣水分的快速检测。陈琳等[9]利用多种方法分别构建红茶含水率预测模型。结果表明,利用联合区间偏最小二乘法构建的含水率预测模型效果更优,其预测集的相关系数和均方根误差分别为0.959 3和0.039 5,模型预测精度高。Arslan等[10]采用近红外光谱法对黑枸杞中总黄酮、花青素等化学成分进行了定量分析,结果表明,近红外光谱法可用于黑枸杞化学成分检测。于旭峰等[11]提出了运用近红外光谱技术检测新鲜马铃薯叶片的含水率,验证了特征波段结合人工神经网络建立的模型准确度较高,并能极大提高预测效率。除此之外,近红外光谱技术还应用于核桃[12]、生姜[13]和血橙[14]等农产品的无损检测。随着国内外对便携式近红外光谱仪器的不断研发,弥补了台式近红外光谱仪不可携带的缺点,实现了便携、实时检测的目的[15]。张珮等[16]阐述了便携式近红外光谱仪在果蔬品质定性和营养指标定量等方面的进展。刘亚超等[17]提出了一种基于便携式近红外光谱仪的试验方法,主要用于大米品质参数的检测。李晓云等[18]借助近红外光谱的无损检测技术,对牛奶中各种营养成分含量进行了检测。Zhu等[19]用便携式近红外光谱仪和漫射透射光谱法测定富士苹果的糖含量和硬度,效果理想。可见借助便携式近红外光谱仪可实现对农产品品质的快速无损检测,但是关于应用该技术在莲子干燥过程中含水率的快速检测报道较少。

因此,本文利用便携式近红外光谱仪获取莲子干燥过程不同时刻的光谱反射率,建立莲子含水率快速检测模型,并对比分析不同光谱数据处理方法对模型预测性能的影响。研究结果可以为莲子含水率的快速检测提供理论依据和技术支持。

1 材料与方法

1.1 试验材料

成熟莲子(广昌莲子和武夷山莲子):分别采摘自江西广昌和福建武夷山,根据相似的外观(大小和外壳颜色)各选择100个莲子样品,如图1所示。所有样品均于2019年采收,置于(4.0±0.5)℃的冷藏室进行存储备用。在每次干燥试验前,将莲子果皮、种皮、莲心去除,并用蒸馏水冲洗干净后用于后期试验数据的采集。

图1 武夷山莲子和广昌莲子代表性样本Fig.1 Representative lotus seeds of Wuyishan and Guangchang

1.2 仪器与设备

NIRez-G1便携式近红外光谱仪:五铃光学股份有限公司;DHG-9053A电热恒温鼓风干燥箱:上海精宏实验设备有限公司;JA5003B电子天平:上海精科天美科学仪器有限公司。

1.3 试验方法

1.3.1 样品的制备

为了得到不同含水率的莲子样品,本试验选择了0、4、8 min和12 min 4个干燥时间的莲子用于光谱数据的采集。在莲子干燥过程中,通过称重法进行含水率测定,每隔4 min通过电子天平测定莲子质量并计算干燥后莲子含水率,具体的计算方法如式(1)所示。

式中:Mt为干燥过程中t时刻莲子的干基含水率,%;mt为干燥过程中 t时刻莲子的质量,g;m0为莲子的干基质量,g。

1.3.2 莲子光谱数据采集

本试验设定采集波段为950 nm~1 650 nm,分辨率10 nm,曝光时间1.27 ms,设置扫描的平均次数为3次,其平均光谱用于近红外光谱分析。光谱数据采集系统ISUZU_NIRez2_eng_3软件控制,通过USB电缆连接计算机和近红外光谱仪。试验前开启便携式近红外光谱仪进行预热,至少20 min后开始测量,以保证获得稳定的读数。在莲子样品的光谱数据采集前,首先获取参考板(聚四氟乙烯)和暗电流的光谱数据,用于减少暗电流和光照不均匀对莲子光谱的影响,校正公式如(2)所示。

式中:R为校正后的莲子光谱反射率;Idark为暗电流;Iraw为莲子原始光谱值;Iref为参考板光谱反射值。

采集光谱信息时,测量窗口要与莲子表面紧密接触。为了采集更加全面的莲子光谱信息,每个莲子样本选取4个不同位置面进行测量,4个面的光谱平均值作为该时刻的光谱值。整个试验过程要保证仪器处于黑暗环境,避免外界光线对试验结果造成影响。

1.3.3 光谱数据处理

将原始光谱进行适当的处理,能够增强近红外光谱与莲子含水率测量值的对应关系,提高关系模型的准确性和可靠性[20-21]。本文分别应用卷积平滑(savitzky golay,SG)、标准正态变量变换(standard normal variate transformation,SNV)、多元散射校正(multiplicative scatter correction,MSC)和归一化对光谱数据进行处理,并比较不同的数据处理方法对模型预测性能的影响。

1.4 建模方法及模型评价

利用Kennard-Stone算法进行样本按照2∶1的比例划分成校正集和预测集。莲子含水率的数学模型采用PLS法建立。PLS法是一种基于线性回归方式的多元校正方法,该方法对光谱阵X和浓度Y同时分解,并在分解时加强两者对应的关系,是光谱多元校正分析中应用最广泛的方法之一[22]。利用PLS模型预测出的样品含水率与真实测量值作比较,最后计算出校正决定系数RC2、校正均方根误差(root mean square error of calibration,RMSEC)、预测决定系数 RP2、预测均方根误差(root mean square error of prediction,RMSEP)和剩余预测偏差(residual predictive deviation,RPD),对模型的预测性能进行评价。当模型的RC2、RP2大于0.9,且均方根误差RMSEC与RMSEP均较小时,可以判定该模型的性能稳定,准确度高。RPD一般作为模型预测能力的评判标准,当RPD高于3.0时,该模型预测精准,RPD在2.6~3.0之间,该模型的预测结果可信度较大,如果RPD在2.1~2.5之间,预测能力一般,如果RPD在1.5~2.0之间,预测结果可参考性不大,如果RPD低于1.5,不能作为预测模型。其中决定系数、均方根误差和剩余预测偏差的计算方法分别见式(3)、(4)和(5)。

2 结果与分析

2.1 莲子含水率的统计分析

莲子样品的含水率统计分析如表1所示。

表1 武夷山莲子和广昌莲子的初始含水率分布情况Table 1 Distribution of initial moisture content of Wuyishan and Guangchang lotus seed samples

广昌莲子与武夷山莲子样本含水率的最大值、最小值、平均值和标准差均有一定差距,广昌莲子的含水率为98.79%~206.10%,武夷山莲子的含水率为112.26%~195.12%。不同品种的莲子含水率差距较大,这要求建立的莲子含水率近红外模型需要具有较好的鲁棒性。

2.2 原始光谱分析

两种莲子干燥0、4、8 min和12 min的原始反射光谱如图2所示。

图2 武夷山莲子和广昌莲子样品的光谱反射率Fig.2 Raw spectra of and Wuyishan and Guangchang lotus seed samples

由图2可知,在950 nm~1 650 nm波长范围内,不同干燥时间的两种莲子表现出了基本相同的光谱形态,且吸收特征波峰明显。O-H拉伸振动的一级倍频在1 450 nm处产生,而二级倍频在960 nm产生峰值变化,莲子的合频吸收谱带不明显,主要表现在1 220 nm附近。960 nm~1 450 nm皆为水的特征吸收变化区,能在一定程度上代表莲子水分含量检测的信息,证明了光谱检测含水率的可行性。另外从图2中还可以看出,莲子在初始时刻的反射率最小,干燥时间越久,莲子含水率越小,相应的光谱反射率越大。

2.3 莲子含水率快速检测模型

为了比较不同的预处理方法对莲子含水率预测模型性能的影响,将武夷山莲子与广昌莲子干燥时间分别为0、4、8 min和12 min的原始光谱数据进行SG处理、SNV处理、MSC处理以及归一化处理,并建立模型,其中武夷山莲子含水率PLS模型的预测效果如表2所示。

从表2中可以发现,不同的预处理方法对原始光谱的作用效果各不相同,适当的预处理才能有效提高模型的性能。相较于武夷山莲子原始光谱建模效果,由MSC预处理后的模型预测效果不佳,影响不显著,说明由莲子表面物理特性造成的光谱差异性不大。而利用归一化处理后的光谱所建立的模型预测决定系数低于原始光谱模型,SG处理后的校正决定系数低于原始光谱模型,可能是由于原始光谱信息在经过这两种方法处理后,造成了部分有效信息的丢失。选用SNV预处理方法建立的模型预测性能最好,能有效提高模型的预测决定系数,降低模型的预测均方根误差,其中校正集的决定系数(RC2)、均方根误差(RMSEC)分别为 0.967 7、0.090 1,预测集的决定系数(RP2)、均方根误差(RMSEP)、RPD 分别为 0.942 1、0.118 2和 4.157 4,说明该模型预测性能较好,可靠性较高。

表2 武夷山莲子含水率PLS模型的预测效果Table 2 Results of PLS for moisture content prediction based on the spectra of Wuyishan lotus seed

广昌莲子的莲子含水率PLS模型的预测效果如表3所示。

表3 广昌莲子含水率PLS模型的预测效果Table 3 Results of PLS for moisture content prediction based on the spectra of Guangchang lotus seed

由表3可知,经过SG预处理后的广昌莲子含水率PLS模型预测效果较好,其中预测决定系数提高到0.916 0,预测均方根误差降低到0.118 1。经SNV处理后的模型虽然提高了预测决定系数,但是预测均方根误差由0.127 4增大到0.129 7,可能是因为采集光谱时由散射光造成的误差较小,过度处理反而增大误差,降低了模型的可靠性。归一化处理后的模型预测效果最差,预测决定系数降低至0.890 1,RPD值降低到3.0171,说明归一化预处理方法对该模型的适用性较差。而经MSC预处理的模型预测效果最好,其中校正集的决定系数与均方根误差分别为0.945 2、0.103 0,预测集的决定系数与均方根误差分别为0.928 6、0.118 7,RPD为3.742 7,在4种预处理方法中最高,模型最可靠。

武夷山莲子与广昌莲子混合样本含水率PLS模型的预测效果如表4所示。

表4 应用武夷山莲子和广昌莲子混合样本构建的含水率PLS模型的预测效果Table 4 Results of PLS for water content prediction based on the combined spectra of Wuyishan and Guangchang lotus seed

由表4可知,与单一品种的莲子原始光谱建立的模型相比,两个不同品种莲子混合后的原始光谱建立的模型预测决定系数(RP2)提高到0.928 3,预测均方根误差(RMSEP)减少至0.112 5,RPD值增加至3.734 3,提高了模型的准确度和可靠性。4种不同预处理方法中,MSC预处理后模型的效果最好,预测决定系数(RP2)和预测均方根误差(RMSEP)分别为 0.945 3、0.108 3,RPD为4.275 0。说明将两个不同品种莲子混合后,使得模型在训练过程加入更多的样本信息,预测能力得到提升。

3 结论

本研究利用便携式近红外光谱仪采集了不同干燥时间的莲子含水率和近红外光谱反射率实时动态变化情况。结果表明:两种不同品种莲子混合后,基于原始光谱建立的PLS模型预测决定系数为0.928 3,预测均方根误差为0.112 5,RPD为3.734 3。4种不同预处理方法中,MSC预处理光谱后建立的PLS模型的效果最好,预测决定系数与预测均方根误差分别为0.945 3、0.108 3,RPD为4.275 0。说明利用便携式近红外光谱仪采集莲子光谱反射率并建立化学计量学分析模型可实现莲子含水率的实时监测,研究结果可为莲子烘干过程含水率的快速无损检测提供技术支持。

猜你喜欢
决定系数方根莲子
随机振动均方根加速度计算方法研究及应用
日本乌贼(Sepiella japonica)形态性状与体质量的相关性及通径分析
不同规格香港牡蛎壳形态性状对重量性状的影响
2种贝龄合浦珠母贝数量性状的相关与通径分析
我们爱把马鲛鱼叫鰆鯃
陈年莲子,过早加糖难煮烂!
基于颜色读数识别物质浓度的数学模型研究
陈年莲子,过早加糖难煮烂!
莲子飞上天
煮不烂的莲子不好