基于近红外光谱技术的南疆骏枣动态水分模型研究

2022-04-19 13:33于智海罗华平孔德国徐嘉翊王长旭王玉婷
新疆农机化 2022年2期
关键词:预处理含水量光谱

于智海,罗华平,孔德国,高 峰,徐嘉翊,王长旭,王玉婷

(1.塔里木大学机械电气化工程学院,阿拉尔 843300;2.新疆维吾尔自治区普通高等学校现代农业工程重点实验室)

0 引言

新疆地区的红枣种植面积在我国红枣总种植面积中占有相当大的比重,而在新疆地区种植的红枣尤以产自南疆地区的骏枣为典型代表[1-4]。在骏枣的加工过程中,对未经加工的骏枣进行清洗是至关重要的步骤,清洗步骤直接影响骏枣的水分含量,农产品的水分含量又是影响农产品储存和加工的主要因素之一[5],过高的水分含量不利于骏枣的储存,而骏枣中的水分含量对于骏枣干燥加工时的烘干温度以及加工时间也有着直接的影响。通过实时检测骏枣的水分含量来调整骏枣的储存方式和骏枣干燥加工时的烘干温度以及加工时间。因此,对骏枣清洗过程中骏枣的水分状况进行快速的实时检测对骏枣的储存以及后续加工步骤的调整与选择等具有指导和借鉴作用[6-9]。

近红外技术是一种快速、无损的检测方法[10-13],可应用于对食品中的蛋白质、糖类、脂肪等成分进行快速检测[14-23]、对果实果腐病的快速筛查与监测和成熟度判别等[24-25]。罗一甲等[26]利用近红外技术结合GA-ELM 模型进行预测,遴选出的最优预处理方法为MSC,结果表明利用近红外技术结合GA-ELM 模型可实现对赤霞珠葡萄中的总酚含量的预测。吕都等[27]研究近红外光谱技术与化学计量学相结合的方法,采用偏最小二乘回归法建立模型,结果表明分位数标准化处理为最适合该鉴别模型的光谱预处理方式。

然而,国内外学者们对有关南疆骏枣在加工过程中其动态水分变化的近红外光谱检测方面研究却不多。而笔者以南疆骏枣作为主要研究对象,分别在骏枣原始状态下以及进行不同时长的浸泡处理之后对其进行了近红外光谱采集,并将所收集到的样本光谱分别进行了SNV、Autoscaling、Normalize 和MSC 四种不同的光谱预处理,对比不同的光谱预处理方式对骏枣动态含水量检测模型的影响,进而遴选出四种预处理方式中最适宜该模型的预处理方式,可实现对骏枣在加工工艺程序中的动态含水量进行检测,以及为进一步研究优化骏枣的加工处理工艺提供借鉴。

1 骏枣含水量检测试验

1.1 检测原理

近红外光,即NIR,是一种电磁辐射波,介于可见光和中红外之间。NIR 在分析样本时具有成本低、效率高、不使用化学药剂、零污染、零损伤等优势被人们所接受,逐渐成为一种新型的分析手段。使用近红外光谱扫描还可以获取样本的内部结构信息,能够更加全面地掌握样本的情况。

1.2 试验材料与仪器

试验所用的骏枣样本采集于阿拉尔市第一师10 团。主要检测仪器是聚光科技(杭州)股份有限公司所生产的聚光世达近红外分析仪(型号为supNIR1520,波长范围1 000~1 800 nm,光谱分辨率≤12 nm,波长准确性±0.2 nm,波长重复性≤0.05 nm,卤钨灯光源,InGaAS 探测器,光谱标定使用PTFE 树脂漫反射白板)。

1.3 检测流程及方法

试验开始前,提前1 h从0℃的冰柜里取出待测骏枣,从中挑选出75 个大小均匀、颜色相近的骏枣作为试验样本,同时用水刺无纺布将骏枣表面擦拭干净,并在骏枣的稳定面按1至75的顺序进行标号。试验样本准备完毕后开始搭建试验平台,在农产品加工与无损检测研究实验室内通过遮光窗帘屏蔽太阳光以及其他外界光源和关闭实验室照明设备等手段排除杂散光干扰,在试验台上摆放好近红外分析仪,连接电源、数据线、电脑等辅助设备,并进行设备调试,将近红外分析仪进行光源预热以及参比校正。将骏枣样品按照从左到右从上到下的顺序摆放在实验台上,准备75 个一次性纸杯并分别注入纯净水至纸杯内约1/2 处备用。

试验测定开始,使用近红外分析仪按照顺序对骏枣样本的稳定面及其背面分别进行扫描并称重及记录扫描时骏枣样品的质量。将骏枣样本按顺序放置于一次性纸杯中进行浸泡,20 min 后按顺序取出骏枣样本并使用水刺无纺布擦干表面水分,立刻进行扫描并称重及记录扫描时样品质量。此后分别在骏枣样品30 min 以及120 min后重复上述扫描和称重及记录步骤。

试验结束后,将骏枣样本按顺序摆放到实验托盘里,按照GB/5009.3-2010《食品中水分的测定》[28]的方法对骏枣样本中的含水量进行测量。

1.4 骏枣光谱预处理方法

因试验环境、电噪声、杂散光等各种因素的影响,使用近红外光谱技术收集到的信息不但包含样本中有用的信息,还包含某些会影响检测结果的其他信息与信息噪声。最终经过检测所得到的信息真实值和实际数值之间会因此产生较为明显的差异,导致检测结果失真。因此需要将最原始的样本光谱数据先进行光谱预处理,再使用经过光谱预处理后的样本光谱数据建立光谱分析模型,本文中选择SNV、Autoscaling、Normalize 和MSC四种光谱数据预处理方法。

1.5 模型的建立与评价

通过无损检测技术对农产品和食品的质量进行检测的同时,应将所测得的待检样本的信号特点和常规检测技术所获取的数据信息进行有效的结合来建立分析模型。

1.5.1 近红外分析法

在采集骏枣样本的近红外光谱之前,先将骏枣样本静置在室内1 h,使骏枣样本的温度等内外部品质基本趋于稳定状态,缩小骏枣样本的内外部与试验环境间差差,随后使用提前预热30 min 的近红外分析仪采集光谱。

对骏枣样本采集的原始光谱进行预处理,并将骏枣样本分为校正样本集与预测样本集,选取有代表性的特征波长变量作为建立模型的数据,同时通过理化手段测量骏枣内部数据信息,并将其和预处理之后的光谱数据信息建立关系。

1.5.2 建模方法以及模型评价

本文采用PLS 回归法(偏最小二进位乘法),即一种采用类似主面体成分回归分析法的多面体因子成分回归计算方法对光谱数据进行建模。

预测模型进行综合分析评价通过三个参数来判断,相关系数(R)、预测残差平方和(PRESS)以及预测标准偏差(RMSEP)均为其判断标准。相关系数(R)的值越大(最大理论值为1),预测模型的预测(或回归)结果越好,预测能力越强;相关系数(R)的值越小(最小理论值为0),预测模型的预测结果越差,预测能力就越弱。

2 试验结果与数据分析

2.1 骏枣含水量的测量结果

对已经确定的75 个骏枣样本,分别在其初始状态下和用水浸泡处理20 min、30 min、120 min 时,从中随机筛选出50 个骏枣样本作为校正集样本,将剩下的25 个骏枣样本作为预测集样本。骏枣样本在初始状态时的含水量最大值为0.2295,最小值为0.1667,平均值为0.1995,平均偏差为0.0099;骏枣样本在浸泡20 min 时含水量最大值为0.2749,最小值为0.1699,平均值为0.2182,平均偏差为0.0168;骏枣样本在浸泡30 min 时含水量最大值为0.3151,最小值为0.1745,平均值为0.2331,平均偏差为0.0226;骏枣样本在浸泡120min时含水量最大值为0.4101,最小值为0.1938,平均值为0.2831,平均偏差为0.0374。

2.2 骏枣含水量预测模型的建立与验证

分别在初始状态时和依次浸泡20 min、30 min、120 min 的75 个骏枣样本中随机选择出其中25 个骏枣样本,再根据随机样本选取的25 个骏枣样本分别进行光谱采集,对这些样本采集到的原始光谱对其分别采用SNV、Autoscaling、Normalize 和MSC 进行光谱数据预处理。对这些试验样本的原始光谱进行不同方式的光谱预处理后,再使用偏最小二乘法计算建立骏枣含水量预测模型,预测结果如表1。

表1 骏枣含水量的PLS 模型结果

2.3 骏枣模型验证结果对比分析

为了排除光谱采集干扰,进一步提高骏枣含水量预测模型的光谱预测性和准确度,需要对骏枣样本所采集到的原始近红外光谱数据进行光谱数据预处理。对骏枣含水量预测模型进行综合分析评价的判断标准为预测相关系数(R)、预测残差平方和(PRESS)和预测标准偏差(RMSEP)。对经过4 种光谱预处理后的样本原始光谱分别建立对应的模型,并对所建立的骏枣含水量预测模型进行模型综合分析评价,结果表明,利用近红外光谱建立模型预测骏枣含水量的准确度受到预处理方式的影响。由此可得建立近红外光谱骏枣含水量预测模型的最优预处理组合是原始光谱+MSC+PLS。相关系数由0.6845增加到0.8778,预测残差平方和由0.0285 减少到0.0178,预测标准偏差由0.0387 减少到0.0298。

将75个骏枣样本在初始状态下和用水浸泡20 min、30 min、120 min 后进行光谱采集,将采集到的骏枣样本光谱使用MSC 进行光谱数据预处理,然后将经过预处理的近红外光谱数据使用偏最小二乘法建立骏枣动态含水量的PLS 预测模型,其结果如图1、图2、图3 和图4。

图1 初始状态下的骏枣光谱PLS 模型

图2 浸泡20 min 后的骏枣光谱PLS 模型

图3 浸泡30 min 后的骏枣光谱PLS 模型

图4 浸泡120 min 后的骏枣光谱PLS 模型

由图1、图2、图3 和图4 可知,原始光谱+MSC+PLS所建立的预测模型中,期望值与测量值的折线趋势相同,误差小且均匀,可以结合NIR 技术作为检测方法来快速、无破坏性地在骏枣的加工过程中对其含水量进行准确的实时检测。

3 结论

本次以南疆骏枣为主要研究对象、以南疆骏枣在加工过程中的动态含水量为主要研究试验指标,以NIR为主要的试验测定技术,在全波段(1 000~1 800 nm)测定了南疆骏枣中的动态含水量光谱检测指标。以4 种预处理方式分别对于模型的检测性与准确度差异显著,相比于未经预处理的原始光谱所建立的模型,原始光谱+Autoscaling+PLS 的相关系数降低,而其它预处理方式对原始光谱进行预处理之后所建立模型的相关系数均有提高且达到0.80以上。遴选出有关南疆骏枣动态含水量检测模型的最优光谱数据预处理组合为原始光谱+MSC+PLS,(R=0.8778,PRESS=0.0178,RMSEP=0.0298),并建立了基于近红外光谱技术的骏枣动态含水量PLS 检测模型。

(1)对第一师10 团所产骏枣进行试验,为进一步提高模型的适用性和广泛性,对南疆其他师团所产骏枣进行建模分析。

(2)对4种近红外光谱预处理方法:SNV、Autoscaling、Normalize和MSC进行了比较,可以通过比较MC(数据中心化)、MA(移动窗口平滑)和一阶导数+SG 等更多的预处理方法来增加预处理方法比较的广泛性。

(3)建立了PLS 骏枣水分动态模型,可以使用如BP神经网络、LS-SVM、ELM、PCA、GA-ELM、ANN 等建模方法来遴选出更优的模型。

猜你喜欢
预处理含水量光谱
基于三维Saab变换的高光谱图像压缩方法
煤炭矿区耕地土壤有机质无人机高光谱遥感估测
手术器械预处理在手术室的应用
污泥预处理-厌氧消化体系的能源经济性评价
基于3D-CNN的高光谱遥感图像分类算法
眼干的人别选高含水量隐形眼镜
污泥预处理及其在硅酸盐制品中的运用
数字说
径流小区土壤含水量TDR法与烘干法测试相关关系探讨
变压器油纸绝缘含水量的介电响应测量方法