黄 蕾,韦紫玉
(1.崇左市粮油质量监督检测中心,广西 崇左 532200;2.广西科技大学经济与管理学院,广西 柳州 545006)
大米作为我国主粮之一,在日常饮食中占据重要的地位。在大米收购、贮藏、加工过程中,其水分含量是一项不可或缺的检测指标[1]。传统大米水分含量多采用GB 5009.3—2016《食品安全国家标准食品中水分的测定》[2]中的直接干燥法,但该方法操作过于繁琐、耗时长,导致大米的水分含量检测效率低。因此,开展大米水分含量快速无损检测方法的研究具有重要的意义。
近红外光谱 (Near Infrared Spectrometry,NIRS)分析技术以其简单准确、快速高效、绿色无损等优点广泛应用于食品、医药、化工、材料等领域[3-4]。目前,近红外光谱技术在大米品质检测中的应用已有诸多报道,孙永海等人[5]利用近红外漫反射技术采集了吉林大米样品的光谱数据,并建立了基于BP 神经网络的定量模型,准确率达到了96.67%。李路等人[6]采用近红外光谱技术对海南大米样品的蛋白质、脂肪、总糖、含水量进行检测,实现了快速检测大米主要营养成分的功能。苗雪雪等人[7]采集了湖南大米样品的光谱数据后,建立了移动窗口偏最小二乘(NMPLS) 大米水分定量模型,实现了大米水分含量的快速测定。路辉等人[8]利用近红外光谱技术对江苏大米样品的直链淀粉、蛋白质、脂肪、水分含量进行了检测,建立了偏最小二乘定量模型,实现了多品质指标的快速检测。然而,目前国内采用近红外光谱技术检测大米品质的研究所用样品大多产地单一,而我国大米产地分布广泛,各地区大米成分存在差异,导致所建立的水分含量近红外定量模型普适性较差。
因此,收集来自不同地区的大米样品,结合化学计量学方法对其近红外光谱数据和水分含量进行分析处理,建立大米水分含量预测模型,并优选多种预处理方法和建模方法,旨在实现基于近红外漫反射光谱技术对多个产地的大米水分含量的快速无损检测。
大米样品:收集不同地区的大米样本共120 个,分别来自江苏省(40 个)、广东省(20 个)、辽宁省(20 个)、湖北省 (20 个) 和海南省 (20 个),样品编号、分装后保存于实验室阴凉处。
S450 型近红外光谱分析仪,上海棱光技术有限公司产品;电热恒温干燥箱,绍兴市苏珀仪器有限公司产品;高速多功能粉碎机,永康市铂欧五金制品有限公司产品;电子天平,上海市菁海仪器有限公司产品。
将大米样品置于实验室阴凉处24 h,每个样品选取150 g 左右置于粉碎机粉碎后装袋备用。选用K-S(Kennard-Stone) 方法划分样品集合,按照7∶3 的比例划分校正集和预测集,最终选取84 个样品作为建立模型的校正集,剩余的36 个样品作为验证模型的预测集。
1.3.1 大米水分含量检测
按照GB 5009.3—2016 中的直接干燥法检测大米样品的水分含量,具体操作流程为称取5 g(精确至0.001 g) 样品放在干燥皿中,置于101~105 ℃干燥箱中烘干4~6 h 至恒质量,取出后置于干燥器中干燥0.5 h,再次对样品进行称量,计算得出水分含量。
1.3.2 光谱数据采集
S450 型近红外光谱分析仪的工作波长范围为900~2 500 nm,选取全波段进行光谱数据采集。在室温条件下,称取50 g 样品装入样品池后进行光谱采集,设置分辨率12 nm,采样间隔1 nm,扫描时每次样品旋转120°,每个样品均重复采集3 次,取平均光谱作为该样品的最终测量光谱,以减少因装样不均匀造成的误差。
1.3.3 近红外建模方法
(1) 光谱预处理。预处理方法可以有效消除光谱采集过程中由于环境、背景等因素产生的噪声信息,提高预测模型的稳定性[9]。使用Matlab 软件对光谱数据进行预处理,包括Savitzky-Golay 平滑(SGF)、矢量归一化(Standard Normal Variate transformation,SNV) 结合一阶导数、归一化、多元散射校正(Multiplicative Scatter Correction,MSC) 和二阶导数等方法,旨在筛选出最优的光谱预处理方法。
(2) 模型建立。分别利用偏最小二乘回归(Partial Least Square Regression,PLSR) 和主成分回归(Principal Component Regression,PCR) 建立预测模型,将5种预处理方法分别与2种建模方法两两结合,构成10种不同建模路径,按照评价指标选择出最优建模方法。
采用多个指标对建立的模型进行评价,以校正集相关系数(Rc)、预测集相关系数(Rp)、校正均方根标准差(RMSEC)、预测均方根标准差(RMSEP)为评价指标。当相关系数R 越接近1,均方根标准差越小,说明模型的性能越优异。
采用直接干燥法检测的大米样品水分含量。
大米水分含量统计表1。
表1 大米水分含量统计
由表1 可知,样本整体的水分含量范围为13.09%~20.93%,范围分布较广,基本涵盖大米水分含量的变化范围。校正集大米样品的水分含量范围为13.09%~20.93%,预测集大米样品的水分含量范围为13.14%~20.55%,验证集是校正集的子集,能够更好地对定量模型进行验证。
不同产地大米水分含量分布散点见图1。
图1 不同产地大米水分含量分布散点
由图1 可知,江苏、湖北、广东、海南4 个地方的样品水分含量差异性较小,而东北大米的水分含量较高,可能是由于地理因素,但较好的数据区分度会提高定量模型的预测性能。
近红外光谱主要是由于分子振动的非谐振型使分子振动从基态向高能级跃迁时产生[10]。
样本的原始近红外光谱图见图2。
图2 样本的原始近红外光谱图
由图2 可知,不同样本在相同波长的吸光度存在一定的差异,可能是由于样品内部化学成分含量不同。水分子由O-H 键构成,而游离O-H 键的组合频产生的吸收峰出现在波长1 950~1 980 nm,一级倍频产生的吸收峰出现在波长1 440~1 480 nm。其他吸收峰主要是C-H 键、N-H 键的振动伸缩和弯曲伸缩产生的[11],不再进行具体分析。
以不同产地大米样品的平均光谱为代表,观察光谱数据的差异。
不同产地大米样品平均光谱对比图见图3。
图3 不同产地大米样品平均光谱对比图
由图3 可知,光谱数据存在差异性,但光谱差异非常小且总体趋势相似,因此选择不同地区大米样品光谱数据建立的定量预测模型具有普遍适用性。
按照试验设计中预处理方法和建模方法对光谱数据进行分析处理。
大米水分近红外光谱模型性能对比见表2。
由表2 可知,PCR 法建立的模型预测精度均高于PLSR 法建立的模型,是由于PCR 能有效去除噪声信息,提高了模型预测性能[12]。其中,MSC 结合PCR 法建立的模型预测效果最好,此时模型的Rc和RMSEC分别为 0.948 8,0.004 8,Rp和 RMSEP分别为0.936 2,0.006 5,这是由于MSC 能够消除因颗粒分布不均匀、颗粒大小不同产生的散射影响。
表2 大米水分近红外光谱模型性能对比
MSC 预处理后的光谱图见图4。
由图4 可知,光谱在1 470,1 960 nm 处的O-H键吸收峰非常明显。
图4 MSC 预处理后的光谱图
2.4.1 内部交叉验证
使用校正集的样本数据进行内部交叉验证。
校正集样品的水分含量预测散点图见图5。
图5 校正集样品的水分含量预测散点图
由图5 可知,校正交叉验证相关系数R 为0.948 8,交互验证均方根标准差(RMSEPCV) 为0.006 9,预测效果较好。从图5 也可看出,校正集数据点均匀地分布在拟合方程两侧,拟合程度比较高。
2.4.2 外部样本验证
为了验证预测模型的准确性和可靠性,使用预测集样本数据对已建立的校正集模型进行评价。结果表明,预测集相关系数为0.936 2,RMSEP 为0.006 5,而校正集的RMSEC 为0.005 8,2 个指标都比较小且仅相差0.000 7,说明预测模型准确可靠,能够应用在大米水分含量的检测中。
预测集样品的水分含量预测散点图见图6。
由图6 可知,模型预测结果的的平均相对误差为3.385 3%,平均绝对误差为0.54%,表明定量预测模型的性能良好。
图6 预测集样品的水分含量预测散点图
收集来自各5 个地区具有代表性的大米样品,采集近红外光谱数据并测定水分含量。使用多种预处理方法和建模方法建立大米水分预测模型并优化,比较各模型的预测效果,选择最优预处理和建模方法。结果表明,经MSC 预处理的PCR 模型预测性能最佳,校正集与预测集相关系数分别为0.948 8,0.9362;RMSEC 和 RMSEP分别为 0.004 8,0.006 5,能够应用于大米水分含量的检测中。
在前人研究的基础上,选择了不同地区的大米样品,扩大了模型应用范围,实现了基于近红外光谱技术对不同产地的大米水分含量的快速无损检测,提高预测模型的稳定性和抗干扰能力,为各地区大米水分的无损检测提供了参考。