孙晓荣, 王赋腾, 刘翠玲, 张 颖, 付新鑫
目前常用的小麦粉水分含量测定方法均为有损检测,存在操作繁琐、耗时长、测定时间不易掌控、易受外界因素干扰等缺点,无法满足小麦粉行业快速、准确的检测要求[1,2]。
近红外光谱分析技术是近年来快速发展的一种快速无损检测技术,该技术结合化学计量学和计算机高速处理技术的特点,具有快速、高效、取样简单、无污染等优点,已经广泛应用于多个检测领域[3,4]。随着近红外在线检测技术的飞速发展,近红外光谱仪也变得越来越精细灵巧。MicroNir—2200近红外光谱仪将光源、检测器、分光系统集中于一个微型探头中,具有体积小、易携带、操作简便、易控制、测量时间短等优点,能更实时准确扫描样品光谱,检测过程省时简便[5]。
本文采用MicroNir—2200采集小麦粉近红外光谱数据,采用建模软件Unscramble 9.7建立了小麦粉水分含量近红外偏最小二乘(partial least square,PLS)校正模型,并利用内部交叉验证和外部预测集验证了模型的预测精度。
1)面粉样品169个,来源于北京古船食品有限公司。
2)MicroNir—2200,检测波长范围为1 150~2 150 nm,光谱采样间隔8.1 nm,共125个波长点。
1)化学值测定
按照直接干燥法(GB 5009.3—2010)测定水分含量[6]。原理为利用食品中水分的物理性质,在101.3 kPa,101~105 ℃下采用挥发方法测定样品中干燥后所减失的重量,同时测定吸湿水、部分结晶水和此条件下能挥发的物质的重量,通过干燥前后的称量数值计算出水分的含量。
2)近红外光谱采集
面粉样品装于密封的样品袋,打开MicroNir—2200近红外光谱仪光源,待仪器温度达到稳定工作温度(37~37.8 ℃)后开始扫描样品。扫描光谱时参数设置为单次积分时间5 100 μs,积分次数100次,光谱扫描间隔为1 s。光谱扫描时将探头紧贴在光滑的样品袋表面,连续扫描5次,每次扫描的不同位置。
3)光谱数据处理
对每个样品多次扫描的光谱求取平均值得到最终建模样品光谱集;采用样本选择方法SPXY算法将样品光谱划分为建模集和预测集,选取20个样品作为预测集。
建立近红外光谱定量模型时,选取的建模集样品应具有代表性,组分浓度在整个范围内尽可能分布均匀,建模集组分浓度变化范围应包括预测集组分浓度变化范围[7]。实验选取的样品水分的浓度范围为12.9 %~14.9 %,平均浓度为14.1 %,相对标准差为0.38,满足建立近红外光谱定量预测模型的基本要求。
建模集光谱图如图1所示。近红外光谱的吸收谱带主要为有机分子含氢基团(C—H,N—H,O—H等)伸缩振动的各级倍频以及合频形成。从图1中可以看出小麦粉的近红外光谱中含有丰富的化学官能团信息,几乎能反映有机物的所有含氢基团的信息,能够反映出分子的结构和组成状态,因此,可通过近红外光谱对有机物样本进行定量分析[8]。
图1 小麦粉样品近红外光谱
2.3.1 最佳预处理方法
对比研究了不同预处理方法对预测模型效果的影响,如表1,并最终得到实验最佳预测模型。
表1 不同预处理方法建立小麦粉水分含量近红外预测模型
实验选取主成分数、决定系数(R-square)、校正均方根误差(root mean square error of calibration,RMSEC)、交叉验证均方根误差(root mean square error of cross verification,RMSECV)、预测均方根误差(root mean square error of prediction,RMSEP)5个参数综合评价模型的性能。其中R-square表示实际值和预测值之间的关系;RMSECV为确定维数和最优校正模型主要依据,其值越小模型越精确;RMSEP用于验证模型的精度,数值越小说明模型外部预测能力越高;RMSEC,RMSECV,RMSEP三者具有一定的数值大小关系,RMSEC一定小于RMSECV,但两者不应差异太大,否则说明选取的样品代表性不好或者表示模型信息提取不充分[9~11]。综合分析表1中的数据可知:当采用一阶导数和Savitsky-Golay(S-G)滤波平滑对光谱进行预处理时所建模型效果最好,与其他模型相比其RMSECV最小,说明模型精度最高,RMSECV略高于RMSEC且RMSEP略高于RMSECV,说明模型所选建模集和预测集具有代表性,模型拟合度高,R-square较高说明预测值与真实值比较接近;其主因子数为5,决定系数为0.929,校正均方根误差为0.111,交叉验证均方根误差为0.126,预测均方根误差为0.154。图2为原始光谱采用一阶导数和S-G平滑滤波后的光谱。
图2 光谱经过一阶导数和S-G滤波平滑后光谱
2.3.2 近红外校正模型的分析和验证
实验采用unscramble 软件建立近红外PLS校正模型,同时采用交叉验证法和外部预测集评价模型的性能。由一阶导+S-G(7 points)建立模型,如图3~图6。其中图3为主成分分析散点图,代表选取建模样本集是否合适,大部分样本点应接近坐标轴且均匀分布。图3中X轴表示样本与第一主成分的相关系数,Y轴表示样本与第二主成分的相关系数,各个点的位置代表各样本的主成分综合得分大小,得分点与某一坐标轴越接近说明与相应的主成分越相关;图3中长轴为X轴,说明第一主成分反映出原始数据较多的信息。可知实验选取样本较合适,但有小部分点远离坐标轴,此类点在一定情况下可当作异常点剔除,但剔除前应综合考虑此类点是否具有代表性或唯一性,避免误删。图4为所建模型的回归系数,代表所测光谱的各个波长区间光谱信息与小麦粉中水分含量的相关性,可以确定波长区间与小麦粉水分含量的信息相关度,为信息的进一步筛选提供了依据。图4中纵坐标数值代表因变量相关性大小,因变量Y大于0说明此区间信息与水分成正相关,区间内蕴含大量与水分正相关的信息。从图4可知1 190~1 250 nm波长区间光谱信息与水分呈正相关,而1 640~1 690 nm波长区间光谱信息与水分呈负相关。图5为剩余验证方差,表示因变量Y的方差与主因子数的关系,预测方差的基本趋势随主因子数的增加而减少,一般情况下,剩余方差曲线趋于平缓的第一个因子数与模型最佳主因子数相等,从图5中可看出,模型最佳主因子数为5。图6为近红外校正模型真实值和内部交叉验证预测值散点图,由图6可以样本的真实值和内部校正预测值很接近,决定系数较高,校正均方根误差和交叉验证均方根误差较小,说明模型的内部预测效果好。
模型建立后,利用外部校验的方法验证前述最优校正模型的性能,预测样品集数目为20,预测均方根误差为0.154,偏差为0.017,表明:最优校正模型拟合度好,预测误差小,能很好地预测未知小麦粉样本的水分含量。
图3 主成分分析
图4 回归系数
图5 剩余验证方差
图6 小麦粉水分含量近红外校正模型
2.3.3 实验结果分析
由表1可知实验评定的最佳预处理方法为一阶导数结合S-G滤波平滑的方式,说明MicroNir—2200长时间工作会产生一定的基线平移现象,而且光谱采集时产生了一定的噪声。从表1的数据可知,大部分的预测模型内部验证结果和外部验证结果基本一致,即RMSEP略大于RMSECV,但是采用多元散射校正+一阶导+S-G滤波平滑或多元散射校正+基线+矢量归一化预处理方法时,所建模型RMSEP远大于RMSECV,预测效果很差,可能的原因是建模采用的预处理方法过多,过多的预处理方法导致了信号的缺失,再进行外部预测时反而预测效果很差。
本实验采用MicroNir—2200扫描小麦粉样品的近红外光谱,采用Unscramble软件建立基于偏最小二乘法的小麦粉水分含量近红外光谱校正模型。结果表明:所建小麦粉水分含量近红外模型具有较好的准确性和稳定性,可应用于小麦粉水分含量的快速检测及质量控制,结果准确可靠,该研究为下一步建立小麦粉的在线快速检测水分含量提供扎实的理论研究基础和分析模型。
后续研究应加入更多不同品种的小麦粉以及增强样本的代表性,选取实验样本时应尽可能在整个浓度范围内均匀分布,提高实验操作精度以达到同时提高模型的稳健性和适用范围。
参考文献:
[1] 闫李慧,王金水,金华丽,等.基于近红外光谱技术的面粉水分无损检测模型的建立[J].现代食品科技,2011,27(2):235-238.
[2] 吴静珠,刘 倩,陈 岩,等.基于近红外与高光谱技术的小麦种子多指标检测方法[J].传感器与微系统,2016,35(7):42-44.
[3] 耿 姝,陈 勇,金 叶,等.基于近红外技术的金银花药材多指标成分快速检测[J].中国现代应用药学,2016,33(2):144-150.
[4] 张玉华,孟 一,张应龙,等.近红外光谱技术在食品安全领域应用研究进展[J].食品科技,2012(10):283-286.
[5] 冯 帮,陈 斌,颜 辉.便携式近红外光谱检测系统的开发[J].现代仪器与医疗,2014(2):12-16.
[6] 国家标准化管理委员会.GB 5009.3—2010食品中水分的测定[S].北京:中国标准出版社,2010.
[7] 金华丽,卞 科.近红外光谱法检测小麦粉中的水分含量[J].中国粮油学报,2010,25(8):109-112.
[8] 刘翠玲,胡玉君,孙晓荣,等.基于近红外光谱技术的小麦粉灰分含量检测方法研究[J].粮油食品科技,2015,23(6):76-79.
[9] 周照艳,岳 勇,王 涛,等.PLS因子数对定量模型性能稳定性的影响分析[J].计算机工程与设计,2014(5):1788-1791.
[10] 吴静珠,吴胜男,刘翠玲,等.近红外和高光谱技术用于小麦籽粒蛋白含量预测探索[J].传感器与微系统,2013,32(2):60-62.
[11] 王宁宁,申兵辉,关建军,等.近红外光谱分析技术识别奶粉中淀粉掺假的研究[J].光谱学与光谱分析,2015,35(8):141-146.