邹 昊,田寒友,刘 飞,李文采,王 辉,李家鹏,陈文华,狄艳全,乔晓玲,*
(1.中国肉类食品综合研究中心,肉类加工技术北京市重点实验室,北京 100068;2.聚光科技(杭州)股份有限公司,浙江 杭州 310052)
近红外光谱的预处理对羊肉TVB-N模型的影响
邹 昊1,田寒友1,刘 飞1,李文采1,王 辉1,李家鹏1,陈文华1,狄艳全2,乔晓玲1,*
(1.中国肉类食品综合研究中心,肉类加工技术北京市重点实验室,北京 100068;2.聚光科技(杭州)股份有限公司,浙江 杭州 310052)
为研究能否通过对算法参数的调整和算法的组合来减弱甚至消除便携式近红外仪和样品组织结构等对样品光谱信息的影响,提高模型的预测准确性和稳健性,实现现场快速无损检测生鲜羊肉挥发性盐基氮(total volatile basic nitrogen,TVB-N)的目的。本研究应用不同参数组合的单一算法和不同算法组合对样品的光谱信息进行预处理并建模,从模型的预测准确性和稳健性2 个方面探讨算法参数和算法组合对模型性能的影响,找出针对检测生鲜羊肉中TVB-N含量的最佳预处理方法。结果表明,不同的算法参数和算法组合对模型性能的影响差别很大,对样品的近红外光谱信息进行差分求导(窗口数为6,求导阶次为1)后,模型性能最佳。模型的校正标准差和验证标准差分别为1.21和1.31,校正标准差和验证标准差的比值为1.08小于1.2,主成分数为10,校正集相关系数和验证及相关系数分别为0.94和0.92。说明通过对算法参数的调整和对算法的组合可以有效提高模型性能,满足应用便携式近红外仪现场快速无损检测生鲜羊肉TVB-N含量的要求。
近红外光谱分析技术;预处理方法;生鲜羊肉;TVB-N;便携式近红外仪
在动物性食品的贮藏过程中,内源性生物酶和外源性微生物共同作用使蛋白质发生分解,产生的氨和胺类等碱性含氮物质进一步与腐败过程中产生的有机酸结合,形成具有挥发性的盐基态氮形式的物质,即为挥发性盐基氮(total volatile basic nitrogen,TVB-N)[1-2]。国家标准中将TVB-N作为一项反映生鲜羊肉新鲜度的重要理化指标[3]。目前检测TVB-N含量的方法主要有分光光度法,微量扩散法和半微量凯氏定氮法[2,4-5]。这些方法虽然可以比较准确的检测TVB-N含量,但存在着操作过程复杂、涉及多种化学试剂及实验室仪器以及对检测人员操作水平要求较高等问题。
近红外光谱分析技术作为一种新型检测技术,因其具有检测速度快,操作简单和绿色环保等特点,被广泛的应用于农业、食品和医药等行业[6-11]。近些年国内外学者在应用近红外光谱分析技术检测肉与肉制品中的TVB-N含量方面进行了大量的研究,并取得了较好的成果[12-17],但仍存在一些空白值得研究。首先,应用近红外光谱分析技术对生鲜羊肉中的TVB-N含量进行定量检测方面还鲜见报道。其次,在相关研究中学者们多采用信噪比、分辨率和波长准确性较好的台式傅里叶变换型光谱仪对样品的光谱信息进行采集[12,14,17],但体积较大不便于移动的特点限制了它在现场检测方面的应用。第三,一些学者在采集样品的光谱信息前将样品进行均质[17-22]来避免因肌肉纤维束传导近红外光束导致样品光谱信息失真的问题[23],但样品前处理增加了检测的时间和复杂程度,破坏了样品的完整性,无法满足快速无损检测的需求。第四,在评价模型性能时,学者们往往只考虑模型的预测准确性而忽略了模型的稳健性。美国谷物化学家协会、国际商会和美国分析化学家协会等国际分析组织的近红外分析标准中均把模型的稳健性作为评价模型性能的一个重要指标[24]。最后,相关研究中多使用单一或组合2 种算法对样品的光谱信息进行预处理[25-28],详细讨论组合3 种或3 种以上算法进行预处理以及算法参数的变化对模型性能影响的研究国内外鲜有报道。
本研究以反映生鲜羊肉新鲜度的TVB-N含量作为检测对象,在不对样品进行任何前处理的情况下,使用便携式近红外仪采集样品的光谱信息,应用不同参数组合的单一算法和不同算法组合对样品的光谱信息进行预处理并建模,从模型的预测准确性和稳健性2 个方面探讨算法参数和算法组合对模型性能的影响,找出针对检测生鲜羊肉中的TVB-N含量的最佳预处理方法,为实现现场快速无损检测生鲜羊肉中的TVB-N含量提供科学依据,为类似研究中预处理算法参数和算法组合的选择提供经验。
1.1 材料与试剂
羊肉样品均为宰后排酸12 h的土种羊通脊肉,采购于北京市牛街清真牛羊肉市场。碳酸钾、硼酸、甲基红、次甲基蓝、阿拉伯胶和甘油均(化学纯) 国药集团化学试剂有限公司;0.010 mol/L盐酸标准滴定溶液 国家化学试剂质检中心。
1.2 仪器与设备
6031-02A型扩散皿 日本柴田科学株式会社;BSA822-CW型电子天平(精确度0.01 g) 德国赛多利斯集团;SupNIR-1520型便携式近红外仪(光谱波长范围1 000~1 800 nm,光谱分辨率10 nm,钨灯光源,平面漫反射探头,探头为直径32 mm的圆)、RIMP Client近红外光谱数据分析软件 聚光科技(杭州)股份有限公司。
1.3 方法
1.3.1 样品制备
将采购的新鲜羊通脊肉分别用塑料袋包裹以避免样品间的干扰和外界环境对样品的影响。所有样品被放置于0~4 ℃冷库贮藏,使其自然缓慢腐败,期间随机选取样品进行光谱信息的采集和TVB-N含量的测定。
1.3.2 样品近红外光谱信息的采集
实验前将便携式近红外仪预热30 min,然后用参比标准白板进行校准(样品间不再进行校准)。所有样品被隔水置于冰水混合物中以确保样品温度在0~4 ℃之间。环境温度为(25±1)℃,相对湿度为50%~60%。在采集样品光谱信息前,用滤纸吸去样品表面渗出的汁液。采集过程中,将样品的表面紧贴于便携式近红外仪的平面漫反射探头上,避免因漏光导致采集的样品光谱信息失真。每个样品至少进行3 次光谱信息的采集,每2 次采集之间间隔10 s,采集的区域不完全重合。每次采集,光谱扫描次数为10 次,采集的近红外光谱波长范围为1 000~1 800 nm,分辨率为10 nm。采集后,观察每个
样品的光谱图,选取2 条平行性最好的光谱作为该样品的光谱信息用于建模。
1.3.3 样品TVB-N含量的测定
根据GB/T 5009.44—2003《肉与肉制品卫生标准的分析方法》中的微量扩散法对样品的TVB-N含量进行测定。每个样品3 个平行,结果取平均值作为该样品的TVB-N含量。
1.3.4 样品光谱信息的预处理与建模
首先使用不同参数组合的单一算法对样品的光谱信息进行预处理并建模,根据模型性能评价参数选出每种算法的最佳参数组合。再将确定了最佳参数组合的算法进行组合,从而选出最佳算法组合。建模使用偏最小二乘回归算法,所用的近红外光谱信息波长范围为1 000~1 800 nm。
选择的预处理算法包括:数据增强类算法:均值中心化(mean centering,MC)和标准化(autoscaling,AS)。导数类算法:Savitzky-Golay求导(Savitzky-Golay derivative,SGD),窗口参数为5~31(间隔为2),拟合次数为2~5,求导阶数为1~4;差分求导(difference derivative,DD),差分点数为1~100,求导阶数为1~2。平滑类算法:Savitzky-Golay平滑(Savitzky-Golay smoothing,SGS),窗口参数为5~31(间隔为2),拟合次数为1~5。信号校正类算法:标准正态变量变换(standard normal variate transformation,SNV)、多元散射校正(multiplication scatter correction,MSC)、静分析信号(net analyte signal,NAS)、正交信号校正(orthogonal signal correction,OSC)、去趋势校正(de-trending,DT)和基线校正(baseline correction,BLC),其中NAS和OSC的主成分范围为1~20。
1.3.5 最佳算法参数组合和算法组合的筛选
综合所得模型的校正标准差(standard error of calibration,SEC)、验证标准差(standard error of prediction,SEP)、SEP/SEC和SEP-SEC以及主成分数对模型性能进行评价,从而判断不同算法参数组合和不同算法组合对模型性能的影响,从而找出针对检测生鲜羊肉中的TVB-N含量的最佳预处理方法。
SEP是模型对未知样品的近红外预测值与其含量之间的残差标准差,它代表了近红外分析的总误差,包括可靠性偏差、稳健性偏差和信息处理过程产生的误差,因此可以直接用于评价模型的预测准确性。
SEC是模型对校正集中各个样品的近红外预测值与含量之间的残差标准差,它只代表模型在建模样品范围内的分析误差,不包括稳健性偏差,因此SEP-SEC应大于0[29]。
美国谷物化学师协会的近红外分析标准中将SEP/SEC作为评价模型稳健性的参数,规定SEP/SEC应小于等于1.2,其值大于1.2时则表示模型的稳健性不够[24]。
每个主成分中都包含了一部分反映待测量的有效信息和一部分背景等无关信息。当引入的主成分数过少时,模型未能充分提取样品光谱信息中的有效信息,模型拟合不足,这时模型虽然稳健性较好,但对样品的预测准确性较差。当引入的主成分数过多时,模型提取了过多样品光谱信息中的噪声信息,模型过度拟合,这时模型虽然对校正集样品的预测准确性较好,但对未知样品的预测准确性较差且模型的稳健性较差。所以在保证模型的预测准确性和稳健性均较好时,主成分数越小,模型的性能越好。
因此本实验在筛选模型时,首先去除SEP/SEC大于1.2以及SEP-SEC小于0的模型,在剩余模型中选取SEP较小的模型,这些模型不仅稳健且预测准确性较好,然后再选取其中主成分数最小的模型即为性能最佳的模型,这个模型所对应的算法参数组合和算法组合即为最佳预处理方法。
2.1 样品TVB-N含量测定结果
表1 羊肉样品TVB-N含量的统计结果Table1 Statistical results of total volatile basic nitrogen content of mutton samples
如表1所示,其范围涵盖了国家标准对鲜、胴体羊肉的TVB-N含量所允许的最大值(15 mg/100 g),说明本实验选用的样品具有较强的代表性。
从总样品集中选取TVB-N含量分布均匀的91 个样品作为校正集,用于模型的建立;剩余的22 个样品作为验证集,用于验证模型的预测准确性和稳健性。
2.2 样品近红外光谱信息采集结果
图1 羊肉样品的近红外漫反射光谱图Fig.1 Near-infrared diffuse reflectance spectra of mutton samples
如图1a所示,在1 000~1 800 nm的光谱区域内,样品的近红外光谱曲线出现多处吸收峰呈递增或递减的趋势,说明本实验所用的羊肉样品在此区域内有很好的光谱响应。其次不同TVB-N含量的羊肉样品其近红外光谱曲线的谱形相似,但又不完全重合,既体现了样品间的差异性,又体现了总样品集的连续性。如图1b所示,同一羊肉样品2 次光谱采集所得的近红外光谱曲线基本重合,说明本实验所用的便携式近红外仪对同一样品进行多次光谱采集时,所得样品的光谱信息重复性较好。
2.3 最佳预处理方法的筛选
2.3.1 算法参数对模型性能的影响及算法最佳参数组合的确定
数据增强类算法中的AS算法和MC算法各只有一种参数组合。导数类算法中的SGD算法有14个窗口参数,4 个拟合次数,4 个求导阶数(拟合次数<窗口参数,求导阶数<拟合次数),共136 种参数组合;DD算法有100 个差分点数,2 个求导阶数,共200 种参数组合。平滑类算法中的SGS算法有14 个窗口参数,5 个拟合次数(拟合次数<窗口参数),共69 种参数组合。信号校正类算法中的DT、MSC、SNV算法和BLC算法各只有一种参数组合,NAS算法和OSC算法各有20 个主成分数,所以各有20 种参数组合。
表2 每种算法的最佳参数组合Table2 Optimal parameter combinations for each algorithm
由表2可知,单独使用导数类算法可以明显提高模型性能,单独使用其他算法,对提高模型性能的作用不大,一些算法甚至会降低模型的预测准确性或稳健性。近些年,国内一些学者在相关研究中也得到了类似的结论,例如刘源等[17]在研究应用近红外技术评价冰鲜大黄鱼新鲜度的过程中发现除导数算法有较好的预处理效果外,大多数预处理算法单独使用时的效果均不佳,一些算法的预处理结果远劣于无预处理方法时的结果。黄涛等[15]在研究基于近红外光谱的淡水鱼新鲜度在线检测方法的过程中发现使用单一算法对样品光谱信息进行预处理时,导数算法的预处理效果最好。
通过MC算法或AS算法来增加不同样品间光谱信息的差异后[30],模型各参数变化不大(表2中序号2、3),说明单独使用MC算法或AS算法,对于模型性能的影响不大。
在筛选SGD算法最佳参数组合的过程中发现,随着窗口数的增大,模型的SEC波动性增大,SEP波动性减小。当窗口参数过大时,模型的SEC较大,模型的预测准确性较差,说明预处理后光谱的分辨率大大减小,建模样品的光谱信息中丢失了大量的细节信息,模型拟合不足。当窗口参数过小时,模型的SEP远大于SEC,即SEP/SEC大于1.2,稳健性较差,说明预处理后建模样品光谱信息中的噪声不能有效地被去除,模型过度拟合,所以窗口参数不宜过大或过小。当求导阶数增加时,模型趋于拟合不足,所以求导阶数不宜过大。随着拟合次数的增加,模型趋于过度拟合,所以拟合次数也不宜过大。经过筛选发现当窗口参数为9,拟合次数为2,求导阶数为1时,所得模型的性能最佳。
在筛选DD算法最佳参数组合的过程中发现,模型各参数随差分点数的增大上下波动,没有明显变化规律;一阶导数和二阶导数对模型性能的影响没有明显区别。经过筛选,当差分点数为6,求导阶数为1时,DD算法的预处理效果最佳。
样品的光谱信息经SGD 9-2-1算法或DD 6-1算法预处理后(表2中序号4、5),所得模型的稳健性和预测准确性均明显提高。
在筛选SGS算法最佳参数组合的过程中发现,随着窗口参数的增大,模型的SEC逐渐增大,SEP逐渐减小。当窗口参数过大时,模型的SEC较大,模型的预测准确性较差,说明此时平滑过度,光谱的分辨率大大减小,建模样品的光谱信息中丢失了大量的细节信息,模型拟合不足。经过筛选,当SGS算法的窗口参数为25,拟合次数为3时,预处理后的模型性能最佳。
使用SGS 25-3算法对样品光谱信息中的随机噪声进行平滑处理后(表2中序号6),模型的预测准确性降低,说明单独使用SGS算法进行预处理效果不佳。
在筛选OSC算法最佳主成分数的过程中发现,随着主成分数的增加,所得模型的SEC波动性减小,SEP波动性增大,主成分数无明显变化规律。当主成分数过大时,模型的SEP远大于SEC,即SEP/SEC大于1.2,且模型的主因子过多,说明预处理后建模样品光谱信息中的噪声没有被有效地去除,模型过度拟合,稳健性较差。所以主成分数不宜过大。经过筛选,当OSC算法的主成分数为8时,对样品光谱信息的预处理效果最好。
单独使用OSC-8算法虽然不能提高模型的预测准确性,但大大降低了模型的主成分数(表2中序号7),使模型的稳健性更好[31]。
在筛选NAS算法最佳主成分数的过程中发现,随着NAS算法的主成分数增加,SEC波动性减小,SEP波动性增大,主成分数上下波动没有明显变化规律,当主成分数较大时,SEP远大于SEC,即SEP/SEC大于1.2且模型的主成分过多(表2中序号8),模型过度拟合,稳健性较差。当主成分数为1时,SEP/SEC仍大于1.2,且预处理后模型的SEP明显增大,模型的预测准确性降低,所以单独使用NAS算法进行预处理,会降低模型的预测准确性和稳健性。
SNV算法和MSC算法主要是消除样品表面颗粒分布不均匀及颗粒大小产生的散射影响,本实验样品的光谱信息在经过SNV和MSC算法预处理后,模型各参数变化不大(表2中序号9、10),说明单独使用SNV算法或MSC算法对模型性能的影响不大。
经DT算法或BLC算法预处理后,所得模型的SEC大幅减小,SEP大幅增大,导致SEP远大于SEC即SEP/SEC大于1.2,且引入的主成分过多(表2中序号11、12),模型明显过度拟合,稳健性差。说明单独使用DT算法或BLC算法对样品的光谱信息进行预处理,会降低模型的稳健性。
2.3.2 组合2 种算法对模型性能的影响
组合2 种算法对样品的光谱信息进行预处理后,部分模型的性能评价参数如表3所示。经MC算法与导数类算法组合以及DD算法与DT算法组合(表3中序号2~4)预处理后,模型的预测准确性和稳健性均明显提高。经一些算法组合(表3中序号5~14)预处理后,模型过度拟合,稳健性变差。组合AS算法与MSC算法(表3中序号15)进行预处理后,模型拟合不足,预测准确性变差。经MC算法与OSC算法组合(表3中序号16)预处理后,模型的SEC和SEP变化不大,但主成分数明显减小,说明在不损失预测准确性的前提下,模型更加稳健。MC算法与BLC算法组合以及AS算法与NAS算法组合对模型性能影响不大(表3中序号17、18)。组合MC算法与MSC算法以及组合SGS算法与NAS算法(表3中序号19、20)进行预处理后,不仅模型的预测准确性明显降低,其稳健性也变差。经DD算法与NAS算法(表3中序号21)组合预处理后,模型的预测准确性有所提高,但稳健性变差。
表3 组合2 种算法对模型性能的影响Table3 Effects of combining two algorithms on the models performance
2.3.3 组合3 种算法对模型性能的影响
如表4所示,组合MC算法、导数类算法、NAS算法以及组合MC、DD、BLC算法(表4中序号2~4)进行预处理后,模型的预测准确性和稳健性均明显提高。经其他一些算法(表4中序号5~9)组合预处理后,模型过度拟合,稳健性变差。组合另一些算法(表4中序号10~16)对样品的光谱信息进行预处理后,模型拟合不足,预测准确性变差。组合MC算法、SGD算法与SNV算法以及导数类算法、SGS算法与NAS算法(表4中序17~19)进行预处理后,不仅模型的预测准确性明显降低,其稳健性也变差。经AS算法、导数类算法与DT算法(表4中序号20、21)组合预处理后,模型的预测准确性有所提高,但稳健性变差。组合MC、DD算法与SNV算法以及AS算法、导数类算法与SNV算法(表4中序号22~24)进行预处理后,模型的SEC和SEP均有所增大且模型的主成分数较小,可以看出样品的光谱信息在预处理过程中丢失了大量的细节信息,模型出现拟合不足的趋势。
表4 组合3 种算法对模型性能的影响Table4 Effects of combining three algorithms on the model performance
2.3.4 组合4种算法对模型性能的影响
表5 组合4 种算法对模型性能的影响Table5 Effects of combining four algorithms on the model performance
如表5所示,数据增强类算法与导数类算法、SGS算法和MSC算法组合(表5中序号2~5)进行预处理后,模型明显拟合不足。组合AS算法与导数类算法、SGS算法和SNV算法(表5中序号6、7)进行预处理,模型的SEC 和SEP均有所增大且模型的主成分数减小,模型有拟合不足的趋势。经其他算法组合预处理后(未列出),模型不同程度的都出现了预测准确性下降和主成分数减小的情况。由此可见,组合4 种算法进行预处理,在去除噪声的同时样品的光谱信息中也丢失了大量反映细节的有效信息,导致模型拟合不足,模型对样品的预测准确性差。
2.3.5 最佳预处理算法及模型参数
通过模型性能评价指标对不同算法参数组合和算法组合的预处理效果进行筛选后发现,在建模前对样品的近红外光谱信息进行差分求导(窗口数为6,求导阶次为1)后,模型性能最佳。模型的SEC和SEP分别为1.21 和1.31,SEP/SEC=1.08,主成分数为10(表2中序号5),校正集相关系数(ratio of calibration,Rc)和验证集相关系数(ratio of prediction,Rp)分别为0.94和0.92。
图2 校正集和验证集样品的TVB-N含量与模型预测值相对应的散点图Fig.2 Scatter plot of measured versus predicted TVB-N content for calibration and prediction set samples
分别以校正集和验证集样品的TVB-N含量为横坐标,模型的预测值为纵坐标作图,如图2所示。校正集中,模型的预测值与校正集样品的TVB-N含量吻合度较高,模型的SEC为1.21,Rc为0.94,说明建模前对样品的光谱信息进行差分求导后,模型较好的拟合了光谱信息中反映样品TVB-N含量的信息。验证集中,样品的TVB-N含量和模型的预测值相关性较高,SEP为1.31,Rp为0.92,说明模型对验证集样品中的TVB-N含量有较好的预测准确性。
本研究以生鲜羊肉中的TVB-N含量作为检测对象,使用便携式近红外仪对完整样品进行近红外光谱信息的采集,从模型的预测准确性和稳健性两方面探讨算法参数和算法组合对模型性能的影响,筛选出针对检测生鲜羊肉中的TVB-N含量的最佳预处理方法。在筛选的过程中发现:不同的算法、算法参数和算法组合对模型性能的影响差别较大,恰当的预处理可以明显提高模型性能,不当的预处理会降低模型性能,所以在对样品光谱信息进行预处理的过程中,有必要先对算法的参数组合进行优化;主成分数组合多种算法进行预处理时,增加算法的数量不一定能提高模型性能,相反,当组合的算法过多时,会对样品的光谱信息预处理过度,在去除噪声的同时也丢失了大量的细节信息,导致模型拟合不足,预测准确性减小。所以算法的数量不宜过多。组合不同算法进行预处理时,预处理效果不线性叠加。
针对检测生鲜羊肉中的TVB-N含量,对样品的近红外光谱信息进行差分求导(窗口数为6,求导阶次为1)
后建模,模型性能最佳。模型的SEC和SEP分别为1.21和1.31,SEP/SEC=1.08小于1.2,主成分数为10,Rc和Rp分别为0.94和0.92。说明单独使用差分导数可以有效减弱检测过程中便携式近红外仪和样品组织结构等对样品光谱信息的影响,提高模型的预测准确性和稳健性,实现现场快速无损检测生鲜羊肉TVB-N的目的。
本研究没有考虑算法组合中算法顺序对模型性能影响,事实上,本研究选用的算法部分是非线性的,所以算法顺序也会影响模型的性能,日后还需做进一步研究。
[1] 张蕾蕾, 彭彦昆, 陶斐斐, 等. 肉品挥发性盐基氮的高光谱无损快速检测[J]. 食品安全质量检测学报, 2012, 3(6): 575-579.
[2] 上海市食品卫生监督检验所. 肉与肉制品卫生标准的分析方法: GB/T 5009.44—2003[S]. 北京: 中国标准出版社, 2003.
[3] 商务部屠宰技术鉴定中心, 江苏雨润食品产业集团有限公司. 鲜、冻胴体羊肉: GB/T 9961—2008[S]. 北京: 中国标准出版社, 2008.
[4] 郭亚萍, 张永春, 陈宇. 鲜肉中挥发性盐基氮含量测定的不确定度评定[J]. 北京工商大学学报(自然科学版), 2011, 29(2): 37-41. DOI:10.3969/j.issn.2095-6002.2011.02.008.
[5] 刘雪云. 挥发性盐基氮检测方法的现状及研究[J]. 农产品加工(学刊), 2014(1): 51-53.
[6] 赵峰, 林河通, 杨江帆, 等. 基于近红外光谱的武夷岩茶品质成分在线检测[J]. 农业工程学报, 2014, 30(2): 269-277.
[7] 介邓飞, 陈猛, 谢丽娟, 等. 适宜西瓜检测部位提高近红外光谱糖度预测模型精度[J]. 农业工程学报, 2014, 30(9): 229-234. DOI:10.3969/j.issn.1002-6819.2014.09.028.
[8] 张瑶, 李民赞, 郑立华, 等. 基于近红外光谱分析的土壤分层氮素含量预测[J]. 农业工程学报, 2015, 31(9): 121-126. DOI:10.11975/ j.issn.1002-6819.2015.09.019.
[9] 吕杰, 郝宁燕, 崔晓临. 利用可见光近红外的尾矿区农田土壤Cu含量反演[J]. 农业工程学报, 2015, 31(9): 265-270. DOI:10.11975/ j.issn.1002-6819.2015.09.040.
[10] 李东华, 潘园园, 张卉. 利用近红外光谱技术检测掺假豆浆[J]. 农业工程学报, 2014, 30(3): 238-242.
[11] KAMRUZZAMAN M, ELMASRY G, SUN Dawen, et al. Nondestructive prediction and visualization of chemical composition in lamb meat using NIR hyperspectral imaging and multivariate regression[J]. Innovative Food Science and Emerging Technologies, 2012, 16: 218-226. DOI:10.1016/j.ifset.2012.06.003.
[12] 蔡健荣, 万新民, 陈全胜. 近红外光谱法快速检测猪肉中挥发性盐基氮的含量[J]. 光学学报, 2009, 29(10): 2808-2811.
[13] 马世榜, 彭彦昆, 徐杨, 等. 可见/近红外光谱结合变量选择方法检测牛肉挥发性盐基氮[J]. 江苏大学学报(自然科学版), 2013, 34(1): 44-48. DOI:10.3969/j.issn.1671-7775.2013.01.009.
[14] 陈伟华, 许长华, 樊玉霞, 等. 近红外光谱技术快速无损评价罗非鱼片新鲜度[J]. 食品科学, 2014, 35(24): 164-168. DOI:10.7506/ spkx1002-6630-201424031.
[15] 黄涛, 李小昱, 彭毅, 等. 基于近红外光谱的淡水鱼新鲜度在线检测方法研究[J]. 光谱学与光谱分析, 2014, 34(10): 2732-2736. DOI:10.3964/j.issn.1000-0593(2014)10-2732-05.
[16] 杨勇, 王殿友, 杨庆余, 等. 近红外光谱技术快速测定鹅肉新鲜度[J].食品科学, 2014, 35(24): 239-242. DOI:10.7506/spkx1002-6630-201424046.
[17] 刘源, 陈伟华, 侯巧娟, 等. 应用近红外光谱技术评价冰鲜大黄鱼新鲜度的研究[J]. 光谱学与光谱分析, 2014, 34(4): 937-941. DOI:10.3964/j.issn.1000-0593(2014)04-0937-05.
[18] 杨建松, 孟庆翔, 任丽萍, 等. 近红外光谱法快速测定牛肉品质[J].光谱学与光谱分析, 2010, 30(3): 685-687.
[19] 刘魁武, 成芳, 林宏建, 等. 可见/近红外光谱检测冷鲜猪肉中的脂肪、蛋白质和水分含量[J]. 光谱学与光谱分析, 2009, 29(1): 102-105. DOI:10.3964/j.issn.1000-0593(2009)01-0102-04.
[20] ALOMAR D, GALLO C, FUCHSLOCHER R, et al. Chemical and discriminant analysis of bovine meat by near infrared reflectance spectroscopy (NIRS)[J]. Meat Science, 2003, 63(4): 441-450. DOI:10.1016/S0309-1740(02)00101-8.
[21] PRIETO N, ANDRÉS S, GIRÁLDEZ F J, et al. Potential use of near infrared reflectance spectroscopy (NIRS) for the estimation of chemical composition of oxen meat samples[J]. Meat Science, 2006, 74(3): 487-496. DOI:10.1016/j.meatsci.2006.04.030.
[22] RIPOLL G, ALBERTÍ P, PANEA B, et al. Near-infrared reflectance spectroscopy for predicting chemical, instrumental and sensory quality of beef[J]. Meat Science, 2008, 80(3): 697-702. DOI:10.1016/ j.meatsci.2008.03.009.
[23] 陶琳丽, 杨秀娟, 邓君明, 等. 禽畜肉化学成分近红外光谱检测技术研究进展[J]. 光谱学与光谱分析, 2013, 33(11): 3002-3009.
[24] AACC. Near-infrared methods-guidelines for model development and maintenance: method 39-00[S].
[25] 夏俊芳, 李培武, 李小昱, 等. 不同预处理对近红外光谱检测脐橙VC含量的影响[J]. 农业机械学报, 2007, 38(6): 107-111. DOI:10.3969/ j.issn.1000-1298.2007.06.027.
[26] 王远辉, 黎庆涛, 姜毅, 等. 在线检测白砂糖近红外光谱的预处理方法研究[J]. 食品科技, 2009, 34(8): 283-286.
[27] 江泽慧, 费本华, 杨忠. 光谱预处理对近红外光谱预测木材纤维素结晶度的影响[J]. 光谱学与光谱分析, 2007, 27(3): 435-438. DOI:10.3321/j.issn:1000-0593.2007.03.006.
[28] 吴静珠, 李慧, 王克栋, 等. 光谱预处理在农业产品近红外模型优化中的应用研究[J]. 农机化研究, 2011(3): 178-181.
[29] 严衍禄, 陈斌, 朱大洲, 等. 近红外光谱分析的原理、技术与应用[M].北京: 中国轻工业出版社, 2013: 170-171.
[30] 褚小立, 袁洪福, 陆婉珍. 近红外分析中光谱预处理及波长选择方法进展与应用[J]. 化学进展, 2004, 16(4): 528-542. DOI:10.3321/ j.issn:1005-281X.2004.04.008.
[31] 尼珍, 胡昌勤, 冯芳. 近红外分析中光谱预处理方法的作用及其发展[J]. 药物分析杂志, 2008, 28(5): 824-829.
Effects of Spectral Pretreatments on Prediction of Total Volatile Basic Nitrogen (TVB-N) Content in Mutton Using Near Infrared Spectroscopy
ZOU Hao1, TIAN Hanyou1, LIU Fei1, LI Wencai1, WANG Hui1, LI Jiapeng1, CHEN Wenhua1, DI Yanquan2, QIAO Xiaoling1,*
(1. Beijing Key Laboratory of Meat Processing Technology, China Meat Research Center, Beijing 100068, China; 2. Focused Photonics Inc., Hangzhou 310052, China)
This study aimed at in situ, rapid and nondestructive detection of total volatile basic nitrogen (TVB-N) content in fresh raw mutton using near infrared spectroscopy. We checked whether the impact of porTablenear infrared spectrometer and microstructure of samples on the spectral information of the samples could be reduced or even eliminated by adjusting algorithm parameters and combing different algorithms for the purpose of improving the accuracy and robustness of the prediction model developed. Various individual algorithms with different parameter combinations and various algorithm combinations were used to pretreat the spectral information of the samples for modeling. The effects of algorithm parameters and algorithm combinations on the performance of the model in terms of predictive accuracy and stability were evaluated and discussed to find the optimal pretreatment method. The results showed that different algorithm parameter combinations and different algorithm combinations distinctly affected the model performance. When the spectral information of the sample was pretreated with difference derivatives (window parameter is 6, and order of differentiation is 1), the best model performance was achieved. The standard error of calibration (SEC) and standard error of prediction (SEP) of the model were 1.21 and 1.31, respectively, with SEP/SEC = 1.08 < 1.2. The number of principal components was 10. The correlation coefficients of calibration and prediction were 0.94 and 0.92, respectively. Our study verified that spectral information pretreatment with proper algorithm parameter combination and algorithm combination can significantly improve the model performance and allow fast, non-destructive and on-the-spot detection of TVB-N in mutton.
near infrared spectroscopy; pretreatment; fresh raw mutton; TVB-N; porTablenear infrared spectrometer
10.7506/spkx1002-6630-201622027
O657.33
A
1002-6630(2016)22-0180-07
邹昊, 田寒友, 刘飞, 等. 近红外光谱的预处理对羊肉TVB-N模型的影响[J]. 食品科学, 2016, 37(22): 180-186. DOI:10.7506/spkx1002-6630-201622027. http://www.spkx.net.cn
ZOU Hao, TIAN Hanyou, LIU Fei, et al. Effects of spectral pretreatments on prediction of total volatile basic nitrogen (TVB-N) content in mutton using near infrared spectroscopy[J]. Food Science, 2016, 37(22): 180-186. (in Chinese with English abstract) DOI:10.7506/spkx1002-6630-201622027. http://www.spkx.net.cn
2016-05-05
“十二五”国家科技支撑计划项目(2014BAD04B05)
邹昊(1988—),男,学士,研究方向为肉品品质无损检测技术。E-mail:1016039906@qq.com
*通信作者:乔晓玲(1964—),女,教授级高级工程师,学士,研究方向为肉制品加工技术。E-mail:cmrcsen@126.com