查靖,葛玲,姚颖,李婷婷,龙白雪,刘鑫汉,2,王武,2*,马飞,2*
(1.合肥工业大学 食品与生物工程学院,安徽 合肥 230009;2.皖南特色农产品加工技术研究与应用中心,安徽 宣城 242000;3.宣城市宣州区农业农村局,安徽 宣城 242000)
挥发性盐基氮(total volatile basic nitrogen,TVBN)成分有氨、二甲胺、三甲胺等,是衡量鱼肉新鲜度的重要指标之一[1]。研究发现,TVB-N 与氨基酸破坏程度显著正相关,特别是蛋氨酸和酪氨酸的降解,会在很大程度上改变鱼肉颜色和风味,造成严重的品质劣化[2]。目前,我国对TVB-N 值有明确规定,预制动物性水产品不得超过30 mg/100 g[3]。虽然臭鳜鱼作为盐渍预制性水产品不在此标准约束之列,但考虑到TVB-N 对臭鳜鱼新鲜度的影响,开展TVB-N 检测十分必要。
目前,传统的TVB-N 检测以凯氏定氮法和微量扩散法为主,这类方法效率低且对样品具有破坏性[4]。随着科技发展,比色传感、高光谱成像和电子鼻等新技术也被用于肉和肉制品的TVB-N 无损检测中[5-7]。然而,这些方法均存在较多局限性,主要表现为比色传感存在环境污染和交叉敏感,高光谱成像存在间接性和数据分析复杂,电子鼻存在设备昂贵且使用寿命短等问题,难以满足工业场景应用[8-9]。
傅里叶变换红外光谱(Fourier transform infrared spectroscopy,FT-IR)是根据分子内部原子间的相对振动和分子转动等信息来确定物质分子结构[10]。由于FT-IR 灵敏度高,被广泛应用于食品新鲜度识别[11]、掺假造假识别[12]、农药残留检测[13]、疾病的快速诊断[14]、环境气体监测[15]等领域。这些研究表明基于气相FT-IR技术在食品分析领域具有较大应用潜力。然而,基于FT-IR 技术无损检测肉及肉制品中TVB-N 未见文献报道。因此,本文以臭鳜鱼为研究对象,探究FT-IR 分析技术对臭鳜鱼中TVB-N 检测的可行性。
机器学习是当前工业现代化背景下的研究热点,被广泛用于处理大量数据和建立与优化各种模型。在光谱预处理上,Savitzky-Golay 平滑(Savitzky-golay smooth,S-GS)在滤除噪声的同时可以确保信号的形状,小波阈值去噪(wavelet threshold denoising,WTD)能在平滑的同时较好地保留反映原始信号特征的尖峰点,稳健局部加权回归(robust locally weighted regression,RLWR)在处理离群值时更为稳健,模拟退火-偏最小二乘(simulated annealing-partial least squares,SAPLS)特征选择具有跳出局部最小值而搜索全局最小值的特点[16-18]。在回归分析方面,偏最小二乘回归(partial least squares regression,PLSR)和支持向量机(support vector machines,SVM)是两种经典的线性和非线性回归建模方法。PLSR 通过将预测和观测变量投影到新的变量空间,将复杂光谱变量转化为少数的潜变量(latent variables,LVs),广泛应用于变量多且高度共线时构建预测模型[19];SVM 应用了一个非线性神经元的隐藏层、一个输出线性神经元和一个专门的学习过程,实现了全局最优值求解和对未知样本良好的泛化能力,被广泛用于回归和分类等多种机器学习[20]。机器学习的应用对于工业现代化具有重要现实意义。
本文使用气相FT-IR 获取臭鳜鱼挥发物的红外光谱,利用移动平均(moving average,MA)、S-GS、高斯滤波(gaussian filtering,GF)、RLWR 和WTD 对光谱进行预处理,采用区间偏最小二乘(interval partial least squares,iPLS)和SA-PLS 进行特征波段选择,构建PLSR 和SVM 检测模型,以相对预测误差(ratio of prediction deviation,RPD)确定较优的预测模型,以期为研发臭鳜鱼TVB-N 无损检测技术提供参考。
臭鳜鱼:市售,均为同一批发酵而成产品,质量为(400±30)g,冰藏运输至合肥工业大学食品与生物工程学院实验室;甲基红、溴甲酚绿、硼酸、盐酸、氧化镁、无水碳酸钠(均为分析纯):国药集团化学试剂有限公司;E-switch 铝箔气体采样袋:上海申源科学仪器有限公司。
IS50 傅里叶变换红外光谱仪:美国赛默飞世尔科技公司;LHP-100 恒温恒湿培养箱:上海三发科学仪器有限公司;K9860 全自动凯氏定氮仪:济南海能仪器股份有限公司;16 m 长光程气室:美国PIKE 技术公司。
将臭鳜鱼分别装入贮藏袋(材质:PA/PE 复合性材料),置于恒温恒培养湿箱(20 ℃、75%湿度)中进行贮藏试验。分别在0、24、48 h 和72 h 取出12 条臭鳜鱼样本,使用气体采样袋收集挥发性气体。
采用置换法减少气体池内气体的影响,使用真空泵将气体池内气体抽出,充入氮气,重复3 次,在每个样本采集前重复此操作。红外光谱的谱仪参数设置:扫描范围为4 000~400 cm-1,分辨率0.5 cm-1,扫描频率为64 次。使用真空泵将气体池内气体抽出,直至压力表显示为-75 kPa,扫描获取背景光谱。连接气体采样袋与气体池,打开进气口阀门和气体采样袋阀门,泵入挥发性气体,至压力表显示为0,在相同条件下获取样本挥发物的红外光谱,每个气体样本重复采集3 次,取平均值。共获取48 个样本的光谱,以36 个样品作为校正集,用于建立预测模型,以12 个样品作为测试集,用于对建立的数学模型进行验证。
参考GB 5009.228—2016《食品安全国家标准食品中挥发性盐基氮的测定》[21]方法检测鱼肉中的挥发性盐基氮。在获得臭鳜鱼挥发物红外光谱后,将臭鳜鱼各部位肉绞碎,取绞碎鱼肉10 g(精确至0.001 g),加入100 mL 超纯水,超声辅助提取15 min,过滤,采用全自动凯氏定氮仪测定。
1.6.1 平滑
基于窗口的平滑方法主要包括MA、S-GS、GF 和RLWR。MA 是对光谱的每个窗口进行移动平均,这种方法有利于减少数据的周期性趋势;S-GS 是对光谱的每个窗口拟合的二次多项式进行平滑处理,当数据快速变化时,这种方法比其他方法更有效;GF 对每个窗口进行移动加权平均;RLWR 是对每个窗口进行稳健线性回归,它在处理离群值时更为稳健。通过改变平滑窗口长度,分别对平滑后光谱建立预测模型,以预测结果的预测均方误差(root mean square error of prediction,RMSEP)选择最优窗口长度。
在WTD 中,小波基函数、阈值类型和小波分解级别等参数的选择均会对最终的信号去噪效果产生很大影响[22]。本文选择多贝西小波,阈值类型包括硬阈值和软阈值。通过改变消失矩、阈值类型和小波分解的级别,分别对平滑后光谱建立预测模型,以预测结果的RMSEP 选择合适参数对光谱进行平滑处理。
1.6.2 特征选择
SA-PLS 的使用参考文献[23]的方法,基于初始波段组合,构建PLS 模型,以预测集R2p及RMSEP 作为SA 的适应度函数,通过Metropolis 准则以一定概率接受新的解集的思想,在全光谱内搜索随机变量,以促进从局部最小值到全局最小值的移动。其参数设置分别为子区间的长度41 cm-1和数量5,初始波段组合861~820、921~880、1 162~1 121、2 844~2 803、3 085~3 044 cm-1,初始温度700,外循环最大迭代次数600,链长500,退温速率0.95。
iPLS 被广泛用于特征光谱区间的优化选择[24]。它是将整个光谱范围划分为n 个等长的子区间,通过建立每个子区间的独立PLSR 模型,以每个子模型的交叉验证的均方根误差作为模型的判断标准选取最优的子区间组合,本文选择5 个长度为41 cm-1子区间作为新的光谱变量。
1.6.3 回归模型
PLSR 是基于多元线性回归改进而来[25],将复杂光谱变量转化为少数的LVs,以LVs 解释的百分比方差和RMSEP 选择合适的LVs 数量,建立TVB-N 预测模型。
SVM 是机器学习中伴随人工神经网络而出现的热点,涉及到分类和回归等许多实际问题,参考文献[26]的方法,采用MATLAB 2020a 中fitrsvm 函数建模,并使用自动超参数优化,找到使五折交叉验证损失最小的超参数,建立TVB-N 预测模型。
光谱处理及预测模型构建通过MATLAB 2020a 完成。显著性分析通过SPSS Statistics 24 完成。图形绘制采用Origin 2019b。
TVB-N 随贮藏时间的变化见图1。
图1 TVB-N 随贮藏时间的变化Fig.1 Changes in TVB-N over storage time
由图1 可知,新鲜臭鳜鱼中TVB-N 为39.90 mg/100 g,在内源酶和微生物的作用下,鱼肉中蛋白质被分解为碱性含氮物质[27],使得贮藏过程中TVB-N 显著增加(P<0.05),在24、48 h 和72 h 后分别达到了56.12、68.31 mg/100 g和86.38 mg/100 g,接近限量标准的3 倍,高含量TVB-N不仅会降低臭鳜鱼的营养价值,食用也会对人体健康产生严重危害[28]。因此,实现臭鳜鱼发酵贮藏过程TVBN 的在线无损检测对于消费者健康至关重要。
臭鳜鱼在贮藏过程中释放的挥发物产生了大量的特征红外吸收峰,为去除水汽和二氧化碳吸收的影响,取1 300~780 cm-1和3 300~2 500 cm-1范围的红外光谱进行分析。臭鳜鱼挥发物红外光谱见图2。
图2 臭鳜鱼挥发物的红外光谱Fig.2 Infrared spectra of volatiles from stinky mandarin fish
由图2a 为1 300~780 cm-1范围的红外光谱,其中1 200~800 cm-1包含许多窄的吸收峰,这与鱼肉释放的氨有关,特别是在1 078、1 069 cm-1和966 cm-1,是氨的特征吸收峰[29]。图2b 为3 300~2 500 cm-1范围的红外光谱,在3 150~2 750 cm-1产生的特征吸收主要与贮藏过程产生的胺类物质有关[30],尤其是三甲胺,它是TVB-N 的主要成分,也是被用来评估鱼变质程度的特征化合物,主要由鱼肉中氧化三甲胺经微生物作用而产生[28,31];在2 650~2 550 cm-1范围产生的特征吸收主要与甲硫醇相关,由含硫氨基酸在微生物作用下降解产生[32]。这些特征吸收峰与臭鳜鱼变质密切相关,且吸收峰强度与TVB-N 含量变化呈正相关。因此,结合红外光谱和计量学分析对TVB-N 预测具有理论支撑。
采用MA、S-GS、GF 和RLWR 平滑方法,依次改变窗口长度获取对应平滑处理后的光谱,并分别建立预测模型,其RMSEP 变化如图3 所示。
图3 4 种平滑方法在不同窗口长度下建立的预测模型RMSEP 变化Fig.3 Changes in RMSEP of prediction models established by four smoothing methods with different window lengths
由图3 可知,随着窗口长度的变化,MA、S-GS 和GF 对模型性能的影响均先提高后降低,分别在窗口长度为17、31 和26 时模型最佳,RMSEP 分别为7.156 6、7.179 8 和7.150 4;RLWR 对RMSEP 的影响呈振荡形式,在窗口长度为22 时模型最佳,RMSEP 为5.7689。结果表明光谱平滑对于优化模型至关重要。
采用小波阈值去噪对光谱进行平滑处理,平滑光谱建立模型的RMSEP 变化见图4。
图4 小波阈值去噪在不同参数下建立的预测模型RMSEP 变化Fig.4 Change in RMSEP of prediction models established by wavelet threshold denoising with different parameters
由图4 可知,图4a 和图4b 分别为硬阈值和软阈值在不同消失矩和小波分解等级下,平滑后光谱所建立预测模型的RMSEP 变化。当阈值类型为软阈值,小波函数为db2,平滑等级为6 时,RMSEP 为6.991 9,优于硬阈值(RMSEP=7.107 7)。原因在于软阈值法将绝对值大于阈值的小波系数不完全保留,进行收缩处理,使得小波系数整体连续性较好,避免附加振荡信号产生[33]。
平滑后光谱结果见图5。
图5 原始光谱及平滑后光谱Fig.5 Original spectra and smoothed spectra
由图5 可知,对比于原始光谱,5 种平滑方法均有效减少了光谱中杂峰。虽然WTD 在平滑过程中有效保留光谱中的尖峰,如1 244 cm-1,但其平滑效果并不明显,而MA、GF、S-GS 和RLWR 有效平滑了在990~930 cm-1和1 090~1 025 cm-1出现的大量杂峰,这也是氨及胺类物质的特征吸收波段。结果表明,光谱平滑处理有效提高了光谱信噪比。
基于原始光谱的PLSR 和SVM 模型对TVB-N 预测结果见表1。
表1 基于原始光谱的PLSR 和SVM 模型对TVB-N 检测Table 1 Detection of TVB-N by PLSR and SVM models based on raw spectra
表1 总结了PLSR 和SVM 回归模型的校正集的R2c、测试集的RMSEP 和R2p,并以RPD 值评估模型的鲁棒性。当RPD 小于1.4 时,认为所建模型不可靠;介于1.4~2.0,认为所建模型较可靠;RPD 大于2.0,则认为所建模型具备较高可靠性,能够用于模型分析[34]。由表1 可知,构建的SVM 预测模型R2p为0.870 9,RPD值为2.812 8,PLSR 预测模型R2p为0.853 2,RPD 值为2.542 3,模型均具备较高可靠性。良好的预测结果证明了通过挥发物的红外光谱预测TVB-N 具有可行性。
平滑后光谱建立预测模型结果如表2 所示。
表2 基于5 种平滑处理方法的PLSR 和SVM 模型对TVB-N 检测Table 2 Detection of TVB-N by PLSR and SVM models based on five smoothing methods
由表2 可知,5 种平滑方法对于TVB-N 检测精度均具有积极影响。其中,RLWR 平滑处理结果最佳,可能由于该方法在平滑过程中将异常值赋予较小的权重。PLSR 预测模型R2p和RPD 分别为0.901 0 和3.247 0。因此,平滑对于提高FT-IR 工业在线检测精度十分重要。
尽管通过平滑处理减少了无用光谱信息,但模型的稳健性仍具有提升空间。在RLWR 平滑光谱的基础上,采用iPLS 和SA-PLS 对光谱进行特征波段选择,减少无关光谱变量,提高模型性能和运行效率。对两种方法各选择了5 个长度为41 cm-1的子区间,SAPLS 特征选择结果(850~809、993~952、1 145~1 104、2 804~2 763、3 123~3 082 cm-1)和iPLS 特征选择结果(821~780、944~903、985~944、1 067~1 026、1 108~1 067 cm-1)见图6。
图6 特征波段选择结果Fig.6 Selection of characteristic wavebands
由图6 可知,在SA-PLS 选取的5 个波段中,2 804~2 763、3 123~3 082 与胺的吸收相关,850~809、993~952、1 145~1 104 cm-1与氨吸收相关,而iPLS 只选择了1 300~780 cm-1范围内的光谱特征,忽略胺类物质在3 150~2 750 cm-1特征吸收。从选择结果可知,SA-PLS优于iPLS,这来源于SA 具有能跳出局部最小值搜索全局最小值的优势[35]。
特征波段选择后光谱的建模结果见表3。
表3 基于SA-PLS 和iPLS 特征选择的PLSR 和SVM 模型对TVB-N 检测Table 3 Detection of TVB-N by PLSR and SVM models based on SA-PLS and iPLS for feature selection
由表3 可知,SA-PLS 显著优于iPLS,虽然特征波段选择减少了重要光谱信息,使得SVM 模型性能降低(R2p=0.886 4,RPD=2.892 2),但变量数量减少了84.46%,运行效率得到显著提升。RLWR-SA-PLS 模型预测结果R2p和RPD 分别为0.942 8 和4.005 0,模型具有可靠性,且优于非线性模型SVM。因此,结合光谱信息与RLWR-SA-PLS 模型可以高精度检测臭鳜鱼TVB-N。
TVB-N 是衡量臭鳜鱼新鲜度的一项重要指标,本文利用气相FT-IR 结合化学计量学开展臭鳜鱼TVBN 含量的无损检测技术研究。基于挥发物的红外光谱建立PLSR 和SVM 两种TVB-N 预测模型,模型可靠性较高(SVM,R2p=0.870 9,RPD=2.812 8),证明方案具有可行性;5 种光谱平滑处理结果表明,RLWR 不仅能有效平滑光谱杂峰,同时还可以提升模型性能(PLSR,R2p=0.901 0,RPD=3.247 0);在此基础上,由SAPLS 优选的5 个特征波段(850~809、993~952、1 145~1 104、2 804~2 763、3 123~3 082 cm-1)可实现TVB-N的高精度预测(PLSR,R2p=0.942 8,RPD=4.005 0),RLWR-SA-PLS 实现了数据维度的明显降低和识别效率的明显提升。因此,基于气相FT-IR 可以实现臭鳜鱼中TVB-N 的无损检测,具备工业在线应用可行性。