王建伟,叶升
(1.天津大学 生命科学学院,天津 300072;2.杭州娃哈哈集团有限公司,杭州 310009)
食品的营养价值取决于食品中营养成分的含量,通常来说,食品的营养成分包括蛋白质、糖类、脂肪、水分等,这些成分的含量对食品的感官品质及口感、风味都有重要的影响,是评价食品品质和营养价值的重要指标。通过分析化学及仪器分析方法对食品成分进行检测,是目前食品成分检测的常规方法。这些方法虽然具有检测精度高的优点,但受限于实验操作复杂、存在试剂消耗、检测速度慢、对样品有破坏等缺点,其已无法满足食品生产和质量检测过程中大规模、快速、无损检测的需求。
近红外光是指波长介于可见区和中红外区的电磁波,其波长范围约为760~2500 nm。在近红外区域中,光谱的主要信息来源于C-H、N-H和O-H等含氢基团的倍频和合频吸收。通过检测样品的近红外光谱,不仅能得到分子的结构、组成信息,还能得到样品的物理状态信息,从而可实现对样品内各成分的定量或定性检测[1-3]。近红外光谱技术无需对样品做严格的预处理,可检测固体、液体、粉末等多种状态的样品,具有检测速度快、精度高、无损、无污染等优点,目前已被广泛应用于食品质量和食品安全检测领域[4-7]。
本文综述了近红外光谱技术在食品成分检测中的应用,首先对近红外光谱技术的特点和优势进行了概括,然后对近红外光谱技术应用于食品中蛋白质、糖类、脂肪、调味品等成分的定量或定性分析方面的研究进行了阐述,最后对近红外光谱技术应用于食品成分检测进行了总结和展望。
近红外光谱技术在食品成分定量、定性分析领域有着广泛的应用,其具有应用范围广、非破坏性、检测速度快、操作简单等优点。
近红外光谱中的主要信息来源为C-H、N-H和O-H等含氢基团的倍频和合频吸收,几乎可应用于所有具有含氢基团样品的理化性质检测。同时,近红外光谱有较强的穿透能力,具有多种光谱采集方式,可应用于液体、固体、粉末、气体等多种状态样品的检测。
近红外光谱技术不需要对样品进行任何化学或物理方式的预处理,即可获得样品的物质信息。因此,近红外光谱技术可对样品进行非破坏性的检测,有利于实现样品的原位检测和在线分析。
近红外光谱技术测量速度快,通常可在1 min内完成光谱的测量。在建立样品的成分预测模型后,通过单次测量样品的光谱数据,即可实现多种组分的定性或定量分析,因此可实现在线分析。
近红外光谱分析通常基于一个已建立好的、稳定的分析模型,整个分析流程中不需要实验人员过多操作,检测结果受人为因素干扰小,比常规分析方法操作简单,且具有更好的重现性。
近红外光谱技术具有快速、便捷、高效等优点,目前已被广泛应用于食品成分检测领域[8-9],如食品中蛋白质、糖类、脂肪、调味品及其他成分的检测。
蛋白质是乳制品、谷物、肉类等食物的主要营养成分,蛋白质的含量直接影响到食物的食用口感、加工特性和营养价值,因此在生产过程中需要对蛋白质含量进行检测,以确保食品品质。目前,常规的蛋白质含量检测方法为凯氏定氮法,其实验操作较为繁琐、检测时间长,是一种破坏性的检测方法,不适合食品生产过程中的实时检测和质量控制。近红外光谱技术具有不破坏样品、快速、无污染的优点,可用于乳制品、谷物、肉类中的蛋白质含量检测。
方雄武等[10]搭建了一套近红外透射光谱系统,并采集了同一批次的200个牛奶样品,经化学方法测定蛋白质含量后,在650~950 nm范围内采集了样品的近红外光谱,用多元线性回归方法建立了牛奶中蛋白质的定量分析模型,模型的校验集决定系数大于0.9,预测效果良好。赵明富等[11]选择了不同波段的牛奶光谱数据,并采用吸光度、吸光比、吸光值3种光谱方式,结合偏最小二乘法建立了牛奶中蛋白质含量的近红外预测模型。研究结果表明,由吸光度光谱建立的模型更为精确,相关系数达到了0.99以上,且蛋白质在2180 nm处建立的预测模型比2056 nm处建立的模型准确度要高。
陈素彬等[12]采集了不同产地、不同品种的248种小麦样本的近红外光谱,并用凯氏定氮法测得其标准蛋白质含量,经光谱预处理、样本集划分、建模参数优化后,确认LS-SVM(最小二乘支持向量机)模型具有最优的小麦蛋白质含量预测性能,其相对分析误差RPD为8.02,达到国际谷物科技协会标准等级“非常好”,可用于实际检测工作。王纯阳等[13]以水稻突变体库为分析对象,研究了漫反射、透射、透反射3种检测模式对水稻近红外光谱及定量模型的影响。研究结果表明,在透射光谱检测模式下,可以建立准确度较高的单粒稻种蛋白质定量模型,偏最小二乘(PLS)模型的决定系数R2为0.96,预测均方根误差RMSEP为0.24%,且该模型对不同来源的水稻种子具有适用性,可应用于水稻育种行业。
牛晓颖等[14]采集了40份不同个体和部位的驴肉肉块样品在4000~12500 cm-1的近红外光谱数据,并用常规化学方法测定样品中蛋白质含量作为参考数据,使用偏最小二乘回归降维结合支持向量回归算法建立了驴肉的蛋白质含量预测模型,其交叉验证均方根误差和相对预测误差分别达到了0.111%和14.39,模型预测精度比较高,可对驴肉的蛋白质含量进行可靠的检测。赵文英等[15]采集了牛、羊、猪肉样品在4000~10000 cm-1的近红外光谱数据,并用偏最小二乘法分别建立了3种样品及混合鲜肉肉糜的蛋白质含量定量分析模型,实验结果表明混合鲜肉肉糜的预测集相关系数为0.929,预测均方根误差为0.669,模型可很好地实现鲜肉蛋白质含量的快速测定。
糖类是水果中重要的营养素和风味物质,它影响着水果的成熟度、口感和品质。水果内的糖类主要为蔗糖、果糖和葡萄糖,其中蔗糖为最主要的积累形式,在酶的作用下,蔗糖可转化为另外两种糖。糖含量的传统检测方法为折射仪、糖度计等,检测过程费时费力,而近红外光谱技术具有无损、快捷、精度高等优点,是水果中糖含量检测的发展趋势。
雷鹰等[16]以不同品种的苹果为研究对象,采集其在900~1700 nm外的近红外光谱数据,并用糖度计测定其糖度值作为参考,经光谱预处理和波段优化后,利用偏最小二乘回归法建立了苹果糖度的预测模型,其预测相关系数为0.919,预测均方根误差为0.237,可对11.2~16.3 Brix范围内的苹果进行糖度预测。盛晓慧等[17]采集了香梨在9140~19920 cm-1外的近红外光谱数据,利用高效液相色谱法测定其可溶性糖含量,经波段优选,建立了基于最小二乘支持向量机算法的香梨可溶性糖预测模型,其预测相关系数为0.976,预测均方根误差为2.313,可实现香梨可溶性糖的在线精准检测。李雄等[18]采用近红外光谱漫反射技术结合偏最小二乘模型,实现了不同品种柚子糖度的无损在线检测,建立模型的预测相关系数为0.86,预测均方根误差为0.55,对柚子的在线分级具有参考意义。刘燕德等[19]研究了脐橙尺寸对近红外在线检测精度的影响,建立了漫透射、多点发射与接收漫反射、环形发射与接收漫反射3种检测方式下的大果、小果、混合果糖糖度的PLS(偏最小二乘法)模型。其中在漫透射检测方式下,混合果糖度预测模型的预测效果最优,预测相关系数为0.84,预测均方根误差为0.64,该研究为不同尺寸脐橙的糖度在线检测提供了参考。杨泉女等[20]利用酶法测定了104份甜玉米的总多糖和淀粉的含量,采集了其近红外光谱数据,分别建立了甜玉米种子的总多糖和淀粉含量预测模型,为筛选超甜、高淀粉含量的玉米种子提供了有效的方法。
脂肪是人体每天必须摄入的一种营养物质,摄入过多或过少都会对人体健康造成不良影响,因此脂肪含量检测是食品品质检测的重要依据。目前,我国的脂肪含量检测方法通常为索氏提取法、酸水解法、碱水解法等国标检测方法,其具有检测结果准确的优点,但实验操作过于繁琐,需要对样本进行预处理,耗时较长,无法进行大批量检测,不能满足快速检测的需求。近红外光谱技术作为一种绿色、快速、非破坏性的分析技术,适用于大规模样本的快速检测。近年来,国内外报道了很多用近红外光谱技术对肉制品、大豆等食物中脂肪含量进行检测的工作,验证了它具有良好的检测效果。
花锦等[21]对猪肉、牛肉、羊肉、鲜肉的近红外光谱数据进行采集,同时用索氏提取法对样本的脂肪含量进行了检测,作为建模的数据集,并对最佳模型波段和光谱预处理方法进行了研究,最终建立了基于偏最小二乘法的脂肪含量预测模型。实验结果表明,不同的肉类样本的最佳建模波段和光谱预处理方法不同,所建立的4种模型都具有较高的精度,符合不同肉类制品的实际检测需求。陈悦[22]收集了963份来自不同地区、不同土壤类型、不同种类的大豆样品,用国标检测方法检测其粗脂肪含量和水分含量,并挑选了413份含量分布具有代表性的样品,用近红外光谱仪对大豆样品进行光谱采集,作为建模数据集,经过数据预处理后,用偏最小二乘法建立了大豆样品中脂肪和水分含量的近红外成分预测模型。实验结果表明,所建立的模型能很好地应用于未参与建模的大豆样品的粗脂肪含量预测,检测结果的误差在3%以内,小于国家标准要求的10%。
马文强等[23]采集了核桃仁在1040~2560 nm处的近红外光谱数据,通过多元散射校正和标准正态化组合方法对原始光谱数据进行预处理,经特征波段筛选后,用支持向量机回归算法建立了核桃仁脂肪含量的预测模型,其模型验证集决定系数为0.86,均方根误差为1.58%,可用于核桃仁脂肪含量的快速无损检测。李路等[24]采集了46种大米样品的近红外光谱数据,并用国标方法对大米中的脂肪等营养成分含量进行了测定,在对光谱数据进行小波消噪预处理及筛选特征波段后,比较了偏最小二乘法和BP神经网络法对建模的影响。实验结果表明,对于大米脂肪的检测,偏最小二乘法建立的模型具有更好的性能,其决定系数为0.95,相对标准差为13.69%。
孙艳文等[25]采集了鸡蛋样品的近红外漫反射光谱数据,用酸水解法测定鸡蛋样品中的脂肪含量,对采集的光谱进行预处理后,用偏最小二乘法对鸡蛋脂肪含量进行建模,最终模型验证集的相关系数为0.906,均方根误差为0.231,可用于鸡蛋中脂肪含量的无损检测。杨福臣等[26]借助近红外光谱技术对不同规格乳粉的脂肪和蛋白质含量进行了研究,在研究了光谱数据预处理、波段优选、奇异值剔除等问题后,以偏最小二乘法建立了乳粉中脂肪和蛋白质含量的预测模型,模型对未知乳粉样品中脂肪预测的相对误差均小于1.5%,具有良好的预测性能。仇逊超等[27]采用近红外光谱技术对红松籽中脂肪含量进行定量分析,通过矢量归一化方法对光谱数据进行预处理,通过反向间隔偏最小二乘法对特征波段进行优选,最终通过偏最小二乘法建立了红松籽中脂肪含量的定量分析模型,模型验证集的均方根误差为0.7651,预测平均偏差绝对值为0.65%,为红松籽中脂肪含量的快速检测提供了参考。
调味品是指能增加食品的色、香、味,促进食欲,有益于人体健康的辅助食品。从广义上讲,调味品包括鲜味剂、咸味剂、酸味剂、甜味剂等,如酱油、醋、食盐、淀粉、桂皮等都属此类[28-29]。调味品中关键成分的含量是反映调味品品质、营养价值的重要指标,目前常见的调味品成分检测方法有液相色谱法、气质联用法、液质联用法、原子荧光光谱法、电位滴定法等[30-32]。但上述常规仪器分析方法存在检测时间过长的缺点,难以满足生产过程中实时检测的需求。近红外光谱技术作为一种绿色、快速、无损的检测技术,目前已被广泛应用于调味品检测领域。
食醋是一种历史悠久的酸味调味剂,食醋中的可溶性固形物含量和pH值是食醋品质的重要评价指标。陆辉山等[33]采用近红外光谱技术结合反向传播神经网络,对陈醋中可溶性固形物含量和pH值进行了定量分析。在对光谱数据进行标准归一化和25点平滑处理后,建立了两种成分的反向传播神经网络预测模型,其中可溶性固形物预测模型的相关系数为0.9999,预测集均方根误差为0.0118;pH预测模型的相关系数为0.9997,预测集均方根误差为0.0088。实验结果表明,所建立模型具有较好的预测精度和稳定性,可用于陈醋品质的实时检测。
食醋总酸包括挥发性酸和非挥发性酸两大类,其中挥发性酸是食醋酸味的主要来源,食醋的总酸含量是评价食醋品质的重要指标之一。梁楷等[34]采集了106种不同酸度的食醋样品,通过扫描其近红外光谱数据,优化光谱数据预处理方法,结合偏最小二乘法建立了食醋总酸含量的预测模型。实验结果表明该模型食醋总酸预测值与实测值的绝对偏差平均为0.035,最小相对误差为1.383%,可有效应用于食醋总酸的快速检测。
酱油是日常生活中常见的调味品,酱油成品中总氮和总酸含量是评价酱油质量的重要指标。陈斌等[35]研究了利用近红外光谱技术对酱油中总氮和总酸含量进行快速检测的方法。研究采集了120个酱油样品,在完成光谱数据预处理后,用偏最小二乘回归法建立了总氮和总酸的预测模型。模型对总氮的预测平均相对误差为4.036%,模型对总酸的预测平均相对误差为4.820%,表明该方法可用于酱油中总氮和总酸的快速检测。
淀粉在调味品生产过程中应用广泛,具有增强食品稳定性、改善口感等功能。不同种类的淀粉具有不同的性质和用途,李梦瑶等[36]采集了不同种类淀粉的近红外光谱数据,结合主成分分析法建立了淀粉的定性判别模型。他们也通过采集不同混合比例的马铃薯和小麦淀粉样品的光谱数据,结合偏最小二乘法建立了淀粉含量的定量预测模型,模型对小麦淀粉含量的预测决定系数为0.9982,预测均方根误差为0.347。实验结果表明,近红外光谱技术具有高的预测精度,可用于快速无损的淀粉定性鉴别和定量分析。
大米的品质评价标准之一为淀粉含量,不同品种大米的淀粉含量有很大差异,目前食品中淀粉的测定方法主要为酶水解法、酸水解法等化学分析方法,此类方法比较繁琐耗时,存在一定的局限性。林葵等[37]收集了40个品种共计393个大米样品,用标准化学法对样品的淀粉含量进行了分析,并采集了样品在1100~2500 nm处的漫反射光谱数据,通过偏最小二乘法建立了大米样品中淀粉和直链淀粉的成分预测模型。用18种预留大米样品对上述模型进行验证,实验结果表明样品的预测结果与标准测量值的偏差在1%以内,证明了近红外光谱技术能够可靠、快速地应用于大米中淀粉含量的测定。
茶多酚和咖啡碱的含量是影响红茶品质的重要因素。卢莉等[38]以小种红茶为研究对象,利用国标方法分析了其茶多酚和咖啡因含量,并采集了样品的近红外光谱数据,建立了小种红茶茶多酚和咖啡因近红外定量分析模型。其中,咖啡因含量模型的验证集决定系数为0.9567,验证集均方根误差为0.148%;茶多酚含量模型的验证集决定系数为0.9759,验证集均方根误差为0.566%。两种模型均有较好的效果,可实现小种红茶茶多酚和咖啡因含量的快速检测。
酿酒车间需要对酒精度、总酸和总酯等关键性指标进行检测,而常规国标检测方法存在操作过程复杂、耗时、环境污染等不足,无法实现快速、精准的酿酒过程中关键性指标检测。田育红等[39]收集了680多个标准白酒样品,利用偏最小二乘法建立了白酒中酒精度、总酸和总酯含量的预测模型,其相关系数分别为0.9995,0.9576,0.9910,验证了近红外光谱技术应用于酿酒行业快速检测的可行性。
金银花作为一种清热解毒的药材,《中国药典》规定其水分含量不得高于12%,但常规检测方法使用甲苯法进行水分含量的测定,存在致癌、环境污染等问题。杨天鸣等[40]制备了不同水分含量的金银花样品,用红外水分仪测定其水分含量后,采集了其近红外漫反射光谱数据,运用偏最小二乘回归法建立了金银花中水分含量定量模型。模型预测值与红外水分仪测定的水分含量经t检验无显著差异,表明该方法适用于金银花中水分含量的快速测定。
野菊花具有清热消炎、保护心血管等作用,黄酮类成分是野菊花的有效成分之一,传统总黄酮测定方法周期较长,不利于原料的快速批量检测。胡小莉等[41]对6种不同产地的野菊花样品采集了近红外光谱数据,并用紫外-可见分光光度法测定样品的总黄酮含量作为参考值,建立了基于偏最小二乘法的总黄酮含量定量分析模型,所建模型的相关系数为0.989,预测均方根误差为0.163,验证集样品预测值的平均相对偏差为2.08%,可用于不同产地野菊花中总黄酮含量的快速测定。
鱼肉的品质,特别是嫩度与其水分含量密切相关,常规的鱼类产品水分含量检测方法多为直接干燥法,但此方法实验操作复杂、耗时过长。赵钜阳[42]以大麻哈鱼为研究对象,采集了120组蒸制大麻哈鱼的近红外光谱数据,并用直接干燥法测定其水分含量。经光谱数据预处理后,采用偏最小二乘法建立蒸制大麻哈鱼水分含量的定量分析模型,模型验证集的相关系数为0.9850,标准差为0.00426。所建立的模型可对蒸制大麻哈鱼的水分含量进行准确、快速的检测,为近红外光谱技术应用于鱼类水分含量的检测提供了参考。
由于食品生产过程的复杂性,对食品成分的准确检测具有十分重要的现实意义。近红外光谱技术相比于常规分析检测技术,具有检测速度快、检测精度高、样品无损坏、操作简单等优势,可对食品中关键成分的含量进行定量或定性分析,在食品感官指标量化、品质检测、质量控制等方面皆有广泛应用。但近红外光谱分析技术也存在些许不足,如建模数据难以获取、建立稳定的模型对专业知识要求较高、检测过程难以做到完全自动化等。因此,如何降低近红外光谱分析技术的应用门槛,提升分析检测的自动化水平,将是今后食品行业的研究重点之一。
随着云技术、大数据、5G、人工智能等前沿技术的快速发展,将近红外光谱技术与这些技术结合,必将为近红外光谱技术赋予更多优势。如将稳定的近红外分析模型存放于云端,供有需要的用户调用,降低其使用门槛;将近红外成分检测系统部署于智能化产线上,无需人工参与即可实时、远程地对食品成分进行分析检测。近红外光谱技术与前沿技术的结合,对于减少人力、物力消耗、保证食品品质、推动食品制造业自动化和智能化必将起到积极作用。