黑果枸杞果实中主要成分的傅里叶变换近红外光谱预测模型构建

2024-03-06 13:34周志磊衡洋洋宋亚玲库进良姬中伟
食品工业科技 2024年5期
关键词:黑果基团花青素

周志磊,衡洋洋,陈 超,宋亚玲,库进良,姬中伟,毛 健,5,*

(1.江南大学粮食发酵与食品生物制造国家工程研究中心,食品学院,江苏无锡 214122;2.江南大学(绍兴)产业技术研究院,浙江绍兴 312000;3.江苏省生物活性制品加工工程技术研究中心,江苏省食品安全与质量控制协同创新中心,江苏无锡 214122;4.北京同仁堂健康药业(青海)有限公司,青海德令哈 817000;5.国家黄酒工程技术研究中心,浙江省绍兴黄酒产业创新服务综合体,浙江绍兴 312000)

黑果枸杞是我国传统具有补益功能的名贵中藏药材,是青海省重要的特色农产品,是花青素含量最高的浆果之一,有“花青素之王”的美誉[1],相应的研究表明,黑果枸杞具有抗氧化、抗疲劳、保护心脑血管、提高免疫力等方面的作用[2-3]。因其具有多种活性和营养成分,越来越受到消费者喜爱,所以对于黑果枸杞方面的研究日益增加。目前,有关黑果枸杞的研究多为开发利用、栽培技术、生理活性成分及保健药理作用研究[4-5];果实化学成分研究、有效成分含量测定与分析[6-7]等。上述的研究方式均采取传统理化方法进行枸杞中相关物质的测定,存在操作时间长、过程繁琐、污染环境等一系列问题,因此有必要开发一种黑果枸杞中快速、简便、无损检测的方法,促进黑果枸杞产业的纵深发展。

傅里叶变换近红外光谱(Fourier transform near infrared spectroscopy,FT-NIR)分析技术因其快速、准确、便捷、无损的特点而备受人们关注,并且在农产品产地识别和品质定量检测方面应用广泛。其是利用有机质在近红外光谱区的振动吸收从而快速测定样品中多种化学成分含量的一种新型技术[8]。该方法可简便、直观地分析具有较大差异的非同种物质,但是在判别成分相近的食品时却无能为力,所以常需要结合化学计量学方法进行判别。近红外光谱技术的成熟与化学计量学方法的丰富使得两者相结合运用到物质的定性和定量分析成为一种趋势。目前已有傅里叶近红外光谱应用于黑果枸杞中的研究报道[9],该学者建立了干果粉末的花青素、胡萝卜素和总酸预测模型,性能优异,稳定性好,证明了近红外光谱技术在黑果枸杞果实的检测中具有良好的应用潜力。然而,仅建立干果模型无法预测鲜果中主要成分的含量。

本研究通过应用傅里叶变换近红外设备,对来自不同产地的黑果枸杞干果复水匀浆/鲜果打浆处理,混合干果和鲜果制备样本集,进行傅里叶近红外光谱扫描,得到近红外特征谱图,结合理化指标结果,对其所含有的总糖、还原糖、总酸、氨态氮、花青素、原花青素、总酚、黄酮和多糖共计9 类指标通过偏最小二乘(partial least squares regression,PLS)、区间偏最小二乘(interval partial least squares regression,iPLS)和联合区间偏最小二乘(synergy interval partial least squares regression,siPLS)算法建立预测模型,并验证了模型的预测效果,以期为黑果枸杞检测技术的发展提供参考。

1 材料与方法

1.1 材料与仪器

黑果枸杞 北京同仁堂健康药业(青海)有限公司提供;氢氧化钠、冰醋酸、酒石酸钾钠、苯酚、亚硫酸钠、盐酸、无水乙醇、无水乙酸钠、冰醋酸、丙酮均为分析纯,没食子酸、芦丁、无水葡萄糖均为色谱纯 国药集团化学试剂有限公司;原花青素(色谱纯)合肥博美生物科技有限责任公司;4-二甲氨基肉桂醛(DMAC)(色谱纯)上海源叶生物科技有限公司。

UV-1800PC 型紫外-可见光分光光度仪 上海美谱达仪器有限公司;MAX-190 型酶标仪 美国分子仪器公司;Vortex-2 型涡流器 美国科学仪器公司;Antaris MXFT-NIR 型近红外光谱仪 美国赛默飞世尔科技公司;BS-224S 型分析天平 赛多利斯仪器设备制造有限公司;CF16XR-Ⅱ型离心机 日本日立公司;5B 型自动滴定仪 上海仪电科学仪器股份有限公司。

1.2 实验方法

1.2.1 样品的采集和制备 由北京同仁堂健康药业(青海)有限公司提供的从青海、甘肃、新疆、宁夏、内蒙古等不同地区收集的135 份样本,其中包括45 份干果样本和90 份鲜果样本,干果浸泡打浆,鲜果直接打浆处理,以备用于指标测定或傅里叶近红外光谱采集。

黑果枸杞干果浆液:将黑果枸杞干果,去梗,1:2.5(g/mL)浸泡复水,打浆,5000 r/min 4 ℃条件下离心10 min,收集上清液,即得到料水比为1:2.5 的黑果枸杞干果浆液。

黑果枸杞鲜果浆液:将黑果枸杞鲜果,打浆,5000 r/min 4 ℃条件下离心10 min,收集上清液,即得到鲜果浆液。

1.2.2 黑果枸杞中主要理化指标的测定 总糖与还原糖含量的测定参照中国食品安全农业标准NY/T 2742-2015《水果及制品可溶性糖的测定 3,5-二硝基水杨酸比色法》;总酸的测定参照中国食品安全国家标准GB 12456-2021《食品中总酸的测定》;氨基态氮采用自动滴定仪测定;花青素含量的测定采用pH 示差法[10];原花青素含量的测定采用DMAC 比色法[11]:以原花青素为标准品,建立标准曲线:y=0.0462x+0.0001,R2=0.9996;总酚含量的测定采用福林酚比色法[12]:以没食子酸为标准品,建立标准曲线:y=0.0146x+0.0026,R2=0.9979;总黄酮含量的测定采用芦丁比色法[13]:以芦丁为标准品,建立标准曲线:y=29.627x+0.0009,R2=0.9972;多糖测定采用苯酚-硫酸法[14]:以无水葡萄糖为标准品,建立标准曲线:y=13.595x+0.0432,R2=0.9982。

1.2.3 傅里叶变换近红外光谱采集 采用傅里叶变换近红外仪进行光谱采集,以卤钨灯为光源,InGaAs 探测器,光谱范围为12000~4000 cm-1,分辨率为4 cm-1,扫描次数为64 次,实验过程中保持室内温湿度基本不变[15]。每个样品采集10 张光谱,取平均值。

1.2.4 光谱预处理 采用11 种不同的预处理方式[16-17],包括无光谱预处理(no spectrum pretreatment,NSDP)、消除常数偏移量(constant offsets eliminate,COE)、减去一条直线(straight line subtraction,SLS)、矢量归一化(standard normal variate,SNV)、最小-最大归一化(min max normalization,MMN)、多元散射校正(multiplicative scatte correction,MSC)、一阶导数(first derivative,1st Der)、二阶导数(second derivative,2nd Der)、一阶导数+减去一条直线(1st Der+SLS)、一阶导数+矢量归一化(1st Der+SNV)、一阶导数+多元散射校正(1st Der+MSC),消除光谱的背景噪声和干扰,确定不同检测指标的最佳处理方式。

1.2.5 预测模型建立与评估 通过偏最小二乘(partial least squares regression,PLS)、区间偏最小二乘(interval partial least squares regression,iPLS)和联合区间偏最小二乘(synergy interval partial least squares regression,siPLS)算法建立预测模型,模型的优劣通过交叉验证相关系数(correlation coefficient of calibration,Rc)、交叉验证均方根误差(root mean square error of calibration,RMSEC)、预测集相关系数(correlation coefficient of prediction,RP)、预测集均方根误差(root mean squared error of prediction,RMSEP)、相对分析误差(ratio prediction deviation,RPD)评估[18-19]。RPD 用来验证模型的稳定性和预测能力,当RPD<1.5 则模型预测性能较低,1.5≤RPD≤2.5 则模型预测性能可满足快速检测的需要,RPD>2.5 则模型具有较高的预测性能。

1.2.6 模型验证 将40 份独立样本代入模型中,得到黑果枸杞中各成分含量的预测值,将样品实测值与预测值代入SPSS 22 软件中进行T检验,根据T值与P值关系对预测结果进行评价。在T检验中若|T|<T(0.05,39)(由T分布表查表可知,T(0.05,39)=2.02),P>0.05,说明预测值和实测值没有显著性差异,即模型泛化能力好,反之则差异显著,说明模型不具有泛化能力。

1.3 数据处理

使用OPUS 7.2 进行傅里叶近红外光谱采集,The Unscrambler X 10.4 进行模型构建与分析,Origin 2022 软件绘图,SPSS statistics 22.0 软件进行T检验。

2 结果与分析

2.1 黑果枸杞中主要理化指标

黑果枸杞样品的9 种主要成分的化学值如表1所示。样品的各成分总量范围:总糖130.48~870.05 mg/g,还原糖102.37~481.40 mg/g,总酸1.69~7.82 mg/g,氨态氮2.31~7.38 mg/g,花青素0.70~21.77 mg/g,原花青素0.69~7.83 mg/g,总酚14.85~37.93 mg/g,总黄酮4.05~41.21 mg/g,多糖14.77~43.50 mg/g。使用Kennard-Stone 算法[15]对黑果枸杞样品集进行划分,用于校正集的样品95 个,验证集40 个。验证集化学值含量均位于校正集范围内,说明样本集划分合理。

表1 黑果枸杞果实样品主要成分化学值Table 1 Chemical values of main components of Lycium ruthenicum Murr samples

2.2 原始光谱数据分析

由图1 可知,不同样品的光谱谱线区分较为明显,在10402、8762、6889、5938、5604、5480、5152、4524、4072 cm-1处有特征吸收(如图1 箭头所示),吸收峰较窄,根据图谱反映信息来看,10402 cm-1为水O-H 基团的二级倍频,同时也为其他化合物含OH 基团的二级倍频;8696~8000 cm-1为C-H 基团二级倍频。在放大谱图后发现,在8197 cm-1存在微弱吸收,可以确定为水O-H 基团合频吸收(较弱);7502~5165 cm-1为C=O 基团三级倍频(相对该区域其他集团而言红外吸收较弱,且存在重合部分);6889 cm-1为其他化合物O-H 基团一级倍频,同时也为水O-H 基团一级倍频;5938 cm-1为化合物CH 基团一级倍频;5604~5480 cm-1之间为C=O 基团二级倍频;5269~4996cm-1之间出现平峰,表明该区域出现饱和吸收,该区域为其他化合物O-H 基团的合频(5000 cm-1),同时也为水的O-H 基团合频吸收(水分子O-H 基团在5155 cm-1红外吸收最强);4524 cm-1处为N-H 基团的合频吸收(标准吸收峰应为4600 cm-1,由于受到饱和吸收的影响,谱线出峰位置后移);图谱放大后,发现在4416 cm-1处出现吸收峰(吸收较弱),在4072 cm-1处出现强吸收,经过分析后认为,这两处峰均为C-H 基团的合频吸收峰(标准吸收位置为4545~4082 cm-1,由于受到饱和吸收的影响,出现后移)。不同黑果枸杞样品的光谱没有明显差异,在12820~3959 cm-1区域范围内光谱的吸光度之间差异较小,但是并非完全重合,说明采集的黑果枸杞样本整体保持一致,但不同样本之间存在一定差异,可以对黑果枸杞样品建立主要成分含量的预测模型。

图1 黑果枸杞果实傅里叶近红外光谱图Fig.1 FT-NIR spectroscopy of Lycium ruthenicum Murr

2.3 近红外光谱预处理方式优化

图1 所示的黑果枸杞原始近红外光谱混合了无关光谱信息、背景噪声和干扰,如果直接应用,可能会损害多变量校准模型的性能[20]。因此,采用数据预处理的方法去除噪声和异常值[21]。为了提高黑果枸杞各指标预测结果的准确性(Rc 与Rp),降低模型RMSEC 值和RMSEP 值,在黑果枸杞全光谱(12000~4000 cm-1)范围内,进行各个指标光谱预处理方式的筛选,结果如表2 所示。

最佳预处理方式选择的依据是最低的内部交叉验证均方根误差(RMSEC)和预测集均方根误差(RMSEP)及较高的内部交叉验证相关系数(Rc)和预测集相关系数(RP),优化的结果如表2 加粗字体所示:总糖采用无光谱预处理(NSDP)的预处理方式,总酸和氨态氮采用一阶导数(1st Der)的预处理方式,还原糖、花青素、原花青素、总酚和总黄酮采用减去一条直线(SLS)的预处理方式,多糖采用最小-最大归一化(MMN)的预处理方式。

2.4 模型建立与评估

2.4.1 偏最小二乘模型 在得到不同样本最佳光谱预处理方式的基础上,建立针对黑果枸杞的全光谱(12000~4000 cm-1)PLS 预测模型。结果如表3 所示。表3 显示了黑果枸杞不同指标全波长PLS 预测模型。由表3 可知,样本全光谱PLS 预测模型中氨态氮对应的RMSEP 值最低,为0.48,表明建立的PLS 模型对于样本中氨态氮含量的预测较为准确。总酸、花青素、原花青素、总酚、总黄酮和多糖的RMSEP 值均在0.81~5.72 之间,表明建模效果较好,然而,总糖与还原糖建模效果并不理想,RMSEP 值分别为46.00 和35.00,说明在模型准确度低,总糖全波长PLS 预测模型,Rc 和Rp 分别为0.8862、0.8752小于0.90,表明该模型无论是从准确度方面,还是从预测与真值相关性方面,建模效果差于其他指标。基于PLS 建立的全光谱预测模型,RPD ≤1.5,无法建立一个合适的、稳健的各指标含量与光谱数据之间的定量关系,可能是由于光谱中的一些区域可能包含非模型信息(噪声),因此应该从模型中排除这部分区域[22]。即,需要开发一个光谱区域选择的校准模型。

表3 黑果枸杞果实中主要成分的全光谱偏最小二乘预测模型Table 3 Full spectra PLS prediction model of main components in Lycium ruthenicum Murr

2.4.2 区间偏最小二乘模型 根据表4 可知,除了总糖和还原糖iPLS 预测模型外的大部分指标,在5~25 个区间内有较低的RMESP 值,iPLS 模型中RMSEP 值随着光谱区间细分而减小,可能是样本中水的存在导致了近红外光谱中出现过饱和吸收峰,产生基线漂移的同时也掩蔽了部分基团的红外吸收,从而使得有效信息在波段较宽时较少被提取到[23];而当波段较窄时,水的过饱和吸收对于实验结果的干扰降低,部分基团有效信息得以被更多提取,从而使模型预测准确度提高。

表4 黑果枸杞果实中主要成分的区间偏最小二乘预测模型Table 4 iPLS prediction model of main components in Lycium ruthenicum Murr

在进行光谱区间划分时,光谱区间较宽,能较为完全地提取到所需要的特征基团光谱,有利于建模,但是较宽的波段容易使得光谱噪声与提取到的无效信息增多,对模型实验结果造成干扰[24],如黑果枸杞中总黄酮的iPLS 模型印证了这一观点。光谱选择区间较窄,虽然屏蔽掉部分光谱噪声和无效信息对实验结果的影响,但是光谱提取到的有效信息,如特征基团等的信息量较少,使得模型结果不准确。因此,选择合适的区间进行建模,有利于提高模型的准确性和稳定性,提高模型可信度,黑果枸杞样本中的花青素、原花青素以及总酚iPLS 预测模型等均印证了这一观点。

2.4.3 联合区间偏最小二乘模型 由表5 可知,除了总糖多糖指标以外,黑果枸杞鲜果样本大部分指标的siPLS 预测模型RMSEP 值表现出与先减小后增大的趋势。黑果枸杞总糖指标的siPLS 预测模型在区间间隔数为5 时,RMSEP 值为14.10,而当区间间隔数为50 时,为4.33,黑果枸杞多糖指标的siPLS预测模型在区间间隔为5 时,RMSEP 值为2.64,在区间间隔为50 时,RMSEP 值为1.47。由此可见,区间间隔数的增加大幅度提高了样本总糖和多糖的预测效果,这是因为随着区间间隔的增加,从光谱中提取的有效信息数量增加,同时噪声与其他无效信息减少,提高了模型预测精确度[25]。随着光谱区间的继续划分,虽然部分有效信息被过滤,导致可提取的信息量减少,但是由于屏蔽了大多数噪声的影响,因而与较小区间间隔相比,间隔数目较高指标的siPLS 预测模型RMSEP 值更低,准确度更高。对于黑果枸杞其他指标,光谱区间数的增加均使得模型预测准确度得到显著提高,并且最佳光谱区间间隔数目为10~25。造成这一结果的原因主要是由于增加的光谱区间间隔有效减少了水分的红外吸收对于实验结果的影响,同时使有效信息增多,无关信息减少,大幅度提高了黑果枸杞样本siPLS 模型的预测效果。

表5 黑果枸杞果实中主要成分的联合区间偏最小二乘预测模型Table 5 siPLS prediction model of main components in Lycium ruthenicum Murr

2.4.4 模型比较 比较PLS、iPLS 和siPLS 模型的结果(表3~表5),siPLS 模型显示出更好的预测能力。实验结果表明:PLS 模型采用全光谱区域的所有变量来校正模型时,其中有许多变量是噪声光谱信息和非信息变量,这些变量不可避免地削弱了模型的性能;iPLS 模型可以通过选择确定的光谱区间来降低噪声,但在校正模型时只选择了一个区间,可能会放弃一些有用的变量。由于在进行选择时没有考虑其它的相关信息,模型的整体性能不可避免的受到削弱。与iPLS 相比,siPLS 具有无可比拟的优势,siPLS不仅具有与iPLS 相同的优点,而且克服了iPLS 的缺点,将两个或三个区间结合起来,通过减少总变量(去除噪声谱信息)和更好的预测能力(不丢失信息)获得更好的模型。因此选择siPLS 算法建立黑果枸杞中主要成分的定量检测模型。

2.5 模型验证

为了验证模型的可靠性和泛化能力,选取了40 份未用于模型建立的样品,样品含量的真实值采用1.2.2 的方法测定,预测值根据FT-NIR 扫描的谱图,采用预测模型输出结果。采用配对样本T检验对黑果枸杞的真实值和预测值进行验证。由表6 可知,|T|<T(0.05,39)(由T分布表查表可知,T(0.05,39)=2.02),P>0.05,差异无统计学意义,说明预测值与实测值基本一致,也表明通过近红外光谱法建立的预测模型能很好地预测黑果枸杞未知样本中总糖、还原糖、总酸、氨态氮、花青素、原花青素、总酚、总黄酮和多糖的含量。

表6 黑果枸杞果实样本主要成分的实测值与预测值T 检验结果Table 6 T-test results of measured and predicted values of main components in Lycium ruthenicum Murr samples

3 结论

本研究采用不同的预处理和回归方法组合,建立黑果枸杞中主要成分的定量检测模型。对于不同指标对应的siPLS 模型,在优化后的波段范围内均具有较为准确的预测结果,验证集样本实测值与预测值无显著性差异,相对分析误差均大于2.5,模型定标效果良好,重现性较好,建立的定标模型可以用于实际检测,黑果枸杞干果和鲜果均适用,模型应用范围广。与传统的实验室分析方法相比,该方法具有操作简单、成本低、速度快、污染小、无损、在线分析方便等优点。上述结果表明,傅里叶变换近红外光谱与化学计量学相结合是一种简单、快速、可靠的进行黑果枸杞中总糖、还原糖、总酸、氨态氮、花青素、原花青素、总酚、总黄酮和多糖含量预测的方法。

猜你喜欢
黑果基团花青素
核桃黑果病的发生与防治
原花青素B2通过Akt/FoxO4通路拮抗内皮细胞衰老的实验研究
R基团筛选技术用于HDACIs的分子设计
黑果枸杞化学成分研究
黑果枸杞在辽西地区的栽培技术
花青素对非小细胞肺癌组织细胞GST-π表达的影响
黑果菝葜根茎化学成分的研究
芳烃ArCOR的构象分析和基团对亲电取代反应的定位作用
山楸梅浆果中花青素提取方法的优化和测定
原花青素对脑缺血再灌注损伤后肠道功能的保护作用