近红外光谱模型快速无损测定肉中糖的含量

2024-01-08 23:21李春燕叶利明薛金涛2
理化检验-化学分册 2023年12期
关键词:维数预处理区间

李春燕 ,叶利明 ,薛金涛2,∗

(1.新乡医学院三全学院 生物与基础医学实验教学中心,新乡 453003;2.新乡医学院 药学院,新乡 453002;3.四川大学 华西药学院,成都 610041)

糖含量的高低是影响肉类和肉制品营养品质和口感风味的重要指标,高效快速的测定糖含量可为肉和肉制品的质量控制提供良好的技术支撑和参考依据。传统的糖含量分析方法一般采用试剂盒或按照国家标准GB/T 9695.31-2008«肉制品:总糖含量测定»中紫外分光光度法或滴定法测定,但传统方法需要对肉类和肉制品进行破坏性检测,整个分析操作过程费时费力,亟需开发一种快速、无损和简便的分析方法测定肉类组织中糖的含量。

近红外光谱是William Herschel在19世纪发现的,近红外光谱技术作为一种分析手段是从20世纪50年代开始的,并在20世纪80年代以后逐渐成为当今发展较快、较引人注目的光谱分析技术,在石油、化工、农业、食品工业、纺织工业、制药工业和临床医学等领域得到广泛的研究和应用。按照美国材料与试验协会(ASTM)的定义,近红外光谱区是指波数 在4 000~12 000 cm-1(即波长780~2 526 nm)的光谱范围。近红外光谱中主要的吸收峰是分子内部含氢基团的倍频与合频的综合吸收信息,其几乎包括化合物中所有含氢基团(如C-H、O-H、N-H 和S-H 等)的信息。近红外光谱中每个基团的吸光度与对应待测物含量之间的定量关系符合比尔-朗伯(Beer-Lambert)定律,但由于近红外吸收峰高度叠加,且这些含氢基团的消光系数弱,另外样品中通常为含有多种成分的复杂样品,这就使近红外光谱中谱峰吸收弱和重叠严重,故近红外光谱无法通过吸收峰归属进行定性分析和简单通过单个或几个波长进行常规的含量测定。采用化学计量学方法,从近红外光谱中提取有用的弱信息和多元信息并建立数学模型,解决了近红外光谱区重叠和吸收峰弱的问题,极大地扩展了近红外光谱技术的应用范围[1-6]。此外,由于近红外光具有很好的穿透性,故近红外光谱法无需样品前处理,即可直接对液体、固体、颗粒状、糊状等不同形态的样品进行分析,具有无损测定、分析快速、可同时分析多组分测定值和不消耗化学试剂(绿色环保)等特点;另外光纤技术的应用使近红外光谱技术可以更方便的应用于在线快速分析,尤其是实现了一台仪器可以对不同位置的多个质量控制点进行监测,以及对复杂和危险环境中的样品实时快速分析。在药品定性监测和定量分析,及药品生产和质量控制过程中各个环节的监控中近红外光谱具有广泛的应用[1-10]。

近年来国内外学者采用近红外光谱法对山药[5]、金银花[6-7]、芝麻[8]和黄芩[9]等进行了快速无损分析。在生物组织样品中近红外具有良好的穿透性[10-11],当前已有研究采用近红外光谱法对花生中糖含量[12]、牡蛎冻干组织中糖原含量[13]和血糖浓度[14]等进行快速分析测定。由于制备不同糖含量的肉组织(牛、羊或猪等)和动物模型成本较高,且试验难度大,因此本工作采用经典的糖尿病模型大鼠的肉组织进行研究,旨在建立一种快速无损的近红外光谱分析模型用于肉类中糖含量的分析测定,可为肉类品质的鉴定和质量控制提供方法依据和技术支撑。

1 试验部分

1.1 仪器与试剂

MATRIX-F 型傅里叶变换近红外光谱仪,配PbS检测器、光纤传输检测探头、OPUS 7.0光谱采集和处理软件;BS-124S型电子天平(感量0.1 mg);BT-25S型电子天平(感量0.01 mg);7020型全自动生化分析仪。

0.1mol•L-1枸橼酸-枸橼酸钠缓冲溶液(pH 4.2~4.5):精密称取枸橼酸约2.1 g,加入100 mL水,为A 液;另精密称取枸橼酸钠约2.9 g,加入100 mL水,为B 液;将A 液和B 液按体积比1∶1混合均匀,用A 液或B液调节酸度为pH 4.2~4.5,于4 ℃放置备用。

1%(质量分数,下同)链脲佐菌素溶液:取适量的链脲佐菌素,以0.1 mol•L-1枸橼酸-枸橼酸钠缓冲溶液(pH 4.2~4.5)为介质进行配制。另外,由于链脲佐菌素在溶液中不稳定,建议现配现用,配制好的溶液在给药前经针式滤器滤菌,并在30 min 内用完。

健康雄性SD(Sprague Dawley,斯泼累格•多雷)大鼠,SPF(Specific Pathogen Free,无特定病原体动物)级,由四川大学试验动物中心提供(许可证号:SCXK(川)-09-2006);大鼠饲料由四川大学试验动物中心提供;链脲佐菌素,批号B64927;葡萄糖测定试剂盒,己糖激酶(Hexokinase Method,HK)法;其他试剂均为分析纯;试验用水为超纯水。

1.2 试验方法

1.2.1 造模与分组

由于食用的肉组织来自牛、羊和猪等,但这些动物模型不易制备,试验成本较高,因此试验采用大鼠模型进行研究。所有大鼠适应性饲养一周,饲养期间,专人分笼喂养,自由饮水和进食,自然昼夜光线照明,室内安静、通风良好,饮用水为自来水。适应性饲养一周后,大鼠随机分为正常组(n=12)、低糖组(n=12)和高糖组(n=36)。高糖组造模前将大鼠禁食过夜,自由饮水,按40 mg•kg-1腹腔注射1%链脲佐菌素溶液[15-21],建模后自由摄食;正常组给予足够的饲料和饮水;低糖组饲料减半,之后每周适当再减量,自由饮水。4周后采集肉类组织,组织样品用生理盐水洗净,滤纸吸干,采集近红外光谱后精密称定,按比例加入生理盐水,手动匀浆。组织匀浆液以转速3 000 r•min-1离心10 min,取上清液测定糖含量。

1.2.2 近红外光谱采集与建模

近红外光谱图的采集采用OPUS 7.0软件。在光谱扫描前,仪器自动基线校正,光谱采集参数:光谱范围12 000~4 000 cm-1,扫描次数32次,分辨率8 cm-1,每份样品采集2个近红外光谱图。将样品按糖含量排序,首先将最低糖和最高糖浓度水平的各两组样品光谱纳入建模集,剩余的再按照4∶1的比例分为建模集和验证集。在近红外光谱模型中,建模集用于建模参数(光谱预处理方法、光谱区间和建模维数)的筛选和优化,验证集用于验证和评价所建模型的优劣。

近红外光谱模型建立过程中采用留一交叉验证法进行模型验算。首先在建模集中选取1个光谱,然后用建模集中其他光谱进行模型验算,验算完成后用选取的光谱对初步建立的近红外光谱模型进行评价;之后选取下一个光谱,再次进行模型验算和评价,直至建模集中所有光谱完成模型验算和评价。近红外光谱的建模采用OPUS 7.0软件,基于偏最小二乘算法,分别对各建模参数进行筛选和优化,最后验证和评价,建立最优近红外光谱模型。

1.2.3 模型验证中参考值的确定

样品中糖含量按照HK 法,采用葡萄糖测定试剂盒在全自动化分析仪上测定,其测定值作为近红外光谱模型验证的参考值。

2 结果与讨论

2.1 光谱分组

由于大鼠自然死亡4 只(低糖组1 只,高糖组3只),共获得56只大鼠肉组织的112个近红外光谱(见图1)。

图1 肉样品的近红外光谱图Fig.1 Near infrared spectra of meat samples

为保证近红外光谱模型的稳健性和适用性,将最低糖浓度水平和最高糖浓度水平的样品光谱纳入建模集,其余样品按照糖含量大小排序分组,最后建模集中有91个近红外光谱,样品中糖的质量分数为(2.712±0.414)mg•g-1;验证集有21个近红外光谱,样品中糖的质量分数为(2.743±0.272)mg•g-1。

2.2 光谱预处理方法的筛选

如图1所示,近红外光谱吸收峰重叠严重,且样品中含有的多种成分相互干扰。为提取有效建模信息,排除背景干扰,需对初始光谱进行预处理。试验筛选了10种常见的光谱预处理方法:矢量归一化(VN)、多元散射校正(MSC)、最小最大归一化、减去一条直线(SLS)、消除常数偏移量(COE)、一阶导数(1stD)、一阶导数+减去一条直线(1stD+SLS)、一阶导数+矢量归一化(1stD+VN)、一阶导数+多元散射校正(1stD+MSC)和二阶导数。

光谱预处理方法、光谱区间和建模维数的评价指标有建模集和验证集的相关系数(r)、残留预测偏差(RPD)、交叉验证均方差(RMSECV)和预测验证均方差(RMSEP),其中最优化的近红外光谱模型应具有较大的r和RPD、较小的RMSECV 和RMSEP。如表1所示,通过比较各模型评价指标,最佳近红外光谱预处理方法为VN。如图2所示,VN 处理后光谱更平滑,降低了背景干扰,能够更有效地提取建模信息。

表1 光谱预处理方法的建模结果Tab.1 Model results of spectral pre-treatment methods

图2 未预处理和VN 预处理的近红外光谱Fig.2 Near infrared spectra by no pre-treatment and VN pre-treatment

2.3 建模光谱区间的筛选

为选择最佳建模近红外光谱区间,结合图1和图2将近红外光谱按照吸收峰波数分为5个光谱区间:光谱区A 9 403~11 995 cm-1、光谱区B 7 502~9 403 cm-1、光谱区C 6 098~7 502 cm-1、光谱区D 4 597~6 098 cm-1和光谱区E 4 246~4 597 cm-1。各近红外光谱区间及不同光谱组合区间的建模结果见表2。

表2 近红外光谱区间的建模结果Tab.2 Model results of the near infrared spectral range

由表2可知,综合各项模型评价指标(r、RPD、RMSECV 和RMSEP),对各光谱区间的建模结果进行评价,其中光谱区间D 建模效果最佳,B 和C次之,A 和E 较差;接下来依次比较了上述光谱区间的不同光谱组合区间,逐步筛选比较,最终确定最佳建模光谱区间为4 246~9 403 cm-1。

2.4 建模维数的筛选

构建最优化的近红外光谱模型需要选择合适的建模维数(潜变量)。以建模集的r和RMSECV 为参考指标,对比了不同建模维数的建模表现,见图3。

图3 建模维数对RMSECV 和r 的影响Fig.3 Effect of latent variable on RMSECV and r

由图3可知:在建模维数逐渐增大到17的过程中,逐步积累建模光谱信息,模型拟合性变好(RMSECV逐渐变小,r逐渐变大);当建模维数超过17后,RMSECV 和r都趋于稳定,此时如选择过大的建模维数,容易将无效建模光谱信息和噪声引入模型中,引起近红外光谱模型的过拟合,影响模型的预测能力和稳健性。基于此,试验中近红外光谱模型的最佳建模维数选择17。

2.5 模型验证与评价

通过对光谱预处理方法、光谱区间和建模维数进行比较筛选,建立了最优化的近红外光谱模型,其建模集和验证集的r和RPD 分别依次为0.990 3和0.975 6、7.23和4.54,RMSECV 为0.057 0,RMSEP为0.061 4。将模型验证集光谱带入近红外光谱模型中,并以参考值为横坐标,近红外光谱模型预测值为纵坐标,进行回归运算,得到标准曲线的线性回归方程为y=0.933 0x+0.202 9,R2=0.951 7,如图4所示。

图4 近红外光谱模型的验证结果Fig.4 Validation results for the near infrared spectra model

由图4可知,近红外光谱模型的分析预测结果与参考值的线性关系良好,因此近红外光谱模型的分析预测结果的准确度良好,可以快速无损地实现肉类组织中糖含量的测定,具有较好的应用价值。

本工作建立了一种快速无损的近红外光谱分析模型,用于肉中糖含量的测定。通过对光谱预处理方法、光谱区间和建模维数进行筛选优化,建立了肉组织糖含量的近红外光谱模型,并进行验证分析。本工作建立的近红外光谱模型可以快速无损地实现肉类组织中糖含量的测定,为肉类品质的鉴定和质量控制提供了高效的方法,具有重要的应用价值和参考意义。

猜你喜欢
维数预处理区间
解两类含参数的复合不等式有解与恒成立问题
你学会“区间测速”了吗
β-变换中一致丢番图逼近问题的维数理论
一类齐次Moran集的上盒维数
基于预处理MUSIC算法的分布式阵列DOA估计
关于齐次Moran集的packing维数结果
涉及相变问题Julia集的Hausdorff维数
浅谈PLC在预处理生产线自动化改造中的应用
区间对象族的可镇定性分析
络合萃取法预处理H酸废水