孔 娜 杨 雪 王禹程 黄姗芬 李云亮 马海乐
(江苏大学食品与生物工程学院 江苏镇江 212013)
目前常用的检测多糖的方法为苯酚硫酸法和蒽酮硫酸法[6]。多糖的传统检测方法由于人为原因出现误差,整个检测过程繁琐,还会导致实际测量的化学值与生产过程之间存在延迟或者误差,不能实现提取过程中多糖含量变化的原位监测。对提取过程中重要参数建立快速、稳定和可靠的在线监测方法的研究显得极为重要。
近红外光谱因快速、无损、便携等优点广泛而被应用于目标物质的监测。Mizushima等[7]对聚乙烯拉伸变形过程中的结构变化进行原位近红外光谱监测;Wold等[8]也利用近红外成像光谱仪在线确定完整牛肉配件的脂肪含量;Sampaio等[9]利用原位近红外光谱监测重组酿酒酵母菌株生产的番茄红素的含量;Prieto等[10-11]也将近红外光谱应用于在线的工业加工,包括对输送机上小牛肉样本中的脂肪、水分和蛋白质含量的在线监测,同时也应用于运送牛肉和猪肉样品在输送带或绞肉机出口上化学成分的监测。上述研究结果表明,近红外光谱技术可用于监测和分析食品在移动的传送带上或连续过程的监测[12]。近年来由于微小型光纤的发展,微小型便携式近红外光谱仪可将光纤探头伸入溶液中采集光谱,可实现原位在线预测目标物质的含量。微小型便携式近红外光谱仪因具有速度快、成本低、无污染、预测结果准确等优点[13-14],为实现食品加工过程的自动化控制奠定了基础[15-16]。
本文主要利用超声辅助提取玛咖多糖并应用便携式近红外光谱仪实时检测提取过程中的光谱信息,建立光谱信息与多糖含量之间的数学模型,实现提取过程中对多糖含量的预测,为提取过程终点的判断提供技术支持。
玛咖,青海神农生物科技有限公司(多糖含量67.3%);其余试剂为分析纯级。
双频逆流聚能式超声设备,江苏大学自主研制;DL-5C离心机,上海安亭科学仪器厂;T-6新世纪可见分光光度计,北京普析仪器有限公司;NIRQUEST256-2.5近红外光谱仪、TP300浸入式光纤探头、DH-2000-BAL UV-VIS-NIR光源,美国海洋光学。
用蒸馏水将原料(过60目筛)分别配制为不同料液比(1∶10,1∶20,1∶30,1∶40,1∶50 g/mL)的玛咖悬浮液1 000 mL,设定超声参数:20~35 kHz交替双频,超声功率150 W/L,超声温度50℃,间歇时间比4s/3s,超声时间 60 min,前 30 min每隔 2 min取样1次,后30 min每隔3 min取样1次,共计130个样品。将所有样品离心(10 000 r/min离心10 min),收集上清液,放置于-20℃保存待测化学值。取样同时采集光谱信息,光谱的范围为900~2 500 nm,分辨率为6.4 nm,扫描8次,光程4 mm,以蒸馏水(50℃)作为背景,每次连续采集3次光谱信息,取其平均值作为原始光谱数据。
多糖的含量采用苯酚硫酸法测定[17-19],以干燥的葡萄糖标准品作为基准物质制作标准曲线,以蒸馏水代替多糖溶液做空白,提取的多糖含量按式(1)计算:
式中,T——提取出的玛咖多糖含量(%);C——待测液中多糖质量浓度(mg/mL);N——稀释倍数;V——样液体积(mL);f——换算因素;m——样品质量(g)。
常用的原材料有:石灰石、白垩、黏土、页岩、铁矿石等。因矿石成分的不确定性,导致水泥中矿物组成变动性大,使水泥与外加剂不相容。
采用偏最小二乘法(Partial least squares,PLS)、区间偏最小二乘法(Interval partial least squares,ipLS)和联合区间偏最小二乘法(Synergy interval PLS,si-PLS)对光谱区间筛选,将筛选出的特征信息与同步测定的多糖含量化学值联立并建模。
不同料液比提取多糖含量的理化指标如图1所示,随着超声提取时间的延长,多糖含量不断增加。在提取前15 min,多糖含量增加快速,随后增加缓慢并出现波动增长的趋势。说明随着时间的延长,玛咖细胞的破碎度逐渐增大,多糖溶出率增加,提取率较高,然而时间过长,会使多糖重聚而沉淀,或由于超声的强剪切力作用使大分子多糖断裂,从而出现多糖含量呈波动的变化趋势[20]。同时监测提取过程中不同料液比的多糖含量,可以更全面、更准确的分析数据及建立模型。
图1 玛咖多糖在超声辅助提取过程中含量的变化Fig.1 The content of maca polysaccharide in ultrasonic assisted extraction
通过 Centre、MSC、SG、SNV、1 st、2 st及 Centre、MSC、SG、SNV 分别与 1 st组合预处理原始光谱图,所有的预处理方法都能很好的消除外界条件的干扰及光谱图的冗余信息,提取及增强特征信息,提高预测模型的预测能力及稳健性。不同方法预处理后的光谱图如图2所示。
图2 不同预处理方法处理玛咖水溶液近红外光谱图Fig.2 Near infrared spectra of maca aqueous solution by different pretreatment methods
将近红外采集的样本光谱经过不同的预处理后,用PLS建立模型,同时用校正模型来预测预测集中的玛咖水溶液中多糖含量,其中以Rc、RMSECV和Rp、RMSEP为评价指标,筛选最优预处理方法。由表1可知,不同的预处理方法所得到的建模效果有所差距,其中SG是最有效地预处理方法,Rc和Rp最高且接近 1,RMSECV和RMSEP在所有的预处理中数值最小,所以在后续将使用平滑处理的光谱用于建模。
表1 不同方法预处理近红外光谱的结果Table1 Results of near-infrared spectroscopy by different pretreatment methods
PLS法是基于全光谱区间(900~2 500 nm)的1 600个波长变量上建立的监测模型,所建立的模型如图3所示。根据评价标准,选取Rc和Rp相关系数最高和RMSECV、RMSEP最低的建模子区间,建立最佳的PLS模型。对于多糖检测模型中,Rc的值为0.9453,RMSECV 值为0.0138,Rp的值为0.9638,RMSEP为0.0144,显示PLS模型预测具有良好的预测效果。
偏最小二乘法是将整个光谱区间分为20个子区间,再对每个子区间建立模型,根据评价标准,选取Rc和Rp相关系数最高和RMSECV、RMSEP最低的建模子区间,建立最佳的模型。由图4和5可知,对于多糖检测模型中,依据Rc最高为0.9163和RMSECV最低为0.017,在整个光谱区间的第19个子区间上所建的模型最佳,该区间所对应的光谱区间为2356.166~2425.508 nm,此区间所建立的模型的Rp为0.9375,RMSEP为0.0178,此模型对多糖含量的预测效果也较好,而PLS法建立的模型比iPLS法可以更好的预测多糖含量。
图3 PLS建立玛咖多糖模型的校正集和预测集Fig.3 PLS established correction set and prediction set for the maca polysaccharide model
图4 iPLS建立玛咖多糖模型最佳子区间Fig.4 iPLS established the best subinterval of maca polysaccharide model
图5 iLPS建立玛咖多糖模型的校正集和预测集Fig.5 iLPS established calibration set and prediction set for the maca polysaccharide model
对于联合区间偏最小二乘法,在被划分的第26子区间并联合其中4个子区间时(第7,19,21,24个,所对应的光谱区间分别为1 258.591~1 316.735 nm,2 027.121~2 084.226 nm,2 153.93~2 210.888nm和2 337.239~2 387.696 nm)所建的模型最佳,如图6和7,Rc和RMSECV分别为0.9621和0.0116,Rp和RMSEP分别为0.9667和0.0137。此法与PLS法相比,Rp与Rc值均更高,且RMSECV和RMSEP相对来说更低,因此si-PLS法在3种方法中可更好地预测多糖含量。
图6 si-PLS联合最佳区间建立玛咖多糖模型Fig.6 Establishment of maca polysaccharide model by si-PLS combined with optimal interval
图7 si-LPS联合最佳区间建立模型的校正集和预测集Fig.7 Correction set and prediction set of si-LPS joint optimal interval model
为确定定量模型,提高模型的建模效果及预测性能,采用3种方法(最小二乘法、偏最小二乘法、联合区间偏最小二乘法)建立模型,以优化玛咖多糖定量预测模型。如表2所示。
表2 不同方法建立多糖含量模型的结果Table2 Results of different methods to establish polysaccharide content model
从表2可以明显看出,利用近红外实时采集光谱,并通过化学计量学计算,3种监测方法均体现出较好的预测性能,可实现提取过程中多糖含量的快速检测;另外,比较3种方法可得,iPLS(Rc为0.9163和Rp为0.9375)稳定性较好,其次PLS(Rc为0.9453和Rp为0.9638)稳定性更好,si-PLS(Rc为0.9621和Rp为0.9667)模型所得校正精度与预测精度最高。3种模型的预测性能出现不同程度地变化,其原因如下:
PLS相比较其它2个建模方法,由于是将整个区间的1 600个变量用于建模,就会存在很多不相关的参数和冗余的波长变量,使得PLS的建模效果减弱,预测性能降低。全光谱建模的校正集和预测集中的相关系数处于中间,也说明全光谱图用于建模不会丢失任何数据,只是增加了模型的复杂性,降低了模型的稳定性。另外,从校正集的相关系数可看出,多糖的全光谱PLS模型存在一定的拟合过度现象,应该是由于参与建模的主因子数过多引起的。因此,筛选特征光谱区间对于建模就显得很重要。
在3个模型中,iPLS模型的预测性低于PLS和si-PLS法。最主要是由于iPLS在建模时只用了一个子区间上的数据,删除数据量过大,其中很多特征数据也并未得到利用,且第19个区间上的数据也不一定是有用数据,最终导致校正集模型和预测集模型的性能都很差。近红外采集的提取过程中光谱信息所反应的参数,主要来自玛咖溶液中不同基团伸缩振动的倍频和合频的吸收,任何一个单独的区间都不能完全反应光谱信息。
Si-PLS模型的预测性能要优于PLS模型和iPLS模型。该方法相比较其它两种方法的优点是,既可剔除很多无用光谱信息,也尽可能多地提取并利用有用信息,联合4个相关的子区间,建立最佳的预测模型。同玛咖多糖相关的变量信息,可能是不连续的且分散在整个光谱区间上,会存在一些子区间共线性的变量。本试验将不连续且分散在整个光谱区间上的4个子区间联合并建立模型,具有更好的预测效果。
1)为扩展样本的数据范围,将 1∶10,1∶20,1∶30,1∶40,1∶50 g/mL 不同料液比的玛咖悬浮液作为在线监测样本。近红外对玛咖溶液提取过程进行原位实时光谱的采集,并同时收集样品,采用苯酚硫酸法离线检测其提取过程中的多糖含量。
2)对玛咖溶液提取过程中的原位光谱进行中心化、中心化与一阶导数、多元散射校正、多元散射校正与一阶导数、平滑、平滑与一阶导数、标准正态变量变换、标准正态变量变换与一阶导数、一阶导数和二阶导数不同方法的预处理,其中平滑预处理后,PLS建模效果最佳。
3)以相关系数和相对误差为评价指标,采用最优光谱波长区间建立玛咖多糖的Si-PLS模型。其 Rc、Rp和RMSECV、RMSEP 分别为0.9621,0.9667和0.0116,0.0137。 另外 Si-PLS与PLS和iPLS建模方法相比,可以在很大程度上减少建模时所需要的波点数,提取并结合子区间,利用了原料溶液中的特征信息,能够很有效的提高模型的预测能力,增加模型的稳定性,可以实现提取过程参数的在线监测。