基于PCR和PLS的蔗糖浓度透反射测量方法研究

2014-04-19 09:18王亚红董大明郑文刚王文重
激光与红外 2014年5期
关键词:蔗糖校正预处理

王亚红,周 萍,董大明,郑文刚,叶 松,王文重

(1.桂林电子科技大学,广西桂林 541004; 2.北京农业智能装备技术研究中心,北京市农林科学院,北京 100097)

基于PCR和PLS的蔗糖浓度透反射测量方法研究

王亚红1,2,周 萍1,董大明2,郑文刚2,叶 松1,2,王文重1,2

(1.桂林电子科技大学,广西桂林 541004; 2.北京农业智能装备技术研究中心,北京市农林科学院,北京 100097)

利用近红外透反射光谱技术,研究短波近红外光谱(780~1100nm)无损检测蔗糖溶液的可行性,并通过主成分回归(PCR)和偏最小二乘(PLS)方法建立了蔗糖溶液的近红外定量分析模型。采用Savitzky-Golay卷积平滑(5点)和多元散射校正(MSC)进行预处理,并且对预处理后的数据进行建模分析。PCR定量分析的结果:主成分数PC=7,交互验证相关系数RCV=0.957335,交互验证的校正标准偏差RMSECV=0.015859;PLS定量分析结果:主成分数PC=4,交互验证相关系数RCV=0.975789,交互验证的校正标准偏差RMSECV=0.012251。分别用PCR和PLS的校正模型对预测集样本进行预测,两种模型的预测标准偏差RMSEP分别为0.0127,0.0118。二者均对高浓度蔗糖溶液的预测结果比较理想,而且在PLS模型下,77%以上的样本相对误差在10%以下,较PCR模型的高。综合结果,PLS所建立的模型简单,而且精度很高,所以,基于短波近红外光谱的蔗糖浓度的快速无损检测是可行的。

近红外光谱;透反射;蔗糖;偏最小二乘;主成分回归

1 引 言

近年来,采用近红外光谱分析技术可对样品光谱数据进行定量或者定性分析,具有快速、无损、无需样品预处理等特点,已广泛应用于食品卫生安全监测方面,例如Ann Peirs、Ann Schenk等利用可见/近红外光谱检测7种苹果在1999—2003年的成熟度,建立了近红外光谱定量分析苹果成熟度的模型[1],屠振华、朱大洲应用近红外光谱结合模式识别方法(LS-SVM)对蜂蜜掺假现象进行了识别分析[2],对掺假蜂蜜的正确判别率能达到100%。江西农业大学的张露采用可见/近红外光谱技术对含有不同浓度三聚氰胺的165份牛奶样本进行检测[3]。Loredana F.Leopol,Nicolae Leopold[4]等人用FTIR光谱仪透射法测量果汁的糖度,校正集模型的相关系数达到0.936等。相关研究人员分析了近红外光谱和样本内部质量指标之间的关系,证实了将近红外光谱应用于固态、液态无损检测的可行性。

蔗糖是人类基本的食品添加剂,冰糖、白砂糖、绵白糖和赤砂糖都含有不同纯度的蔗糖。糖的传统分析方法有离子高效液相色谱法[5-6]、离子色谱法[7]和比色法[8]等,这些方法操作时间长、费用高,不适宜在线分析。饶震红、李民赞[9]采用短波近红外光谱法同时定量分析水溶液中葡萄糖、果糖和蔗糖,校正集以及预测集的相对标准偏差均低于4%。但是定量分析模型比较单一,运用不同的定量分析模型建模并对预测集进行预测的研究相对较少。本文通过近红外透反射光谱技术检测溶液中的蔗糖,采用PCR和PLS两种定量分析方法进行建模,对比分析两种方法的模型预测精度。

2 实验

2.1 实验材料及设备

绵白糖400 g,用纯净水配制60个样本溶液(浓度范围:0~30%),用500 mL烧杯盛装,溶液定容至300 mL。实验样品分成校正集样本48个,预测集样本12个。

实验采用CCD近红外光谱仪(AvaSpec-2048,Avantes,The Netherlands)。糖度计为海鸥光学仪器厂的ATC型手持折光仪(0~32%),最小刻度值为0.2%。内部带有温度补偿装置,温度自动补偿范围10~30℃。

2.2 糖浓度值测量

取少许配置好的蔗糖溶液,滴在ATC型手持糖度计折光仪棱镜表面,关上辅助棱镜,朝向光源处并调节目镜视度圈,使视野内出现清晰明暗分界线,分界线相应的读数即蔗糖溶液的浓度。每次测量时应保持棱镜表面的清洁。

2.3 光谱测量

采用Avantes近红外光谱仪的浸入式透反射光纤探头,如图1所示,光源为石英卤素灯12W/12V,检测器为2048像元线性阵列CCD检测器,采集的光谱范围为300~1100 nm,CCD积分时间为45 ms,扫描次数为25,平均值设为10,光程为10 mm。实验在自行设计的密闭环境中进行,对不同浓度蔗糖溶液的吸光度进行测量,以纯净水为背景进行背景光谱的采集。

图1 实验原理图Fig.1 Experimental schematic

3 结果与分析

3.1 光谱预处理

因为短波近红外波段主要是含氢基团C-H,NH,O-H伸缩振动的倍频与合频吸收[10-11],所以选取780~1100 nm波段内溶液的吸光度值。

如图2所示,随着蔗糖溶液浓度的递增,蔗糖溶液的吸光度值增大,蔗糖溶液的原始光谱图存在基线漂移、平移的现象,光谱存在较大噪声。所以在建模之前,本文采用Camo公司The Unscrambler 9.7软件对原始光谱数据进行预处理,预处理方法采用Savitzky-Golay(S-G)卷积平滑法和MSC(multiplicative scattering correction)多元散射校正法,S-G卷积平滑法是通过多项式对移动窗口内的数据进行多项式最小二乘拟合,经过大量实验,移动窗口的宽度为5时模型精度最优,MSC主要用来消除颗粒分布不均以及颗粒大小产生的散射[12],对原始光谱依次进行(S-G)卷积平滑和MSC预处理后,有效的消除了原始光谱中的漂移,强化了谱带特征。预处理后的光谱如图3所示。

图2 原始光谱Fig.2 Original spectra

图3 预处理后的光谱Fig.3 Spectra after pretreatment

3.2 溶液糖分的PCA和PLS回归模型

主成分回归(PCR)和偏最小二乘(PLS)是两种不同的建模方法,它们都能够达到对光谱数据降维的目的[12-13],但是,PLS考虑到样品浓度矩阵的影响,可以对浓度矩阵做同样的处理,消除其无用的信息[13]。

选用47份校正集样本,利用软件 The Unscrambler 9.7对蔗糖浓度的测量值与吸光度数据进行相关性分析,采用PCR和PLS建立模型,模型的最佳主成分个数由交互验证(cross-validation)法确定[14-15]。两种建模方式下蔗糖溶液交互验证的预测值和测量值的对应关系如图4、图5所示。

图4 校正集样本的PCA回归模型Fig.4 PCA model regression figure of calibration set

图5 校正集样本的PLS回归模型Fig.5 PLSmodel regression figure of calibration set

如图4、图5所示,横坐标表示蔗糖溶液的真值,纵坐标是蔗糖溶液的预测值,图中的坐标点都紧紧围绕在拟合的直线附近,而且直线的斜率分别是0.96114,0.97664,都近似等于1。PCR模型的预测结果为:PC=7,RCV=0.957335,RMSECV= 0.015859。PLS模型的预测结果为:PC=4,RCV= 0.975789,RMSECV=0.012251。综合比较,两种方法的预测精度都比较高,但是,PLS模型的交互验证相关系数RCV=0.975789,略高于PCR模型,交互验证标准偏差RMSECV也比PCR模型的小,而且,PLS模型的主成分是4,与PCR模型相比,减少了运算量,模型相对简单[16-17],所以,PLS模型比 PCR模型的预测精度更高。

3.3 溶液糖分回归模型的预测能力分析

用已建立的数学模型(PCR、PLS)对13个预测集样品的糖度进行预测,预测样品的浓度范围: 6.6%~27.2%,两种模型下蔗糖溶液的预测值和真实值的对应关系如图6、图7所示,12个预测集样品的真实值、预测值及相对误差如表1所示。

图6 预测集样本PCR回归的真实值与预测值的相关性Fig.6 The correlation of predicted values and real values by PCR in prediction set

图7 预测集样本PLS回归的真实值与预测值的相关性Fig.7 The correlation of predicted values and real values by PLS in prediction set

表1 预测集样本的真实值、预测值及相对误差Tab.1 The predicted results of 13 samples in prediction set %

由图6、图7可知,拟合直线的斜率分别是0.9331,0.94134,均大于 0.9,RMSEP分别是0.0127,0.0118,PLS预测结果的 RMSEP略小于PCR模型。

由表1可知,PCR模型的预测结果:样本号为1,2,3,5,6的蔗糖溶液的预测结果不是很理想,其相对误差均在10%以上;60%以上的样本的相对误差在10%以内。PLS模型的预测结果:1~3号样本的相对误差在10%以上,其余样本的相对误差均在10%以内。综合比较,PCR、PLS两种方法均对高浓度蔗糖溶液的预测结果理想,而且,PLS模型对77%以上的样本预测精度较高,所以与PCR模型相比,PLS的建模方式最优。

4 结论

采用短波近红外光谱透反射方式采集蔗糖溶液的光谱,并用两种定量分析方法PCR、PLS进行建模分析。结果表明:①两种模型预测结果都比较好,但PLS模型的精度略高于PCR模型,且PLS模型更为简洁。②两种模型均对高浓度蔗糖溶液的预测结果比较理想,PLS对77%以上的预测集样本预测结果比较好,而PCR仅对60%以上的样本预测结果好。所以,PLS模型性能更优,运用近红外光谱透反射技术进行蔗糖溶液浓度的无损检测是可行的。

[1]Ann Peirs,Ann Schenk.Postharvest effect of natural variability among apples on the accuracy of VIS-NIR calibrationmodels for optimalharvest date predictions[J].Biology and Technology,2005,35:1-13.

[2]TU Zhenhua,ZHU Dazhou,JIBaoping,et al.Adulteration detection of honey based on near-infrared spectroscopy[J].Transactions of the CSAE,2011,27(11):382-387.(in Chinese)

屠振华,朱大洲,籍保平.基于近红外光谱技术的蜂蜜掺假识别[J].农业工程学报,2011,27(11): 382-386.

[3]ZHANG Lu.Nondestructive detection of melamine and pesticide residue in themilk products based on raman and VIS/NIR spectroscopy technology[D].Nanchang:Jiangxi Agricultural University,2012,5.(in Chinese)

张露.奶产品中三聚氰胺和农药残留的拉曼及可见/近红外光谱无损检测技术研究[D].南昌:江西农业大学,2012,5.

[4]Loredana F.Leopol,Nicolae Leopold,Horst-A.Diehl.Quantification of carbohydrates in fruit juices using FTIR spectroscopy and multivariate analysis[J].Spectroscopy,2011,26:93-104.

[5]JIANG Xiaotong,CHEN Guosong,JIANG Lingling,et al.Simultaneous HPLC determination of 6 sweeteners[J].Food Science,2011,32(6):165-168.(in Chinese)

蒋晓彤,陈国松,姜玲玲,等.高效液相色谱法同时检测6种甜味剂[J].食品科学,2011,32(6):165-168.

[6]YANG Xiaoqi.Study on determination of sweetener additives and organic acids in food with high performance liquid chromatography and their application[D].Chengdu: Sichuan University,2007,5.(in Chinese)

杨晓琪.食品中甜味剂、有机酸的高效液相色谱分析方法研究及其应用[D].成都:四川大学,2007,5.

[7]XU Li.Application studies to the determination of gallic acid and soluble sugars by Ion chromatography[D].Chongqing:Southwest university,2012,6.(in Chinese)

许丽.离子色谱法在没食子酸和可溶性糖类分析中的应用研究[D].重庆:西南大学,2012,6.

[8]MO Shuxun,QIAN Chengliang.Colorimetric method to determine content of soluble sugar[J].Journal of Fruit Science,1992,9(1):59-62.(in Chinese)

莫淑勋,钱承梁.果实中可溶性糖的比色法测定[J].果树科学,1992,9(1):59-62.

[9]RAO Zhenhong,LIMinzan,JI Haiyan.Simultaneous determination ofglucose,fructose and sucrose in aqueous solution by shor-twavelength near infrared[J].Spectroscopy Spectroscopy and Spectral Analysis,2006,26(4): 633-635.(in Chinese)

饶震红,李民赞,吉海彦.短波近红外光谱法同时定量分析水溶液中葡萄糖、果糖和蔗糖[J].光谱学与光谱分析,2006,26(4):633-635.

[10]XIE Jun,PAN Tao,CHE Jiemei.Joint optimization of Savitzky-Golay smoothingmodels and partial least squares factors for near-infrared[J].Spectroscopic Analysis of Serum Glucose.Analytical Chemistry,2010,3(8):342-346.(in Chinese)

谢军,潘涛,陈洁梅.血糖近红外光谱分析的Savitzky-Golay平滑模式与偏最小二乘法因子数的联合优选[J].分析化学,2010,38(3):342-346.

[11]DING Haiquan,LU Qipeng,CHEN Jiemei.Effectof variable optical path length on the accuracy of the model in noninvasive biochemical detection by NIR spectrum[J].Acta Optica Sinica,2012,32(4):1-6.(in Chinese)

丁海泉,卢启鹏,陈星旦.近红外光谱无创生化检测中不定光程对模型精度的影响研究[J].光学学报,2012,32(4):1-6.

[12]ZHU Xiaoli.Molecular spectroscopy analytical technology combined with chemistries and its applications[M].Beijing:Chemical Industry Press.2011.(in Chinese)

褚小丽.化学计量学方法与分子光谱分析技术[M].北京:化学工业出版社,2011.

[13]LUO Yunhan.Analyses on internal interferer factors in noninvasive measurement of blood glucose concentration with near-infrared spectroscopy[J].Laser& Infrared,2008,38(5):465-471.(in Chinese)

罗云瀚.近红外光谱无创伤血糖浓度测量的内部干扰因素分析[J].激光与红外,2008,38(5):465-471.

[14]Natalia Soro,Eleuterio Arancibia,Santiago A.Bortolato.Visible/near infrared-partial least-squares analysis of Brix in sugar cane juice A test field for variable selectionmethods[J].Chemo-metrics and intelligent laboratory systems,2010,102:100-109.

[15]ZHAO Ke,XIONG Yan,ZHAO Min.Rapid non-destructive testing of navel orange based on near infrared spectroscopy[J].Laser&Infrared,2011,41(6):649-652.(in Chinese)

赵珂,熊艳,赵敏.基于近红外光谱技术的脐橙快速无损检测[J].激光与红外,2011,41(6):649-652.

[16]YANG Chunmei,LINing,ZHAO Xuehong,et al.Recent developments of NIRS technique for nondestructivemeasurement of fruitand vegetable interior quality[J].Laser&Infrared,2009,39(11):1137-1141.(in Chinese)

杨春梅,李宁,赵学玒,等.用于果蔬内部品质无损检测的NIRS技术新进展[J].激光与红外,2009,39 (11):1137-1141.

[17]ZHAO Jiewen,ZHANG Donghai,LIU Muhua.Non-destructive determination of sugar contents o f apples using near infra red diffuse reflectance[J].Transactions of the CSAE,2005,21(3):162-167.(in Chinese)

赵杰文,张海东,刘木华.利用近红外漫反射光谱技术进行苹果糖度无损检测研究[J].农业工程学,2005,21(3):162-167.

Sucrose concentration measurement by transm ission and reflection spectroscopy based on PCR and PLS

WANG Ya-hong1,2,ZHOU Ping1,DONG Da-ming2,ZHENGWen-gang2,YE Song1,2,WANGWen-zhong1,2
(1.School of Electronic Engineering and Automation,Guilin University of Electronic Technology,Guilin 541004;
2.Beijing Research Center for Intelligent Equipment for Agriculture,Beijing Academy of Agriculture and Forestry Sciences,Beijing 100097,China)

Near-infrared spectra of trans-reflective is applied to determine the feasibility of nondestructive testing of the sucrose solution in the near-infrared wavelength range of 780~1100nm,and principal component regression(PCR) and partial least squares(PLS)are used to establish the near-infrared quantitative analysismodel of sucrose solution.After the pretreatment of(Savitzky-Golay)5 points smoothing and multiplicative scatter correction(MSC),the (PCR and PLS)calibration model ismade.The results of quantitative analysis of PCR are the number of principal component PC=7,the correlation coefficient RCV=0.957335,rootmean square error of cross validation RMSECV= 0.015859;The results of quantitative analysis of PLS are the number of principal component PC=4,the correlation coefficient RCV=0.975789,rootmean square error of cross-validation RMSECV=0.012251.The prediction samples are predicted respectively by the calibration model of PCR and PLS.Root mean square errors of prediction are 0.0127,0.0118 respectively.Both of themethods are satisfactory for the predicted results of high concentration samples.The relative errors ofmore than 77%of validation samples are below 10%using PLS.All of results show that PLSmodel is simpler and its prediction accuracy is higher,and short-wave near-infrared spectrometry is a valuable,rapid and nondestructive tool for the quantitative analysis of sucrose solution.

near infrared spectroscopy;transmission and reflection;sucrose;partial least squares;principal component regression

TN219

A

10.3969/j.issn.1001-5078.2014.05.011

1001-5078(2014)05-0528-05

国家自然科学青年基金(No.31101748);北京市农林科学院创新能力建设专项(No.KJCX201102001)资助。

王亚红(1987-),女,硕士研究生,主要从事近红外光谱检测仪器应用研究。E-mail:547573454@qq.com

2013-08-12;

2013-09-09

猜你喜欢
蔗糖校正预处理
2019年来宾市蔗糖业总产值近100亿元
劉光第《南旋記》校正
一类具有校正隔离率随机SIQS模型的绝灭性与分布
掺HRA 对蔗糖超缓凝水泥基材料性能的影响
基于预处理MUSIC算法的分布式阵列DOA估计
机内校正
澜沧县蔗糖产业发展的思考
浅谈PLC在预处理生产线自动化改造中的应用
络合萃取法预处理H酸废水
基于自适应预处理的改进CPF-GMRES算法