基于近红外光谱结合波长优选检测单颗葡萄的SSC含量

2016-11-15 01:09梁梦醒
食品与机械 2016年9期
关键词:波长预处理光谱

郭 成 马 月 梁梦醒 颜 辉

(江苏科技大学生物技术学院,江苏 镇江 212000)



基于近红外光谱结合波长优选检测单颗葡萄的SSC含量

郭 成 马 月 梁梦醒 颜 辉

(江苏科技大学生物技术学院,江苏 镇江 212000)

葡萄;可溶性固形物;近红外光谱;随机蛙算法;无信息变量消除法

据统计[1],2014年中国葡萄总产量达1 254.6 万t,如此多的产量,需要有效的田间与采后管理。葡萄为葡萄科葡萄属木质藤本植物,是世界性的水果。葡萄中的可溶性固形物含量(Soluble Solids Content,SSC)是衡量葡萄品质的重要指标之一。SSC传统的检测方法是从每穗摘取l~3粒葡萄,做成葡萄汁再进行含量的测定,但该方法费时、费力,并且具有破坏性[2]。由于葡萄不同果穗以及相同果穗上不同个体的成熟度不一致,如能在果穗上不同位置无损检测单粒葡萄的SSC,首先可以获得葡萄个体和整体的情况,用以指导果农采用合理的田间管理方法,提高葡萄的品质;其次,根据葡萄中SSC含量,选择最佳的储存条件,延长储存时间;对于客户,通过无损检测SSC,选择购买适合自己口感的葡萄。

近红外光谱 (Near Infrared,NIR)分析技术具有分析速度快、绿色、无损等优点[3],正逐渐广泛应用于苹果[4]、脐橙[5]、西瓜[6]、梨[7]等水果SSC的检测。吕刚等[8]采用基于USB4000的自制手持式光谱仪,建立LV-SVM模型预测葡萄活体生长期单个果粒的糖度,该系统功耗较大,不利于长期现场分析。吴桂芳等[2]采用Handheld FieldSpec光谱仪建立的PLS-ANN模型预测葡萄浆果的糖度,该仪器价格昂贵。陈辰等[9]使用NIRS DS2500,采用可见/近红外漫反射光谱技术建立MPLS模型预测单个葡萄SSC,但该光谱仪体积大,耗能高,价格昂贵。徐洪宇等[10]采用MPATM 型傅里叶变换近红外光谱仪,使用积分球采谱,建立PLS模型预测酿酒葡萄的糖度,该方法所需样品数多,无法分析单个样品的品质,且光谱仪体积大,不便于实时现场检测。因此,目前多数NIR分析仪器体积大(通常采用光纤光谱仪)、光源功耗高、价格高昂,难以适合现场检测的需求[11]。

由于便携式NIR仪器的分辨率不如研究型仪器高,所以建立的模型预测精度也不如研究型仪器[12]。通过NIR与偏最小二乘回归(Partial Least Squares,PLS)方法结合进行建模,一般认为PLS具有较强的全波长建模能力。通过波长优选可以简化模型,更主要是可以剔除不相关或非线性变量,从而得到稳健性好、预测能力强的校正模型[13-14]。目前,波长优选方法主要有随机蛙(Random Frog,RF)[15]、移动窗(Moving Window,MW)[16]、无信息变量消除法(Uninformative Variable Elimination,UVE)[17]、间隔偏最小二乘法(Interval PLS,iPLS)[18]、自适应量加权采样(Competitive Adaptive Reweighted Sampling,CARS)[19]和遗传算法(Genetic Algorithms,GA)[20]等。

本研究拟采用低功耗的便携式近红外光谱仪,探讨UVE与RF两种波长优选方法与PLS的结合,建立最适于实时现场预测单颗葡萄SSC含量的近红外无损检测模型,用以克服前人研究中分析仪器体积大、光源功耗高、价格高昂、不利于现场开展工作等缺点,以期应用于葡萄田间管理与摘后储藏。

1 材料和方法

1.1 材料与仪器

1.1.1 材料

葡萄:采自江苏省镇江市丹徒区公琴水果合作社,分别在目视成熟度不同的20个葡萄果穗上采摘,从每个果穗的穗节部、穗尖部各采摘一颗,穗中部采摘两颗,共采摘80颗葡萄。

1.1.2 仪器设备与软件

折光仪:WZ-103型,浙江托普云农科技股份有限公司;

便携式近红外光谱仪:MicroNIR1700型,美国捷迪讯通讯技术有限公司(JDSU);

软件:近红外光谱预处理与PLS建模使用MATLAB R2009a在PLS Toolbox 6.2工具箱中实现,UVE与RF波长优选分别使用ChemoAC和LibPLS工具箱实现。

1.2 方法

1.2.1 近红外光谱采集 用MicroNIR1700采集葡萄的近红外反射光谱,光谱范围为950~1 650 nm。光谱采样间隔为12.5 nm,积分时间15 ms,扫描次数50 次。每个样品采集赤道一点作为一个样本,共有80 个。每个点采集光谱3 次,以3 次平均值作为最终光谱。

1.2.2 SSC测定 采集光谱后即刻采用折光仪测量葡萄SSC含量。

1.2.3 校正集和预测集定义 所有样本按照SSC升序排序,根据3∶1的比例分为校正集和预测集,校正集含60个样本,预测集含20个样本,其中SSC最大和最小样品应为校正集。预测集样品SSC范围应被包含在校正集样品SSC范围。

1.2.4 光谱预处理 通常采用的预处理方法包括均值中心化(mean centering)、标准化(autoscaling)、不同点移动平滑(move smoothing)、一阶导数(1stD)、标准正态变量变换(standard normal variable transformation,SNV)、多元散射校正(multiplicative scatter correction,MSC)等。

选择多种方法对原始光谱进行预处理,比较以下预处理方法的组合,1stD、1stD+SNV、1stD+SNV+Mean Center、1stD+MSC+Mean Center,分别使用上述4种预处理方法进行PLS建模。

1.2.5 偏最小二乘回归法 PLS是一种多元回归分析方法,模型建立在成分提取的方法之上。PLS在提取成分的过程中,同时考虑到预测变量数据和因变量数据中的信息,使从两者中提取的信息之间的相关性达到最大,然后用所获得的成分建立多元回归分析模型[21]。

将光谱数据与相应的SSC数据导入PLS工具箱,选择光谱最佳预处理方法,采用留一法(Leave one out,LOO)进行交叉验证。

1.2.6 波长优选 NIR分析一般采用线性方法建立模型,波长优选能够剔除与分析目的性质无关或呈非线性关系的波长变量,从而达到简化模型、提高预测精度的目的。本研究中,拟采用无信息变量消除法(UVE)、随机蛙算法(RF)进行波长优选,以期达到提高模型精度的目的。

(1) 无信息变量消除法:UVE是建立在分析PLS回归系数基础上的算法,目的是消除那些不提供有用信息的波长变量。在NIR的PLS多元回归模型中,UVE是把相同于自变量矩阵的变量数目的随机变量矩阵加入光谱矩阵中,然后通过交叉验证,逐一剔除无信息的变量,建立PLS多元回归模型,从而得到回归系数的矩阵,通过分析回归系数矩阵中回归系数向量的均值和标准偏差的商的稳定性,最后根据商值的绝对值大小决定是否把该变量用于最终的模型中[22]。

(2) 随机蛙算法:RF是一种新型的波长优选算法,特点是能够利用少量的变量迭代进行建模,是一种非常有效的高维数据变量选择方法。该算法针对每个波长变量选择可能性进行输出,根据可能性的大小进行波长选择[23]。

2 结果与分析

2.1 SSC测定结果

由表1可知,校正集和预测集的SSC值范围相近,分别为6.15~18.20 °Brix和6.80~17.85 °Brix,且校正集和预测集样品的标准差相近,分别为3.24和3.26,因此校正集和预测划分合理,为建立可靠的模型奠定了基础。

2.2 光谱特征

图1为80个葡萄样品的原始近红外光谱曲线。由图1可知,各个样品的光谱曲线类似,无明显异常的样品。光谱在970 nm和1 440 nm处出现O—H吸收峰,在1 190 nm出现了C—H键二级倍频吸收峰[24-25]。原始光谱曲线呈现的吸收特征变化反映了葡萄内部不同组分信息含量的差异。

表1 样本SSC 参考值统计结果

2.3 模型的分析与比较

2.3.1 PLS 由表2可知,选择1stD+SNV+Mean Center进行预处理的效果最好,其均方根误差小,相关系数大。

图1 原始光谱

表2 预处理方法对PLS的影响

2.3.2 UVE-PLS 采用UVE进行特征波长的提取。图2是UVE方法进行波长优选的结果,横坐标方向上,垂直线左边的部分为实际光谱变量,右边的为光谱的系统噪声变量,该部分由随机噪声模拟产生,纵坐标方向上是每个变量的稳定性数值,水平两条虚线代表选择实际变量的稳定性数值的阈值,在阈值范围内的稳定性数值对应的变量是与葡萄SSC无关的信息量,在阈值范围外的稳定性数值对应的变量则是与葡萄SSC有关的信息量,据此,保留有关的信息量对应的波长变量,去除无关的信息量对应的波长变量,最后根据保留的波长变量建立PLS模型。

图2 无信息变量消除法选择变量图

图4是两种波长优选的结果,优选后的波长主要集中在970,1 190,1 450 nm附近。优选波长是基于数学方法随机选择所得,部分波长会被重复选中,说明这些区域数据信息与被测对象含量有较高的相关性。优选波长包含了葡萄糖和蔗糖等可溶性固形物官能团的合频和倍频吸收区,如970 nm附近与糖相关的O—H键合频吸收,1 190 nm附近是与糖相关的C—H键合频吸收,1 450 nm附近是与糖相关的O—H键1倍频吸收。上述分析说明波长优选结果和化学结构分析具有一致性。

图3 随机蛙算法选择变量图

图4 两种的特征波长选择

方法LVsRMSECR2cRMSECVR2cvRESEPR2pPLS80.67470.95590.98000.90731.00370.9006UVE⁃PLS70.64150.96010.85340.92950.89980.9246RF⁃PLS70.63820.96050.82990.93340.86880.9304

3 结论

本研究结果表明了基于MicroNIR1700的近红外光谱技术在葡萄SSC预测中的高度可行性。通过减少冗余的无信息变量,可增加模型的稳定性和预测精度。其中RF-PLS算法对于葡萄SSC的预测效果优于UVE-PLS算法。本工作的完成对水果种植的田间管理、采摘后贮藏以及消费者的使用提供了非常有效的工具。

[1] 国家统计局. 中国统计年鉴[Z]. 北京: 中国统计出版社, 2015: 267.

[2] 吴桂芳, 黄凌霞, 何勇. 葡萄浆果糖度可见/近红外光谱检测的研究[J]. 光谱学与光谱分析, 2008, 28(9): 2 090-2 093.

[3] 李敏. 近红外光谱技术在水果无损检测中的最新研究进展[J]. 绿色科技, 2013(10): 215-218.

[4] 屈亚堃, 宫元娟. 近红外光谱技术在苹果品质无损检测中的应用[J]. 农业科技与装备, 2014(6): 32-33.

[5] 赵珂, 熊艳, 赵敏. 基于近红外光谱技术的脐橙快速无损检测[J]. 激光与红外, 2011, 41(6): 649-652.

[6] 介邓飞, 谢丽娟, 饶秀勤, 等. 近红外光谱变量筛选提高西瓜糖度预测模型精度[J]. 农业工程学报, 2013(12): 264-270.

[7] 崔秀帅, 唐荣年, 杨举华, 等. 芒果无损检测方法的研究现状及发展趋势[J]. 贵州农业科学, 2013, 41(7): 167-170.

[8] 吕刚, 杨海清. 基于光谱技术的葡萄活体可溶性固体含量在线检测研究[J]. 红外, 2012, 33(10): 43-48.

[9] 陈辰, 鲁晓翔, 张鹏, 等. 玫瑰香葡萄贮藏期间糖酸品质的近红外检测[J]. 食品与发酵工业, 2015(6): 175-180.

[10] 徐洪宇, 张京芳, 侯力璇, 等. 基于FT-NIR光谱技术检测酿酒葡萄中可溶性固形物含量[J]. 中国食品学报, 2013, 13(11): 153-159.

[11] 王亚红. 葡萄中糖含量的近红外检测技术研究与仪器开发[D]. 桂林: 桂林电子科技大学, 2014: 121-125.

[12] YAN Hui, LU Dao-li, CHEN Bin, et al. Development of a hand-held near infrared system based on an Android OS and MicroNIR, and its application in measuring soluble solids content in Fuji apples[J]. NIR news, 2014, 25(4): 16.

[13] ZOU Xiao-bo, ZHAO Jie-wen, POVEY M J W, et al. Variables selection methods in near-infrared spectroscopy[J]. Analytica Chimica Acta, 2010, 667(1/2): 14-32.

[14] 褚小立, 袁洪福, 陆婉珍. 近红外分析中光谱预处理及波长选择方法进展与应用[J]. 化学进展, 2004, 16(4): 528-542.

[15] LI Hong-dong, XU Qing-song, LIANG Yi-zeng. Random frog: an efficient reversible jump Markov Chain Monte Carlo-like approach for variable selection with applications to gene selection and disease classification[J]. Anal Chim Acta, 2012(740): 20-26.[16] KASEMSUMRAN S, DU Yi-ping, LI Bo-yan, et al. Moving window cross validation: a new cross validation method for the selection of a rational number of components in a partial least squares calibration model[J]. Analyst, 2006, 131(4): 529-537.

[17] KOSHOUBU J, IWATA T, MINAMI S. Elimination of the uninformative calibration sample subset in the modified UVE(Uninformative Variable Elimination)-PLS (Partial Least Squares) method[J]. Anal Sci., 2001, 17(2): 319-22.

[18] JIANG Hui, LIU Guo-hai, MEI Cong-li, et al. Measurement of process variables in solid-state fermentation of wheat straw using FT-NIR spectroscopy and synergy interval PLS algorithm[J]. Spectrochimica Acta Part a-Molecular and Biomolecular Spectroscopy, 2012(97): 277-283.

[19] LI Jiang-bo, GUO Zhi-ming, HUANG Wen-qiang, et al. Near-infrared spectra combining with CARS and SPA algorithms to screen the variables and samples for quantitatively determining the soluble solids content in strawberry[J]. Guang Pu Xue Yu Guang Pu Fen Xi, 2015, 35(2): 372-8.

[20] CAO Nan-ning, WANG Jia-hua, LI Peng-feng, et al. Study on Variable Selection of NIR Spectral Information Based on GA and SCMWPLS[J]. Spectroscopy and Spectral Analysis, 2010, 30(4): 915-919.

[21] 丁光辉. PLS和GA应用于部分有机污染物的QSAR研究[D]. 大连: 大连理工大学, 2006: 97-99.

[22] 吴迪, 吴洪喜, 蔡景波, 等. 基于无信息变量消除法和连续投影算法的可见—近红外光谱技术白虾种分类方法研究[J]. 红外与毫米波学报, 2009, 28(6): 423-427.

[23] 陈立旦, 赵艳茹. 可见—近红外光谱联合随机蛙跳算法检测生物柴油含水量[J]. 农业工程学报, 2014(8): 168-173.

[24] 唐建平. 近红外光谱在水果品质检测中的应用[J]. 北京农业, 2014(24): 232-232.

[25] YAN Hui, HAN Bang-xing, WU Qiong-ying, et al. Rapid detection of Rosa laevigata polysaccharide content by near-infrared spectroscopy[J]. Spectrochim Acta A Mol Biomol Spectrosc, 2011, 79(1): 179-84.

[26] 丁姣, 蔡建荣, 张海东, 等. 近红外结合Si-ELM检测食醋品质指标[J]. 食品与机械, 2012, 28(1): 93-96.

[27] 安泉鑫, 陈莉, 庞林江, 等. 近红外光谱技术在食品中的应用进展[J]. 食品与机械, 2012, 28(5): 239-242.

Determination of SSC content in single grape based on NIR combined with wavelength selection

GUO ChengMAYueLIANGMeng-xingYANHui

(SchoolofBiotechnology,JiangsuUniversityofScienceandTechnology,Zhenjiang,Jiangsu212000,China)

grapes; soluble solids content; NIRS; random frog; uninformative variable elimination

镇江市农业科技支撑项目(编号:NY2014032)

郭成,男,江苏科技大学硕士研究生。

颜辉(1971—),男,江苏科技大学副教授,博士。

E-mail: yanh1006@163.com

2016-07-02

猜你喜欢
波长预处理光谱
HPLC-PDA双波长法同时测定四季草片中没食子酸和槲皮苷的含量
基于三维Saab变换的高光谱图像压缩方法
基于预处理MUSIC算法的分布式阵列DOA估计
双波长激光治疗慢性牙周炎的疗效观察
日本研发出可完全覆盖可见光波长的LED光源
浅谈PLC在预处理生产线自动化改造中的应用
星载近红外高光谱CO2遥感进展
络合萃取法预处理H酸废水
便携式多用途光波波长测量仪
基于自适应预处理的改进CPF-GMRES算法