刘云宏,王庆庆,石晓微,高秀薇
金银花贮藏过程中绿原酸含量的高光谱无损检测模型研究
刘云宏1,2,王庆庆1,石晓微1,高秀薇1
(1. 河南科技大学食品与生物工程学院,洛阳 471023;2. 河南省食品原料工程技术研究中心,洛阳 471023)
绿原酸(chlorogenic acid, CGA)是评价金银花品质的重要指标。为了实现金银花贮藏期间CGA含量变化的快速有效检测,该文采集了500个不同贮藏时间(0~20 d)的金银花高光谱图像,构建CGA含量的高光谱检测模型。为了提高模型性能,采用savizky-golay卷积平滑(SG),移动窗口平滑(moving average),标准正态变量(standard normal variable,SNV),基线校正(baseline correction,BC),多元散射校正(multiplicative scatter correction,MSC),正交信号校正(orthogonal signal correction,OSC)6种预处理方法并建立偏最小二乘回归(partial least squares regression,PLSR)模型,确定SNV方法为最佳预处理方法,其预测集的2为0.976 6,RMSE为0.271 1%。为了简化校准模型,利用无信息变量消除(uninformative variable elimination,UVE),连续投影算法(successive projections algorithm,SPA),竞争性自适应加权算法(competitive adaptive reweighted sampling,CARS)以及UVE-CARS、UVE-SPA等方法对SNV预处理后的光谱提取特征波长。然后,分别基于全光谱数据和所选特征变量数据,建立线性偏最小二乘回归(PLSR)和非线性BP神经网络模型。结果表明:UVE-CARS算法可以有效地减少提取变量个数(共提取26个,仅占全光谱范围的3.2%),PLSR和BP模型的预测集2分别为0.974 6和0.978 4,RMSE分别为0.286 3%和0.250 3%。非线性BP模型预测结果整体优于线性PLSR模型,在BP模型中,UVE-CARS-BP预测精度最高,预测集的2和RMSE的值分别为0.978 4, 0.250 3%。综上,基于高光谱成像技术建立的SNV-UVE-CARS-BP模型,可以实现金银花贮藏过程中CGA含量变化的快速无损预测。
光谱分析;无损检测;模型;高光谱成像;金银花;绿原酸;特征波长;贮藏
金银花为忍冬科植物忍冬的干燥花蕾,富含酚类、环烯醚萜类、黄酮类、精油等多种活性成分,具有抗菌消炎、清热解毒等功效[1-2]。绿原酸(chlorogenic acid,CGA)是金银花中的主要药用成分之一,具有抗病毒、抗真菌等功效,在抵抗心血管疾病、癌症和糖尿病等慢性疾病方面也有重要作用[3-4]。化学和药理研究表明,CGA含量高低是评价金银花药材质量优劣的重要标志[5-6]。而CGA由于活性强、易氧化,容易在金银花贮藏过程中不断降解。因此,实现金银花在贮藏过程中CGA含量的准确、可靠、快速、无损检测,对监测和保证金银花的药效品质十分重要。高效液相色谱(high performance liquid chromatography,HPLC)、液相色谱-质谱联用和紫外分光光度计等常用的CGA含量测定方法,虽然能够实现准确测定,但具有耗时、费力、化学试剂使用量大等缺陷,难以实现CGA的快速无损检测。白雁等[7]和郝海群[8]分别利用近红外光谱分析技术(near infrared spectroscopy,NIRS)对金银花中CGA含量进行检测,表明NIRS可用于快速测定金银花中CGA的含量。但在上述NIRS检测金银花中CGA的研究中,都对金银花样品进行了粉碎处理,未能保证样品的完整性、无损性。另一方面,利用NIRS采集的金银花样品的光谱数据量较大,维度较高,且未采用数据降维方法,不利于在线检测[9]。因此,采用多种变量筛选及其变量方法之间的融合对光谱数据降维,选取特征光谱变量,可以降低模型的复杂度,对后续建模分析非常重要[10]。
高光谱成像(hyperspectral imaging,HSI)技术将光谱学和计算机视觉相结合,可以同时获得样本的光谱信息和空间信息[11-12]。从而实现食品和农产品成分及品质的快速、无损检测与鉴定,且无需对检测对象进行前处理。Liu等[13]采用HSI技术成功实现了紫薯干燥过程中花青素含量的快速预测,为干燥过程中农产品品质检测提供了有效手段。李靖等[14]利用HSI技术结合BP神经网络模型预测燕麦-葡聚糖含量,预测值与测定值之间的决定系数2为0.75,预测均方根误差为0.009 8。Shi等[15]利用HSI结合RBF神经网络对不同贮藏温度下罗非鱼片新鲜度指标(总挥发性盐基氮、总需氧量和值)进行了无损测定。上述文献研究证实了HSI技术可以实现物料品质及成分的快速无损检测,但目前,有关金银花贮藏过程中CGA含量变化的高光谱检测研究未见报道。
本研究以金银花贮藏过程中CGA含量为研究对象,进行HSI检测模型构建方法研究。首先使用6种不同的预处理方法对原始光谱进行降噪并建立偏最小二乘回归(partial least squares regression,PLSR)模型,以期确定最优的预处理方法;接着采用5种变量(波长)筛选方法提取特征波长;最后分别建立线性PLSR和非线性BP神经网络的CGA高光谱检测模型,通过对比模型的预测精度以获得最佳的特征波长筛选方法和预测模型,以期为实现金银花贮藏过程中CGA含量的无损检测提供参考。
本试验所用金银花购买于河南省洛阳市同仁堂药房,试验所用金银花中CGA的质量分数为4.864 2%。选择无损伤的、完整的金银花作为实验对象进行后续研究与分析。将金银花平铺在15个培养皿中,并置于恒温恒湿箱内进行模拟贮藏,本研究采用温度30 ℃,相对湿度85%的贮藏条件[16],以实现在较短时间内获得必要信息来评估金银花的品质指标。每5 d取出3个培养皿的金银花进行试验。首先,用HSI系统分别扫描每组样品(100个金银花),然后利用HPLC法测量相应的CGA含量。由于在贮藏20 d后,金银花已发生明显霉变,且表面有大量的菌丝,说明此时的金银花已不具备商业价值,因此,本研究只对贮藏前20 d金银花的CGA含量变化进行研究。
本研究所用HSI系统[17]的光谱范围为371~1024 nm。该系统主要由CCD相机、光谱仪(Inno-Spec IST50-3810,德国),光源,高精度电机控制的传送带,计算机以及暗箱组成,光谱分辨率为2.8 nm,光源为4个对称放置的150 W的可调节光纤卤素灯(90000420108型,德国ESYLUX公司)。
在采集金银花样品的高光谱图像前,先将仪器开启预热0.5 h,使光源和采集系统达到稳定。经过反复调试,设定镜头与平台之间的高度为250 mm,传送带移动速度为1.2 mm/s,CCD相机的曝光时间为90 ms。在图像采集过程中,每次将一个金银花放置在传送平台上,使用SICap-STVR(Inno-Spec GmbH Ltd,德国)软件共采集500个金银花高光谱图像。为了减少暗电流噪声和不均匀照明的影响,使用式(1)对所获取的原始高光谱图像进行黑白校正[10, 18]。
式中是黑白校正后的图像数据,是原始高光谱图像数据,是全黑标定数据,是全白标定数据。
用HSI系统采集的金银花高光谱图像为三维的立方体数据块,其包括二维的图像信息和一维的波长信息,图像中的每一个像素点包含全波长的光谱信息,提高了光谱数据的可靠性和稳定性[12]。使用ENVI 5.1软件(Research Systems Inc.,Boulder,CO,USA)将金银花样品与背景分离,并根据样品和背景之间的光谱差异(样品与背景光谱值差异最大的波长位置分割图像)确定感兴趣区域(region of interest,ROI)。金银花的形状和品质分布具有不规则性和不均匀性。若感兴趣区域选择局部,提取的光谱信息不能表征整个金银花样本。虽选择整个金银花作为ROI,因其形体尺寸不大,所以对整个样品ROI提取数据后,经过对光谱数据去除噪声比较大的信息,以及对全波长提取特征波长,用于建模分析是可行的。因此,该研究选择整个金银花样品作为ROI,提取的光谱信息更为全面,将ROI内所有光谱信息的平均值作为对应反射光谱值。在Matlab 2014a中计算分割出的每张图像内ROI的平均光谱值,并绘制所有样品对应ROI内平均值的光谱曲线图。
在采集完不同贮藏时间的金银花的高光谱图像后,利用HPLC法测量金银花中CGA含量[19]。首先,将金银花样品用研钵粉碎后精确称量0.1 g到锥形瓶中,并向锥形瓶中加入10 mL 50%甲醇,随后将锥形瓶放在50 W的超声清洗仪中,在20 ℃下水浴30 min提取CGA。然后,在10 000 r/min速度下离心20 min,并用0.22m Millipore膜过滤上清液。最后,将过滤得到的溶液密封并储存在深色玻璃瓶中,用HPLC Agilent Technologies 1260 Infinity系统作进一步分析。采用C18色谱柱(250 mm × 4.6 mm,5m)进行CGA分离,柱温25 ℃,流动相由乙腈-0.4%磷酸溶液以15∶85的比例混合而成,进样量为10L,流速为1.0 mL/min,检测波长为327 nm。每组试验重复3次。
高光谱图像采集时,由于样品表面不均匀、仪器的基线漂移、随机噪声、光散射等原因使得原始光谱中包含无用的信息[20-21]。为了提高模型预测精度和建模的效率,本研究采用了6种光谱预处理方法来增强原始光谱数据信息,包括savizky-golay卷积平滑(SG),移动窗口平滑(moving average),标准正态变量(standard normal variable,SNV),基线校正(baseline correction,BC),多元散射校正(multiplicative scatter correction,MSC),正交信号校正(orthogonal signal correction,OSC)。
本试验中采集的每个高光谱图像的大小是1 032×270像素,每个像素光谱包含1 288个变量,数据维度较高。为了解决高光谱原始数据量庞大、冗余信息多、预测精度降低的问题,需要对全波段数据进行降维。因此,使用无信息变量消除(uninformative variable elimination,UVE),连续投影算法(successive projections algorithm,SPA),竞争性自适应加权算法(competitive adaptive reweighted sampling,CARS)来筛选原始光谱数据中与检测样品相关性较高的特征波长,并通过对比模型的精度确定最佳变量筛选方法。
UVE是一种基于偏最小二乘回归(partial least squares regression,PLSR)算法中回归系数稳定性来消除无信息变量的算法,可以有效筛选有用的波长变量[22-23]。UVE算法就是把与光谱矩阵同维数的随机变量矩阵(人工添加随机噪声信息)加入到光谱矩阵中,通过交叉验证逐一剔除法建立PLSR模型,得到相应的回归系数向量,分析回归系数向量的平均值和标准偏差的商的稳定性,去除光谱矩阵对应的C
SPA是一种前向变量选择算法,可以减少变量之间的共线性,使冗余度最低,以选择矢量空间共线性最小的变量集合[24-25]。SPA算法详细的模型步骤可见参考文献[26]。
CARS算法是根据自适应重加权采样技术和指数衰减函数选择PLSR中回归系数绝对值较大的变量,去掉权重较小的波长点,寻出最佳变量组合[27-28],CARS算法详细的模型步骤可见参考文献[9]。
PLSR模型是一种线性多变量数据分析方法,集中了主成分分析和典型相关分析的特点,通过从自变量和因变量数据中提取包含原数据变异信息的主成分来建立回归模型[10, 29],被广泛应用于食品和农产品内部含量的预测。PLSR是一种常用算法,具体模型可详见参考文献[25]。
为了得到适合CGA含量的预测模型,本试验除了建立PLSR模型外,又建立了CGA含量的BP神经网络模型。BP神经网络是一种基于误差逆传播算法的多层前馈网络,是目前应用较广泛的神经网络模型,它可以处理复杂的非线性问题[30-31]。本试验采用3层结构的BP神经网络:输入层、隐含层、输出层。每一层之间通过神经元连接,同层之间无连接,用函数作为隐层神经元传递函数、函数为训练函数、e函数为输出层神经元传递函数,输入层为光谱变量个数(本试验中全光谱数据的输入变量数为824,特征波长输入变量分别与对应的特征波长数一致),输出层为测定的CGA值,隐含层节点数设为6,迭代次数、训练目标误差和学习速率分别设为1 000、0.000 1和0.01。
以决定系数(2)和均方根误差(RMSE)来估计模型性能。2较高且RMSE较低时,模型性能较好[32]。若2的值高于0.90,则表示该模型有很高的预测能力[33]。本试验所有数据处理与结果分析均在Matlab 2014a软件中进行。
通过HPLC法测得的金银花贮藏过程中CGA含量变化结果如表1所示。金银花中CGA含量与其品质呈正相关。初始CGA质量分数最高,为4.864 2%,表明相应的金银花品质也是最高。随着贮藏时间从第5到20天,平均CGA含量降低至初始含量的6.1%,表明CGA在本贮藏试验中损失严重。这可能是由于金银花中CGA等活性成分在较高湿度的贮藏环境下易发生酶促氧化降解[34],从而导致金银花质量在短时间内明显下降。此外,由于贮藏20 d后,金银花发生了明显霉变,说明本研究中金银花的贮藏条件适合部分微生物生长,从而消耗了金银花中的CGA等活性成分[34],这可能是CGA大量损失的另一个主要原因。
在基于光谱数据和CGA含量值建模之前,先将500个样品按照2∶1的比例随机划分为校正集和预测集。划分结果与对应的CGA含量统计结果见表2。由表可知,在不同的贮藏期(0、5、10、15、20 d),CGA含量之间有较大的差异,而校正集与预测集之间的差异很小,这有利于建立精度更高的金银花CGA含量检测模型。
表1 金银花贮藏过程中的绿原酸含量值
表2 校正集和预测集的绿原酸含量统计值
金银花光谱图像的采集范围为371~1024 nm,由于371~483 nm和902~1 024 nm范围内噪声影响明显,信噪比很低。因此,本研究仅选用483~902 nm(共824个波段)的光谱范围作进一步分析。图1为不同贮藏时间(0、5、10、15、20 d)金银花样本的平均光谱曲线。由图可见,在665~682 nm处有明显的波谷,这可能是由于金银花中C-H伸缩振动而引起的[35]。光谱曲线在682~774 nm范围内急剧上升,这可能是因为金银花在可见光波段的吸收较少[36]。700~900 nm光谱区主要反映样品内含氢基团(C-H、O-H)振动的倍频与合频的特征信息[33],而随着贮藏时间的延长,金银花样品中CGA含量逐渐减少,使得光谱反射强度逐渐降低。每条平均光谱曲线呈现出相似的趋势,说明金银花含有的内部成分大致相同。但样本的光谱反射率存在明显差异,这可能与金银花内部化学成分含量不同有关,而这些差异为建立不同贮藏期金银花CGA含量预测模型提供了理论依据。
图1 不同贮藏时间金银花样品的原始平均光谱图
基于原始数据和预处理后的数据建立PLSR模型,以比较不同预处理方法的效果,结果如表3所示。原始光谱的PLSR模型校正集2为0.966 9,RMSE为0.315 4%,预测集2为0.941 6,RMSE为0.384 9%。与原始光谱相比,所有预处理后的PLSR模型的校正集2的值都高于0.98,预测集2值在0.97以上,RMSE均小于0.3%,表明PLSR模型的预测性能有所提升。其中,经SNV预处理后所建的PLSR模型有最佳的预测效果,预测集的2为0.976 6,RMSE为0.271 1%,表明SNV方法能有效地消除由固体颗粒大小、表面散射和光程变化引起的光谱误差,显著提高模型的精度[37]。因此,本试验选择SNV为最佳的预处理方法,并进行后续的建模分析。
表3 基于不同预处理方法的PLSR的模型结果
2.4.1 UVE方法提取特征波长
UVE方法用于剔除原始824个波段中的无信息变量,金银花贮藏过程中CGA含量的UVE变量的稳定性分布结果如图2所示。2条平行线表示变量稳定性的上、下限,两条阈值分界线内的波长变量全部剔除,分界线以外的变量保留用于进一步分析。经UVE方法筛选后,共得到192个波长变量,占全波长的23.3%。
注:垂直虚线左侧为光谱变量的稳定性分布曲线,右侧为UVE中引入的824个随机噪声变量的稳定性分布结果。
2.4.2 CARS方法提取特征波长
运行CARS算法时,迭代次数和蒙特卡罗采样运行次数分别设置为800和55。基于CARS筛选金银花CGA含量高光谱特征波长的过程如图3所示。图3a,3b和3c分别表示随着采样次数的增加,采样变量的个数,RMSECV值和每个波长的回归系数路径的变化趋势。
图3 CARS方法筛选结果
从图3a可以看出,第一阶段变量数减少较快,随后逐渐减慢,这是由于指数衰减函数的作用,体现了使用CARS算法筛选特征波长中有“粗选”和“精选”2个阶段[38]。图3b反映了随着采样次数增加RMSECV的变化趋势。采样次数从1到26,RMSECV值差距不大。随后RMSECV值升高,可能是因为在剔除无信息变量时丢失了一些重要信息变量。结合图3c分析可知,当采样次数为26时(“*”列所对应的位置),获得最佳变量子集且RMSECV值最小(0.347 7%)。最终,CARS算法从824个波段中选择了51个最佳波长,占整个波长的6.2%。
2.4.3 SPA方法提取特征波长
SPA算法的最大有效波长设置为30,对应的RMSE分布如图4a所示,其中方块对应所选变量数。由图可知,随着变量数的增加,RMSE值呈下降趋势,当波长数增加到17后,RMSE值基本不变。通过SPA算法从824个波长中选择了17个最佳波长,分布如图4b所示,其中正方形对应所选择的波长所对应的具体波段(共17个),全光谱变量被极大压缩,占全波长的2.1%。
注:a图中方块表示最终筛选的变量个数;b图中方块表示筛选变量具体对应的波长。
由于高光谱图像在采集过程中存在非线性因素在内的多种因素的影响,如背景干扰,散光和CCD噪声等,不利于对光谱数据的分析。而BP神经网络是一种常用的非线性的建模方法,它可以有效地处理非线性问题[39]。因此,本试验分别以UVE,CARS,SPA这3种算法提取的特征波长变量作为输入变量,金银花CGA含量值作为因变量建立线性PLSR和非线性BP神经网络模型。为了评估提取的特征波长对预测金银花不同贮藏时间的CGA含量的有效性,将其与全光谱数据的模型相比较,结果如表4所示。
表4 金银花CGA含量的PLSR和BP模型的预测结果
对比线性的PLSR模型的结果可知,全光谱-PLSR模型校正集的2为0.981 9,RMSE为0.229 7%,预测集的2为0.976 6,RMSE为0.271 1%,代表模型效果较好。从特征波长选择的角度可知,不同波长筛选方法对相应模型的建立会发生不同程度的变化。UVE-PLSR,CARS- PLSR和SPA-PLSR模型的预测结果较全光谱-PLSR模型均有不同程度的降低,但校正集和预测集的2均高于0.9,说明基于特征波长建立的PLSR模型还是可行的,具有良好的预测性能,其中UVE-PLSR模型的预测效果优于CARS-PLSR和SPA-PLSR,预测集的2为0.970 4,RMSE为0.298 6%,且结果与全光谱-PLSR接近。表明UVE方法可以有效地剔除无用的信息变量,保留与金银花品质相关性强的信息,而SPA算法可能在剔除冗余变量的同时将有用的信息也剔除。但是,与CARS、SPA算法相比,UVE算法提取的特征波长数量较多(192个)占全波长的23.3%,导致模型运算时间相对较长。因此,为了提高UVE-PLSR模型的运算时间,将UVE分别与CARS和SPA算法相结合提取特征波长变量,UVE-CARS选取特征变量26个,占UVE的13.5%,UVE-SPA选取9个特征变量,占UVE的4.7%,并建立相应的模型,模型的预测结果见表4。由表4可知,UVE-CARS-PLSR模型的预测集2为0.974 6,RMSE为0.286 3%,UVE-SPA-PLSR模型的预测集2为0.9414, RMSE为0.413 1%。与UVE-PLSR对比可知,UVE-CARS-PLSR不仅减少了模型的输入变量,还提高了模型的预测精度,而UVE-SPA虽提取的特征波长数较少,减少了模型的运行时间,但其预测精度降低。综合考虑PLSR模型的复杂度,选择UVE-CARS-PLSR为CGA最优的PLSR预测模型。得到的UVE-CARS-PLSR模型如式(2):
=2.901 6-32.085 1523.59nm+38.202 3532.82nm+
25.462 8537.94nm-21.055 6540.51nm-
49.843 2543.07nm+ 39.462 5563.57nm+
30.562 8580.98nm-47.307 3590.72nm-
20.071 5593.28nm+ 30.537 6604.03nm+
15.104 3609.15nm+ 34.470 7610.17nm-
48.476 7616.83nm-29.888 7643.43nm+
34.287 3648.03nm+ 23.689 8650.59nm-
36.834 2653.14nm-45.829 2746.98nm+
42.650 0751.05nm+ 47.525 5812.93nm-
33.304 9813.94nm-37.450 9814.95nm+
31.003 6817.98nm+ 33.288 1818.49nm-
36.648 1819.5nm-16.285 7821.02nm(2)
式中为预测的CGA的值,为UVE-CARS筛选得到的特征波长对应的光谱反射率。
比较BP神经网络模型效果可知,全光谱-BP模型校正集2为0.989 8,RMSE为0.172 5%,预测集2为0.977 1,RMSE为0.258 1%,模型精度较好。分析UVE-BP,CARS-BP,SPA-BP,UVE-CARS-BP和UVE- SPA-BP模型可知,UVE-CARS-BP模型的预测效果最好,其预测集2为0.978 4,RMSE为0.250 3%,且仅有UVE-CARS-BP模型的预测精度优于全光谱-BP模型。因此,选定UVE-CARS-BP模型为最优BP模型。
图5为5种变量筛选方法提取的特征波长的分布图,分析最佳变量筛选方法UVE-CARS筛选的波长主要集中在520~660 nm,这可能与C-H键的伸缩振动有关[40],且选取的750 nm和810 nm附近与CGA物质的C-H、O-H 键以及H2O分子的倍频吸收有关[41]。与UVE-CARS算法相比,基于UVE算法提取的特征波长变量建立的预测模型性能与其接近,但选取的波长变量数较多。SPA与UVE-SPA 2种算法,可能选取的波长数较少,不足以提取与CGA物质相关性较强的波长。虽然CARS算法提取的波长基本包含了所有的UVE-CARS提取的波长,但建立的CARS-模型的精度低于UVE-CARS模型的精度,这可能是由于CARS算法选择的特征波长除包含与CGA物质相关的有用信息外,同时也包含噪声信息[42]。
图5 不同变量筛选方法选取的特征波长变量
综上可知,UVE-CARS方法是最佳的特征变量筛选方法,由UVE-CARS方法筛选的26个特征波长变量可以代替全光谱变量,非线性的BP神经网络模型更适应于金银花贮藏过程中CGA含量的预测,且UVE-CARS-BP模型为最优金银花CGA含量预测模型。基于SNV预处理后的光谱数据建立的UVE-CARS-BP模型的CGA含量的预测值和测量值的结果如图6所示,其预测集2为0.978 4,RMSE为0.250 3%,回归方程为=0.978 4+ 0.097 0,拟合效果最佳。
图6 基于SNV预处理后的UVE-CARS-BP模型的CGA含量的预测值与测量值
本研究采用HSI技术对金银花贮藏过程中CGA的含量进行定量检测,基于不同预处理方法和多种变量筛选方法,尝试建立预测能力较高的高光谱模型,为利用HSI技术对金银花贮藏过程中CGA含量测定和品质控制提供参考。主要结论如下:
1)为了降低仪器噪声、基线漂移等对原始光谱的影响,分析了SG、Moving average、SNV、BC、MSC、OSC这6种不同的光谱降噪方法,通过建立PLSR模型对比得出,经SNV预处理后的光谱数据建立的PLSR的模型精度最高,预测集2为0.977 6,RMSE为0.271 1%,表明SNV方法的降噪效果最好,可以显著提高模型的精度,其被确定为最佳的预处理方法用于后续的建模分析。
2)探讨了基于UVE,CARS,SPA,UVE-CARS和UVE-SPA这5种变量筛选方法对模型的性能的影响,发现UVE-CARS为最佳的变量筛选方法,基于UVE-CARS筛选的特征波长变量建立的PLSR和BP模型的预测集2分别为0.974 6和0.978 4,RMSE分别为0.286 3%和0.250 3%。
3)对比线性PLSR模型与BP神经网络模型的精度发现,BP神经网络模型的性能整体优于PLSR模型,其中SNV-UVE-CARS-BP模型精度最好,预测集2为0.978 4,RMSE为0.250 3%。
在今后的工作中将扩大试验样本的多样化,收集不同地区,不同批次的金银花原料,解决同一地区相同批次样品之间较小差异导致提高模型泛化能力的问题。此外,本研究中未涉及金银花的图像信息,而图谱融合能够提供更多的有用信息,因此,在未来的工作中,将基于光谱信息与图像信息的有效融合来进一步研究金银花中CGA含量的快速无损检测方法。
[1] 李晓芳,刘云宏,马丽婷,等. 远红外辐射温度对金银花干燥特性及品质的影响[J]. 食品科学,2017,38(15): 69-76. Li Xiaofang, Liu Yunhong, Ma Liting, et al. Effect of far-infrared radiation temperature on drying characteristics and quality of[J]. Food Science, 2017, 38(15): 69-76. (in Chinese with English abstract)
[2] Wang X Q, Wei F Y, Wei Z F, et al. Homogenate-assisted negative-pressure cavitation extraction for determination of organic acids and flavonoids in honeysuckle (Thunb.) by LC–MS/MS[J]. Separation and Purification Technology, 2014, 135: 80-87.
[3] Yao X H, Xu J Y, Hao J Y, et al. Microwave assisted extraction for the determination of chlorogenic acid in Flos Lonicerae by direct analysis in real time mass spectrometry (DART-MS) [J]. Journal of Chromatography B Analytical Technologies in Biomedical and Life Science, 2018, 1092: 82-87.
[4] Hunyadi A, Martins A, Hsieh T J, et al. Chlorogenic acid and rutin play a major role in the in vivo anti-diabetic activity of Morus alba leaf extract on type II diabetic rats[J]. PLoS One, 2012, 7(11): e50619.
[5] 毛利华,李世周,杨哲,等. 金银花活性成分及其产品开发研究进展[J]. 江苏科技信息,2018,35(17): 47-49. Mao Lihua, Li Shizhou, Yang Zhe, et al. Research progress on active components in honeysuckle and development of its products[J]. Jiangsu Science and Technology information, 2018, 35(17): 47-49. (in Chinese with English abstract)
[6] 葛朝晖,张海娟. 基于化学成分含量变化的金银花药材保质期预测[J]. 中国药房,2017,28(12): 1677-1680. Ge Zhaohui, Zhang Haijuan. Forecast on shelf life of lonicerae japonicae based on its chemical components variation[J]. Chain Pharmacy, 2017, 28(12): 1677-1680. (in Chinese with English abstract)
[7] 白雁,李珊,王星,等. 近红外光谱法快速测定金银花中绿原酸的含量[J]. 中国实验方剂学杂志,2011,17(5): 66-69. Bai Yan, Li Shan, Wang Xing, et al. Determination of chlorogenic acid of honeysuckle by near-infrared spectroscopy rapidly[J]. Chinese Journal of Experimental Traditional Medical Formulae, 2011, 17(5): 66-69. (in Chinese with English abstract)
[8] 郝海群. 近红外光谱法测定金银花中绿原酸含量[J]. 河南中医,2015,35(3): 640-642. Hao Haiqun. The chlorogenic acid content of jinyinhua tested with near infrared ray chromotherapy[J]. Henan traditional Chinese medicine, 2015, 35(3): 640-642. (in Chinese with English abstract)
[9] 王巧华,周凯,吴兰兰,等. 基于高光谱的鸡蛋新鲜度检测[J]. 光谱学与光谱分析,2016,36(8): 2596-2600. Wang Qiaohua, Zhou Kai, Wu Lanlan, et al. Egg freshness detection based on hyper-spectra[J]. Spectroscopy and Spectral Analysis, 2016, 36(8): 2596-2600. (in Chinese with English abstract)
[10] 刘燕德,肖怀春,孙旭东,等. 柑桔叶片黄龙病光谱特征选择及检测模型[J]. 农业工程学报,2018,34(3): 180-187. Liu Yande, Xiao Huaichun, Sun Xudong, et al. Spectral feature selection and discriminant model building for citrus leaf Huanglongbing[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(3): 180-187. (in Chinese with English abstract)
[11] Wu D, Sun D W. Advanced applications of hyperspectral imaging technology for food quality and safety analysis and assessment: A review — Part II: Applications[J]. Innovative Food Science and Emerging Technologies, 2013, 19(1): 1-14.
[12] Xiong Z, Sun D W, Xie A, et al. Quantitative determination of total pigments in red meats using hyperspectral imaging and multivariate analysis[J]. Food Chemistry, 2015, 178: 339-345.
[13] Liu Y H, Sun Y, Xie A G, et al. Potential of hyperspectral imaging for rapid prediction of anthocyanin content of purple-fleshed sweet potato slices during drying process[J]. Food Analytical Methods, 2017, 10(12): 3836-3846.
[14] 李靖,王春光. 基于高光谱的燕麦-葡聚糖含量测定方法研究[J]. 农机化研究,2018,40(4): 149-155. Li Jing, Wang Chunguang. Study on determination method of-glucan content in oat based on hyperspectral technology [J]. Journal of Agricultural Mechanization Research, 2018, 40(4): 149-155. (in Chinese with English abstract)
[15] Shi C, Qian J P, Zhu W Y, et al. Nondestructive determination of freshness indicators for tilapia fillets stored at various temperatures by hyperspectral imaging coupled with RBF neural networks[J]. Food Chemistry, 2019, 275: 497-503.
[16] Cong S L, Sun J, Mao H P, et al. Non-destructive detection for mold colonies in rice based on hyperspectra and GWO-SVR[J]. Journal of the Science of Food and Agriculture, 2017, 98(4): 29-35.
[17] Liu Y H, Wang Q Q, Xu Q, et al. Non-destructive detection of Flos Lonicerae treated by sulfur fumigation based on hyperspectral imaging[J]. Journal of Food Measurement and Characterization, 2018, 12(4): 2809-2818.
[18] 刘小丹,冯旭萍,刘飞,等. 基于近红外高光谱成像技术鉴别杂交稻品系[J]. 农业工程学报,2017,33(22): 189-194. Liu Xiaodan, Feng Xuping, Liu Fei, et al. Identification of hybrid rice strain based on near-infrared hyperspectral imaging technology[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2017, 33(22): 189-194. (in Chinese with English abstract)
[19] 王萌,王建成,刘钧宁,等. HPLC法测定不同加工方法金银花中绿原酸和木犀草苷的含量[J]. 药学研究,2014,33 (5): 261-263. Wang Meng, Wang Jiancheng, Liu Junning, et al. Determination of chlorogenic acid and galuteolin with different processing methods in flos lonicerae by HPLC[J]. Journal of Pharmaceutical Research, 2014, 33 (5): 261-263. (in Chinese with English abstract)
[20] 蒋蘋,罗亚辉,胡文武,等. 基于高光谱的油茶籽内部品质检测最优预测模型研究[J]. 农机化研究,2015,37(7): 56-60. Jiang Ping, Luo Yahui, Hu Wenwu, et al. Research on optimal predicting model for the detection of internal quality by hyperspectral technology [J]. Journal of Agricultural Mechanization Research, 2015, 37(7): 56-60. (in Chinese with English abstract)
[21] Mohammadi-Moghaddam T, Razavi S M A, Taghizadeh M, et al. Hyperspectral imaging as an effective tool for prediction the moisture content and textural characteristics of roasted pistachio kernels[J]. Journal of Food Measurement and Characterization, 2018, 12(3): 1493-1502.
[22] Wei X, Zhang Y C, Wu D, et al. Rapid and non-destructive detection of decay in peach fruit at the cold environment using a self-developed handheld electronic-nose system[J]. Food Analytical Methods, 2018, 11(11): 2990-3004.
[23] Zhang H Y, Zhu Q B, Huang M, et al. Automatic determination of optimal spectral peaks for classification of Chinese tea leaves using laser-induced breakdown spectroscopy[J]. International Journal of Agricultural and Biological Engineering, 2018, 11(3): 154-158.
[24] 冯洁,刘云宏,王庆庆,等. 基于高光谱成像技术的金银花与山银花快速鉴别[J]. 食品与机械,2018,34(5): 87-90,176. Feng Jie, Liu Yunhong, Wang Qingqing, et al. Rapid identification ofandbased on hyperspectral imaging[J]. Food and Machinery, 2018, 34(5): 87-90, 176. (in Chinese with English abstract)
[25] Zhu H Y, Chu B Q, Zhang C, et al. Hyperspectral imaging for presymptomatic detection of tobacco disease with successive projections algorithm and machine-learning classifiers[J]. Scientific Reports, 2017, 7(1): 4125.
[26] 吴迪,宁纪锋,刘旭,等. 基于高光谱成像技术和连续投影算法检测葡萄果皮花色苷含量[J]. 食品科学,2014,35(8): 57-61. Wu Di, Ning Jifeng, Liu Xu, et al. Determination of anthocyanin content in grape skins using hyperspectral imaging technique and successive projections algorithm[J]. Food Science, 2014, 35(8): 57-61. (in Chinese with English abstract)
[27] Jiang J L, Cen H Y, Zhang C, et al. Nondestructive quality assessment of chili peppers using near-infrared hyperspectral imaging combined with multivariate analysis[J]. Postharvest Biology and Technology, 2018, 146: 147-154.
[28] 郑涛,刘宁,孙红,等. 基于高光谱成像的马铃薯叶片叶绿素分布可视化研究[J]. 农业机械学报,2017,48(S1): 153-159,340. Zheng Tao, Liu Ning, Song Hong, et al. Visualization of chlorophyll distribution of potato leaves based on hyperspectral imaging technology[J]. Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(S1): 153-159, 340. (in Chinese with English abstract)
[29] 冯海宽,杨福琴,杨贵军,等. 基于特征光谱参数的苹果叶片叶绿素含量估算[J]. 农业工程学报,2018,34(6): 182-188. Feng Haikuan, Yang Fuqin, Yang Guijun, et al. Estimation of chlorophyll content in apple leaves base on spectral feature parameters[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(6): 182-188. (in Chinese with English abstract)
[30] 陈明. MATLAB神经网络原理与实例精解[M]. 北京:清华大学出版社,2013.
[31] Zhang D Y, Lu X, Dong L, et al. Fast prediction of sugar content in dangshan pear (.) using hyperspectral imagery data[J]. Food Analytical Methods, 2018, 11(8): 2336-2345.
[32] Pan Y, Sun D W, Cheng J H,et al. Non-destructive detection and screening of non-uniformity in microwave sterilization using hyperspectral imaging analysis[J]. Food Analytical Methods, 2018, 11(6): 1568-1580.
[33] Yu X J, Tang L, Wu X F, et al. Nondestructive freshness discriminating of shrimp using visible/near-infrared hyperspectral imaging technique and deep learning algorithm[J]. Food Analytical Methods, 2018, 11(3): 768-780.
[34] 刘治华. 金银花干燥动力学及其贮藏稳定性研究[D]. 济南:山东大学,2015. Liu Zhihua. Drying Kinetics and Storing Stability of the Flower Bud ofThunb.[D]. Jinan: Shandong University, 2015. (in Chinese with English abstract)
[35] 程丽娟,刘贵珊,何建国,等. 灵武长枣蔗糖含量的高光谱无损检测[J]. 食品科学, 2018,40 (10): 285-291. Cheng Lijuan, Liu Guishan, He Jianguo, et al. Sucrose content nondestructive detection of lingwu long jujube by hyperspectral imaging technique[J]. Food Science, 2018, 40 (10): 285-291. (in Chinese with English abstract)
[36] 李晓丽,魏玉震,徐劼,等. 基于高光谱成像的茶叶中EGCG分布可视化[J]. 农业工程学报,2018,34(7): 180-186. Li Xiaoli, Wei Yuzhen, Xu Jie, et al. EGCG distribution visualization in tea leaves based on hyperspectral imaging technology[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2018, 34(7): 180-186. (in Chinese with English abstract)
[37] Bi Y M, Yuan K L, Xiao W Q, et al. A local pre-processing method for near-infrared spectra, combined with spectral segmentation and standard normal variate transformation[J]. Analytica Chimica Acta, 2016, 909: 30-40.
[38] 于雷,洪永胜,周勇,等. 高光谱估算土壤有机质含量的波长变量筛选方法[J]. 农业工程学报,2016,32(13): 95-102. Yu Lei, Hong Yongsheng, Zhou Yong, et al. Wavelength variable selection methods for estimation of soil organic matter content using hyperspectral technique [J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2016, 32(13): 95-102. (in Chinese with English abstract)
[39] 叶勤,姜雪芹,李西灿,等. 基于高光谱数据的土壤有机质含量反演模型比较[J]. 农业机械学报,2017,48(3): 164-172. Ye Qin, Jiang Xueqin, Li Xican, et al. Comparison on inversion model of soil organic matter content based on hyperspectral data[J]. Transactions of the Chinese Society for Agricultural Machinery, 2017, 48(3): 164-172. (in Chinese with English abstract)
[40] Dutta D, Das P K, Bhunia U K, et al. Retrieval of tea polyphenol at leaf level using spectral transformation and multi-variate statistical approach[J]. International Journal of Applied Earth Observation And Geoinformation, 2015, 36: 22-29.
[41] Sun J T, Ma B X, Dong, J, et al. Detection of internal qualities of hami melons using hyperspectral imaging technology based on variable selection algorithms[J/OL]. Journal of Food Process Engineering. 2017, 40(3), UNSP e12496, 1-10.
[42] 梁琨,刘全祥,潘磊庆,等. 基于高光谱和CARS-IRIV算法的‘库尔勒香梨’可溶性固形物含量检测[J]. 南京农业大学学报,2018,41(4): 760-766. Liang Kun, Liu Quanxiang, Pan Leiqing, et al. Detection of soluble solids content in‘Korla fragrant pear’based on hyperspectral imaging and CARS-IRIV algorithm[J]. Journal of Nanjing Agricultural University, 2018, 41(4): 760-766. (in Chinese with English abstract)
Hyperspectral nondestructive detection model of chlorogenic acid content during storage of honeysuckle
Liu Yunhong1,2, Wang Qingqing1, Shi Xiaowei1, Gao Xiuwei1
(14710232.471023)
During the storage process, honeysuckle easily undergoes discoloration and mildew under the influence of temperature, humidity and microorganisms, which leads to a significant decrease of its medicinal efficacy and economic value, and even harms the health of consumers. Hence, it is necessary to monitor the quality of honeysuckle during storage. Chlorogenic acid (CGA), as the main active ingredient, is an important indicator to evaluate the quality of honeysuckle. In order to realize rapid and effective detection of CGA content in honeysuckle, 500 hyperspectral images of honeysuckle during different storage periods were collected by hyperspectral imaging (HSI) system, and then CGA content values were measured by high performance liquid chromatography (HPLC) method. Average spectral information extracted from the hyperspectral images and corresponding CGA values were used to build HSI detection models. Because of the non-uniformity of sample surface, baseline drift of instrument, random noise and light scattering, the collected hyperspectral images contained some redundant information, which could reduce the accuracy of modeling. In order to improve the prediction accuracy and efficiency of the model, six spectral preprocessing methods were used to improve the signal-to-noise ratio of the original spectrum, including Savizky-Golay filter (SG), moving average, standard normal variable (SNV), baseline correction (BC), multiplicative scatter correction (MSC), orthogonal signal correction (OSC). Comparing the effects of different pretreatment methods by establishing partial least squares regression (PLSR) models, the SNV-PLSR model obtained the best prediction accuracy with determination coefficient (2)of 0.976 6 and root mean square error (RMSE) of 0.271 1% in prediction set, and SNV was identified as the best pretreatment method for further analysis. In order to simplify the calibration model, the uninformative variable elimination (UVE), successive projections algorithm (SPA), competitive adaptive reweighted sampling (CARS), the combination of UVE and CARS (UVE-CARS), and the combination of UVE and SPA (UVE-SPA) were used to extract characteristic wavelengths from the pre-processed spectrum by SNV method. And UVE, CARS, SPA, UVE-CARS and UVE-SPA selected 192, 51, 17, 26, 9 characteristic wavelengths from the full spectrum. Then, based on the full spectrum data and the selected characteristic variables by five variable screening methods, the linear PLSR and the non-linear BP neural network model were established. The performance of all the models were evaluated by the index of2for calibration set and prediction set, (RMSE) for calibration set and prediction set. The results showed that UVE-CARS algorithm could effectively eliminate useless information variables from full spectrum, and 26 characteristic wavelengths were selected from full spectrum by UVE-CARS algorithm, and the established model based on UVE-CARS algorithm had high accuracy, which was considered as the best feature wavelength screening method. The prediction results of the non-linear BP model were better than that of the linear PLSR model. In all BP model, the prediction accuracy of UVE-CARS-BP was the highest with2of 0.978 4 and RMSE of 0.250 3% in prediction set, respectively, and it was proved that the non-linear model was more suitable for the prediction of CGA content in honeysuckle. In conclusion, HSI technology combined with SNV-UVE-CARS-BP model can realize the rapid and non-destructive prediction of CGA content in honeysuckle during storage.
spectrum analysis; nondestructive detection; models; hyperspectral imaging; honeysuckle; chlorogenic acid; characteristic wavelength; storage;
10.11975/j.issn.1002-6819.2019.13.035
O433
A
1002-6819(2019)-13-0291-09
2019-01-23
2019-05-29
国家自然科学基金资助项目(U1404334);河南省自然科学基金项目(162300410100);河南省高校创新人才资助项目(19HASTIT013);河南省科技攻关项目(172102310617;172102210256)
刘云宏,副教授,博士,主要从事农产品加工及品质检测研究,Email:beckybin@haust.edu.cn
刘云宏,王庆庆,石晓微,高秀薇.金银花贮藏过程中绿原酸含量的高光谱无损检测模型研究[J]. 农业工程学报,2019,35(13):291-299. doi:10.11975/j.issn.1002-6819.2019.13.035 http://www.tcsae.org
Liu Yunhong, Wang Qingqing, Shi Xiaowei, Gao Xiuwei.Hyperspectral nondestructive detection model of chlorogenic acid content during storage of honeysuckle[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2019, 35(13): 291-299. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2019.13.035 http://www.tcsae.org