樊 平,郑伟波,崔 钊
(中国科学院 上海技术物理研究所,上海 200083)
基于荧光光谱的空间高等植物叶绿素含量测量技术
樊 平,郑伟波,崔 钊
(中国科学院 上海技术物理研究所,上海 200083)
开展高等植物光合作用过程参数的实时检测技术研究,对于深入开展空间生物学效应具有重要意义。作为光合作用重要参数的高等植物叶绿素含量与其荧光光谱具有较好的相关性,为此,可以通过探测分析植物荧光光谱,建立其与叶绿素的相关性模型,间接表征其中的叶绿素含量。介绍一种新的建模方法即支持向量机(SVM),通过实验验证,方法预测叶绿素含量是可行的,相对于一般采用的线性回归法具有更好的预测效果和更高的测量精度。
荧光光谱; 标定; 支持向量机; 线性回归
人类空间活动不断增多,宇航员食物的获取,氧气的获取和废气的净化离不开高等绿色植物的培育生长。绿色高等植物既能进行光合作用,又是氧气和二氧化碳最重要的交换中心。绿色高等植物在空间微重力、高辐射环境下的生长发育情况与地面有所不同。为了收集高等绿色植物在空间环境下的生长数据,需要开展一系列的空间生命科学研究。空间生命科学实验仪器是空间生物学实验的载体,完成空间生命科学实验的实施、监控和观测,其回收的样品和收集的实验过程数据是科学家进行生物学机理研究的主要依据[1]。
地面上,多光谱成像技术凭借其二维图像信息与光谱信息融合的特点,已成为植物生理化学研究的一种重要手段,得到广泛应用。将荧光光谱[2]运用于高等植物的观测中具有快速实时无损等优点。用荧光光谱图像准确地表示叶片叶绿素含量的分布取决于单点标定的准确性。一般采用线性回归法建模对单点的荧光光谱和叶绿素含量之间建立模型,需要采集大量样本的荧光光谱和用标准方法测定的叶绿素含量。
本文提出一种以统计学理论为基础的支持向量机算法[3]进行叶绿素含量的标定,在处理小数量样本时表现出良好的准确性。
1.1 叶绿素含量测量原理
叶片中的叶绿体是进行光合作用的主要场所。当光照射到叶片上时,有反射、透射以及吸收这三种形式。叶绿素分子吸收光能后大部分用来进行化学反应,极少部分以热辐射和荧光发射的形式释放。在观察植物的荧光光谱光谱时,要通过蓝光或者紫外光对叶片进行激发。
紫外光虽然可以激发荧光,但紫外光会对叶片内的组织产生损伤,植物在生长过程中为了抵挡紫外光就在叶片表面生成紫外遮挡物,所以紫外光很难穿透叶片,激发出的荧光较弱。叶绿素在蓝光波段有明显吸收峰,且蓝光比紫外光更易穿透叶片到达叶绿素分子,所以,蓝光比紫外光更能激发出荧光。
荧光光谱在470~480 nm,680~685 nm 以及 730~740 nm三个波段附近各有一个强度峰值。470~480 nm波段的峰值主要是由阿魏酸产生的,而680~685 nm和730~740 nm波段的峰值是由叶绿素产生的。因而研究叶绿素的含量只需从后两个波段的强度峰值入手即可,大量研究表明:这两个峰值下荧光强度的比值与叶绿素的含量存在线性关系。
1.2 测量系统
基于荧光光谱的叶绿素含量测量系统(如图1所示)主要由激发光源、分光组件、成像控制组件及上位机构成。激发光源为蓝光LED(<500 nm),用于激发叶绿素荧光;分光组件采用滤光轮的形式滤光片;成像组件的图像传感器选用的芯片为IBIS5A—1300,像素大小为1024×1280,现场可编程门阵列(FPGA)控制成像采集输出的同时控制电机运动,用于切换滤光片,以便获取不同通道的光谱图像数据;上位机实现数据接收和数据反演分析。数据反演分析主要要建立相关性模型,并且通过标定试验进行参数标定。
图1 光谱成像系统Fig 1 Spectral imaging system
1.3 标定原理
叶绿素含量的标定包含两个步骤:一是获得叶片某点荧光光谱;二是获得该点标准叶绿素含量值。对荧光光谱用Matlab处理数据,提取特征量,然后将特征量和标准叶绿素含量值建模。步骤一可以采用如图2所示的系统测量而得。
图2 荧光光谱采集系统示意图Fig 2 Collection system diagram for fluorescence spectra
该系统使用海洋光学公司的HR4000光谱仪,光纤探头400 μm,软件为SpectraSuite;激发光源为激光二极管泵浦激光器,型号为MBL—III—473;使用圆形渐变密度滤光片NDFC5020调节激光强度。将叶片用夹具固定,激光器发出的光经过衰减计照射到叶片上并与叶片成45°,将光纤探头与叶片也成45°固定,采集到得信号经过光谱仪连接到计算机上。整个实验需要在暗室中进行。将采集到的30幅荧光光谱用Matlab显示在一幅图中,如图3所示。从图3中可以看出:这30条曲线的特征大抵相同都有两个峰,将左锋值比上右峰值得到特征量。此特征量将用于建模。
图3 采集到的荧光光谱Fig 3 Collected fluorescence spectra
标准叶绿素含量值这部分由中国科学院上海生命科学研究院植物生理生态研究所协助完成,具体步骤:1)将叶片上标记的点打孔取下,放在研钵中,加入 95 %的乙醇,过滤,制成实验原液;2)由公式c=6.63A665-18.08A649测量溶液在 665 nm和649 nm的吸光度带入公式即得叶绿素含量,见表1。
表1 样品叶绿素含量
叶绿素含量的标定原理是先提取荧光光谱中的特征量,然后对特征量和标准的叶绿素含量值进行建模得到关系式。对于待测的叶子,只要测得荧光光谱提取特征量带入关系式即可求得叶片的叶绿素含量。因此,建模过程中选择什么样的回归方式显得尤为重要。
2.1 支持向量机回归理论
支持向量机(support vector machine,SVM),SVM最初被用来解决分类问题,后来被推广到函数逼近和信息融合领域。已知拟合点(xi,yi),i=1,2,…,n,xi∈Rn为输入量,yi∈R为输出量。
SVM线性回归其本质就是在线性回归中在特征到结果中加入了一层映射,模型[4,5]为
(1)
鉴于只有叶绿素荧光光谱和叶绿素含量只有两个变量,用线性回归函数式(2)拟合样本数据
f(x)=〈w,x〉+b
(2)
式中 w,b分别为式(1)中的α,θ0。
假设样本数据可以在精度ε满足不敏感损失函数
(3)
这时SVM的回归拟合就是转化为求优化目标函数最小化问题
(4)
2.2 SVM具体操作
非线性SVM回归的具体操作是将输入量xi通过核函数映射到高维,则目标函数为
(5)
(6)
1)支持向量机的性能取决于惩罚系数C,核函数的函数设置γ,不敏感损失函数ε及核函数类型。惩罚系数C是对模型复杂度和泛化能力的折中,它决定了损失大于ε的惩罚程度,当C太小时,模型结构复杂度下降,训练误差可能超出接收范围;当C→∞ 时,模型优化目标误差退化至风险最小化,出现“过学习”现象。ε是SVM回归的重要特征,它决定了支持向量的数目TotalSV。通过对LibSVM3.11软件包中核函数类型对比,结果采用RBF核函数的e-SVR[6,7]。SVM中相关参数C=2.2,γ=2.8,ε=0.01;标准线性回归R2=0.845 6。
2)目前没有一个完备的方法来确定SVM回归参数,常用的SVM参数的方法主要有:遗传法(genetic algorithm,GA)、粒子群优化(PSO)算法、网络优化选择法。
遗传算法的主要特点是直接对结构对象进行操作,不存在求导和函数连续性的限定;具有内在的隐并行性和更好的全局寻优能力。粒子群优化算法是一种新的全局优化进化算法。系统初始化为一组随机解,通过叠代搜寻最优值,在解空间追随最优的粒子进行搜索。网格优化算法是一种大范围点集搜索方法。搜索范围的确定仍需建模者设定。该方法简单易行,但是训练时间较长。
各寻优参数结果见表2,对比相关系数可知遗传算法较好,但是网格优化算法所需支持向量数较少,SVM回归模型较简单。
表2 相应寻优算法所得参数及计算出的相关系数
将遗传算法所求参数SVM回归模型结果列于表3并同线性回归结果进行比较,发现SVM回归比线性回归相关性好,平均绝对误差比线性回归小,因此,SVM回归有较好的分析效果。
表3 SVM与线性回归对比
本文分析了叶绿素荧光产生机制,以及基于荧光光谱的叶绿素含量测量原理,建立了基于荧光光谱的空间高等植物叶绿素含量测量系统,并采用SVM算法在标定部分进行建模。经过原理上的验证,可见SVM在回归的相关性和误差上比标准线性回归效果要好许多。
[1] 郑伟波.空间高等植物培养观察装置及其空间飞行实验[J].科学技术与工程,2007,17(7):4403-4407.
[2] 杨昊谕.基于叶绿素荧光光谱分析的植物生理信息检测技术研究[D].长春:吉林大学,2010.
[3] 李海生.支持向量机回归算法与应用研究[D].广州:华南理工大学,2005:1-18.[4] Vapnik V N.The nature of statistical learning theory[M].New York:Springer Verlag,1995.
[5] Vapnik V N,Levin E,Le Cun-Y.Measuring the VC dimension of a lerning machine[J].Neural Computation,1994,6:851-876.
[6] Mendes R,Kenney J.The full informed particle swarm:Simpler,maybe better[J].IEEE Transaction on Evolutionary Computation,2004,8(3):204-210.
[7] 朱 波,刘 飞,李顺江.基于优化有向无环图支持向量机的多变量过程均值异常识别[J].计算机集成制造系统,2013,19(3):549-568.
Measurement technology for chlorophyll content in space higher plants based on fluorescence spectrum
FAN Ping,ZHENG Wei-bo,CUI Zhao
(Shanghai Institute of Technical Physics,Chinese Academy of Sciences, Shanghai 200083,China)
Doing research on technology for real-time detection of process parame-ters of photosynthesis in higher plants have great significance for deeply studying biological effects of space.Chlorophyll content which is an important parameter of photosynthesis in higher plants shows a very good correlation with fluorescence spectra.Therefore,establish correlation model between fluorescence spectra and chlorophyll to indirectly represent the chlorophyll content by detecting and analyzing fluorescence spectra of plants.Describe a new method of modeling which is support vector machine(SVM).Through experimental verification,the method is feasible to predict the chlorophyll content,which has better prediction performance and higher precision than linear regression method.
fluorescence spectrum;calibration;support vector machine(SVM);linear regression
10.13873/J.1000—9787(2016)11—0140—03
2016—01—20
V 556
A
1000—9787(2016)11—0140—03
樊 平(1990-),女,江苏扬州人,硕士研究生,主要从事荧光光谱成像方面的研究工作。