李奇辰, 李民赞*, 杨 玮, 孙 红, 张 瑶
1. 中国农业大学烟台研究院, 山东 烟台 264003 2. 中国农业大学智慧农业系统集成研究教育部重点实验室, 北京 100083 3. 中国农业大学农业农村部农业信息获取技术重点实验室, 北京 100083
土壤磷素是植物最重要的养分之一。 土壤中施入磷肥以后, 绝大部分被固定于土壤中, 成为植物难以吸收利用的形态[1]。 水溶性磷素是植物可以直接利用的养分形态, 决定着土壤养分的供给能力。 过量施用磷肥会导致土壤微量元素养分流失, 以及环境污染等问题。 因此, 开发土壤磷素的快速检测技术, 从而优化施肥方法很有意义[2]。 传统实验室化学试剂提取方法不仅耗时费力、 而且难以提供准确的土壤磷素的形态信息。 基于光谱学技术的土壤速测方法为土壤磷素快速检测提供了新的可能性。 一些研究探索证明, 利用可见光-近红外光谱分析技术可以快速检测土壤磷素含量[3-4]。 然而, 由于磷素在土壤中形态复杂, 在可见光-近红外范围没有明显的吸收波段, 以往基于可见光-近红外光谱的土壤磷素快速检测一般是通过间接预测的方式[5-6], 使得检测结果缺乏重现性。
由于拉曼光谱选择性好、 受到土壤水分、 粒度等基质特性影响小的特点, 在土壤成分的速测技术中具有优势。 并且, 拉曼光谱与红外吸收光谱有互补特性, 在土壤成分的定量分析中有望增强模型的稳定性及预测精度。 但是, 拉曼光谱存在信号强度弱、 受荧光干扰强等问题, 限制了拉曼光谱在土壤成分检测中的应用。 如何扬长避短成为利用拉曼光谱检测土壤成分的研究热点。 近年来, 随着激光半导体技术、 共焦显微拉曼技术、 以及表面增强拉曼技术的发展, 为提升拉曼信号的稳定性、 信噪比提供了技术保障。 在土壤成分的速测技术中, 国内外很多学者都尝试了应用拉曼光谱对土壤成分的定性与定量分析[7-10]。
在土壤磷素的检测中, Lanfranco等测试了拉曼光谱对土壤中混合金属磷酸盐的识别能力。 结果表明, 拉曼光谱是识别土壤中不同磷酸盐形态的极其有效的工具, 较传统检测方法具有较低的检测限。 但是, 作者在检测中遭遇了荧光干扰等问题, 为有效拉曼信号获取带来一定困难[11]。 Nkebiwe等应用人工土、 自然土、 以及农田土三种土壤作为基底, 测试了共焦拉曼显微光谱对土壤中添加三种磷酸钙的识别能力。 发现共焦显微拉曼技术可以对土壤中不同形态磷酸盐进行精确识别及定位[12]。 在土壤磷素含量的快速检测中, Bogrekci与Lee开发了一种便携式的基于拉曼光谱技术的土壤磷素检测仪。 应用该检测仪测试土壤磷素的预测能力, 建立基于偏最小二乘法(PLSR)预测模型决定系数R2达到了0.98[13]。 Zheng等使用磷酸钙[Ca3(PO4)2]、 磷酸铁(FePO4·2H2O)、 磷酸镁[Mg3(PO4)2·2H2O]、 以及磷酸铝(AlPO4)配制了不同磷素浓度的土壤来测试拉曼光谱对土壤中磷素定量分析的效果。 采用了小波包分解方法滤除背景噪声, 应用分解后拉曼光谱建立PLSR预测模型决定系数(R2)为0.94[14]。
综上可知拉曼光谱在土壤磷素的定性分析中具有较强的优势, 在定量分析中也具有很大潜力。 然而, PLSR模型具有模糊性, 为减少冗余变量, 提升预测模型的可重复性或重现性, 需进一步弄清拉曼光谱与磷酸根浓度的定量关系。 本文以水溶性磷为研究对象, 分析了水溶性磷浓度对拉曼光谱的影响, 建立了二者之间的定量关系模型。
采用磷酸二氢钾试剂KH2PO4(AR分析纯, 西陇科学化工)作为测试样品, 分别配制了低浓度区间(0.02~5 g·L-1)与高浓度区间(5.21~93.87 g·L-1)的KH2PO4溶液。 低浓度区间根据土壤肥际微域中磷含量浓度进行配制[1]; 高浓度区间从KH2PO4室温饱和度到低浓度区的最高值之间进行配制。 各个区间配制浓度如表1所示。 以下为各浓度区间溶液的配制方法:
表1 KH2PO4样本溶液配制Table 1 Preparation of KH2PO4 sample solutions
(1) 低浓度区间KH2PO4溶液配制
选取KH2PO4试剂在110 ℃烘干2 h, 在烘干炉里冷却至室温, 称取4.793 9 g, 放入烧杯用水溶解, 转移到500 mL容量瓶, 加去离子水稀释至标线。 此时配制的溶液浓度为5 g·L-1(P2O5计)的标准液。 准确移取0.40、 1.00、 2.00、 4.00、 8.00、 16.00和32.00 mL于100 mL容量瓶中, 加去离子水稀释至刻度, 摇匀。 此时配制成浓度分别为0.02、 0.05、 0.1、 0.2、 0.4、 0.8和1.6 g·L-1的使用溶液(P2O5计)。
(2) 高浓度区间KH2PO4溶液配制
选取KH2PO4试剂在110 ℃烘干2 h, 在烘干炉里冷却至室温, 称取1、 5、 8、 10、 12、 15和18 g KH2PO4试剂, 分别加入100 mL去离子水充分混合。 此时配制浓度分别为5.21、 26.07、 41.72、 52.15、 62.58、 78.22和93.87 g·L-1的使用溶液(P2O5计)。
实验设备采用实验室用拉曼光谱仪(LRS-2/3, 天津港东科技有限公司)。 该仪器由外光路系统、 单色仪、 数据展示端组成。 采用波长为532 nm、 功率40 mW激光器作为激发光源。 激光束从下向上垂直射入液体样品管, 激发散射光由物镜组汇集到单色仪分光, 扫描范围200~800 nm, 分辨率0.1 nm。 检测器为单光子计数形式, 将检测到的光强在软件界面按波长顺序逐一显示。 在检测样本以前以四氯化碳标准溶液为参照, 首先对光强、 波峰位置进行调整。 通过调节聚光透镜的相对位置、 以及单色仪狭缝宽度, 确保数据显示界面可观测到清晰的拉曼散射特征峰。 由于拉曼信号强度微弱, 采集拉曼光谱时使用遮光布覆盖仪器, 屏蔽外界光的干扰。
表2 磷酸根离子的拉曼频移Table 2 Raman shifts of phosphorus bonds
由以往实验及群论方法推测, 可知在411和466 cm-1附近也可能存在磷素的拉曼波峰[14-15]。 同时, 研究也表明2 000 cm-1以上H键相关振动对模型预测干扰较大[14]。 并且, 考虑瑞利峰干扰以及单波长扫描的检测方式比较费时, 本实验选择扫描范围是544~600 nm(拉曼频移401~2 130 cm-1), 分辨率0.1 nm, 积分时间150 ms。 每个样品采集5次, 取均值作为样本代表。 由于激光对样本有损伤, 发现异常光谱时则更换样本重新检测。
首先对每个光谱进行5点移动平均(MA)处理, 之后分别采用基线校正(BL)、 标准正态变量(SNV)变换, 多元散射校正(MSC)来去除基线漂移。 采用偏最小二乘回归(PLSR)建模, 交叉验证法(CV)确定PLSR因子数(nF), 避免模型过拟合。 采用PLSR模型回归系数确认特征峰位置, 选取特征峰作为独立变量应用多元线性回归(MLR)建模。 光谱预处理及建模采用软件The Unscrambler X(version 10.5, CAMO software AS, Norway)执行。
图1(a)为MA处理后的低浓度区间KH2PO4的拉曼光谱数据。 在低浓度区间, 不同浓度展现为光谱基线的变动。 0.4 g·L-1浓度以下的光谱数据没有明显变动, 从0.4 g·L-1开始可以观测到明显的基线上升趋势, 但是未能辨认出拉曼波峰。 图1(b)为经过MA+MSC处理后的高浓度区间KH2PO4的拉曼光谱数据。 如图1(b)所示, MSC可以滤除杂散光带来的基线漂移。 5.21 g·L-1的光谱没有观测到明显的拉曼波峰, 从26.07 g·L-1开始可以观测到两处明显的拉曼特征峰, 分别位于拉曼频移863与1 070 cm-1。 由过往文献可知这两处波峰为磷酸根离子的伸缩振动引起[16]。 并且这两处波峰的峰高随着溶液浓度的增加有增强的趋势。
图1 (a)低浓度区间KH2PO4拉曼光谱; (b)MSC滤波后的高浓度区间KH2PO4拉曼光谱Fig.1 (a) Raman spectrum of KH2PO4 in low concentration range (0.02~5 g·L-1); (b) MSC filtered Raman spectrum of KH2PO4 in high concentration range
制约拉曼光谱在定量分析中推广应用的主要因素之一是信号弱。 荧光信号通常会淹没强度较弱的拉曼信号, 为拉曼光谱的谱学分析带来困难。 荧光以及背景光对拉曼信号的干扰通常反映在光谱基线的变动上。 为进一步研究影响拉曼谱线变动的原因, 本文统计了每个样本5次重复检测获取的拉曼光谱的变异系数, 对每个波长算得的变异系数求均值作为该样本的代表, 来反映荧光等背景光干扰的强弱。 图2比较了低浓度区间与高浓度区间变异系数的离散特征。 如图2所示, 高浓度区间变异系数的离散程度较大, 变化范围在0.08~0.30之间。 中位数、 下四分位数、 上四分位数分别为0.15、 0.13、 0.23。 低浓度区间变异系数的离散程度较小, 变化范围在0.03~0.1之间。 中位数、 下四分位数、 上四分位数分别为0.07、 0.05、 0.1。
图2 低浓度与高浓度区间单一样本5次重复检测的变异系数Fig.2 Coefficient of variation of five repetitions in the low and high concentratioos
结果说明样本浓度对拉曼信号稳定性影响较大, 低浓度区间与高浓度区间变异系数具有显著差异。 可以推测高浓度样本受到荧光等干扰较强, 从而增大了拉曼光谱数据的离散程度。 其次, 磷酸根离子的成核、 结晶过程也会影响拉曼光谱的采集[16]。 高浓度磷酸根溶液更易结晶, 晶体对光的反射也会造成较大的背景光波动, 成为增加光谱离散程度的主要原因。
图3 不同光谱预处理的PLSR模型的预测精度RS: 原始光谱; MA: 移动平均、 MA+BL: 移动平均+基线校正; MA+SNV: 移动平均+标准正态变量变换; MA+MSC: 移动平均+多元散射校正Fig.3 PLSR results of different spectra pretreatment methodsRS: Raw spectra; MA: Moving average; MA+BL: Moving average+baseline offset; MA+SNV: Moving average+standard normal variable transform; MA+MSC: Moving average+multiple scatter correction
低浓度区间模型精度最高为MA+BL数据集, 其次为MA数据集。 高浓度区间精度最高为MA+BL数据集, 其次为MA+MSC。 全浓度区间最高为原始光谱数据集RS, 其次为MA+SNV。 SNV与MSC可以滤除背景光、 荧光等引起的基线漂移, 所以模型主要贡献因子为拉曼特征峰。 低浓度区间由于没有明显拉曼波峰, 模型贡献因子为拉曼散射以外的因素(比如荧光引起的基线漂移), 所以MA+MSC与MA+SNV处理比MA单独处理降低了模型精度。 而高浓度区间则相反, SNV与MSC都增加了模型精度。 全浓度原始光谱数据集(RS)预测精度最高, 说明了浓度的变异造成了光谱基线的漂移, 对PLSR模型精度起到了积极作用。
PLSR模型通过特征向量与特征值建立独立变量(拉曼频移)与响应变量(P2O5)之间的联系, 并使用较少的因子(主成分)解释待测目标的大部分变异。 由于这些特性, 可以推知PLSR模型对拉曼信号以外的噪声信号(荧光等)的抗干扰能力较强, 有时可以利用干扰因子增强模型的精度。 然而, PLSR的问题是算法中对于独立变量赋予的权重具有随机性, 通常难以解释其产生原因及物理意义。
为进一步研究磷浓度与拉曼光谱的关系, 降低PLSR模型中的模糊性, 尝试选取少的独立变量进行建模。 选取高浓度区间PLSR模型的回归系数作为研究对象。 图4(a)为高浓度区间PLSR模型独立变量(拉曼位移)对应的回归系数。 回归系数曲线对应的波峰(波谷)说明了该波段所占权重大小。 如图4(a)所示, 回归系数中在磷酸根的拉曼特征峰863与1 070 cm-1处有明显的波峰, 与拉曼光谱数据的波峰位置吻合[图1(b)], 进一步说明高浓度区间模型中磷酸根的拉曼特征峰对模型精度的贡献程度较大。
图4 (a)高浓度区间PLSR模型的回归系数; (b)根据回归系数选取特征波峰建立MLR预测模型的1∶1散点图Fig.4 (a) Regression coefficients of PLSR results in high concentration range; (b) Scatter plot of MLR result of cross-validation using characteristic Raman peaks
采用不同浓度的KH2PO4溶液作为研究对象, 研究了拉曼光谱对水溶性磷定量分析的能力。 应用波长532 nm激光光源的实验室拉曼光谱分析仪, 分别获取了低浓度区间(0.02~5 g·L-1)与高浓度区间(5.21~93.87 g·L-1)KH2PO4溶液的拉曼光谱。 使用RS、 MA、 MA+BL、 MA+SNV、 MA+MSC方法对光谱进行预处理, 应用PLSR方法对处理后的光谱进行建模。 并且, 根据PLSR回归系数选取特征波长作为独立变量建立MLR模型, 结果表明:
(1)低浓度区间与高浓度区间光谱的变异系数具有显著差异, 高浓度区间光谱的离散程度较大, 说明样本浓度对拉曼光谱的稳定性影响较大。
(5)通过PLSR模型回归系数, 选取645、 863、 1 070和1 412 cm-1四点波段建立MLR模型, 决定系数接近1。 说明这四点峰值的变化几乎可以解释所有磷浓度的变异。 同时说明敏感波段选取可以滤除背景光干扰, 揭示了拉曼光谱在磷酸根溶液定量分析的潜力。
(6)以上结果说明普通拉曼光谱难以满足土壤肥际微域中麟素含量快速分析的需求。 降低背景光干扰、 提高拉曼信号的稳定性的同时, 开发特征波段选择方法、 提高模型可重复性及抗干扰能力是未来高分辨率拉曼光谱快速检测技术开发的关键。