杜艳红 张伟玉 杨仁杰 杨延荣 常若葵
摘要:利用光谱分析技术分析不同的水样pH值,并应用逐步回归法建立了564、670和732 nm处水质的反射光谱吸收强度与其pH值之间的定量分析模型,模型的复相关系数R2=0.992 8,校正复相关系R2Adj=0.976 0,定标标准误差SEC=0.174,预测误差SEP=0.028,并通过了F验证,对连续、快速分析水质具有重要意义。
关键词:可见-近红外光谱;pH值;逐步回归法;定量分析模型
中图分类号:X832文献标识码:A文章编号:0439-8114(2012)03-0612-03
Analysis on pH in Water by Visible-Near Infrared Spectroscopy
DU Yan-hong,ZHANG Wei-yu,YANG Ren-jie,YANG Yan-rong,CHANG Ruo-kui
(Department of Electromechanical Engineering, Tianjin Agricultural University, Tianjin 300384, China)
Abstract: A new method with spectroscopy analysis to detect water pH was developed. The quantitative analysis model between pH and the water reflect spectroscopy absorption intensity at the wavelength of 564, 670 and 732 nm was established by stepwise regression method. The model passed the F verification, and multiple correlation coefficient was 0.992 8, and revised multiple correlation coefficient was 0.976 0, and calibration errors and predict errors were 0.174 and 0.028, which plays an important role for continues and rapid water analysis.
Key words: visible-near infrared spectroscopy; pH; stepwise regression method; quantitative analysis model
pH值作为水的最基本性质,它可以影响水体的弱酸、弱碱的离解程度,降低氯化物、氨、硫化氢等的毒性,对水质的变化、生物繁殖的消长、腐蚀性、水处理效果等均有影响,是评价水质的一个重要参数,因此测定水体pH值具有重要意义[1]。传统的玻璃电极法,操作过程复杂且需添加化学试剂,这就导致了在测定水体pH值时不仅破坏了被检水样而且易产生误差,且检测周期长,无法保证监测的实时性。近年来,近红外光谱在环境监测尤其是水质检测方面也得到了应用,Wang等[2]利用卫星遥感监测深圳水库水质的变化,应用可见-近红外光谱测量与标准方法测量相比较,测得总有机碳含量、生化需氧量和化学需氧量值有较高的相关性;何金成等[1,3]为快速确定废水的污染程度,研究了运用近红外光谱法测量废水的有关成分含量。Stephens等[4]用近红外光谱建立了BOD5快速测量的预测模型。刘宏欣等[5,6]基于近红外光谱建立了水中总氮、总磷的定量分析模型。杜艳红等[7]基于可见-近红外光谱建立了水中氨氮的定量分析模型。本研究主要是从520~118 2 nm波长范围的可见-近红外反射光谱入手,考察水体pH值与其光谱吸收强度间的关系,应用逐步回归法建立反射光谱与pH值的相关模型,实现水质pH值的分析,避免了周期长、破坏水样、不直观等传统方法的弊端。
1仪器与方法
1.1实验仪器
检测系统由计算机和可见-近红外光谱仪两部分组成,光谱仪采用的是美国海洋光学公司的USB2000光纤光谱仪。检测原理如图1所示,使用LS-1钨卤灯发射光源,通过‘Y形导光光纤的光入射端探头照射被测水样的同时,由反射光端口将反射信号传给微型光谱仪USB2000,将信号放大、A/D转换后传输给计算机,再利用海洋光学公司开发的光谱应用Spectra Suite软件进行光谱采集和去噪处理。
1.2水样的获取
实验中采用的水样为应用pH标准缓冲溶液配制而成的水样。
1.3检测方案
利用可见-近红外光谱检测水质pH值的主要设计方案为:采集具有代表性的水样的光谱,通过误差为0.01的pH计检测水样的pH值;找出样品的pH值与其光谱数据间的关系,并建立数学分析模型;通过该数学模型预测未知水样的pH值,与运用pH计检测的数据进行比较,以此来进一步验证数学模型,分析方案如图2所示。
1.4光谱采集
实验室温度为20 ℃左右,将‘Y形光纤从光谱仪中引出并固定于自制的支架上,再将水样放于白色背景的玻璃器皿中,保证‘Y形光纤光入射端探头距水样表面距离为6 mm,在520~118 2 nm全光谱范围内,对实验水样在采样间隔为0.37 nm连续采集10次,取其均值,由此得到一个水样的光谱图,采集过程中通过运行Spectra Suite软件设定参数,实现光谱数据的获取和存储。采集的一组光谱图如图3所示。
为了去除来自高频随机噪音、基线漂移、样本不均匀、光散射等影响,需要进行光谱预处理来消除噪音,本研究在剔除异常样品的基础上对光谱数据平滑处理,选用平滑点数为3,此时能很好滤除各种因素产生的高频随机误差。
2结果与分析
2.1建模波长的选取
虽然pH值不是物质成分,不直接对应分子的振动吸收频带,但是近红外光谱能够定量分析影响pH值的物质含量[8],并已用于不同物质中pH含量的预测[8-11]。在建立模型之前,要选取特征波长,从图3的水样光谱图可以看出,分别在波长564、670和732 nm处存在特征峰,而且特征峰的强度随着水样pH值的增加而增大,因而建模波长选为564、670和732 nm。
2.2模型的建立
建立定量分析模型时最重要的一点是使复相关系数为最大,利用变量增加法等手段逐渐增加可使多元复相关系数变大的变量,一般不难获得高的多元复相关系数和小的标准差的标定方程。但是另一方面光谱中由偶然的干扰所引起的高复相关系数的变量也有可能被吸收进去,则不能充分发挥对未知样本的预测能力[12]。为了避免这种情况的发生,分别选取564、670和732 nm附近的14处波长所对应的水样吸收光谱强度为变量,应用逐步回归法找出变量的最佳组合,建立定量分析模型的数据如表1所示。利用MATLAB软件对表1数据建立逐步多元线性回归模型,变量回归系数如图4所示。历次建模的模型标准差如图5所示。
对同一样品中的同一组分复相关系数越大,则模型标准差(RMSE)越小,即逐步多元线性回归算法所提取的光谱信息与分析组分的相关性越好,所得到的模型越好。从图5中可以看到模型标准差最小的几种变量组合中,满足复相关系数等参数的要求且变量参与最少的组合为:X2、X3、X4、X7、X8、X10、X13;从图4中看出变量X1、X5、X6、X9、X11、X12、X14的显著性最差,故移去这些变量,则对变量Y和X2、X3、X4、X7、X8、X10、X13作多元线性回归,即水质的pH值与其在563.7、564.1、564.4、670.2、670.6、671.3、732.1 nm处的光谱吸收强度建立定量分析模型,如式(1),复相关系数R2=0.994 7。
Y=12.126 9+0.172 7X2+0.552 7X3+0.173 0X4-0.191 1X7+0.154 0X8-0.091 4X10-0.091 7X13 (1)
2.3模型的验证
模型整体性检验的显著性概率P<0.01,拒绝零假设,回归具有统计学意义;模型的复相关系数R2=0.994 7,由于引进变量越多,复相关系数越大,则不能反映回归方程的优良性,因此采用校正复相关系数,R2Adj=0.976 0,表明模型具有高度的相关性;计算定标标准误差为SEC=0.174。应用6个水样作为预测样本验证模型,如图6所示,计算预测误差为SEP=0.028。
线性回归模型是建立在假定Y与X确实存在线性关系的基础上的,因此,对模型除了上述的检验之外,还需要通过假设检验对模型总体的线性关系和每个回归系数的显著性进行检验。
计算可得预测模型F=53.8,取显著水平α=0.05,查表得临界值F0.05(7,n-8)=F0.05(7,2)=19.35,通过了F验证,获得了较好的效果。
3结论
1)分析了不同pH值水样在520~1 182 nm波长范围内的可见-近红外反射光谱,得出在564、670和732 nm波长处水质pH值与其吸收光强有着显著的正相关。
2)应用逐步回归法建立了水质pH值与其吸收光强的定量分析模型,模型的复相关系数R2=0.992 8,校正复相关系数R2Adj=0.976 0,定标标准误差为SEC=0.174。
3)应用6个未知水样验证模型,预测误差为SEP=0.028,并通过了F验证。
4)从分析结果可知,应用逐步回归法进行红外光谱建模分析水质的pH值是可行的,对连续、快速分析水质pH值具有重要意义。
参考文献:
[1] 何金成,杨祥龙,王立人. 基于近红外光谱法的废水COD、BOD5、pH的快速测量[J].环境科学学报,2008,27(12):2105-2108.
[2] WANG Y P,XIA H,FU J M. Water quality change in reservoirs of Shenzhen. China: detection using LANDSAT/TM data[J]. Science of the Total Environment,2004,328:195-206.
[3] 何金成,杨祥龙,王立人. 近红外光谱法测定废水化学需氧量[J]. 浙江大学学报,2007,41(5):752-756.
[4] STEPHENS A B,WALKER P N. Near-infrared spectroscopy as a tool for real-time determination of BOD5 for single source samples[J].Transactions of the ASAE,2002,45(2):451-458.
[5] 刘宏欣,张军,王伯光. 水中总氮的无损快速分析[J].光学精密工程.2009,17(3):525-529.
[6] 刘宏欣,张军,王伯光. 水质监测中总磷无损的近红外光谱分析研究[J].分析科学学报.2008,24(6):664-666.
[7] 杜艳红,杨岗,卫勇,等. 基于可见-近红外光谱的水质中氨氮的分析[J].天津农学院学报,2010,17(3):26-28.
[8] 朱登胜,吴 迪,宋海燕,等. 应用近红外光谱法测定土壤的有机质和pH值[J].农业工程学报,2008,24(6):196-199.
[9] 王莉,刘飞,何勇. 应用可见-近红外光谱技术进行白醋品牌和pH值的快速检测[J].光谱学与光谱分析,2008,28(4):813-816.
[10] 葛炯,王维妙,张建平. 近红外光谱技术对烟草pH值的快速测定[J]. 分析测试学报,2009,28(6):742-745.
[11] LIU F,HE Y. Use of visible and near infrared spectroscopy and least squares-support vector machine to determine soluble solids content and pH of cola beverage[J]. Journal of Agricultural and Food Chemistry,2007,5(22):8883-8888.
[12] 李民赞. 光谱分析技术及其应用[M].北京:科学出版社,2006.
收稿日期:2011-08-16
基金项目:天津农学院科学研究发展基金资助项目(2008N014)
作者简介:杜艳红(1979-),女,辽宁盖州人,讲师,硕士研究生,主要从事检测与控制方面的教学与研究工作。(电话)18622262985(电子信箱)
yanhong_du@163.com。