基于太赫兹光谱的乙二醇含水率检测方法研究

2023-11-17 07:27刘泉澄魏文卿于洙海尚丽平
激光与红外 2023年10期
关键词:赫兹乙二醇折射率

刘 伟,邓 琥,2,3,刘泉澄,3,魏文卿,3,于洙海,尚丽平,2,3

(1.西南科技大学信息工程学院,四川 绵阳 621010;2.西南科大四川天府新区创新研究院,四川 成都 610299;3.特殊环境机器人技术四川省重点实验室,四川 绵阳 621010)

1 引 言

乙二醇是一种非常重要的有机化工原料,可用于制造树脂、增塑剂、合成纤维、化妆品和炸药,也可用作溶剂、配制发动机的抗冻剂。水含量是评价聚酯级乙二醇产品质量等级的一项极为重要的指标。该指标能反映出乙二醇产品的质量状况,实际生产中可以通过控制该指标来保证产品质量。因而快速准确地测定乙二醇产品中的水含量,在乙二醇实际生产中有着极其重要的指导意义[1]。

根据现行GB/T6283-2008《化工产品中水分含量的测定卡尔·费休法(通用方法)》,乙二醇水分含量的测定标准方法为卡尔·费休法,卡尔·费休法是针对水分的特异性方法,是大多数溶剂水分测量的标准方法。但是卡尔费休法副反应较多,操作繁琐、耗时较长,存在人为滴定误差,且使用的化学试剂具有一定毒性,使用不当还会造成环境污染[2-3]。乙二醇本身也存在毒性,因此在检测时需要严格规范检测措施,结合乙二醇的质量检测指标要求,高精度的在线检测方法具有良好的契合性。太赫兹时域光谱技术是一种可实现水分快速和无损检测的新兴技术,太赫兹波(Terahertz,THz)是一种介于微波和红外波之间的电磁波,频率范围为0.1~10 THz、波长为0.03~3 mm、光子能量为0.414~41.4 meV。由于水分子在太赫兹波段独有的分子键振动模式使其对太赫兹波具有极强的敏感性和吸收性,太赫兹时域光谱技术还具有、无损、安全、快速、高信噪比等特点,因而太赫兹时域光谱技术在物质水分含量评价领域具有广泛的应用前景[4]。已有学者利用太赫兹技术开展了木材[5-6]、叶片[7-8]、药材[9]、皮肤[10]等固体物质含水率的检测,通过建立样本的吸收系数和折射率与含水率的关系,采用多元线性、偏最小二乘法、支持向量机、神经网络等回归分析方法建立含水率预测模型,预测精度比较可观,证明了太赫兹对于水分含量检测的可行性。目前应用太赫兹时域光谱技术对于液体水分含量的检测研究主要集中于油水混合物的检测[11-13],而对于极性溶液以及高含水率的相关检测报道较少,主要原因是极性液体对太赫兹也具有较强吸收,因此太赫兹在对乙二醇水含量检测上的研究有重要意义。

本文选用优级纯乙二醇,制备不同含水率的液体样本(0~50 %),设计了可用于极性液体检测的样本池,为太赫兹液体检测提供了样品池参考,获得了太赫兹时域光谱,根据光学参数提取模型计算出样本的折射率和吸收系数,采用不同的预处理算法对原始数据进行优化处理,并构建了PCR、PLSR、SVR三种回归预测模型,对不同模型比较选优,挑选出最优的预处理方法和定量分析模型的组合,对含水率进行了预测。

2 实验部分

2.1 实验器材

实验需要用到的主要器材:采用光纤式太赫兹时域光谱系统(TeraSmart,MenloSystems)用于获取样本的光谱信息、空气压缩机(1200H-180)和空气干燥机(TYWD-0.3)用于保持实验系统的湿度≤1 %,此外还需要用到电子天平(AUW120D,Shimadzu)、超声波震荡仪、无水乙二醇(GR500 ml)、定制液体样本池(PTFE)(如图1),实验器材具体清单如表1所示。

表1 实验器材清单

图1 定制液体池实物

2.2 太赫兹时域光谱系统原理

采用德国MenloSystems公司光纤耦合式太赫兹时域光谱系统(TeraSmart),系统采用耦合式光纤发射和接收太赫兹信号,有效频带宽度>6 THz,光谱动态范围>95 dB,其系统原理如图2所示。为了使获取的太赫兹样本信息最大化,采用平行太赫兹光束与样本作用。飞秒激光器(Femtosecond laser)产生两束能量不同的光束,泵浦光(Pump)和探测光(Probe)。能量较强的泵浦光经光纤耦合光电导天线发射端(THz TX)激发产生太赫兹波,太赫兹波经离轴抛物镜(OAP1)转变成平行光束并与样本作用,带有样本信息的太赫兹波经OAP2、OAP3、OAP4聚焦到光纤耦合光电导天线接收端(THz RX)。能量较弱的探测光经过时间延迟系统(Time delay )和光纤到达光纤耦合光导天线接收端与太赫兹信号汇合,再经信号放大器(Amplifier)信号处理获得被测样本的太赫兹时域光谱。

图2 光纤式太赫兹时域光谱系统原理图

图3 样本的制备及测试流程

2.3 光学参数提取原理

使用光纤式太赫兹时域光谱系统分别获得空液体池和含水液体样本的太赫兹时域光谱数据,以空液体池时域光谱为参考,由于太赫兹波穿过很薄(0.5 mm)的液体池会使时域光谱信号产生反射峰,导致频域信号会产生震荡,需要先对反射峰及之后的数据进行截断补零处理,再通过快速傅里叶变换获得太赫兹频域光谱,采用Dorney[14]和Duvillaret[15]等提出的光学参数提取模型,计算得到液体样本的吸收系数和折射率,其计算公式为:

(1)

(2)

式中,n(ω)为样本实折射率;α(ω)为样本吸收系数;ω为角频率;c为光速;d为液体样本厚度;φ(ω)、T(ω)分别为液体样本和空液体池频谱信号相位之差和振幅之比。

2.4 含水样本的制备及测试流程

步骤一,将样本存液瓶置于天平并调零,用微量进样器取0.01 g去离子水注射到存液瓶,随后加入无水乙二醇9.99 g,记录数据,放入超声波震荡仪中5 min使其混合均匀;

步骤二,按照步骤一方法制备不同浓度的乙二醇溶液,溶液含水浓度0.1~50 %;

步骤三,打开太赫兹时域系统飞秒激光器开关,并预热60 min,设置太赫兹时域光谱系统参数:平均次数2000,扫描宽度100 ps;同时开启空气干燥装置通入干燥空气至整个系统相对湿度<1 %,即可开始测量;

步骤四,向液体池中通入干燥空气持续2 min后,并测量其太赫兹光谱,用作参考信号;

步骤五,用注射器取出液体样本注入到液体池,等其填充满整个液体池塞上橡胶塞密封,并测量其太赫兹光谱;

步骤六,测量结束后排出液体池中样品并用无水乙醇润洗5次,随后向液体池通入干燥空气5 min;再进行下一样本测试;

步骤七,重复步骤五和步骤六,得到所有液体样本太赫兹光谱。

3 结果与讨论

3.1 含水乙二醇样本太赫兹光谱

图4为利用太赫兹时域光谱系统得到的不同含水率的乙二醇样品时域光谱,图5和图6分别为通过光学参数提取后的不同含水率乙二醇样本吸收光谱及折射率谱;从图中可以看出,随着乙二醇含水率的增大,样本时域光谱峰值呈减小和右移的趋势,这是由于不同含水率的乙二醇样本对太赫兹波的吸收强度、折射和反射各不相同,且在相同频段内其吸收系数和折射率随含水率和频率的变化趋势基本相同,均呈现出正相关。由于不同含水率乙二醇样本的吸收系数和折射率在0.5~1.5 THz之间的差异性显著,0.5 T前及1.5 T 后数据波动较大,因此选取0.5~1.5 THz作为含水乙二醇样本的太赫兹光谱分析频段,当乙二醇含水率以1 %、5 %、10 %梯度增加时,其吸收系数和折射率增加的趋势显著,当含水率以0.1 %左右梯度增加时,吸收系数和折射率增加的趋势不明显。

图4 不同含水率乙二醇样本时域光谱

图5 不同含水率乙二醇样本吸收光谱

图6 不同含水率乙二醇样本折射率谱

3.2 光谱数据预处理分析

从实验结果中可以看出,单一频率下的吸收系数和折射率与含水率之间有较好的相关性,但是单个维度的数据易受到光谱数据容易受到系统及环境噪声、基线漂移等各方面的影响,使得光谱变得杂乱及信噪比降低,可能会造成样品的很多重要信息丢失,影响定量分析的结果。为了减少或去除光谱中其他因素的干扰,减小光谱失真,使提取的样品相关信息最大化,需要对原始光谱数据进行预处理,使其能更加契合模型,提高模型质量。选取0.5~1.5 THz频段(138维数据)的吸收系数与折射率进行分析,使用一种和多种组合形式的预处理方法进行处理,使用标准正态变换(Standard Normal Variate,SNV)、Savitzky-Golay平滑、z-score标准化和Min-max归一化方法不同组合(共9种)对乙二醇太赫兹光谱数据进行预处理分析;再结合3种回归分析方法建立预测模型,依据最终建模效果评价选择出最佳的预处理方法组合。

3.3 建立定量回归模型

根据不同组合分析获得的乙二醇光谱数据预处理结果,分别以乙二醇吸收系数和折射率为输入,乙二醇含水率为输出,建立主成分回归(Principal components regression,PCR)、偏最小二乘回归(Partial least squares regression,PLSR)和支持向量机回归(Support vector regression,SVR)三种回归预测模型。

主成分回归是以主成分分析法为基础思想的多元校正分析方法,可有效解决数据共线性问题,消除实验误差对模型结果的影响[16]。其基本思想是将原始高维变量重新组合成一组新的不相关的主成分低维变量。根据实际需求和累计贡献率,选择较少的主成分变量尽可能多地提取原始变量的信息,再对主成分变量进行回归分析得到回归方程。

偏最小二乘法是一种典型的多变量统计分析方法,适用于小样本数据,偏最小二乘回归与主成分回归相关,在构建模型时,采用主成分分析对训练样本进行降维处理,将主成分中累积贡献率超过98 %的数据作为特征数据。在预测模型中使用PLS分量,采用PLSR算法建立校正模型[17]。

Vapnik于1995年提出了支持向量机方法(Support Vector Machine,SVM),该方法在过去二十年中迅速流行,并在不同领域得到广泛应用。支持向量机是一种用于分析分类和回归问题的监督学习算法,可以应用于线性和非线性系统,在不同的领域中都有广泛的应用;近年来,支持向量机也被用于解析太赫兹光谱,进行分类和回归分析,其主要思想是找到一个使所有样本都接近目标样本的最佳决策超平面[18-19]。而支持向量回归(Supportvector Regression,SVR)基本思想是使用核函数将输入数据映射到高维特征空间,并在高维特征空间建立线性回归[20]。

采用决定系数R2与预测均方根误差RMSEP来评价预测模型的准确性和稳定性,进而优选出最佳的预测模型及预处理方法的组合。R2表示自变量与因变量之间的线性关系的强度,反映用自变量可以解释因变量变化的百分比,在浓度范围相同的前提下,其值越接近1,模型的回归和预测效果越好,其表达式如下:

(3)

(4)

式中,n为样本数量;yi,act为第i个样本实测含水率的值;yi,pre为测试集过程中第i个样品含水率的预测值。

3.4 结果分析

根据不同组合分析获得的乙二醇吸收系数和折射率光谱数据预处理结果,建立三种回归预测模型,建模时随机抽取4/5样本数据作为训练集,剩余1/5作为预测集。为了保证模型结果准确性,模型随机运行10次,并以10个随机抽样模型的平均值作为最终的预测结果。

3.4.1 基于吸收系数预测模型乙二醇含水率定量分析结果

图7和图8展示不同预处理下乙二醇吸收系数的三种定量预测模型预测性能结果对比,通过对比模型预测集决定系数R2与均方根误差RMSEP,可以看出三种定量分析模型对于乙二醇含水率具有不同程度的预测精度,三种模型中SVR预测性能最佳,最契合乙二醇吸收系数的回归预测,PLSR次之,PCR最差。不同预处理方法也对模型有不同程度的影响,综合模型和预处理方法对预测结果的精度影响,可以得出,经SNV处理后乙二醇吸收系数的SVR模型预测性能最佳,其预测集R2与RMSEP分别为0.9941和0.00451,具有较高的预测精度。

图7 基于吸收系数三种模型RMSEP分析结果

图8 基于吸收系数三种模型R2分析结果

3.4.2 基于折射率预测模型乙二醇含水率定量分析结果

图9和图10展示不同预处理下乙二醇折射率的三种定量预测模型预测性能结果对比,通过对比模型预测集决定系数R2与均方根误差RMSEP,折射率模型的预测性能与基于吸收系数的模型预测性能高低顺序一致,SVR>PLSR>PCR。综合模型和预处理方法对预测结果的精度影响,可以得出,经SNV处理后乙二醇吸收系数的SVR模型预测性能最佳,经S-G平滑预处理处理后乙二醇折射率的SVR模型预测性能最佳,其预测集R2与RMSEP分别为0.9988和0.00507,预测精度良好。

图9 基于折射率三种模型RMSEP分析结果

图10 基于折射率三种模型R2分析结果

4 结 论

本文提出了基于太赫兹时域光谱技术检测乙二醇含水率的新方法,实现了太赫兹光谱技术对于极性液体的定量分析研究,获得了不同含水率乙二醇样本的折射率和吸收系数,结合光谱预处理方法,构建了PLSR、PCR、SVR三种回归模型对乙二醇含水率进行了预测。得出以下结论:三种回归预测模型都能有效预测乙二醇的含水率,其中SVR模型预测性能最佳,表明了太赫兹光谱技术应用在乙二醇含水率的高精度检测是可行的。适合的光谱数据预处理方法可以提升模型的性能,在基于吸收系数的预测模型中,经SNV处理后乙二醇吸收系数的SVR模型预测性能最佳,预测集R2与RMSE分别为0.9941和0.00451;在基于折射率的预测模型中,经S-G平滑预处理处理后乙二醇折射率的SVR模型预测性能最佳,其预测集R2与RMSE分别为0.9988和0.00507;均具有较高的预测精度。研究结果表明,所提方法能为乙二醇质量快速评价提供技术指导,也为有机溶剂水分含量检测提供新的检测思路。

猜你喜欢
赫兹乙二醇折射率
新型装配式CO2直冷和乙二醇载冷冰场的对比研究
乙二醇:需求端内忧外患 疫情期乱了节奏
基于双频联合处理的太赫兹InISAR成像方法
太赫兹低频段随机粗糙金属板散射特性研究
太赫兹信息超材料与超表面
努力把乙二醇项目建成行业示范工程——写在中盐红四方公司二期30万吨/年乙二醇项目建成投产之际
单轴晶体双折射率的测定
扩链剂对聚对苯二甲酸乙二醇酯流变性能和发泡性能影响
用Z-扫描技术研究量子点的非线性折射率
如何选择镜片折射率