基于机器学习集成算法的电离层层析算法迭代初值精化

2022-08-06 03:44郑敦勇姚宜斌聂文锋林东方梁继陈春花
地球物理学报 2022年8期
关键词:电子密度层析电离层

郑敦勇, 姚宜斌, 聂文锋, 林东方, 梁继, 陈春花

1 湖南科技大学地理空间信息技术国家地方联合工程实验室, 湖南湘潭 411201 2 湖南科技大学地球科学与空间信息工程学院, 湖南湘潭 411201 3 武汉大学测绘学院, 武汉 430079 4 广西空间信息与测绘重点实验室, 桂林 541006 5 山东大学空间研究院, 山东威海 264209 6 湖南省测绘科学技术研究所, 长沙 410007

0 引言

电离层位于地面上约60~1000 km范围内,是地球高空大气受太阳高能辐射以及宇宙线的激励而被电离的区域,主要由带电粒子、中性原子及分子组成,在整个日地空间环境中,电离层是直接影响人类空间活动的最重要环节之一(Liu et al. 2021).GNSS电离层层析技术(Computerized ionospheric tomography, CIT)作为监测和研究电离层的一种重要手段,其重构的电子密度分布能同时反映电离层水平结构和垂直结构的变化,从而克服了二维电离层模型的局限性,因此,在近20余年来得到了突飞猛进的发展.目前,这些模型大致可以分为两类:一类是函数基电离层层析模型(Hansen et al., 1997);另一类是像素基电离层层析模型(Rius et al., 1997; 徐继生和邹玉华, 2003).相比之下,函数基CIT模型可以用少量的模型参数去反演大范围的电离层电子密度,且反演结果较稳定,但缺点是反演结果过于平滑,有时会掩盖一些电离层的小尺度扰动结构特征.而在像素基CIT模型的反演过程中,也存在一个比较棘手的问题:可利用的观测数据不足或分布不均,从而导致待反演的电离层空间离散化后部分像素没有信号射线穿过,这也就意味着电离层电子密度的反演问题是一个不适定问题(闻德保, 2013).为了克服上述问题给像素基CIT模型带来的不利影响,国内外许多学者提出了解决方法,其主要分为算法改进、多源数据融合以及神经网络模型等三类.

针对层析算法的改进,目前主要包括基于奇异值分解(Singular Value Decomposition, SVD)、截断奇异值分解(Truncated SVD, TSVD)的非迭代算法,基于代数重建算法(Algebraic Reconstruction Technique, ART)、乘法代数重建算法(Multiplicative ART, MART)、同步迭代重构算法(Simultaneous Iterative Reconstruction Technique, SIRT)、Kalman滤波以及正则化的改进迭代算法,其中,非迭代算法的优点是不需要初值,但由于可用的观测数据不足以及离散误差和观测噪声的影响,若单独使用会导致其反演结果精度不高(闻德保, 2013),因此,目前主要用于顾及数据权比因子的多源数据融合反演(汤俊, 2014),另外,非迭代算法一般都涉及大规模矩阵求逆,从而对硬件要求也较高.

相较于非迭代算法,目前在像素基CIT研究中使用改进迭代算法相对较多.如Yavuz等(2005)提出了联合整体最小二乘法和ART的混合算法,其中利用整体最小二乘法为ART算法提供初值;肖宏波等(2008)发展了一种联合最速下降法和MART的改进算法,该算法有效降低了MART算法对迭代初值的敏感度,提高了电离层层析的可靠性;Liu等(2010)提出了附加约束的同步迭代代数重构(Constrained CSIRT, CSIRT)算法;Kunitsyn等(2011)提出了基于Sobolev正则化约束的同步迭代重构算法;闻德保(2013), 闻德保等(2014)以及Wen等(2015)先后提出了改进ART算法、基于Phillips平滑约束和MART的二步算法、基于TSVD和ART的组合算法、约束MART算法、约束ART算法、约束自适应联合迭代重构算法以及选权拟合重构算法;Yao等(2013a, b, 2018)先后提出了基于函数基与像素基模型的组合算法、混合正则化迭代算法以及附加侧面射线的CIT算法;汤俊(2014)提出了基于多源数据融合的CIT算法以及基于总变差最小化的CIT算法;霍星亮等(2016)通过改进迭代算法及其松弛因子来提高CIT的反演精度,相对于传统ART算法,该方法反演的电子密度剖面更接近于实测数据;Wang等(2016)提出一种基于Tikhonov正则化的CIT方法,利用模型函数方法去确定最优的正则化参数,以此来平衡观测数据和背景模型值之间的权重,并提高算法的全局收敛速度;Yin等(2017)发展了多程层析迭代算法,该算法通过构建不同的像素分辨率来实现多次反演,从而提高反演精度;赵海山等(2018)提出自适应层析算法(Adaptive MART, AMART),其中根据有信号射线像素中的截距和电子密度值的综合影响,合理分配算法的迭代差值,并提出与电子密度值相关的自适应松弛因子,有效克服传播噪声对电子密度反演的影响;Jin和Li(2018)提出了改进的二步算法,首先用NeQuick模型对背景模型进行精化,然后结合MART算法进行反演;Chen等(2019)提出了一种参数化电离层层析方法,根据像素八个角处的电子密度值(Ionospheric electron density, IED),利用垂直指数插值和水平反向距离加权插值获取像素内任意位置的IED;除此之外,Zheng等(2015, 2016, 2017, 2018, 2021b)也先后提出了基于多尺度剖分、可变像素高度、可变像素尺度、松弛因子自动搜索技术以及有序子集约束ART的电离层层析算法,均表现出良好的层析效果和效率.总的来说,通过增加约束条件或组合其他算法得到的这类改进迭代算法,其性能较之前有大幅度提高,但离完全克服不适定性问题仍有较大差距,主要表现在无信号射线像素的反演电子密度对初值比较依赖,而初值通常是由精度不高的经验模型给出,从而拉低了电离层层析的整体精度.

Stolle等(2003)在基于GPS数据的CIT反演中,提出融合掩星数据来提高电子密度的垂直分辨率;Bust等(2004)基于三维变分同化技术3DVAR,发展了三维电离层数据同化算法(IDA3D),IDA3D可以同化GNSS、低轨信标以及测高仪等多类观测数据;Garca-Fernández等(2005)利用日本密集的GPS网数据,融合SAC-C掩星和测高仪数据,反演了日本上空的三维电离层电子密度,其中掩星和测高仪数据以及改进的Abel算法被用来构造电子密度剖面的背景分布,以此来提高电子密度的垂直分辨率;徐继生等(2005)建立了融合GPS和掩星数据的时变CIT模型,并利用实测数据对模型进行了仔细验证;Lee等(2007)融合GPS和测高仪数据,基于Tikhonov和总变分TV算法,得到两种不同的CIT模型,并利用测高仪数据和Chapman函数构造电子密度垂直剖面模型来验证反演精度;Angling(2008)基于最优化线性无偏估计理论,融合GPS和掩星数据,发展了电离层电子密度同化模型;Chartier等(2012)发展了融合GPS和电离层测高仪数据的CIT方法,其中利用测高仪数据构建垂直方向的基函数,自适应地在反演中提供电子密度信息;Li等(2012)发展了一种融合地基GPS和COSMIC掩星数据的CIT方法;Zhao等(2013)提出了一种融合三频GPS、地面垂测和斜测数据以及顶部探测仪数据的CIT方法;Yu等(2014)发展了电离层数据同化系统IDAAS,并对东南亚上空的电离层三维电子密度结构进行了重构,被同化的数据包括地基GPS和测高仪数据;Semeter等(2016)提出了融合GPS和非相干散射雷达ISR数据的CIT方法,其中把插值的ISR密度场作为反演初值,然后使用最大熵正则化方法求解;Aa等(2016)利用三维变分数据同化算法以及地基GPS和掩星数据,得到中国及相邻区域上空电离层的三维电子密度结构,其结果证明了该同化技术在提高区域电离层形态规范方面的有效性;欧明等(2016)提出了一种融合天地基多源数据的CIT算法,其多源数据包括地基GNSS、LEO掩星、卫星信标及测高仪等数据,并利用改进的Kriging插值与MART算法实现多源数据的有效融合;She等(2017)提出了一种基于多源数据同化技术的CIT算法,该方法在水平和垂直方向上分别采用球谐函数和经验正交基函数来进行电子密度估计,其同化数据包括地基GPS、LEO掩星、海洋测高卫星数据等;dos Santos Prol等(2019)提出融合测高仪、掩星、以及垂直方向总电子含量(Vertical Total Electron Content, VTEC)数据的层析方法,其中利用测高仪和掩星数据对背景模型进行精化,然后把通过投影函数得到的VTEC数据加入到层析方程中,从而提高层析精度.尽管上述研究表明多源数据融合技术的发展使陆上大范围的层析精度有了一定提高,但仍存在两个主要问题:①部分研究中,直接将各类观测数据按等权处理,这显然是不合理的,而另一部分研究中,利用方差分量估计对观测数据的权重进行了确定,但其过程略显复杂,且实施起来有一定难度,如很多学者利用Helmert方差分量估计法来确定权重,但在实际应用时,各类方差因子相等的收敛条件是难以满足的;②由于受时空分辨率的限制,多源数据融合技术并不能完全克服不适定性问题,特别是针对陆上的小范围层析以及海域层析时,可利用的多源数据不多甚至缺失,因此,不适定性问题依然会较严重.

神经网络以其自身的自组织、自适应和自学习等特点被广泛应用于各个领域,Ma等(2005)首次提出利用BP神经网络重构区域电离层电子密度的思想,并融合测高仪数据来提高电子密度垂直分辨率;陈必焰等(2012)基于传统层析模型的反演结果,利用神经网络对电子密度进行预测,在建模过程中,用当前反演的全部电子密度及其像素特征构建学习样本,然后用训练好的模型预测下一时段的电子密度,其预测精度明显高于IRI(International Reference Ionosphere)模型;Razin和Voosoghi(2016)设计了一种多隐含层神经网络CIT算法,并基于IRI2012模型构造了一个经验正交基函数作为神经网络训练的目标函数,以此来提高电离层垂直方向的分辨率,在此基础上,Razin和Voosoghi(2019)发展了基于粒子群优化训练的小波神经网络CIT算法,该算法不仅能改善层析模型的不适定问题,且能保证效率和全局收敛.尽管这些基于神经网络的层析算法对促进CIT技术的发展起到了一定的推动作用,但仍存在三个主要问题:①把精度不高的经验模型(IRI)值当做真值去构建学习样本,这势必会导致最终神经网络模型的预测精度也不高;②用传统层析算法的全部反演结果构建学习样本,没有顾及那些无射线穿过像素的反演电子密度对初值的依赖问题;③学习样本的输入参数和时间跨度没有考虑全面.鉴于此,Zheng等(2021a)提出了基于AdaBoost-BPNN算法的电离层层析模型,该模型利用有信号射线像素的特征及其电子密度反演值对机器学习模型进行训练,然后预测无信号射线像素的电子密度,有效避免传统层析算法中仍然存在的不适定性对层析结果的影响,进而提高电离层层析的整体精度.然而在该模型中,仍然存在未完全顾及层析初值的影响,且其机器学习算法有待进一步优化等问题,为此,本文提出使用机器学习集成算法XGBoost对层析初值进行预测,最终建立一种高精度的机器学习电离层层析模型(简称XGB-CIT模型),并以独立的电离层测高仪数据为参考值,对XGB-CIT模型进行有效验证.

1 XGB-CIT模型构建

GNSS信号路径上的总电子含量(Total Electron Content, TEC)可表示为电子密度沿信号传播路径的线性积分,在电离层层析过程中,首先利用相位平滑伪距方法(Jin et al., 2012)获取信号路径上的TEC,然后对上述线性积分进行离散化后并利用相应的反演算法获取其像素的IED(闻德保, 2013).

如Zheng等(2018)所示的改进IART算法在本文中被使用,一方面可以为机器学习模型提供输入数据,另一方面把机器学习模型预测的电子密度作为初值,然后反演得到最终的电离层电子密度,其具体的流程图如图2所示,同时IART算法还可以作为参考方法进行对比分析.本文中对IART算法施加水平和垂直平滑约束,以避免相邻像素之间电子密度值的突然变化,其中水平约束采用高斯加权函数构造(Wen et al., 2015),垂直约束利用Chen等(2019)中的方法,并结合机器学习模型预测的电子密度得到.

1.1 XGBoost算法

集成学习(Ensemble learning)是通过构建并结合多个个体学习器来完成学习任务(图1),从而获得比单一学习器显著优越的泛化性能(周志华, 2016).根据个体学习器的生成方式,目前的集成学习方法大致可分为两大类:基于Boosting的和基于Bagging的,前者的代表算法有AdaBoost、GBDT、XGBoost、LightGBM以及CatBoost,后者的代表算法主要是随机森林(RF).通过对比分析,本文选择XGBoost算法并使用Python软件来实现电离层层析重构.

图1 集成学习示意图Fig.1 The schematic diagram of ensemble learning

XGBoost(Extreme Gradient Boosting)是由Chen和Guestrin于2011年首次提出的机器学习模型,并在众多学者的后续研究中不断优化和改进(Chen and Guestrin, 2016; Li et al., 2019).XGBoost对损失函数进行二阶泰勒展开,可以自动使用CPU的多线程进行并行计算,且使用多种方法避免过度拟合.下面简要介绍XGBoost算法,更多详细信息可参考文献Chen和Guestrin (2016).

XGBoost中用加法将所有树模型集成,假设总共有K个树,则有

(1)

q(x)表示将样本x分到了某个叶子节点上,在本文中,针对如表1所示的样本数据,若我们以输入变量Lon<112.75°E为分裂点,则可得到左右两个叶子节点,其中左叶子节点中的样本有3,右叶子节点中的样本有1、2、4、5;w是叶子节点的权重,在本文中即为电子密度预测值,最终根据(5)式计算得到.

表1 样本数据示例Table 1 Sample data example

XGBoost的目标函数如下:

(2)

(3)

Ω是防止过拟合以及控制模型复杂度的正则化函数:

(4)

其中T是树的叶子总数,γ和λ分别为L1和L2正则的惩罚项.为了使得目标函数最小,正则项越小越好,因此,一方面要使叶子节点个数T最少,这样树就简单,从而提高计算效率,实际应用时,T由树的深度max_depth决定;另一方面要对叶子节点的值w进行L2正则,这样才会把w的解约束在一个范围内.

通过对目标函数(4)的改写、泰勒展开以及求导,可分别得到第j个叶子的最优权重(式(5))和相应的最优目标函数值(式(6)):

(5)

(6)

这里Ij={i|q(xi)=j}表示i样本落在第j个叶子节点上,

通常不可能枚举所有可能的树结构q,取而代之的是一种贪婪算法,该算法迭代地添加树,一直到K颗树停止,实际应用中,弱分类器数目n_estimators即为树的颗数,具体迭代过程如下:

(7)

另外,假设IL和IR是拆分后左右节点的实例集,设I=IL∪IR,则分割后的损失函数由下式给出:

(8)

1.2 XGB-CIT模型流程

如图2所示,XGB-CIT的流程大致可分为3部分.

图2 XGB-CIT流程图Fig.2 The flow chart of XGB-CIT

(1)训练样本构建

基于传统层析IART算法,利用多个连续时段(滑动窗口内)中有信号射线像素的特征及其电子密度反演值(IED1)构建XGBoost的训练样本,其输出参数即为IED1,输入参数来源于与电子密度变化相关的几类变量,结合Zheng等(2021a)的介绍以及大量试验,本文最终确定12个输入参数,包括像素中心的纬度(Lat)、经度(Lon)以及像素中心距地面的高度H,世界时的正弦(UTS)和余弦(UTC)分量(sin(2π·UT/24), cos(2π·UT/24)),太阳仰角的正弦(ELES)和余弦(ELEC)分量(sin(2π·ELE/360), cos(2π·ELE/360)),太阳方位角的正弦(AZIS)和余弦(AZIC)分量(sin(2π·AZI/360), cos(2π·AZI/360)),地磁指数Dst、ap和AE值.

(2)机器学习模型训练

目标函数是判断机器学习模型质量的基础,因此构造合理的目标函数是XGB-CIT成功的关键,本文的总目标函数(total objective function, OF)定义如下:

OF=model_gs.best_score+rmse_score,

(9)

式中model_gs.best_score与rmse_score分别是交叉检验的最优得分和检验样本(未参与训练)的TEC正演误差.

由于XGBoost在使用时需要调整的参数较多,根据相关研究(Li et al., 2019)和实践经验,本文调整了如表2中所示的参数以使模型发挥最佳性能,其具体的调整流程如图3所示,即针对不同参数,依次找到最优值;同时,在参数调整过程中使用了交叉验证(GridSearchCV)方法,其主要参数设置为:模型评估方法scoring=‘neg_mean_squared_error’,分割次数cv=5.

图3 XGBoost的参数调整流程图Fig.3 Parameter adjustment flow chart of XGBoost

表2 XGBoost的参数及其调整范围Table 2 Parameters of XGBoost and its adjustment range

(3)电离层电子密度最终输出

利用训练好的XGBoost预测下一时段中所有像素的电子密度IED0,并以此作为迭代初值,再次结合IART算法进行层析反演,从而得到最终的电子密度IED2,同时,IED2又参与下一个滑动窗口内的训练样本构建.

总的来说,如表3所示,相较于传统层析方法,尽管XGB-CIT的建模过程相对复杂,但其优点也比较明显.

表3 XGB-CIT与IART的构建方法比较Table 3 Comparison of construction methods between XGB-CIT and IART

2 数值实验

利用湖南省CORS网的GNSS观测数据对XGB-CIT的性能进行验证,如图4所示,重构区域的经纬度范围分别为108.5°E—114.5°E和24.5°N—30.5°N,共包含73个GNSS测站和2个电离层测高仪站.重构区域的高度范围设为70~1000 km,并采用0.5°×0.5°×15 km的像素尺度对电离层区域进行剖分,最终共有8928个像素.实验中使用了2015-12-30—2015-12-31连续两天(每小时中只采用半小时数据,且每天23∶00—23∶59都没有数据)共46个时段(UT1, …, UT46)的数据.同时,图5给出了2015年12月30日和12月31日的ap、Dst和AE等地磁指数的时间序列,由图可知,12月30日电离层处于平静状态,而12月31日则相反.

图4 重构区域及测站分布图Fig.4 The reconstructed area and observation stations distribution

图5 连续两天的ap (a)、Dst (b)和AE (c)指数序列图Fig.5 ap (a), Dst (b) and AE (c) index sequence diagram of two consecutive days

在讨论XGB-CIT的性能之前,利用Jin等(2012)中的载波相位平滑伪距方法得到GNSS信号路径上的TEC,反演区域的每个像素由IRI2016模型初始化.基于XGB-CIT的流程,利用每个反演周期的TEC数据,首先采用IART算法对重建区域的IED进行反演,然后利用有观测信息像素的反演IED以及像素特征,得到XGBoost的学习样本,随后对2015年12月31日23个时段内每个像素的IED进行滚动预测,两种样本的结构如表4所示.

表4 学习和预测样本的时间跨度Table 4 Time span of learning and prediction samples

针对12月31日的每个反演时段,利用XGBoost与IRI2016预测的IED重新计算TEC并进行比较,表5分别列出了23个反演时段内TEC的均方根误差(RMSE)和平均绝对误差(ΔE),其计算公式如下:

(10)

由表5可知,XGBoost的两项误差在所有的时段中都远低于IRI2016模型的,其中IRI2016与XGBoost的平均RMSE分别为6.97 TECU和2.23 TECU、平均ΔE分别为6.58 TECU和1.82 TECU,由此可知,基于RMSE统计,XGBoost的IED预测精度相较于IRI2016平均提高了68%,因此,初步验证了XGBoost算法结果用于XGB-CIT模型迭代初值的可行性.

由图2可知,在XGB-CIT模型中,把XGBoost算法得到的IED作为迭代初值,并再次与IART算法相结合,得到最终的IED.结合(10)式,图6分别

图6 GNSS观测值和层析模型获取的TEC在23个层析时段的误差比较Fig.6 Errors comparison between GNSS observations and TEC obtained by tomography model in 23 tomography periods

给出了传统层析算法IART与XGB-CIT模型在23个反演时段内TEC的反演误差柱状图.由图可知,除了UT26、UT37、UT38时段,XGB-CIT的RMSE和ΔE均小于或等于IART,其中IART与XGB-CIT的平均RMSE分别为0.55 TECU和0.53 TECU、平均ΔE分别为0.33 TECU和0.32 TECU,尽管基于平均RMSE和ΔE,XGB-CIT相较于IART的提高幅度不大,但由图7可知,由于迭代初值的改

图7 两种层析方法的迭代次数比较Fig.7 Iteration times comparison of two tomography methods

进,XGB-CIT的收敛速度比IART提高了20%,因此,这初步证明了XGB-CIT模型的优良性能,同时进一步验证了XGBoost算法的可行性.

图8中给出了6个历元中不同反演方法的电子密度廓线比较情况,其子图从上往下分别代表UT26、UT27、UT33、UT34、UT41、UT42,每个子图的左侧是邵阳测高仪站(111.3°E, 27.1°N),右侧是武汉测高仪站(114.4°E, 30.5°N),总的来说,相对于IRI2016和IART,XGB-CIT的电子密度廓线与测高仪的真实数据更加符合.由图4可知,由于邵阳站位于研究区域的中心位置,其垂直方向的像素都有信号射线穿过,因此,除了子图(f),IART和XGB-CIT的电子密度廓线在邵阳站几乎是重合的,这也说明,当像素有信号射线穿过时,即使提高迭代初值精度,但其最终的反演精度也不会大幅提高,这也是对图6中反演精度的一个直观反映;然而武汉站位于研究区域的边缘位置,其垂直方向的像素几乎都没有信号射线穿过,因此,当迭代初值精度提高后,似乎会直接导致反演电子密度的精度提高幅度较大,但实际上并非如此.图9中显示了不同历元中无信号射线像素的反演电子密度比较,每个子图中从左往右,分别是IART与IRI2016的比较、XGBoost获得的层析初值与IRI2016的比较、以及XGB-CIT与IRI2016的比较,其中子图(a)、(b)、(c)和(d)分别代表历元UT24、UT29、UT36和UT39,且他们的无信号射线穿过的像素比例分别为78.47%、63.89%、37.67%和32.46%.由图可知,无信号射线像素的比例越大,其反演结果与初值越接近,而UT36和UT39中,尽管反演结果在初值基础上有所改变,但其幅度也不大,因此,我们认为对于无观测区域的电子密度反演,其本质是电子密度在时间和空间上的预测问题.总的来说,在有观测信息像素的反演精度提高空间有限的情况下,能大幅提高无观测信息像素的初值精度,这也是我们利用机器学习对迭代初值进行精化的一个主要目的.

图8 不同层析历元的电子密度廓线对比Fig.8 Comparison of electron density profiles in different tomography epochs

图9 无信号射线像素的反演电子密度比较Fig.9 Comparison of inversion ionospheric electron density of pixels without signal ray

图10给出了IRI2016(左)、IART(中)、XGB-CIT(右)三种反演方法在UT34(上)和UT42(下)的电子密度三维示意图,其中UT34和UT42的地方时分别是18∶00—18∶30 LT和02∶00—02∶30 LT,由图5可知,UT34处于磁暴发生的上升阶段,而UT42处于磁暴的短暂下降阶段,因此导致两个历元中电子密度的差别较大.在两个子图中,由IART获取的电子密度剖面图在边缘位置几乎都与它的迭代初值IRI2016相同,而XGB-CIT的电子密度剖面图中则不存在这个问题,结合图8的分析可知,边缘地带的像素中由于缺少信号射线,是导致这种现象的主要原因.因此,这充分证明了利用机器学习进行迭代初值精化的必要性和可行性.另外,图11中显示了四个反演历元中由XGB-CIT获取的VTEC与CODE的电离层格网产品(http:∥ftp.aiub.unibe.ch/CODE/IONO/2015/)对比情况,其中子图(a)、(b)、(c)和(d)分别代表历元UT24、UT31、UT34和UT37,但由于CODE提供的格网产品分辨率是2.5°×5°,而我们的层析像素分辨率是0.5°×0.5°,因此能覆盖我们研究区域(24.5°N—30.5°N, 108.5°E—114.5°E)的CODE电离层格网点只有15个,特别是在有些历元中,CODE提供的这15个格网值都是相同的,这导致CODE-VTEC图并不能完全反映出我们研究区域内电离层的真实变化,毫无疑问,我们利用XGB-CIT反演方法得到的电离层精度肯定高于CODE产品,这也充分说明在局部区域建立电离层模型的必要性和利用层析模型获取高精度电离层信息的可行性.

图10 IRI2016(a)、IART(b)和XGB-CIT(c)三种反演方法在两个历元UT34(A)和UT42(B)中的电子密度三维示意图Fig.10 Three-dimensional schematic diagram of the electron density in two epochs UT34 (A) and UT42 (B) by three inversion methods, IRI2016 (a), IART (b) and XGB-CIT (c)

图11 XGB-CIT获取的VTEC (右)与CODE (左)的电离层格网产品比较Fig.11 Comparisons of the VTEC from XGB-CIT (right) with the CODE ionospheric grid product (left)

图12、13分别给出了2015年12月31日XGB-CIT方法在120°E经度面和25.5°N纬度面上的电子密度剖面图,总的来说,两个图都很好地展现了电子密度的日变化,且电子密度在经度面和纬度面上的变化比较一致,都在UT33(17∶00—17∶30 LT)达到峰值,一方面UT33处于磁暴的上升阶段,另一方面本地时17∶00—17∶30 LT也是电离层比较活跃的阶段,因此图12—13中电子密度峰值出现的时间与实际情况也是比较吻合的.由图12可知,在该磁暴期间,其南部的电子密度明显大于北部的,但在纬度面上,电子密度有比较明显的从东向西的转移现象,另外,两个图中的电子密度从UT41(01∶00—01∶30 LT)开始又出现了短暂的回升,我们认为这是受磁暴影响导致的异常情况.综上所述,本文提出的新方法在磁暴期间能很好地重构电离层电子密度三维结构,且其三维结构能精确地反映出电子密度的日变化及其异常情况,这有助于后续的电离层探测以及电离层异常扰动研究.

图12 XGB-CIT在120°E经度面上的电子密度剖面图Fig.12 Electron density profile of XGB-CIT on 120°E longitude plane

图13 XGB-CIT在25.5°N纬度面上的电子密度剖面图Fig.13 Electron density profile of XGB-CIT on 25.5°N latitude plane

3 结论

针对因观测数据不足或分布不均导致的反演不适定性问题,本文提出了一种基于机器学习集成算法(XGBoost算法)的电离层层析新方法(XGB-CIT),其中利用XGBoost算法获取的迭代初值,相较于常用的IRI2016模型值,其精度提高了68%,而基于该初值构建的XGB-CIT模型,在最终的反演精度上也展现了优良的性能,尤其对无观测信息像素的电子密度反演,其精度有了大幅提高,同时,根据其电子密度的二维和三维剖面图分析可知,该方法也能精准地反映出电子密度的日变化,另外,由于该方法可以对电离层未来的变化提供相对精准的信息,因此其预测的电子密度还可以为电离层异常扰动的探测提供准确的背景值,因此,我们认为XGB-CIT是一种新的、可靠的电离层探测手段.

致谢感谢湖南省测绘科技研究所提供的GNSS观测数据,感谢地球物理数据中心——地球系统科学数据共享平台提供电离层测高仪数据.

猜你喜欢
电子密度层析电离层
地震折射层析法在红壤关键带地层划分中的应用研究*
一种电离层TEC格点预测模型
Kalman滤波估算电离层延迟的一种优化方法
全波形反演与断控层析反演联合速度建模——以南海东部A油田为例
不同GPS掩星电离层剖面产品相关性分析
等离子体电子密度分布信息提取方法研究
飞秒激光脉冲成丝的诊断及其应用概述
包涵体蛋白的纯化层析复性技术研究进展
纸层析法分离叶绿体色素方法的低毒优化
电离层对中高轨SAR影响机理研究