文化立,金泽林,范荣双,王崇兵,李浩然,刘依伦
HKDE-EEMDAN的CORS站高程时间序列分析方法
文化立1,2,金泽林3,范荣双2,王崇兵1,2,李浩然1,刘依伦1
(1. 辽宁工程技术大学测绘与地理科学学院,辽宁 阜新 123000;2. 中国测绘科学研究院,北京 100036;3. 中国能源建设集团辽宁电力勘测设计院有限公司,沈阳 110000)
针对传统整体经验模态分解(EEMD)方法进行信号分解时整体平均的结果未能完全消除随机噪声影响使分解信噪比降低、信号重构效果差的问题,结合距离评价函数和熵的聚类算法提出了一种改进的噪声自适应整体经验模态分解方法。在经验模态分解处理时,添加白噪声分解的模态分量并对迭代过程中各阶本征模函数(IMF)分量进行聚类分析。采用该方法和EEMD方法对2个连续运行参考站(CORS)站近20 a高程时间序列进行分解,基于信噪比、正交指数以及均方根误差指标对2种方法的分解精度进行分析比较。实验结果表明:该方法提高信噪比5%以上,提高分解精度26%以上,降低重构信号均方根误差21%以上,降低了随机噪声对时间序列分解和信号重构的影响。
自适应噪声;聚类分析;高程时间序列;信息熵;信号重构
全球卫星导航系统(global navigation satellite system, GNSS)连续运行参考站(continuously operating reference stations, CORS)运动特征分析是维持我国2000国家大地坐标系(China geodetic coordinate system 2000, CGCS2000)现势性和动态性的重要基础[1-2]。CORS站坐标时间序列高程方向表现为复杂的周期和非线性运动。目前常采用固定模型描述CORS站高程坐标时间序列,这种方法限制了测站本身的运动规律,可能会偏离甚至违背其实际运动情况[3-4]。因此,找到一种基于序列本身的方法对序列进行分析更具实际意义[5]。
文献[6]采用经验模态分解(empirical mode decomposition,EMD)的思想[7],先对获取到的预报电离层总电子含量(total electric contents,TEC)时间序列采取分解变换,然后对分解得到的时间序列进行模型的建立,通过模型可以提升对TEC时间序列值预测的精度。文献[8]在EMD基础上提出了整体经验模态分解(ensemble empirical mode decomposition,EEMD)方法;该方法采用白噪声的统计特性,使信号在其真解邻域内发生扰动,达到目的后又进行自消,最终得到真实的结果;该方法在信号分析领域得到广泛应用。文献[9]将自适应时序分析技术引入卫星导航定位基准站高程时间序列分析领域,并对该方法进行了一定程度的改进,但存在着某些不足。
本文结合距离评价函数和熵的聚类(hierarchical-means clustering algorithm based on distance evaluation function and entropy, HKDE)算法[10]提出了一种改进的噪声自适应整体经验模态分解(ensemble empirical mode decomposition of adaptive noise,EEMDAN)方法,即HKDE-EEMDAN方法,并用2个CORS站20 a的高程时间序列对该方法的适用性进行验证。
EEMD是在EMD的基础上提出的改进算法,该算法是一种引用白噪声辅助的数据分析方法,其核心是有限次地向原始时间序列中添加等长有限幅值的白噪声构成新的待分解信号,并对新生成的待分解信号独立进行EMD分解为
假设添加随机白噪声构成待分解信号的次数为,对次待分解信号分别进行EMD分解,得到次分解的各阶IMF分量后,取相同阶数的IMF分量均值作为EEMD分解的IMF分量,即
式中:为EEMD分解得到的IMF的个数;()为EEMD分解后的残余分量。
相关研究表明,EEMD较好地弥补了EMD方法的不足,但由于信号中间歇性高频信号的影响,整体平均的结果未能完全消除随机高斯白噪声的影响[11-14],使得分解后序列信噪比(signal noise ratio, SNR)降低、模态混叠现象明显、进而影响了信号重构效果。
HKDE算法[10]是针对传统聚类算法聚类准确度低且对噪声敏感的问题提出的一种基于距离评价函数和熵的聚类算法。该方法首先构建距离评价函数算法确定最佳聚类数,其次利用熵这种相似度衡量指标指导簇的合并,能有效地降低噪声和孤立点对聚类效果的影响。
本文提出的HKDE-EEMDAN方法主要思想:①添加白噪声后经过EMD分解仅获取一阶分量IMF1,对次分解得到的IMF1分量集进行聚类分析。首先,基于距离评价函数确定最优分类数完成划分聚类;其次,以信息熵为相似度评价标准进行层次聚类;最后,保留样本数最多的一类取均值作为HKDE-EEMDAN方法的IMF1分量。②从原始序列中剔除IMF1得到剩余信号,向剩余信号中添加白噪声经EMD分解的IMF分量后再进行分解,同样只分解出一阶模态分量并进行聚类分析,直至求解出所有的IMF分量。本文方法主要步骤如下。
保留样本数最多(记样本数为1)的一类IMF1进行均值处理,得到经过HKDE-EEMDAN方法获得的IMF1分量为
4)为获取原始信号()的第阶IMF重复上述步骤直至求解出各阶IMF分量,则原始信号可表达为
可以看出,HKDE-EEMDAN方法的改进主要有:①利用自适应白噪声调节参考尺度,消除高斯白噪声对序列的影响;②采用聚类分析方法降低了随机添加白噪声时产生的孤立点数据对整体平均结果的影响[15]。
判断CORS站高程时间序列分解方法的优劣程度需要采用一定指标进行定性、定量分析,可以从3个方面进行考虑:①信号分解后各阶IMF分量中是否存在明显的模态混叠现象;②相邻IMF分量间的正交指数(index of orthogonality, IO)分析;③利用部分IMF分量进行信号重构后求解重构信号的均方根误差(root mean square error, RMSE)及信噪比。
衡量分解后各分量间正交性常用指标为正交指数。正交指数越小,说明分量间正交性越好,即分解精度越高。在HKDE-EEMDAN分解结果中,任意2个IMF分量间的正交指数计算公式为
信噪比是指信号序列与噪声序列的比值大小。信噪比越高,则说明序列中信号所占的比例较大,得到的有用信息较多。CORS站高程时间序列的信噪比计算公式为
均方根误差反映了重构信号与原始序列的差异性。均方根误差数值越大,则说明重构信号效果越不理想;数值越小,则说明重构信号效果越理想。均方根误差由重构信号和原始时间序列定义为
本文实验选取斯克里普斯轨道和常驻阵列中心(Scripps Orbit And Permanent Array Center, SOPAC)网站提供的BJFS站和LHAZ站2000—2020年Clean产品中高程方向时间序列进行实验,该序列经数据中心处理已经剔除了粗差,并且不存在明显的阶跃突变。但大量研究表明该数据中仍存在粗差信号[16-17],因此对原始信号利用3倍中误差法剔除粗差,利用3次样条插值法进行插值,并进行去常数处理。BJFS站和LHAZ站的原始高程时间序列如图1所示。本文对2个测站分别进行EEMD和HKDE-EEMDAN实验。
图1 CORS站原始高程时间序列
根据文献[17],本文实验设置EEMD与HKDE-EEMDAN方法中添加白噪声与信号标准差之比为0.1,添加噪声次数为100次。图2、图3为2个测站分别采用2种方法的分解结果,本文仅给出分解得到的中低频部分IMF分量,余项表示为residual。
图2和图3中,可以直观看出2种分解方法均得到了明显的周期变化项。为分析高程时间序列中主要周期运动的贡献项,统计中低频IMF分量的方差贡献率为判断指标,如表1所示。
BJFS站的结果为:EEMD分解所得分量中IMF6与IMF7所占的方差贡献率分别为9.00%和37.78%,是周期运动的主要贡献项,IMF6和IMF7分别呈现出季节性和年周期变化;HKDE-EEMDAN分解所得分量中IMF7与IMF8所占的方差贡献率分别为9.53%和43.29%,是周期运动的主要贡献项,IMF7和IMF8分别呈现出季节性和年周期变化。2种方法均判定BJFS站主要表现为季节性和年周期运动形式。
LHAZ站的结果为:EEMD分解所得分量中IMF6与IMF7所占的方差贡献率分别为10.11%和38.53%,是周期运动的主要贡献项,IMF6整体呈现出半年周期变化,IMF7整体呈现出年周期变化;HKDE-EEMDAN分解所得分量中IMF7与IMF8所占的方差贡献率分别为13.50%和36.55%,是周期运动的主要贡献项,IMF7整体呈现出半年周期变化,IMF8整体呈现出年周期变化。2种方法得到的结论一致,LHAZ站的周期运动形式主要表现为季节性半年周期和年周期。
图2 BJFS站分解中低频IMF分量
图3 LHAZ站分解中低频IMF分量
表1 BJFS和LHAZ站IMF6至IMF11方差贡献率
计算2种方法分解得到的IMF分量中相邻两项的正交指数,以衡量EEMD和HKDE-EEMDAN的分解精度。正交指数如表2所示。
表2 正交指数统计
HKDE-EEMDAN方法得到的周期运动主要贡献项滞后于EEMD方法,分别以2种方法主要周期运动的贡献项间正交指数衡量分解精度。BJFS站经HKDE-EEMDAN处理得到的正交指数78相较于EEMD方法67减少39.8%,LHAZ站经HKDE-EEMDAN处理得到的正交指数78相较于EEMD方法67减少26.8%。
GNSS连续运行导航定位基准站高程时间序列经2种方法分解后得到一系列频率由高到低的IMF分量,BJFS站和LHAZ噪声主要分布于高频分量IMF1至IMF5中。本文以主要周期项IMF6为信噪分界点进行信号重构,重构信号如图4所示。
图4 重构信号效果
图4中黑色实线为HKDE-EEMDAN部分IMF重构序列,带有“+”标记符的虚线为EEMD部分IMF重构序列,可以看出HKDE-EEMDAN重构效果更贴近原始时间序列的变化趋势。为定量分析高程时间序列重构效果,计算重构信号的信噪比和均方根误差如表3所示。
表3 信噪比和均方根误差
由BJFS站和LHAZ站20a的高程时间序列重构信号经2种分解方法处理后的信噪比和均方根误差值对比可知:HKDE-EEMDAN方法处理下的信噪比明显大于EEMD方法,两站分别提高5.2%和7.7%;HKDE-EEMDAN方法处理下的均方根误差明显小于EEMD方法,两站分别降低31.6%和21.7%。采用HKDE-EEMDAN方法对CORS站高程时间序列处理后,信号重构的效果优于EEMD方法。
1)本文结合距离评价函数和熵的聚类算法提出了一种改进的噪声自适应整体经验模态分解方法。2个CORS站近20a高程时间序列实验结果表明,该方法改善了传统EEMD方法进行信号分解时整体平均的结果未能完全消除随机噪声影响使分解信噪比降低、模态混叠现象明显、影响信号重构效果的问题。
2)本文提出方法还原了CORS站高程时间序列的真实运动情况,为高程方向非线性建模奠定了基础,但算法计算效率较低,如何提高算法计算效率并对序列中的噪声进行定性和定量分析是进一步研究的课题。
[1] 姜卫平. GNSS基准站网数据处理方法与应用[M]. 武汉: 武汉大学出版社, 2017.
[2] 程鹏飞, 成英燕, 秘金钟, 等. 2000国家大地坐标系建立的理论与方法[M]. 北京: 测绘出版社, 2014.
[3] 张鹏, 蒋志浩, 秘金钟, 等. 我国GPS跟踪站数据处理与时间序列特征分析[J]. 武汉大学学报(信息科学版), 2007,32(3): 251-254.
[4] 徐健, 周志祥, 唐亮, 等. 基于总体平均经验模态分解算法的自适应改进[J]. 振动与冲击, 2017, 36(11): 215-223.
[5] 武曙光. 区域 CORS 站坐标时间序列特征分析[D]. 武汉: 武汉大学, 2017.
[6] 汤俊, 姚宜斌, 陈鹏, 等. 利用EMD方法改进电离层TEC预报模型[J]. 武汉大学学报(信息科学版), 2013, 38(4): 408-411, 444.
[7] WU Z H, HUANG N E. A study of the characteristics of white noise using the empirical mode decomposition method[J]. Proceedings of the Royal Society of London Series A: Mathematical Physical & Engineering Sciences, 2004, 460(2046): 1597-1611.
[8] WU Z H, HUANG N E. Ensemble empirical mode decomposition: a noise-assisted data analysis method[J]. Advances in Adaptive Data Analysis, 2009, 1(1): 1-41.
[9] 张恒璟, 齐昕, 文汉江. 基于均值聚类EEMD的CORS高程时间序列信号分析方法[J]. 大地测量与地球动力学, 2019, 39(10): 1053-1057.
[10] 李鹏. 基于层次均值的聚类算法的研究[D]. 哈尔滨: 哈尔滨工程大学, 2015.
[11] 明锋, 杨元喜, 曾安敏, 等. 中国区域IGS站高程时间序列季节性信号及长期趋势分析[J]. 中国科学(地球科学), 2016, 46(6): 834-844.
[12] 李忠盼, 赵冬青, 向民志, 等. 一种加速GNSS信号捕获的短时傅里叶变换算法[J]. 测绘科学技术学报, 2019, 36(1): 23-27.
[13] 雷亚国, 孔德同, 李乃鹏, 等. 自适应总体平均经验模式分解及其在行星齿轮箱故障检测中的应用[J]. 机械工程学报, 2014, 50(3): 64-70.
[14] 李长伟, 雷文平, 庞博, 等. 基于EEMD的相关排列熵的滚动轴承故障诊断[J]. 组合机床与自动化加工技术, 2020(8): 1-4.
[15] 唐东明. 聚类分析及其应用研究[D]. 成都: 电子科技大学, 2010.
[16] 罗权. GPS坐标时间序列的功率谱分析研究[D]. 武汉: 武汉大学, 2017.
[17] 张恒璟. 国家CORS基准站高程时间序列非线性时变研究[D]. 阜新: 辽宁工程技术大学, 2013.
Time series analysis method of CORS station elevation based on HKDE-EEMDAN
WEN Huali1,2, JIN Zelin3, FAN Rongshuang2, WANG Chongbing1,2, LI Haoran1, LIU Yilun1
(1. School of Geomatics, Liaoning Technical University, Fuxin, Liaoning 123000, China; 2. Chinese Academy of Surveying and Mapping, Beijing 100036, China;3. China Energy Engineering Group Liaoning Electric Power Survey and Design Institute Co., Ltd., Shenyang 110000, China)
To address the problem that the impact of random noise cannot be completely eliminated when the traditional Ensemble Empirical Mode Decomposition (EEMD) method is used for signal decomposition and the signal noise ratio is reduced and the effect of signal reconstruction is not satisfactory, this paper proposed an improved ensemble empirical mode decomposition of adaptive noise using clustering algorithm based on distance evaluation function and entropy. In the Empirical Mode Decomposition (EMD) processing, the modal components of white noise decomposition were added, and clustering analysis was implemented on the Intrinsic Mode Function (IMF) components of orders in the iterative process. This method and the EEMD method were used to decompose the elevation time series of two Continuously Operating Reference Stations (CORS) for the past 20 years. Based on the signal noise ratio, index of orthogonality and root mean square error index, the decomposition accuracies of these two methods were analyzed and compared. The final experimental result showed that this method could increase the signal noise ratio by more than 5%, improve decomposition accuracy by more than 26%, and reduce the root mean square error of reconstructed signal by more than 21%, thus it was capable of reducing the impact of random noise on time series decomposition and signal reconstruction.
adaptive noise; cluster analysis; elevation time series; information entropy; signal reconstruction
P228
A
2095-4999(2021)06-0077-07
文化立,金泽林,范荣双,等. HKDE-EEMDAN的CORS站高程时间序列分析方法[J]. 导航定位学报, 2021, 9(6): 77-83.(WEN Huali, JIN Zelin, FAN Rongshuang, et al. Time series analysis method of CORS station elevation based on HKDE-EEMDAN[J]. Journal of Navigation and Positioning, 2021, 9(6): 77-83.)
10.16547/j.cnki.10-1096.20210612.
2021-01-25
国家重点研发计划项目(2016YFC0803100);辽宁省教育厅辽宁省高等学校基本科研项目(LJ2017QL008)。
文化立(1994—),男,河南濮阳人,硕士研究生,研究方向为空间大地测量数据处理与GNSS高程非线性运动、地理信息系统应用。
金泽林(1996—),男,辽宁抚顺人,硕士,研究方向为大地测量学与工程测量学。