基于HHT及主成分分析的光缆识别信号特征提取

2022-10-14 00:55韩晓伟田晓蓓
河北工业科技 2022年5期
关键词:希尔伯特光缆贡献率

韩晓伟,田晓蓓

(中国电子科技集团公司第五十四研究所,河北石家庄 050081)

目前光纤通信已大规模应用,因机房搬迁、网络扩容升级导致的光缆线路改造和光缆故障抢修等情况不断涌现,如何快速、有效地识别目标光缆至关重要。光缆上的标签随着时间推移可能损坏甚至脱落,光缆识别困难的问题随之产生。常用的光缆识别技术有4种:光时域反射技术,相干解调技术,射频识别(radio frequency identification,RFID)技术,可识别介质光缆技术。RFID技术需要在光缆护套上附带标识芯片,通过检测标识芯片来识别目标光缆[1-2];介质光缆技术在光缆护套上覆嵌多条有色条状识别带来完成光缆识别[3]。这两种方法都需要在光缆护套附带标识物,工艺相对复杂。光时域反射技术利用瑞利散射原理,通过检测后向散射光完成光缆识别,探测过程中需要对光缆进行弯曲或冻结,容易损伤光缆且成本较高[4]。光相干解调技术原理、实现方案都相对简单。基于光的相位载波(phase generate carrier,PGC)调制解调来识别目标光缆的检测技术已经广泛应用[5-7]。基站人员于待测光缆中选取两根构建萨格纳克干涉场。根据光纤弹性效应,远地操作者敲击光缆时,干涉场的幅度和相位会随之变化,基站人员可通过探测回波干涉信号的幅值来判断被敲击的光缆是否为目标光缆[8-9]。该方向的研究多集中于干涉光路的优化设计以降低操作复杂度,及硬件电路的优化设计以提高信噪比、灵敏度等性能。在环境噪声较严重时,如光缆某一处被固定挤压,目标光缆与其他线缆绞在一起相互磕碰,所用激光源的相干性较差等情况下,仅依靠时域幅值获得的信息是有限的,无法保证光缆识别的准确率。此时的回波干涉信号是非线性、非平稳的,建立在谐波基函数的傅里叶变换和小波基函数的小波变换对于此类信号的分析有其局限性[10-12]。

针对非线性、非平稳信号的分析,相关学者做了大量的研究。研究人员提出的经验模态分解法(empirical mode decomposition,EMD)不需要事先设定基函数,而是根据信号自身的时间尺度特征自适应的完成分解[13-15],其分解结果是若干按照各自频率大小排列的时域信号。文献[16]结合EMD与BP神经网络算法,以各阶模态函数作为神经网络的训练数据,实现超声缺陷信号的提取;文献[17]提出了一种改进的奇异谱分解方法,其核心算法是借助奇异值分解进行降噪;文献[18]引入机器学习领域的t-SNE降维算法,实现EMD与t-SNE的有效结合,有效提高振动信号的故障特征识别精度。本文结合EMD及主成分分析(principal component analysis,PCA)对回波干涉信号进行检测和降噪;通过希尔伯特-黄变换分辨各阶信号的幅值和频率差异,完成敲击特征信号提取。

1 特征提取算法及数据处理

实验用光缆长10 km左右,铺设于管道、电杆架空等复杂环境中。实验方案如图1所示,采用双纤远端环回的方式构建干涉场,远地操作者通过敲击定位目标光缆。用示波器完成干涉信号的采集后,借助上位机软件完成数据处理。

图1 实验方案

实测回波干涉信号如图2所示,横轴为采样点数。回波干涉有用信号间杂着大量噪声,个别采样点的噪声幅度甚至与有用信号持平;敲击信号的幅度在时域上持续震荡衰减,噪声幅度没有大的浮动。这给后续数据处理分析造成一定困难。

图2 原始回波干涉信号

完整信号特征提取方案如图3所示。将回波干涉信号进行EMD分解得到各阶本征模态分量(IMF,intrinsic mode components);然后将各阶IMF分量作为列向量构建矩阵,以奇异值分解的方式进行主成分分析;按照奇异值的贡献率进行成分取舍并完成降噪;此时按照希尔伯特-黄的相关理论提取目标特征信号[19];根据频率和幅度信息判断是否为敲击信号,识别目标光缆。

图3 信号特征提取方案

1.1 经验模态分解

经验模态分解可将非平稳时间信号分解为有限个IMF分量和残余信号,其分解过程如下:

1)找出原始信号的极大值点、极小值点,分别拟合出上包络线、下包络线,并计算出平均包络线;

2)原始信号减去上述平均包络线,得到第1阶IMF分量;

3)原始信号减去第2)步生成的IMF分量得到新的待检信号。将新的待检信号作为原始信号回到第1步重复整个过程。

经过多次分解后,原信号可表述为

(1)

式中:IMFi为第i个IMF分量;rN为分解后的残余项。

基于以上算法对图2回波干涉信号进行EMD分解,得到的各阶IMF分量如图4所示。筛选出的第1阶IMF分量(即图中的IMF1分量)是原数据序列中频率最高的分量,随后的IMF分量频率依次降低。

图4 原信号经验模态分解的各阶IMF分量

1.2 降噪算法

主成分分析法在数据压缩和噪音消除等领域都有广泛应用[20]。通常情况下有用信号具有较大的方差,噪声具有较小的方差,并且信号与噪声是不相关的。这意味着主成分分析得到的奇异值中,较小的奇异值对应着噪声的方差,较大的奇异值对应着有用信号的方差。通过对比奇异值贡献率舍弃较小的奇异值及相应的奇异向量可实现噪声消减。

将1.1节得到的各阶IMF分量作为列向量构建样本矩阵进行PCA处理。假设回波干涉信号EMD分解后得到n组数据,其中每组数据包含m个采样点。样本矩阵表示为X(X∈Rm×n)。X=(x1,x2,x3,…,xn),其中x1=IMF1,x2=IMF2,…,xn=IMFn,即经验模态分解后的各阶本征模态分量。PCA处理的具体步骤如下。

3)设特征值为λi,奇异值为σi,左奇异向量为ui,右奇异向量为vi,则可以列出矩阵C的特征方程,求得各奇异值及奇异向量:

Cvi=λivi,

(2)

(3)

(4)

4)选取主成分,最终选取的主成分的个数按照奇异值的累积贡献率来确定。这里定义奇异值的贡献率和累计贡献率:

(5)

(6)

式中,p为确定的奇异值的个数,最终选取p个奇异值和对应的左右奇异分量来描述矩阵的主要特征。光缆识别时只需要区分有无敲击信号,不需要回波干涉信号的详细参数,累计贡献率门限可以定得低一些。当累计贡献率>60%时,可认为前p个主成分已能反映原数据序列的信息。

按以上算法处理图2回波干涉信号,得到的奇异值曲线如图5所示,相应的奇异值及所占贡献率如表1所示。由图5及表1可知,自第2个奇异值处曲线开始骤降,前2个奇异值累计贡献率占67.76%。因此认为前2个奇异值及其所对应的左右奇异分量包含了原始数据的大部分信息,余下的奇异值及奇异分量被视为噪声舍弃。

表1 各阶IMF分量的奇异值及所占贡献率

图5 各阶IMF分量的奇异值曲线

1.3 希尔伯特-黄变换

希尔伯特变换通常用来求解瞬时频率、瞬时幅度、瞬时相位、边际谱等时频域信息,无法直接用于处理非线性、非平稳信号[19]。而经验模态分解得到的各阶本征模态函数消除了尖峰突变、跳跃、骑波等非线性、非平稳特征,满足希尔伯特变换的条件[21]。

希尔伯特变换的表达式如下:

(7)

H[x(t)]是x(t)与1/πt的卷积。假设原始信号为x(t)=A(t)cosφ(t),那么对应的希尔伯特变换信号为x(t)=A(t)sinφ(t)。

(8)

(9)

(10)

信号幅值随时间和频率的变化曲线称为希尔伯特频谱,表示为

(11)

任何信号在某一个确定的时刻都对应着唯一的瞬时幅度、唯一的瞬时相位、唯一的瞬时频率。光缆识别信号的幅度和相位随着敲击光缆发生变化,并且其相位变化最终以影响时域幅度的形式被探测器探知。受限于探测器的灵敏度及响应速度,敲击发生时间段内的局部特征不一定能被实时探知,这种情况下可通过希尔伯特-黄变换从局部特征或瞬时特征中提取到敲击信号的有用信息。

2 实验结果

采用前述特征提取算法对光缆敲击回波干涉信号进行分解,无敲击发生、有敲击发生两种情况下降噪重构后的回波干涉信号如图6所示。与图2对比可以看到残余噪声的幅度已被有效抑制,可清晰地看到敲击造成的震荡衰减信号。

图6 降噪后的回波干涉信号

为了量化分析1.2节所述降噪算法的效果,计算了原始回波干涉信号及降噪后回波干涉信号的信噪比,见表2。信噪比按照S/N=20log(VS/VN)计算,VS,VN分别表示信号与噪声的幅值。降噪处理后,信噪比由6.29 dB变为8.30 dB,优化了2.01 dB。信噪比越大,信号质量越高,相同硬件检测性能条件下目标光缆误判的概率越小。

表2 降噪前后信噪比差异

图7是降噪后的希尔伯特时频谱灰度图像,横坐标为采样点,左侧纵坐标为归一化频率(以采样频率的一半为基准做归一化),右侧颜色深浅即坐标值表示幅度大小。从图中可看到回波信号的幅值频率都是与时间相关的变量。从频域看,无敲击时的信号频率范围大概是0~2,有敲击时的信号频率范围是0~1。无敲击时的信号频率范围完全覆盖有敲击时的信号频率范围,这说明无法从瞬时频率来进行光缆识别。2种情况下的瞬时幅值波动区分是比较明显的。无敲击时幅值波动较小,最大到0.025;敲击发生时幅值明显增大,可通过瞬时幅度判断敲击是否发生。

图7 降噪后的希尔伯特时频谱

图8为各阶IMF分量经希尔伯特-黄变换得到的瞬时幅值。通过观察有敲击时的IMF1可看出,敲击光缆形成的幅度峰值出现在第920个采样点处,由此很容易判断出该光缆是否为目标光缆。实际使用时可以设置一个门限值(比如0.1 V,取决于信噪比及放大倍数)。将所得瞬时幅值与门限值比较,如果存在大于门限值的数则判断为目标缆,否则判断为非目标缆。

图8 瞬时幅度

3 结 语

目前基于光相干解调技术识别目标光缆的检测技术已经广泛应用。在环境噪声较严重或是受限于硬件性能如激光源的相干性较差等情况下,该检测技术无法保证光缆识别的准确率。针对这个问题的研究多集中于干涉光路的优化设计及硬件检测电路性能的提升两方面。本文从算法角度入手,将机器学习领域的降噪、特征提取算法进行适应性改进,用于光缆识别信号的数据处理。在不升级硬件性能的前提下提高信噪比,降低目标光缆误判的概率。

针对光干涉信号非线性、非平稳的特征,讨论了一种希尔伯特-黄变换及主成分分析相结合的特征提取方法。具体而言,做了以下2个方面工作。

1)提出了一种信号特征提取方法。首先,借鉴经验模态的相关理论将采样收集的光探测信号进行时域分解,把分解得到的本征模态分量作为列向量构建矩阵;其次,将所述矩阵作为样本,以奇异值分解的方式进行主成分分析。基于有用信号方差较大、噪声方差较小,信号与噪声互不相关的有效前提,以奇异值的贡献率进行可用成分筛选,完成数据降噪;最后,将降噪信号进行希尔伯特-黄变换得到瞬时特征信号,完成目标光缆识别。

2)通过实验验证所述特征提取方法的有效性。①在不改进光路设计和硬件性能的情况下,比对原始采样信号的信噪比与降噪后信号的信噪比,结果表明后者比前者优化了约2 dB;②通过研究降噪后信号的希尔伯特时频谱灰度图像,发现频率、相位均无法有效表征所关注的敲击信号,因此将瞬时幅度作为待提取的目标特征。通过设置门限值并比较瞬时幅度与该门限值的差异,判断是否为目标光缆。

基于HHT及主成分分析的光缆识别信号特征提取方法,可有效提高待测信号的信噪比,降低误判目标光缆的概率。本文在实验验证阶段采用的方式是把光探测器输出的信号通过示波器采样传到上位机进行处理与分析,实时性较差。未来在工程应用中需要完善数据的实时采集与分析处理。另外,本文通过比对有敲击和无敲击2种情况下的处理结果,初步说明了该方法应用于光缆识别的有效性。后续有待增加实验样本量,模拟更加多样的环境噪声,以提供更为有效的统计分析结果。

猜你喜欢
希尔伯特光缆贡献率
一个真值函项偶然逻辑的希尔伯特演算系统
一种通用的装备体系贡献率评估框架
有趣的希尔伯特
铺条长长的海底光缆
关于装备体系贡献率研究的几点思考
无卤阻燃光缆及防蚁光缆
无卤阻燃光缆及防蚁光缆
水线光缆
基于希尔伯特-黄变换和小波变换的500kV变电站谐振数据对比分析
В первой половине 2016 года вклад потребления в рост китайской экономики достиг 73,4 процента