周以琳,雷印杰
(四川大学电子信息学院,成都 610065)
光收发机同相/正交(In‑phase/Quadrature,IQ)损伤监测技术对于相干光通信系统实现可靠传输非常重要。IQ 损伤是由发射机和接收机设备缺陷引起的同相(I)和正交(Q)不匹配[1‑3]。在高数据速率和高阶调制格式下,IQ 损伤会严重影响其他参数的估计,并导致系统性能显著下降[4‑6]。因此,收发机IQ 损伤监测技术对高速光纤通信系统的未来发展至关重要。
针对上述问题,已有许多学者做了大量工作。例如,对扫描有限脉冲滤波器的增益比例因子来检测相干IQ 发射器功率不平衡进行研究[7]。设计一种基于最大似然独立分量分析的方法[8],无需训练数据和调制格式信息即可准确估计Tx‑IQ 不平衡。以及经典的Gram‑Schmidt正交化程序[9],用于补偿和估计数字域中的Rx‑IQ 不平衡。设计一种联合监测Tx 和Rx 中IQ 损伤的方法[10],但它依赖于对自适应多层SL 和WL滤波器系数的良好控制[11]。
近年来,机器学习技术已应用于光通信。例如,对基于深度学习辅助监测相干发射机IQ偏斜和功率不平衡进行研究[12]。但是,该方法需要额外的特征工程来提取信号特征。然后,利用简单的全连接前馈神经网络建立信号特征与发射机中IQ 偏斜和IQ 功率不平衡之间的数值关系。此外,该方法不能估计发射机中的IQ 相位偏差和接收机中的IQ损伤。
我们提出了一种分段序列联合学习网络(segmented sequence joint learning network,SSLN),该网络通过分析DSP 处理的时域数据来隔离和监测相干收发机IQ 损伤,而无需额外的特征提取器。数字信号处理器(DSP)应用于相干检测后的二次过采样接收信号,其中数字信号处理包含CD 补偿、时钟恢复、频偏补偿和载波恢复。经过上述处理后,将经过训练的SSLN模型用于监测收发器IQ 损伤。为了证明所提出的方法在监测相干光收发机IQ 损伤方面的有效性,我们对100 km 标准单模光纤上的100‑Gbaud QPSK/64QAM 信号传输进行了数值模拟。数值模拟结果表明,当多种损伤同时存在时,所提出的SSLN 能够准确有效地监测Tx 和Rx 的IQ损伤。
本节对传统光学Tx和具有相干检测的Rx中IQ 损伤进行数学描述,以为后续研究提供理论基础。考虑到Tx 和Rx 产生的IQ 损伤是I、Q 两路信号的相位、幅度和时间存在不匹配,在下面使用IQ分量来数学描述损伤。
在图1(a)所示的Tx 中,来自A/D 输出的两个信号驱动IQ 调制器调制来自ECL 的光源。与90°相移混合后,它构成了IQ分量。在这个过程中,IQ 时延、IQ 幅度不平衡和IQ 相位偏差依次发生。假设理想传输的信号是受发端IQ损伤影响后可以表示[10,13]
图1 发射机(a)和接收机(b)装置
其中: ⊗代表卷积运算,gI和gQ,τI和τQ分别是I和Q两路的增益和时延。在此,发射机IQ幅度不平衡以dB 为单位, 可以表示为γTx=20 lggQ/gI,IQ 相位偏差αTx=α,IQ 时延可以表示为τTx=τQ−τI。
图1(b)显示了具有相干检测的传统光学Rx配置。当平衡检波器的输出功率与放大器的增益不匹配时,就会发生幅度不平衡。光学混合电路的相位出现偏差时会导致IQ 分量出现相位偏差。在接收端光路和接收器侧电路之间的长度差异也会引起IQ 时延。假设接收到的信号为受收端IQ 损伤影响后可以表示为
其中:T 表示转置,接收机IQ 幅度不平衡为γRx= 20 log10gQ/gI,IQ 相位偏差为αRx=α,IQ skew为τRx=τQ−τI。
基于上述原理,一些工作通过补偿滤波器的系数监测收发器智商损伤[10‑11]。我们的工作使用经过训练的SSLN 模型来联合监测IQ 损伤。接下来,我们将重点介绍分段序列联合学习网络(SSLN)的原理。
我们提出了分段序列联合学习网络(SSLN)来监测相干光收发机中的IQ 损伤。SSLN 网络由三个模块组成,如图2所示。分割序列融合模块(FSS)和自适应降噪模块(ANR)用于参数共享,从接收到的数据中学习IQ 损伤的融合特征。多任务分支学习模块(MBL)用于优化各自任务的共享特征。具有三个模块的SSLN 在DSP 处理的接收信号X 与Tx 和Rx 中的IQ 损伤之间建立了映射关系。然后,监测Tx 和Rx 中的IQ 偏斜,IQ幅度不平衡和IQ相位偏差。
图2 SSLN网络模型
从前面介绍的IQ损伤数学模型中可以看出,接收到的数据中的每一个点都包含着每个IQ损伤的影响值。为了增强同一样本的IQ损伤特征,我们增加了FSS 模块,用于分割序列和提取特征,然后将提取的特征融合以增强有效特征。FSS模块将网络的输入数据X =[]x(1),x(2),…,x(n) 分成N块。输入数X变为
每块数据可以表示为
融合的特征包含或多或少的冗余信息。为了减少这些冗余信息,我们引入了ANR 模块,该模块由软阈值化结构和多层一维卷积结构组成。软阈值化是信号降噪算法的核心步骤[15]。它可以将绝对值小于阈值的特征设置为零,绝对值大于此阈值的特征也会朝着零的方向收缩。它可以简单地表示为
软阈值的获得通常是与注意力机制相结合[15]。它通过简单的MPL 自主学习阈值θ,以便每个样本都有自己唯一的阈值θ。将融合后的特征fFus经过软阈值化后再送入1D 卷积网络,得到更高层次的特征信息fANR。我们将该模块的映射表示为FANR(∙),则不同输入对应不同的去噪结果:
其中FANR( )∙的参数由网络学习确定。
因为需要监测多种损伤,SSLN 也是一种多任务联合学习模型。CFF 和ANR 可以看作是多任务学习模型的共享参数部分,每个任务相互作用,最后通过分支模块输出每个任务的目标值。为了便于理解,我们将用于收发机IQ 时延监测的分支模块表示为Fτ(∙),将用于收发机IQ相位偏差监测的分支模块表示为Fα(∙),将用于收发机IQ 幅度不平衡监测的分支模块表示为Fγ(∙)。每个任务分支模块获取的监测值为
Fτ(∙)、Fα(∙)和Fγ(∙)是通过组合不同的全连接层来实现的,所有这些都使用激活函数ReLU。它们的参数也由网络训练决定。
SSLN 是一个深度神经网络,其优化需要定义损失函数和优化器。优化器将通过最小化损失函数来优化SSLN 中每个模块的参数。我们选择自适应动量优化器(Adam)[16]来优化SSLN 参数。它能保持梯度平滑,并在训练过程中为不同参数生成自适应学习率。损失函数选择适用于回归模型的SmoothL1Loss[17],其定义为
其中:x表示预测值;y表示目标值,式(10)对x的偏导数为
从式(11)可以看出,当预测值与目标值的误差较小时,SmoothL1Loss 在x上会有较小的梯度;当误差较大时,x上的梯度绝对值不会超过1,从而可以保证网络稳定地更新参数。
在推理阶段,输入经DSP 处理后的接收数据,SSLN 可以同时输出Tx 和Rx 中的IQ 时延,IQ幅度不平衡和IQ相位偏差。
我们对光通信系统传输进行了仿真。在发射端,100‑Gbaud QPSK/64QAM 信号首先进行两次过采样,然后由滚降因子为0.1 的根升余弦滤波器RCC 进行脉冲成形。来自数模转换器输出的信号驱动IQ 调制器调制来自ECL 的光源。与90°相移混合后,构成调制光信号。光信号通过100 km SSMF 传输并通过相干检测接收。其中激光线宽设置为50 kHz。发射机IQ 损伤和接收机IQ损伤分别基于公式(1)和(2)诱导。表1总结并提供了数值模拟的发射机和接收机IQ损伤范围。
表1 数值模拟参数
DSP应用于相干检测后的二次过采样接收信号,其中数字信号处理包含CD补偿、时钟恢复、频偏补偿和载波恢复。经过上述处理后,将经过训练的SSLN模型用于监测收发机IQ损伤。
SSLN 模型使用基于Python 3.7 的Pytorch 框架实现,并在带有GeForce RTX 2080ti 显卡的Ubuntu 16.04系统上进行训练。使用实验数据训练模型是不切实际的,因为深度神经网络需要大量的训练数据才能生成高精度的模型。我们仿真生成了包含800,000 个样本的数据集,其中每个样本根据表1 的随机组合在Tx 和Rx 中添加IQ 损伤。使用97%的数据集优化SSLN 的参数,并使用3%的数据集测试模型。在此方案中,训练批次设置为128,初始学习率设置为0.01。我们每迭代20 轮就进行一次0.1 倍的学习率衰减。使用Adam 优化器来获得最佳模型参数。实验结果来自50 次独立测试的平均值,每个测试使用6144 个采样信号。为了便于比较分析,测试集中的IQ时延从−5 ps增加到+5 ps,步长为1 ps;IQ 幅度不平衡从−4dB 增加到+4 dB,步长为1 dB;IQ 相位偏差从−10°增加到+10°,步长为1°。
我们监测100‑Gbaud 64QAM 和QPSK信号上的收发机IQ 损伤,以测试SSLN 性能。图3 显示了SSLN 模型在两个不同调制格式数据集上的监测结果的平均绝对误差(MAE)。其中每组MAE来自50 次独立测试的平均值。对于Tx 和Rx损伤,IQ 幅度不平衡的范围为[−4,4]dB,监测误差在0.2 dB 内;IQ 相位偏差的范围为[−10°,10°],监测误差在0.8°以内;IQ 时延的范围为[−5,5]ps,监测误差在0.2 ps 以内,如图3所示。两种不同的调制格式下监测误差基本相近。
图3 基于SSLN的100⁃Gbaud QPSK/64QAM信号的监测MAE
我们使用仅添加Tx‑IQ 损伤或Rx‑IQ 损伤的测试集来评估SSLN 网络模型的鲁棒性。图4 显示了仅在100‑Gbaud 64QAM 信号中添加Tx‑IQ 损伤或Rx‑IQ 损伤时,使用经过训练的SSLN 模型对每个IQ损伤的监测偏差分布。我们可以看到,SSLN 模型在仅存在发射机或接收机IQ 损伤时,也能有效地监测个体IQ损伤。
图4 SSLN模型对每个IQ损伤监测的偏差分布
我们通过改变测试集的OSNR 来评估SSLN的鲁棒性。在1300 组数据上进行了测试,监测偏差的分布如图5所示。在测试集中,调制格式为64QAM,OSNR 分布在15~40 dB 的范围内。为了便于讨论,所有测试集的收发机IQ损伤都是相同的(Tx‑IQ 时延为−1 ps,Rx‑IQ 时延为2 ps,Tx‑IQ 幅度不平衡为2 dB,Rx‑IQ 幅度不平衡为1 dB,Tx‑IQ 相位偏差为5°,Rx‑IQ 相位偏差为4°)。由图可看出,各损伤的监测偏差都随着OSNR 的增加而降低。此外,当OSNR 范围为15~40 dB 时,IQ 相位偏差的监测偏差小于0.8°,如图5 所示。当OSNR 超过20 dB 时,IQ时延的监测偏差小于0.2 ps,IQ幅度不平衡的监测偏差小于0.2 dB。结果表明,所提出的SSLN模型在OSNR分布范围较宽的情况下仍能取得有效的监测效果。
图5 不同OSNR条件下SSLN模型在IQ损伤的监测分布
我们提出了一种基于SSLN 模型的相干光收发机IQ 损伤监测方案,并对100‑Gbaud QPSK/64QAM的传输系统进行了仿真。验证结果表明,SSLN 模型在多个IQ 损伤同时存在的条件下,可以有效地监测并分离每个IQ 损伤。SSLN 模型通过分析经CD 补偿、时钟恢复、频偏补偿和载波恢复处理后的接收数据,能够准确有效地监测IQ损伤,监测结果受调制格式和OSNR影响。