利用机器学习设计光子晶体全光逻辑门

2023-10-08 06:37陈建伟郝然占春连金尚忠张鹏举庄新港费丰
光子学报 2023年9期
关键词:全光波导光子

陈建伟,郝然,占春连,金尚忠,张鹏举,庄新港,费丰

(1 中国计量大学 光学与电子科技学院, 杭州 310018)

(2 中国电子科技集团公司第四十一研究所, 青岛 266555)

0 引言

全光逻辑门是光子计算机、光信号处理和全光网络的核心元件[1],能实现全光信号提取[2]、锁存器[3]、光子路由器[4]和光开关[5]等,近年来受到国内外广泛关注。人们提出了许多实现全光逻辑门的方案,例如使用非线性光纤[6]、半导体光放大器[7]和光子晶体[8]。其中,基于光子晶体的光逻辑门因其结构简单、损耗低、运算速度快、体积小而备受关注[9-12]。并且光子晶体已经实现了波长尺度的全光逻辑门,例如采用多分支波导耦合器[13]、非线性环形谐振器[14]和拓扑保护谷光子晶体逻辑门[15]。此外,THEOCHARIDIS A 等[16]在光子晶体波导(Photonic Crystal Waveguide, PCW)带隙边缘处发现克尔非线性效应会增强,从而影响另一束光信号。JANDIERI V 等[17]提出了一种基于非线性耦合光子晶体波导(Coupled Photonic Crystal Waveguide,C-PCW)带隙传输的全光逻辑与门,带隙传输使得时间孤子在每次逻辑运算期间都能保持稳定的脉冲包络。

设计光子晶体器件需要调整几何结构并迭代模拟,以逐渐接近目标响应[18],然而受限于研究者的设计经验和仿真能力,传统方法只能调整有限的设计参数以寻求最佳结构。此外,大规模的光子晶体全光逻辑门需要多个PCW 紧密排列,根据需求设计PCW 也是实际工程面临的挑战。逆向设计可以快速搜索设计空间,更有效地获取目标光学器件的几何结构[19-21]。因此,逆向设计可以加快光学器件的变量分析与性能评估,为大规模集成光路设计提供支持。该方法已成功应用于各种非常规光子器件的设计,如光子晶体纳米腔[22]、等离子体波导系统[23]和纳米光子功率分配器[24]等。

本文采用神经网络作为辅助手段,设计出一种带隙传输的光子晶体全光逻辑门,以更加直观、有效的方式加速光子晶体的分析与设计。逆向神经网络模型可根据所需光学特性设计光子晶体全光逻辑门。采用时域有限差分法分析了该逻辑门在时域中的与(AND)和非(NOT)运算,仿真结果表明,该器件能保持稳定的脉冲包络,展现出较好的性能。

1 结构设计与网络模型

1.1 光子晶体结构设计

非线性光子晶体可在同一芯片上实现密集的全光信号处理,大大减小了光学逻辑门的器件尺寸。PCW是在光子晶体中引入线缺陷而形成的,频率在光子带隙内的电磁波受相邻未扰动光子晶体势垒的限制,被引导沿缺陷通道传播。特别地,若将两个或三个PCW 紧密放置,就会形成耦合光子晶体波导,光功率会从一个PCW 传输到另一个PCW[25]。

设计合理的C-PCW,可以利用克尔型非线性效应,实现基于带隙孤子传输的紧凑型全光逻辑门。这对PCW 提出了更高的要求:首先耦合光子晶体波导逻辑门需要有多个PCWs 在目标带隙上具有重叠的光子带隙;其次,多个PCWs 在色散曲线边缘的频率范围应当不同,这样可以防止线性区域的模式传播;最后,慢光的光约束力[26]是增强非线性效应的必要条件[27]。因此要想增强克尔非线性效应,需要PCW 在一定带宽内具有低斜率线性色散的特征。为了便捷、准确的设计出满足目标需求的PCW,本文搭建了神经网络光子晶体波导正向性能表征和逆向结构设计模型,以实现目标PCW 的性能评估与器件设计。

为了获取PCW 的光学性质,常见的方法是改变光子晶体周期结构排列和缺陷形状。图1 是光子晶体的结构设计,光子晶体周期为a,缺陷孔的半径r等于0.34a。改变靠近波导的第一排和第二排缺陷孔的位置和形状,实现PCW 光学特性的调控,其中d1和d2,d3和d4分别是第一排和第二排气孔的椭圆长轴和短轴;X1和Y1,X2和Y2分别是第一排和第二排缺陷相较三角晶格结构的横向与纵向偏移。然后,使用平面波展开法获取光子晶体的色散特性,并获取PCW 的慢光评价指标如群折射率(Group Index,ng)、带宽和归一化延迟带宽积(Normalized Delay-Bandwidth Product, NDBP)等,评估PCW 的性能。此外,为了设计光子晶体逻辑门,还提取了色散曲线边缘频率、相邻色散曲线的频率差和带隙宽度等光学参数。将几何结构参数和光学性能参数数字化编码,这有利于神经网络模型的数值预测。最后,使用差值扫描光子晶体波导结构参数,编写数据处理代码以获取PCWs 的结构参数及其光学性能指标,共提取了17 万组数据,训练集与测试集的比例为9∶1。

图1 光子晶体波导结构设计图Fig.1 Structure design of photonic crystal waveguide

1.2 深度学习模型

传统设计方法依赖研究者的经验推测PCW 的几何结构,并使用理论计算或者数值仿真获取其光学性能,但这种设计过程的效率低并且无法根据目标光学性质进行逆向预测。为了实现光子晶体波导的正向性能表征与逆向结构预测,本文搭建了神经网络模型(如图2 所示)实现光子晶体性能表征和结构设计。

图2 光子晶体波导正向性能表征与逆向结构预测模型Fig. 2 Forward performance characterization and inverse structure prediction model of photonic crystal waveguide

网络模型是使用Python 3.9.7 编程语言和TensorFlow 2.7.0 框架建立的,使用随机搜索优化神经网络的超参数,对比网络模型的性能评价指标,获得最佳的网络结构参数。正向性能预测模型的输入和输出分别是编码后的几何结构参数与光学性能参数。正向与逆向神经网络使用Intel Core i9-10940X 处理器和RTX 3080 Ti 显卡,训练时间分别为0.2 h 与0.36 h。

正向神经网络共有13 层全连接层,训练的总参数为197 612 个,通过随机搜索选取最佳的激活函数(Tanh)和优化器(Adamax)。如图3 所示,正向网络经过60 次训练后,均方误差(Mean Squared Error,MSE)为0.000 274,为了衡量网络预测值与真实值的偏差,采用决定系数作为评价指标,可通过式(1)计算决定系数R2。

图3 正向网络和逆向网络验证集的均方误差Fig.3 Mean squared error of the forward and inverse network verification sets

式中,Sres为残差平方和;Stot为总平方和;yˉ为真实数据的平均值;fi为第i个样本的预测值;yi为第i个样本的真实值。图4(a)展示了正向神经网络对ng的预测结果,决定系数为0.997,预测值与真实值呈现出斜率为1的直线,说明预测准确度良好。

图4 神经网络模型预测值与真实值的关系Fig.4 The relationship between the predicted value of the neural network model and the actual value

进一步地,逆向神经网络可以从目标光学性质逆向预测PCW 的几何结构,以满足实际工程的要求。该神经网络由26 层全连接层组成,总参数为155 704 个,输入为PCW 的目标光学性能,输出为光学结构参数。经过160 次训练,逆向网络的均方误差为0.000 353,决定系数为0.998(见图4(b)),表明预测值与真实值相匹配,证明了网络的准确性。当深度学习模型训练完成后,预测100 万组数据耗时3.5 min,此外保存深度学习模型后,进行预测将不受计算资源限制。因此,当深度学习模型训练完成,它可以在几秒钟内设计出所需的光子器件,从而提高设计效率。

接下来,演示逆向神经网络根据目标性能设计光子晶体逻辑门,由1.1 节可知,所提出的逻辑门利用带隙孤子传输,当输入信号的频率在光子带隙的边缘,逻辑门的输出端口会被其他输入信号非线性扰动。逆向神经网络能够根据带隙宽度、工作频率和慢光性能指标逆向预测出PCW 的几何结构参数。为了确保PCWs 能拥有重叠的带隙,设置PCW 的带隙宽度要大于0.01,并指定色散曲线的频率差值。PCW 的慢光效应能够降低光的群速度并增强非线性效应,因此设置ng在20~50 之间。根据这些要求,逆向设计的PCWs的色散曲线在0.259

图5 基于逆向模型设计的PCWs 的光学性能Fig.5 Optical performance of PCWs based on inverse model

2 全光逻辑门的设计

如1.2 节所述,为了使全光逻辑门能够正常工作,需要选取合适的工作频率,以防止线性传播模式被激发。根据图5(a)的色散曲线,将逻辑门的工作频率选定为a/λ=0.26。图6(a)是全光逻辑门的结构示意图,Port-A 和Port-B 为输入端,Port-C 为输出端同时输入固定相位和振幅的光脉冲作为参考信号。当脉冲信号输入到Port-A 和Port-B 时,耦合波导会产生克尔非线性效应,从而使Port-C 的色散曲线向低频方向移动。当Port-C 的色散曲线边缘点与工作频率重叠时,就形成了时间带隙孤子。本文采用时域有限差分方法来模拟全光逻辑门的AND 和NOT 操作。光子晶体逻辑门的周期为420 nm,输出端口与输入端口相距70 个周期,可以观测输出端口的电场变化,确定逻辑运算。迄今为止,大多数光子晶体逻辑门都采用连续波信号来进行操作,而本文则使用时域上的高斯脉冲模拟“数字”信号进行逻辑运算。

图6 光子晶体全光逻辑门AND 运算Fig.6 Photonic crystal all-optical logic gate AND operation

2.1 AND 逻辑门

图6(a)展示了AND 逻辑门的实现过程,光子晶体波导逻辑门的自上而下的椭圆缺陷孔分别采用是Structure B、Structure A 和Structure C 结构,圆形缺陷孔的半径为0.34a。首先,给Port-C 输入归一化频率为a/λ=0.26,振幅为0.2 的连续波,以此为基准,识别脉冲变化。接着,在Port-A 和Port-B 输入归一化频率为a/λ=0.26,宽度为10 ps,振幅为0.5 的高斯脉冲。该脉冲以25 ps 为一个周期进行逻辑运算,其中有脉冲输入判断为逻辑“1”,无脉冲输入判断为逻辑“0”。表1 为AND 逻辑门的真值表,经过设计的PCW 保证了慢光状态下的光波限制,增强了非线性效应,而克尔非线性效应能够影响光子晶体波导的非线性折射率,会导致对称模式的色散曲线移位到较低的频率,从而形成带隙孤子。根据VAKHTANG J 等[28]的研究,控制输入脉冲的频率与振幅,能够控制克尔型非线性引起的角频率位移。由于克尔效应与光强成正比,随着输入光信号的增大,耦合光子晶体波导的折射率也增大,当Port-A 和Port-B 都有光脉冲输入时,输出端口Port-C由于非线性效应色散曲线发生偏移,从而输出光脉冲。只有Port-A 或Port-B 单个光脉冲输入时,折射率变化较小,不能满足色散曲线偏移,因此输出光脉冲较弱。

表1 AND 逻辑门真值表Table 1 AND logic gate truth table

图6(b)展示了Port-B 脉冲信号,模拟输入端“11”的电平状态,Port-A 也输入相同的高斯脉冲,输入的电平状态为“10”。如图6(a)所示,模拟“10”和“11”的AND 运算,观察Port-C 在时域上输出的光脉冲(图6(c)),高斯脉冲的包络基本保持不变,输出电平状态为“10”。输入光脉冲的频率位于光子晶体禁带,而C-PCW 能够产生稳定的光脉冲,这是因为克尔非线性效应使色散曲线向低频偏移,从而实现禁带传输。比较输入信号和输出信号的光脉冲,输入信号的脉冲宽度为10 ps,输出信号的脉冲宽度为10.36 ps,变化了3.6%;当输入脉冲强度降低至1/e 时,原脉冲的宽度为5.82 ps,而逻辑运算后的光脉冲为5.88 ps,变化了1%。该逻辑门实现了带隙传输的“数字”逻辑操作,能够在时域上保持稳定包络传输,实现AND 逻辑运算。

2.2 NOT 逻辑门

如图7(a)所示,NOT 门与AND 门采用相同的结构,改变Port-A 和Port-B 的脉冲相位差,控制光波干涉与非线性效应,实现NOT 逻辑运算。表2 展示了耦合光子晶体逻辑门的NOT 逻辑真值表,Port-B 作为激活端口始终输入高斯脉冲,Port-A 为逻辑门输入端口。Port-A 和Port-B 输入的脉冲是相位差为180°、振幅为1、归一化频率为a/λ=0.26 的高斯脉冲。当Port-A 和Port-B 同时输入脉冲时,合并后的脉冲信号会因相消干涉而被抵消。由于相消干涉,因此没有光向前传播,Port-A 输入光脉冲不能引起克尔非线性效应,输出端口Port-C 不会形成光孤子。而Port-A 没有输入光脉冲时,激活端口Port-B 有光脉冲,光强达到目标角频率偏移的阈值,因此克尔非线性效应能让Port-C 形成光孤子,实现NOT 运算。

表2 NOT 逻辑门真值表Table 2 NOT logic gate truth table

图7 光子晶体全光逻辑门NOT 运算Fig.7 Photonic crystal all-optical logic gate NOT operation

当Port-A 输入脉冲而Port-B 没有输入脉冲时,Port-A 的光脉冲会导致非线性效应发生,形成光孤子,从而实现NOT 运算。与AND 逻辑门相同,Port-A 和Port-B 的输入电平分别为“10”和“11”。观测Port-C的输出信号,输出电平为“01”。图7(b)和图7(c)分别展示了输入脉冲和输出脉冲的归一化传播强度,其中输入脉冲的脉宽为10 ps,输出脉冲脉宽为11.2 ps。相较AND 运算,NOT 运算的光脉冲变化较大,这是因为AND 运算是由两个光脉冲叠加增强克尔非线性效应实现带隙传输;而NOT 运算是由于Port-A 和Port-B光脉冲相消干涉,只有当Port-A 和Port-B 呈现非状态时,才会增强克尔非线性效应,因此相较AND 运算,NOT 运算的脉宽有所展宽,但是该器件利用带隙光孤子传输,两种逻辑运算的脉冲包络保持良好,这有助于在时域中实现稳定的“数字”逻辑运算。

3 结论

本文提出了基于神经网络模型的光子晶体性能分析与全光逻辑门结构设计,神经网络具有较高的准确度,正向性能表征模型的决定系数为0.997,逆向结构预测模型的决定系数为0.998。逆向网络模型能够根据所需的光学特性,如群折射率、光子带隙和工作波长,逆向设计出光子晶体逻辑门的结构参数。所设计的逻辑门能够实现带隙传输,能在时域对“10”和“11”的高斯脉冲进行AND 和NOT 运算。该逻辑门输出的脉冲包络稳定,AND 运算输出脉宽仅变化了3.6%,有利于在时域上实现“数字”逻辑运算。本方案利用神经网络模型协助设计光子晶体,加速了光学器件的性能分析与结构设计,在集成光学电路和全光信息处理系统的设计中具有潜在的应用价值。

猜你喜欢
全光波导光子
《光子学报》征稿简则
一种新型波导圆极化天线
华为发布智慧全光城市目标网架构
偏振旋转效应在全光缓存器中的应用与实现
一种脊波导超宽带滤波器
一种带宽展宽的毫米波波导缝隙阵列单脉冲天线
基于SOA的100G全光信号处理
在光子带隙中原子的自发衰减
光子晶体在兼容隐身中的应用概述
基于反射系数的波导结构不连续位置识别