利用机器学习设计光子晶体全光逻辑门

2023-10-08 06:37陈建伟郝然占春连金尚忠张鹏举庄新港费丰

光子学报 2023年9期

陈建伟，郝然，占春连，金尚忠，张鹏举，庄新港，费丰

（1 中国计量大学光学与电子科技学院，杭州 310018）

（2 中国电子科技集团公司第四十一研究所，青岛 266555）

0 引言

全光逻辑门是光子计算机、光信号处理和全光网络的核心元件［1］，能实现全光信号提取［2］、锁存器［3］、光子路由器［4］和光开关［5］等，近年来受到国内外广泛关注。人们提出了许多实现全光逻辑门的方案，例如使用非线性光纤［6］、半导体光放大器［7］和光子晶体［8］。其中，基于光子晶体的光逻辑门因其结构简单、损耗低、运算速度快、体积小而备受关注［9-12］。并且光子晶体已经实现了波长尺度的全光逻辑门，例如采用多分支波导耦合器［13］、非线性环形谐振器［14］和拓扑保护谷光子晶体逻辑门［15］。此外，THEOCHARIDIS A 等［16］在光子晶体波导（Photonic Crystal Waveguide， PCW）带隙边缘处发现克尔非线性效应会增强，从而影响另一束光信号。JANDIERI V 等［17］提出了一种基于非线性耦合光子晶体波导（Coupled Photonic Crystal Waveguide，C-PCW）带隙传输的全光逻辑与门，带隙传输使得时间孤子在每次逻辑运算期间都能保持稳定的脉冲包络。

设计光子晶体器件需要调整几何结构并迭代模拟，以逐渐接近目标响应［18］，然而受限于研究者的设计经验和仿真能力，传统方法只能调整有限的设计参数以寻求最佳结构。此外，大规模的光子晶体全光逻辑门需要多个PCW 紧密排列，根据需求设计PCW 也是实际工程面临的挑战。逆向设计可以快速搜索设计空间，更有效地获取目标光学器件的几何结构［19-21］。因此，逆向设计可以加快光学器件的变量分析与性能评估，为大规模集成光路设计提供支持。该方法已成功应用于各种非常规光子器件的设计，如光子晶体纳米腔［22］、等离子体波导系统［23］和纳米光子功率分配器［24］等。

本文采用神经网络作为辅助手段，设计出一种带隙传输的光子晶体全光逻辑门，以更加直观、有效的方式加速光子晶体的分析与设计。逆向神经网络模型可根据所需光学特性设计光子晶体全光逻辑门。采用时域有限差分法分析了该逻辑门在时域中的与（AND）和非（NOT）运算，仿真结果表明，该器件能保持稳定的脉冲包络，展现出较好的性能。

1 结构设计与网络模型

1.1 光子晶体结构设计

非线性光子晶体可在同一芯片上实现密集的全光信号处理，大大减小了光学逻辑门的器件尺寸。PCW是在光子晶体中引入线缺陷而形成的，频率在光子带隙内的电磁波受相邻未扰动光子晶体势垒的限制，被引导沿缺陷通道传播。特别地，若将两个或三个PCW 紧密放置，就会形成耦合光子晶体波导，光功率会从一个PCW 传输到另一个PCW［25］。

设计合理的C-PCW，可以利用克尔型非线性效应，实现基于带隙孤子传输的紧凑型全光逻辑门。这对PCW 提出了更高的要求：首先耦合光子晶体波导逻辑门需要有多个PCWs 在目标带隙上具有重叠的光子带隙；其次，多个PCWs 在色散曲线边缘的频率范围应当不同，这样可以防止线性区域的模式传播；最后，慢光的光约束力［26］是增强非线性效应的必要条件［27］。因此要想增强克尔非线性效应，需要PCW 在一定带宽内具有低斜率线性色散的特征。为了便捷、准确的设计出满足目标需求的PCW，本文搭建了神经网络光子晶体波导正向性能表征和逆向结构设计模型，以实现目标PCW 的性能评估与器件设计。

为了获取PCW 的光学性质，常见的方法是改变光子晶体周期结构排列和缺陷形状。图1 是光子晶体的结构设计，光子晶体周期为a，缺陷孔的半径r等于0.34a。改变靠近波导的第一排和第二排缺陷孔的位置和形状，实现PCW 光学特性的调控，其中d1和d2，d3和d4分别是第一排和第二排气孔的椭圆长轴和短轴；X1和Y1，X2和Y2分别是第一排和第二排缺陷相较三角晶格结构的横向与纵向偏移。然后，使用平面波展开法获取光子晶体的色散特性，并获取PCW 的慢光评价指标如群折射率（Group Index，ng）、带宽和归一化延迟带宽积（Normalized Delay-Bandwidth Product， NDBP）等，评估PCW 的性能。此外，为了设计光子晶体逻辑门，还提取了色散曲线边缘频率、相邻色散曲线的频率差和带隙宽度等光学参数。将几何结构参数和光学性能参数数字化编码，这有利于神经网络模型的数值预测。最后，使用差值扫描光子晶体波导结构参数，编写数据处理代码以获取PCWs 的结构参数及其光学性能指标，共提取了17 万组数据，训练集与测试集的比例为9∶1。

图1 光子晶体波导结构设计图Fig.1 Structure design of photonic crystal waveguide

1.2 深度学习模型

传统设计方法依赖研究者的经验推测PCW 的几何结构，并使用理论计算或者数值仿真获取其光学性能，但这种设计过程的效率低并且无法根据目标光学性质进行逆向预测。为了实现光子晶体波导的正向性能表征与逆向结构预测，本文搭建了神经网络模型（如图2 所示）实现光子晶体性能表征和结构设计。

图2 光子晶体波导正向性能表征与逆向结构预测模型Fig. 2 Forward performance characterization and inverse structure prediction model of photonic crystal waveguide

网络模型是使用Python 3.9.7 编程语言和TensorFlow 2.7.0 框架建立的，使用随机搜索优化神经网络的超参数，对比网络模型的性能评价指标，获得最佳的网络结构参数。正向性能预测模型的输入和输出分别是编码后的几何结构参数与光学性能参数。正向与逆向神经网络使用Intel Core i9-10940X 处理器和RTX 3080 Ti 显卡，训练时间分别为0.2 h 与0.36 h。

正向神经网络共有13 层全连接层，训练的总参数为197 612 个，通过随机搜索选取最佳的激活函数（Tanh）和优化器（Adamax）。如图3 所示，正向网络经过60 次训练后，均方误差（Mean Squared Error，MSE）为0.000 274，为了衡量网络预测值与真实值的偏差，采用决定系数作为评价指标，可通过式（1）计算决定系数R2。

图3 正向网络和逆向网络验证集的均方误差Fig.3 Mean squared error of the forward and inverse network verification sets

式中，Sres为残差平方和；Stot为总平方和；yˉ为真实数据的平均值；fi为第i个样本的预测值；yi为第i个样本的真实值。图4（a）展示了正向神经网络对ng的预测结果，决定系数为0.997，预测值与真实值呈现出斜率为1的直线，说明预测准确度良好。

图4 神经网络模型预测值与真实值的关系Fig.4 The relationship between the predicted value of the neural network model and the actual value

进一步地，逆向神经网络可以从目标光学性质逆向预测PCW 的几何结构，以满足实际工程的要求。该神经网络由26 层全连接层组成，总参数为155 704 个，输入为PCW 的目标光学性能，输出为光学结构参数。经过160 次训练，逆向网络的均方误差为0.000 353，决定系数为0.998（见图4（b）），表明预测值与真实值相匹配，证明了网络的准确性。当深度学习模型训练完成后，预测100 万组数据耗时3.5 min，此外保存深度学习模型后，进行预测将不受计算资源限制。因此，当深度学习模型训练完成，它可以在几秒钟内设计出所需的光子器件，从而提高设计效率。

接下来，演示逆向神经网络根据目标性能设计光子晶体逻辑门，由1.1 节可知，所提出的逻辑门利用带隙孤子传输，当输入信号的频率在光子带隙的边缘，逻辑门的输出端口会被其他输入信号非线性扰动。逆向神经网络能够根据带隙宽度、工作频率和慢光性能指标逆向预测出PCW 的几何结构参数。为了确保PCWs 能拥有重叠的带隙，设置PCW 的带隙宽度要大于0.01，并指定色散曲线的频率差值。PCW 的慢光效应能够降低光的群速度并增强非线性效应，因此设置ng在20～50 之间。根据这些要求，逆向设计的PCWs的色散曲线在0.259