柯 特,朱 盈,彭楚宇,胡 晓,肖 希
(中国信息通信科技集团有限公司 光纤通信技术和网络国家重点实验室,武汉 430074)
人工神经网络(Artificial Neural Networks,ANN)是一种运算模型,用以对生物神经系统结构和功能进行抽象和模拟,在信息处理和模式识别等领域发挥着重要作用[1]。现代神经科学的实验表明,许多生物神经系统都采用神经元发放脉冲的时间来编码信息[2-3],脉冲信号在神经系统中的运动是大脑进行思维的基础[4]。因此,根据现代神经科学的最新研究成果,更具生物可解释性的第3代ANN——脉冲神经网络(Spiking Neural Networks,SNN)应运而生。SNN具有计算量小、对噪声鲁棒性强的优势,其应用已涉及信息处理的各个领域并取得了较大进展。SNN适合于硬件实现,近十年来随着光学器件技术和工艺的进步,结合光学优势克服电学瓶颈的光子SNN正逐步取得发展。
本文介绍了脉冲神经元的建模机制,SNN的学习机制和软硬件实现,重点介绍了光子SNN基于不同光学器件的实现方案,进而对光子SNN的发展进行总结与展望。
生物神经元具有对内外刺激做出响应的能力,而脉冲神经元模仿生物神经元的工作模式,图1 所示为脉冲神经元模型。图1(a)展示了一个生物神经元通过大量的树突接收其他神经元的轴突发放的各不相同的动作电位,即脉冲序列,并对它们进行整合从而使得轴突发放一定时间间隔的输出脉冲序列,该输出脉冲序列又成为与之连接的下一个神经元的输入脉冲序列。真实的生物神经元形态和动力学特征十分复杂,对其进行高维建模则很难进行数学分析,不利于大规模SNN的组网和研究,因此,研究者对脉冲神经元建立了状态变量微分方程模型并对其进行简化从而提出多种影响较大的脉冲神经元模型[5-16],图1(b)所示的泄露积分发放(Leaky Intergrate-and-Fire,LIF)神经元模型是目前普遍公认的在生物真实性和实现简化性方面取得最佳平衡效果的神经元模型[17],长期以来在包括光子SNN的神经计算领域得到了广泛的应用。
脉冲神经元的连接构成了SNN,在SNN的学习机制方面,通常认为具有两种学习机制:即在无标签数据的情况下进行无监督训练和在标签数据的情况下进行监督训练。在无监督学习中,脉冲时序依赖可塑性(Spike-Timing-Dependent Plasticity,STDP)算法与生物学习机制密切相关[18-20],是一种基于突触前脉冲和突触后脉冲的时序来调整神经元之间连接强度的机制[21-24],图1(c)所示当突触前脉冲先于突触后脉冲发放(tpre
图1 脉冲神经元模型
在基于软件实现SNN方面,北京大学信息科学技术学院数字媒体所媒体学习组和鹏城实验室联合开发了SpikingJelly框架,该框架基于PyTorch并采用SNN进行深度学习,已应用于物体检测任务并实现了较好的效果[33]。此外,Eshraghian团队[34]开发的SNN深度学习框架snnTorch亦被深度学习界广泛使用。但使用上述框架在图形处理器(Graphics Processing Unit,GPU)等通用硬件上对数据集进行训练时,数据集的“0-1”脉冲序列编码被GPU等通用硬件当作普通实值进行矩阵运算,从而无法体现SNN的优势。
在基于硬件实现SNN方面,具有代表性的成果包括:英国曼彻斯特大学的SpiNNaker[35]、德国海伦堡大学的HiCANN[36]、美国斯坦福大学的Neurogrid[37]、IBM公司的True-North[38]、Intel公司的Loihi[39]、我国浙江大学的Darwin[40]以及清华大学的Tianjic[41],以上神经形态的硬件实现摒弃冯·诺依曼架构而采用存算一体的方式并结合SNN设计,实现学习、感知、推理和预测的人工智能行为。然而,受限于电子瓶颈以及摩尔定律的放缓,电子类脑硬件难以进一步提高SNN的计算速度和能效[42]。
相较于传统电子计算芯片面临制程接近摩尔定律极限所带来的瓶颈和约束,光具有高带宽、高速率、低延时和低功耗的优良特性,因而利用光的上述优势集成光子SNN,进而实现学习、感知、推理和预测等功能,已成为当今信息处理领域多学科融合的热门方向,国内外的多个研究团队开展了深入研究并已取得较为丰富的成果。本文以下内容将介绍多种光子SNN,按照实现器件分类,包括半导体光放大器(Semiconductor Optical Amplifier,SOA)实现方案、电吸收调制器(Electro Absorption Modulator,EAM)实现方案、激光器实现方案、微环实现方案以及其他实现方案。
2009年,美国普林斯顿大学Fok研究团队[43]首次提出了光子LIF神经元,开辟了光子SNN的研究领域。经过多次完善,2011年,该团队设计了图2所示的实验来实现基于SOA的光子LIF神经元[44],其核心思想是建立SOA载流子密度变化和LIF神经元膜电位变化之间的对应关系来实现光子LIF神经元。输入脉冲经可调光衰进行加权和可调延时线进行延时后通过50∶50耦合器耦合形成一路输入信号(图2中A处),输入信号与波长为λ1的采样脉冲同步进入SOA。由于采样脉冲的能量很小,因此它对SOA增益的影响相比输入信号可忽略不计。由于SOA内部的交叉增益调制(Cross Gain Modulation,XGM),输入信号会导致SOA的增益突然下降,SOA输出的采样脉冲(图2中B处)能量随之降低;随后SOA的增益逐渐恢复,采样脉冲的输出功率也逐渐提升。SOA输出处的带通光谱滤波器使得只有波长为λ1的采样脉冲经掺铒光纤放大器(Erbium Doped Fiber Amplifier, EDFA)放大和偏振控制器(Polarization Controller, PC)后输出至由长度为10.5 m的高掺杂GeO2(HD)非线性光纤所构成的阈值判决器1,对低于设定阈值的光信号进行过滤从而输出清晰的脉冲序列,然后由太赫兹光非对称解复用器(Teraherz Optical Asymmetric Demultiplexer, TOAD)对阈值判决器1的输出(图2中C处)进行反转,阈值判决器1的输出脉冲作为TOAD的控制信号,在该控制信号所制造的转换窗口内波长为λ2的采样脉冲作为TOAD的输出信号从而实现信号的反转。TOAD的反转作用实现了光信号的恢复,使得输出波长完全独立于输入波长。此外,由于对信号的反转会带来一定程度的信号劣化,在神经网络的传播过程中这种劣化会积累进而导致类脑计算错误,从而在TOAD的输出端对光信号进行第二次阈值处理。
图2 基于SOA的光子LIF神经元[44]
上述实验虽然实现了基于SOA的光子LIF神经元模型,但两个阈值判决器使得LIF神经元模型的实现过于复杂和昂贵,且没有实现对神经元的抑制性输入。针对上述问题,该团队提出了图3所示的基于SOA的对称光子神经元结构[44]。该结构包含两个SOA,SOA1接收兴奋性输入,SOA2在接收抑制性输入的同时接收SOA1的输出。基于SOA的对称光子神经元的输出可以视为单独兴奋性输入和单独抑制性输入结果的叠加,当且仅当兴奋性输入存在而抑制性输入不存在时,基于SOA的对称光子神经元才发放脉冲。
图3 同时接收兴奋性输入和抑制性输入的对称光子神经元结构[44]
基于SOA的光子脉冲神经元性能受载流子生存时间和脉冲发放后恢复时间的影响,现代SOA的载流子生存时间可低至10 ps,恢复时间可低至25 ps,实验所用SOA的恢复时间从小于100 ps到近似500 ps,可输出皮秒级脉宽。
与此同时,国内也有北京大学和西安电子科技大学等高校开展了相关研究。2015年,北京大学赵建业教授团队[45]进行了基于SOA的光子STDP的实验,其实验结构框图如图4所示。锁模激光器(Mode-locked Laser,MLL)作为脉冲源,其输出光经两个带通滤波器输出波长为λ1和λ2的光并分别被用作突触前脉冲和突触后脉冲,两束光之间的相对时延由一个可变光延迟线(Optical Delay Line,ODL)控制,突触前脉冲和突触后脉冲由一个90∶10的光耦合器分开,形成的强脉冲作为信号脉冲,弱脉冲作为探测脉冲,突触前探测脉冲和突触后信号脉冲进入SOA1,突触前信号脉冲和突触后探测脉冲进入SOA2,信号脉冲进入SOA之前,通过电流注入对应于载流子密度的SOA增益被保持在一个常数值,信号脉冲进入SOA之后,载流子密度由于受激发射而下降,这个持续数ps的过程被称为增益饱和。脉冲通过后,表征SOA增益的载流子密度将由来源于外部电流注入的载流子而恢复,一般恢复时间将持续几百ps,增益恢复的动态特性由探测脉冲采样,探测脉冲通过光带通滤波器从SOA的输出提取,然后通过光电探测器(PhotoDetector, PD)探测。图5所示为基于SOA的光子STDP实现机制,如果探测脉冲在信号脉冲到来之前进入SOA(图5中Ⅱ、Ⅲ所示),那么探测信号被正常放大且不被载流子损耗所影响,如果探测脉冲在信号脉冲之后的几百ps以内到达SOA(图5中Ⅰ、Ⅳ所示),那么此时探测信号的输出功率将弱于正常放大的功率,SOA1构成图5(左)的波形,SOA2构成图5(中)的波形,SOA1构成的波形和SOA2构成的波形相减之后形成图5(右)所示的STDP特征。该团队所用MLL脉冲发放频率为100 MHz,因此脉冲发放间隔为10 ns,远大于实验所用SOA的恢复时间25 ps,突触前脉冲和突触后脉冲的相对时延Δt在-400~400 ps之间可调。
图4 基于SOA的光子STDP实验结构框图[45]
图5 基于SOA的光子STDP实现机制[45]
2021年,我国西南大学邓涛教授团队[46]提出利用垂直腔半导体光放大器(Vertical-Cavity Semiconductor Optical Amplifier, VCSOA)对上述实验进行改进,相比于传统的平面SOA,VCSOA所需的偏置电流和输入功率都更低。
2012年,美国普林斯顿大学Fok研究团队[47]提出了一种混合模/数的光子脉冲神经元,并首次利用EAM构建光子脉冲神经元,其实现原理图如图6所示,该光子脉冲神经元由一个作为积分器的EAM、一个基于四波混频(Four-WaveMixing, FWM)的异步脉冲源发生器以及一个基于高锗掺杂非线性环路镜(Ge-doped NLM)的阈值判决器组成。图6中Ⅰ处波长为1 550.12 nm的N路输入信号进行加权和延时并由图6中Ⅱ处的光耦合器进行耦合。图6中Ⅲ处所示少部分混合信号通过FWM构成脉冲光源,一个分布反馈式激光器二极管(Laser Diode, LD)发出1 547.21 nm的连续波光信号作为FWM的泵浦,当输入信号和泵浦同时存在时FWM发生,由此新产生的1 544.30 nm波长的光信号构成了脉冲光源。图6中Ⅳ所示混合信号和脉冲光源的发光进入EAM,输入信号的能量积累于EAM,EAM的输出表征脉冲源的强度。EAM的输出脉冲进入图6中Ⅴ处的阈值判决器,阈值判决器滤除低于阈值的弱脉冲,高于阈值的强脉冲则以图6中Ⅵ处的阈值输出。该团队的研究成果使得神经元的输出不再受限于脉冲源的采样速率,实现了神经元的异步响应。信号在EAM的累积基于负偏置EAM的有限交叉调制恢复时间,负偏置越大相应的恢复时间越低。该团队所用EAM负偏置最大可调至-3 V,相应恢复时间最低可为约10 ps,产生50 ps的累积窗口进而实现ps级的脉宽。
图6 基于EAM的异步光子脉冲神经元的实现[47]
2013年,该研究团队利用具有饱和吸收体的EAM和SOA完成了STDP的ps级实现[48],其实验结构框图及实现机制图如图7所示。图7(a)所示突触前脉冲和突触后脉冲分离,突触前脉冲绝大部分进入EAM,突触后脉冲绝大部分进入SOA。图7(b)中Ⅰ所示当突触后脉冲先于突触前脉冲发放时,突触后脉冲进入SOA导致SOA增益的迅速下降,如果突触前脉冲紧随突触后脉冲到来,那么SOA的输出功率会最低,反之,如果突触前脉冲的发放时间远在突触后脉冲发放时间之后,那么随着时间的增加SOA的增益会逐渐恢复,SOA的输出功率也会增加,此时对于EAM,图7(c)中Ⅲ所示由于EAM反向偏压的存在,在突触前强脉冲到来之前EAM无法对突触后弱脉冲进行饱和吸收,导致EAM的输出功率很低。图7(b)中Ⅱ所示当突触前脉冲先于突触后脉冲发放时,突触弱脉冲不会导致SOA增益下降,因此输出功率保持不变,对于EAM,图7(c)中Ⅳ所示当突触后脉冲紧随突触前脉冲到来时,强烈的饱和吸收作用于突触后脉冲导致EAM输出强脉冲,由于反向偏压的存在,EAM的吸收逐渐建立,导致突触后脉冲的输出功率逐渐降低。将图7中Ⅰ~Ⅳ所实现的效果线性叠加即可实现(图7(d)所示)基于SOA和EAM的光子STDP,实验所用突触前脉冲和突触后脉冲的功率都为10 dBm左右,脉宽都为5 ps左右,相对时延在-300~300 ps之间可调。
图7 基于SOA和EAM实现光子STDP[48]
2.3.1 DFB激光器实现方案
2013年,美国普林斯顿大学Nahmias团队[49]首次提出利用嵌入可饱和吸收(Saturable Absorber, SA)的分布反馈式(Distributed FeedBack,DFB)激光器(DFB-SA)和光电探测器来模拟LIF神经元模型,其实验结构框图及原理图如图8 所示。图8(a)所示该模型主要由3个部分组成:两个PD和1个激光器,PD接收的兴奋性输入和抑制性输入综合作用产生可以调制激光器增益模块载流子注入的输入电流并通过SA输出光脉冲。DFB-SA作为阈值判决器和脉冲生成器其行为类似于真实的生物神经元轴突。图8(b)所示输入脉冲作用于PD产生的电流扰动调制增益,足够的兴奋积累导致脉冲的输出,紧随而来的是一个短暂的不应期,与此伴随的是增益载流子浓度的下降和SA载流子浓度的上升。2015年,该研究团队继续对上述实验进行扩展[50],图8(c)所示通过波分复用(Wavelength Division Multiplexing, WDM)技术多路输入脉冲在同一波导传播,通过一组可调光谱滤波器对不同波长的脉冲信号在光域进行兴奋加权或抑制加权后再次集成在同一波导进入平衡光电探测器(Balanced PhotoDetector, B-PD)。WDM技术的使用实现了神经元的多路输入进而可实现光子脉冲神经元的大规模片上集成。2020年,该团队进一步将基于DFB-SA的LIF神经元模型集成到Ⅲ-Ⅴ族光子集成电路中[51]。
图8 基于DFB-SA实现LIF神经元[49-50]
2020年,我国上海交通大学邹卫文教授团队[52]使用DFB-LD实现了基于单波长的光子STDP,其实验结构框图和结果曲线如图9所示。图9(a)所示输入波形由任意波形发生器(Arbitrary Waveform Generator, AWG)提供,DFB-LD由一个具有150 kHz外部调制带宽的LD控制器驱动,随后的可调光衰用于调整B-PD的输入光功率,最后由示波器监控输出信号。图9(b)和9(c)所示低幅度的脉冲为突触前脉冲,高幅度的脉冲为突触后脉冲。当突触后脉冲先于突触前脉冲发放时,B-PD的输出有两个波峰,两个波峰幅度之差构成了图9(d)所示的STDP曲线tpost-tpre<0的部分。当突触前脉冲先于突触后脉冲发放时,B-PD的输出有一个波峰,该波峰的幅度构成了图9(d)所示的STDP曲线tpost-tpre>0的部分。图9(e)所示当突触后脉冲幅度上升时STDP曲线随之整体上升。图9(f)所示突触前脉冲幅度上升时,STDP曲线tpost-tpre>0的部分保持稳定而tpost-tpre<0的部分会下降,因此可以将突触前脉冲和突触后脉冲的幅度作为可调参数来调节STDP曲线。
图9 基于DFB-LD实现光子STDP[52]
2.3.2 嵌入石墨烯可饱和吸收体(GSA)的可激发激光器实现方案
2013年,美国普林斯顿大学Shastri等人[53]首次提出基于可饱和吸收体(Graphene Saturable Absorption,GSA)的可激发激光器实现光子脉冲神经元,其实现原理图如图10所示。该团队进行了图10(a)所示的实验,波长为980 nm的泵浦光经由一个980/1 550 nm的WDM耦合器进入掺铒光纤(Erbium Doped Fiber, EDF)以保持其载流子浓度,用以放大通过1 480/1 550 nm的WDM耦合器进入环路的兴奋性脉冲。隔离器确保激光器中光信号的单向传输。激光器的脉冲通过一个80∶20的耦合器输出。图10(b)所示的结果验证了当有足够的兴奋性光(蓝色)输入石墨烯增益区提升了载流子浓度后,环路将激射出脉冲(红色)。
图10 石墨烯可激发激光器的实现[53-54]
2016年,该团队在前期实现石墨烯可激发激光器作为LIF神经元的基础上实现了简单时间模式检测任务[54],其原理图如图11所示。两个石墨烯可激发激光器级联,输入为一对时间间隔为Δt的脉冲,脉冲经过第一个激光器后通过数千米长的单模光纤(Single Mode Fiber, SMF)产生延时τ,当Δt≈τ时第2个激光器发放脉冲,两个激光器之间通过一个PD而非直接的光输入用以调制激光驱动器,这种PD驱动架构有利于大规模片上神经网络的实现。与此同时,该团队还实现了基于石墨烯可激发激光器的LIF神经元实现反馈回路,其原理图如图12所示。通过作为延时单元的SMF将输出反馈给输入,电加权单元控制光/电探测器的调制深度,用以根据是否高于阈值来提供全响应或无响应。脉冲可以在反馈回路中循环传播。反馈回路的实现表明基于石墨烯可激发激光器的LIF神经元具备多级联和信息记忆的能力,这种能力是实现多层神经网络进而实现复杂信息处理任务的基础。
图11 基于石墨烯可激发激光器的LIF神经元实现时间模式检测任务[54]
图12 基于石墨烯可激发激光器的LIF神经元实现反馈回路[54]
2018年,该团队在前期实现基于石墨烯可激发激光器的LIF神经元基础上对实验进行了进一步的改进[55],其原理图如图13所示。
图13 同时接收兴奋性输入和抑制性输入的石墨烯可激发激光器[55]
AWG1调制一个1 480 nm的LD来生成兴奋性输入,AWG2调制一个980 nm的LD来生成抑制性输入,此时的EDF没有额外的泵浦输入。实验表明兴奋性输入会导致脉冲输出,当抑制性输入在时间上先于兴奋性输入且逐渐接近兴奋性输入时,脉冲输出逐渐被压制到0。
2.3.3 垂直腔面发射激光器实现方案
2013年,美国普林斯顿大学Nahmias团队[56]首次提出嵌入SA的垂直腔面发射激光器(Vertical-Cavity Surface-Emitting Laser, VCSEL)(VCSEL-SA)光子脉冲神经元,并从理论上提出这种低功耗、小面积和便于大规模集成的嵌入SA的可激发激光器具有LIF神经元的动力学行为,其结构示意图如图14所示。来自光纤系统的多路输入波长(λ1,λ2,…,λk)信号通过光栅耦合器耦合向下进入VCSEL-SA,不同波长的光信号各自产生兴奋或抑制激励,波长为λ0的激励脉冲沿VCSEL-SA朝上输出。2015年,该团队进一步通过SPICE分析从理论上提出了基于VCSEL-SA的光子脉冲神经元等价电路模型[57],并在此基础上进一步验证了该等价电路模型的脉冲输出神经元动力学特性。2017年,我国西南大学邓涛团队[58]设计实验验证了两个互连的VCSEL之间可以实现可控的脉冲传输。
图14 VCSEL-SA结构示意图[56]
2019年,西安电子科技大学项水英教授团队从理论上提出利用VCSEL和VCSOA设计双层光子SNN以实现基于无监督算法的任意脉冲模式识别[59],其结构示意图及原理图如图15所示。图15(a)所示为嵌入SA的VCSEL构成LIF神经元(VCSEL1,VCSEL2,…,VCSELn),突触连接权重(W1,W2,…,Wn)通过由前所述基于VCSOA实现的STDP阵列进行调整。图15(b)所示为神经网络仿真学习过程,时空脉冲发放时刻固定(t1、t2),训练过程中噪声脉冲发放时刻随机(t3),突触后神经元的脉冲发放时刻(t4)逐渐收敛到首脉冲发放时刻t1,图15(c)所示随着学习的进行突触后脉冲发放时刻(Post-Synaptic Spike Timing, PST)、突触连接权重(w1、w2、w3)逐渐收敛至固定值,PST与目标脉冲输出时刻之差sdm逐渐收敛到0,由此验证了基于光子STDP的学习规则对噪声的鲁棒性,同时该团队还验证了由于噪声脉冲发放时刻具有随机性,因此实际需要更多的学习周期以达到收敛,更多的突触前神经元、VCSOA的输入波长接近谐振腔的谐振波长以及提升学习速率有利于提升神经网络的性能,VCSOA更高的偏置电流亦有利于提升神经网络的性能但要考虑平衡功耗。
图15 基于VCSEL和VCSOA实现无监督任意脉冲模式识别的光子SNN[59]
2021年,该团队在上述工作的基础上进一步提出基于VCSEL-SA和VCSOA的光子SNN实现监督学习分类任务[60],其结构示意图如图16所示。“0-9”为待识别的10种输入模式并在实际训练时对输入模式加上噪声后进行时空编码构成输入层神经元(PRE1, PRE2,…,PRE-IN)的输入,每种输入模式由20×20的像素所构成,监督信号为目标脉冲,神经网络的训练由基于STDP和anti-STDP规则的ReSuMe算法来执行。输入层神经元的输入、监督信号以及由输出层神经元输出构成的脉冲反馈共同作用通过上述算法训练神经元的连接权重wij。随着训练的进行输出层神经元(POST1,POST2,…,POST-O)脉冲发放时刻会逐步收敛,最终实现根据输出层神经元的脉冲发放时刻识别对应的输入模式。
图16 基于VCSEL-SA和VCSOA实现监督学习分类任务的光子SNN结构示意图[60]
同年,该团队在传统权重学习基础上引入突触延时可塑性,实现了基于VCSEL-SA的光子SNN[61]和基于VCSEL-SA的二进制卷积光子SNN[62],实现了利用基于VCSEL-SA的光子SNN实现数独求解器[63]。2022年,该团队又实现了基于VCSEL-SA的光子SNN用于运动识别和方向识别[64]以及基于VCSEL-SA的多层光子SNN[65]。表1所示为基于激光器的光子脉冲神经元关键性能参数。
表1 基于激光器的光子脉冲神经元关键性能参数
2.3.4 其他激光器实现方案
2011年,比利时布鲁塞尔自由大学Coomans团队[69]提出基于半导体环形激光器的光子脉冲神经元,并从理论上提出通过光注入触发脉冲在可激发非对称的半导体环形激光器内部触发脉冲的可能性。2013年,葡萄牙阿尔加维大学Romeira团队[70]提出包含了由纳米级双势垒量子阱共振隧道二极管所驱动的LD组成光电集成电路在1 550 nm工作波长条件下生成ns级光脉冲的能力;2022年,英国斯特拉斯克莱德大学Hejda团队[71]进一步提出了基于共振隧道二极管的光子SNN,在时空脉冲模式分类任务中实现了94%的分类准确率;2013年,比利时根特大学Alexander团队[72]提出基于微盘激光器的光子脉冲神经元,同年该团队从理论上验证了微盘激光器可以对来自其他微盘激光器的兴奋性脉冲做出响应[73]。2014年,法国巴黎第七大学Braive团队[74]提出基于嵌入SA的微柱激光器具有神经元的兴奋性行为,验证了在单脉冲扰动下激光器可以产生亚纳秒的响应脉冲并分析了激光器泵浦偏置的作用、双脉冲激发条件下激光器的绝对和相对不应期,以及由载流子动态特性所调制的抑制动态;2019年,同样来自该机构的Pammi团队[75]继续验证了单个和耦合的微柱激光器的计算能力以及通过可调时延和脉冲碰撞来执行时间模式识别;2016年,希腊雅典国立卡波蒂斯坦大学Mesaritakis团队[76]提出一种半导体量子点被动MLL来实现神经元的兴奋性和抑制性行为,该实现方式仅需简单地调整激光器内置SA的反转电压而无须使用复杂的电/光转换结构。2019年,同样来自该机构的Sarantoglou团队[77]验证了半导体量子点被动MLL具有将兴奋性信号和抑制性信号分别在各自波段内进行光脉冲编码来实现真正的抑制性神经元的能力;2022年,我国西安电子科技大学项水英教授团队[78]提出基于SA的法布里佩罗激光器来实现光子脉冲神经元并通过实验验证了其具有时间积分、门限判决、脉冲生成以及不应期的LIF神经元特性,并进一步提出通过时分复用脉冲编码来实现基于光子SNN的模式识别任务。
2012年,比利时根特大学Van Vaerenbergh团队[79]从理论上验证了当输入波长接近微环谐振器共振波长时足够高的输入功率会加热微环,由此产生的热光效应会形成双稳态性能,此外由于光可以产生改变折射率系数的自由载流子,因此高品质系数的微环甚至可以自激发脉冲。微环的这种双稳态性能和可以自激发脉冲的能力使得绝缘硅上微环可以实现脉冲神经元的特性;2013年,该团队继续从理论上验证了微环的动态特性可以用于设置脉冲在级联的两个微环间传播的时延用以实现SNN的训练算法,为基于微环谐振器的更大规模SNN的实现奠定了基础[80];2018年,美国普渡大学Chakraborty团队[81]提出基于顶部嵌入相变材料Ge2Sb2Te5(GST)的微环谐振器作为光子脉冲神经元,其结构示意图及原理图如图17所示。图17(a)所示为其结构示意图,初始状态的GST为晶态,满足谐振条件的“写”脉冲从INPUT端口耦合进入环形波导作用于GST导致其晶度降低非晶化提升最终到达非晶态,相应地,在“读”阶段随着GST晶度的降低谐振光波从THROUGH端口导出的比例相对降低而从“DROP”端口导出的光波相对提高。图17(b)所示为DROP端口的传输特性,这种仅改变GST的晶度即可控制光波传输比例的机制构成了“积分-发放”脉冲神经元模型。在此基础上该团队进一步将两个嵌入GST的微环谐振器组合成一个可同时接收正输入和负输入的单个神经元(如图17(c)所示),输入脉冲通过两个微环谐振器的“DROP”端口和“THROUGH”端口分别进行正积分和负积分,通过移相器Φ形成的合成脉冲的幅度为两者之差,神经元膜电位的积分与合成脉冲的幅度成比例。脉冲的发放由图17(c)的“输出单元”来执行,该结构包含一个光放大器,一个环行器,以及一个顶部嵌入初始状态为晶态的GST的矩形波导。对嵌入GST的矩形波导而言,当GST处于晶态(非晶态)时,其传输率较低(高)。对积分单元和输出单元而言,“读”、“写”周期逐次循环进行,在神经元积分单元的“写”周期内,“读”脉冲通过发放单元。另一方面,在神经元积分单元的“读”周期内,“读”脉冲依次通过微环谐振器和放大器后形成的脉冲写入位于输出单元嵌入于波导的GST。环行器用于引导进入和离开矩形波导的脉冲。当位于积分单元的GST处于初始晶态时,光放大器的输出不足以使矩形波导内的GST非晶化,因此此时的脉冲无法通过矩形波导,然而,在若干“写”脉冲的作用下,膜电位的积分超过阈值后光放大器的输出足以使矩形波导内的GST非晶化进而可以实现脉冲的输出。一旦神经元实现脉冲输出,“复位”脉冲将会传递,使得神经元恢复初始状态。该团队利用这种同时包含积分单元和输出单元的光子脉冲神经元构建了3层全连接的SNN用以对MINIST数据集进行训练,实现了98.06%的识别准确率。
图17 基于嵌入GST微环谐振器的光子脉冲神经元[81]
2019年,德国明斯特大学Feldmann团队[82]提出并制造出集成可塑突触(图18(a)所示)的全光SNN,其结构图如图18所示。神经元之间突触连接的权重通过集成于光波导顶部的相变材料(Phase Change Material,PCM)来改变,多路不同波长(λ1,λ2,…,λN)的输入加权后经微环谐振器以及WDM多路复用器(图18(b)所示)集成于单波导后进入集成PCM胞体(图18(c)所示)的环形谐振器(图18(d)所示),足够的功率将导致环形谐振器输出脉冲,以上的过程同样构成了“积分-输出”的脉冲神经元模型。通过调整上述所述单个神经元(图18(e)所示)的输入权重即可实现最简单的基于监督学习与非监督学习的模式识别任务,进一步地集成多个上述神经元构成多层SNN可实现更为复杂的模式识别任务。
图18 基于相变材料和微环谐振器的全光脉冲神经网络[82]
2022年,美国普林斯顿大学Jha团队从理论上验证了一种互补金属氧化物半导体(Complementary Metal Oxide Semiconductor,CMOS)兼容的集成石墨烯硅基微环谐振器光子脉冲神经元[83],其结构示意图如图19所示。该团队从理论上验证了石墨烯的克尔效应和饱和吸收可以提升神经元的非线性效应。
图19 与硅总线波导耦合的混合石墨烯硅基微环示意图[83]
同年,西安电子科技大学项水英教授团队提出一种基于Add-Drop型微环谐振器的光子脉冲神经元[84],图20所示的基于Add-Drop型微环谐振器的光子脉冲神经元的动力学模型表现为“共振-输出”,这种光子脉冲神经元没有明确的脉冲发放阈值门限,任意强度的光扰动输入在光泵浦的作用下即可产生一个输出脉冲,这种特性对于光时序编码SNN是重要的实现机制。同时,该团队还验证了这种Add-Drop型微环谐振器在突触强脉冲的作用下对随后到来的弱脉冲产生强烈的非线性效应,由此实现了光子STDP。此外Add-Drop型微环谐振器还具有权重配置的功能,Add-Drop型微环谐振器具有较大的热光系数使得温度的变化和折射率的变化有着近似线性的关系,折射率的变化进一步导致共振波长的变化,最终导致Drop端口的输出发生变化,产生权重在[0,1]范围内可调的效果。基于以上成果该团队实现了基于Add-Drop型微环谐振器的光子脉冲神经元构成的神经网络,采用基于权重的ReSuMe延时学习算法进行脉冲序列学习并实现了收敛,同时该团队还验证了初始权重、门限功率和学习速率对神经网络性能有影响,对其进行合理的设置有助于提升网络性能。表2所示为基于微环谐振器的光子脉冲神经元关键性能参数。
图20 基于Add-Drop型微环谐振器的光子脉冲神经元[84]
表2 基于微环谐振器的光子脉冲神经元关键性能参数
除上述方案之外,2020年,我国西南大学吴加贵研究员团队[86]提出了基于硅基光子微腔的光子脉冲神经元,验证了微驱动谐振器的调制效应可以生成神经形态光脉冲;同年,我国上海交通大学苏翼凯教授团队[87]提出了基于无源微谐振器的光子脉冲神经元,该团队利用微谐振器的非线性特征来实现脉冲神经元,并表现出了脉冲神经元的激发门限特性、不应期特性和级联特性;2021年,波兰华沙大学Tyszka团队[88]通过实验验证了在激子极化激元的脉冲非共振激发状态下半导体微腔具有LIF神经元的行为。
总体来看,基于SOA和EML的光子神经元为早期的实现方案,技术成熟,但SOA和EML存在体积较大难以集成的问题。基于激光器实现光子脉冲神经网络的方案众多,但还是受制于“光-电-光”的转换效率,且从大规模集成的角度来看激光器的体积仍然偏大。基于相变材料和微环谐振器的方案是近年的研究趋势,微环谐振器体积小容易集成,但受制于微环谐振器的控制难度和相变材料的寿命,该方案仍待进一步完善与优化。
SNN的硬件化是实现其强大智能算力的重要途径,同时,光具有高速、低功耗和大带宽等特性,因此光子SNN具有比生物大脑快千万倍乃至十亿倍的运算速度和推理能力的潜力。总体来看,由于人类对神经科学和类脑机制的研究还处于初始阶段,因此现阶段光子SNN的理论模型和训练算法仍与真实生物神经元的运行机制存在较大差异;其次,现阶段光子SNN的物理实现还主要以单个分离光学器件实现神经元和突触为主,整体网络的性能探索和研究多基于仿真,实现真正的大规模集成光子SNN还需克服器件体积大、加工难度高,以及不同功能的光学器件难以耦合等各种难题;最后,现阶段光子SNN的训练和控制仍然要通过电子芯片来实现,这也使得光子SNN的整体性能将仍然受限于电学硬件的瓶颈。
综上,光子SNN涉及人工智能、计算科学和光电集成等多个领域,需要从底层的材料器件,中间的系统架构,到上层的算法实现来进行多层次、跨领域的交叉研究和发展。未来,随着光子技术的不断进步与突破,光子SNN的实现有望往大规模、集成化、可编程、低功耗和低成本的方向演进,越来越多地适用于数据中心和自动驾驶等复杂场景。