陈祁 吕玉琳
摘要:本文将递归最小二乘法(RLS)推广到具有生物意义的随机HH神经元模型,通过训练网络的突触连接,对直线型和正弦型的目标函数进行学习. 发现离子通道的随机开关引起的内噪声会影响学习表现. 只有在适中的膜面积下,通过RLS训练的随机HH神经元网络才会取得良好的学习表现.
关键词:递归最小二乘法; 随机Hodgkin-Huxley模型; 神经网络; 内噪声; 膜面积.
中图分类号:G642;TN96-4文献标识码:A
文章编号:1009-3044(2022)02-0104-03
近年来,递归神经网络(RNN)的规模和应用更是与日俱增[1]。2001年,Jaeger提出了ESN方法[2]。2009年,Abbott等人改进并提出了FORCE方法[3],后续表明FORCE方法是一种富有潜力的研究方法[4]。
人工神经网络的研究往往离不开神经科学的发展. 1952年,Hogkin等人利用改进的电压钳方法,分析电流得到了HH模型[5]。后续表明内噪声源于离子通道是以随机的方式打开或关闭,这启发了本文对一定膜面积上内噪声的建模与研究[6]。
本文采用FORCE方法中常见的递归最小二乘法(RLS),对内含噪声的随机HH神经元构成的递归网络进行权重修改,从而讨论了不同膜面积下的网络学习表现。
1 模型
1.1 神经元电位模型
網络中第[i]个随机HH神经元的膜电位方程为
[CmdVitdt=-gLVit-VL-gNam3hVit-VrevNa-gKn4Vit-VrevK-Isynit-Iextit,]
其中[Cm]是膜电容,[Vit]是膜电位,[gL]和[VL]分别是泄漏通道的电导系数和反转电位,[gNa]和[VrevNa]分别是[Na+]通道的最大电导系数和反转电位,[gK]和[VrevK]分别是和[K+]通道的最大电导系数和反转电位,[m]、[h]和[n]分别为相应通道的门控变量,[Isynit]和[Iextit]分别是内部突触电流和外部输入电流。其中,外部输入电流[Iextit]采用的是泊松输入:
[Iextit=Qdtdt,]
其中,[Q]为单位面积上外部输入的电荷量,[t]是强度为[λ]的泊松过程。
1.2 门控变量模型
在式中,门控变量[m]、[h]和[n]的Langevin方程为
[dm=αmV1-m-βmVmdt+2αmVβmVNNaαmV+βmVdWm,dh=αhV1-h-βhVhdt+2αhVβhVNNaαhV+βhVdWh,dn=αnV1-n-βnVndt+2αnVβnVNKαnV+βnVdWn.]
其中[αmV]、[αhV]和[αnV]是门控变量打开速率,[βmV]、[βhV]和[βnV]是门控变量关闭速率,[NNa]和[NK]分别是[Na+]通道和[K+]通道的总数目,[Wmt]、[Wht]和[Wnt]是互相独立的维纳过程。其中门控变量[m]、[h]和[n]的打开速率与关闭速率根据以下经验公式
[αmV=0.1V+401-exp-V+40/10,βmV=4exp-V+65/18,αhV=0.07exp-V+65/20,βhV=1exp-V+35/10+1,αnV=0.01V+551-exp-V+55/10,βnV=0.125exp-V+65/80,]而离子通道的总数目为离子通道密度与膜面积[S]之积,即[NNa=ρNaS,NK=ρKS]。
1.3 突触电流模型
由[N]个神经元构成一个循环神经网络,神经元之间采用稀疏度为[p]的循环连接。本文中[N]取[200],[p]取[0.5]。
网络中第[i]个神经元所受到来自其他神经元的突触电流为:
[Isynit=j=1Nwijrjt.]
在式中,[wij]是第[i]个神经元接收到来自第[j]个神经元的连接权重强度,[rjt]表示在[t]时刻时第[j]个神经元的发放速率,它满足
[τrdrjtdt=-rjt+sjt;τddsjtdt=-sjt+i=1Ntki<tδt-tki. ]
其中,[τr]和[τd]分别表示突触rise和decay的时间常数,[δt]是Dirac-delta函数,[tki]是第[i]个神经元第[k]次脉冲发放时刻。
1.4 递归最小二乘法
递归最小二乘法(RLS)已被推广至速率神经网络[3]和脉冲神经网络[4],用于对突触权重进行训练,使得网络输出目标信号,进而对大脑活动与肢体行为之间的关系做出解释。
对于网络中第[i]个神经元的突触连接向量[wi=wi1,…,wiN],有
[witK+1=witK+fitK+1-witKrtK+1rTPtK+1]
其中末项[PtK+1=k=1K+1rtkrTtk+μIN-1]采用迭代计算
[PtK+1=PtK+PtKrtK+1rTtK+1PtKrTtK+1PtKrtK+1+1,]
2 主要结果
本节通过RLS方法训练随机HH神经元网络中的突触电流从而达到学习的目的,如果训练成功,训练后给神经元同样的刺激就能诱发出预期的反应。
训练时间轴与刺激电流参数如下:[0ms~450ms]是训练前的情况,[450ms~900ms]是训练结束后的情况,其中在[100ms~150ms]和[550ms~600ms]对给所有神经元施加外部泊松刺激。当刺激结束后的[200ms]内对网络内部连接权重使用RLS方法进行更新,共计训练[30]次。
2.1 目标函数的学习
对正弦函数进行学习。在膜面积[S=10μm2]时,目标函数[fit=Asinωit+φi],其中[ωi~U8π,10π],[φi~U0,2π],[A=0.2]。 在训练前后神经元所受突触电流(图 1A)和膜电位水平(图 1B)也大不相同。
在图 1中,训练前给神经元刺激,神经元的突触电流曲线与目标函数完全不吻合。 训练[30]次后,给神经元同样的刺激,神经元的突触电流曲线与目标函数完全吻合,即诱发出了预期的反应(图1A)。 训练前神经元发放是毫无规律的,训练[30]次后,神经元在目标函数取负值时不发放(图1B)。 随着训练次数的增加,突触权重的修改量总体上呈减小趋势,并且前几次训练的权重更新更加迅速(图1C)。
2.2 膜面积对学习的影响
在随机HH神经元中,细胞膜上离子通道的打开与关闭是随机的,由此产生的通道噪声的影响是不可忽略的。 为进一步探究膜面积与学习表现的关系,对当膜面积[S=0.5μm2,1μm2,3μm2,5μm2,][8μm2,9μm2,10μm2,20μm2,30μm2,50μm2]时分别做[30]次实验,记录相应的训练前误差[Isynpre-f]和训练后误差[Isynpost-f]以及训练前后误差之比[Isynpost-fIsynpre-f] (图 2)。这表明当膜面积[5μm2<S<20μm2]时,学习表现较优。 这与文献[8]中的结果一致,只有当膜面积适中时,随机HH神经元内部噪声既不足以干扰学习,又能打破脉冲发放同步性,还有助于避免过拟合,RLS方法将取得较好的学习表现。
3 讨论
在文献[4]中,由Theta模型,Leaky IF模型和Izhikevich模型构成的脉冲循环网络均能使用RLS方法更新权重以学习预先给定的目标函数。本文对更具有生物意义的随机HH神经元构成的循环脉冲网络也得到了类似的学习结果。 如果给予一定的刺激,神经元网络在训练后能给出预期的响应。 正如大脑的学习与记忆机制,给予恰当的刺激便能唤起相应记忆。
数值结果表明训练后的网络神经元发放具有一定规律,但当目标函数取得负值时,网络神经元几乎不发放(图 1B)。 而图 1C表明突触权重的改变量与学习误差均会随着训练次数的增加而越来越小并趋于稳定。这与文献[3]中的结果一致,符合RLS方法主要依赖前几次权重更新的特点。进一步研究发现,由离子通道内噪声会显著影响学习效果:只有当膜面积适中([5μm2<S<20μm2])时,学习表现较理想(图 2C)。
参考文献:
[1] Robinson T,Fallside F.A recurrent error propagation network speech recognition system[J].ComputerSpeech&Language,1991,5(3):259-274.
[2] Jaeger, Herbert. The “echo state” approach to analysing and training recurrent neural networks-with an erratum note. Bonn, Germany: German National Research Center for Information Technology GMD Technical Report 148.34 (2001): 13.
[3] Sussillo D,Abbott L F.Generating coherent patterns of activity from chaotic neural networks[J].Neuron,2009,63(4):544-557.
[4] Nicola W,Clopath C.Supervised learning in spiking neural networks with FORCE training[J].Nature Communications,2017,8:2208.
[5] Hodgkin A L,Huxley A F,Katz B.Measurement of current-voltage relations in the membrane of the giant axon of Loligo[J].The Journal of Physiology,1952,116(4):424-448.
[6] Skaugen E,WalløeL.Firing behaviour in a stochastic nerve membrane model based upon the Hodgkin-Huxley equations[J].Acta Physiologica Scandinavica,1979,107(4):343-363.
[7] StrassbergAF,DeFeliceLJ.Limitations of the Hodgkin-Huxley formalism:effects of single channel kinetics on transmembrane voltage dynamics[J].Neural Computation,1993,5(6):843-855.
【通聯编辑:李雅琪】
1296501705345