Elman神经网络在中子解谱中的应用

2020-06-03 10:55莫双荣幸浩洋朱敬军
关键词:能谱中子探测器

莫双荣, 刘 钰, 幸浩洋, 朱敬军, 张 乐, 王 桢

(1. 四川大学原子核科学技术研究所 辐射物理及技术教育部重点实验室, 成都 610064;2. 四川大学物理学院, 成都 610064)

1 引 言

宇宙中的暗物质一直是基础物理研究领域的一个谜, 随着理论物理和实验工作的不断探索, 目前WIMPs(弱相互作用粒子)粒子是被认为最可能的暗物质粒子. 位于我国四川西昌的锦屏地下实验室(China Jinping Underground Laboratory, CJPL), 岩石覆盖厚度为2 400 m, 是目前世界上最深的地下实验室, 可以屏蔽大部分的宇宙射线. 中子探测器通过中子与探测器物质的原子核发生的核反冲过程进行探测, 与WIMPs粒子产生的信号很难区分, 因此必须对CJPL的中子通量进行测量. 由液体闪烁体EJ-335以及聚四氟乙烯、高纯无氧铜、石英玻璃等高纯度、低放射性材料制成的液闪中子探测器于2014年开始记录CJPL的中子数据[1].

实验发现, 中子探测器输出的能谱(实际上是中子与探测器物质的原子核碰撞产生的核反冲能谱)与输入探测器的能谱并不相同. 探测器输出的能谱并不能直接推断输入能谱, 不同的输入对应着不同的输出能谱, 如何从探测器输出能谱反解出输入能谱是个难题. 常见的中子解谱方法有迭代法、蒙卡算法、遗传算法、广义最小二乘法等传统线性拟合方法[2]. 而随着计算机网络的发展, 计算机可以完成各种人脑难以完成的复杂计算, 甚至可以模仿人的思维过程, 进而解决科研和生活中的各种问题[3-4]. 因此尝试把神经网络应用到中子解谱应用中, 国内外有用径向基神经网络(RBF), 最小二乘QR分解算法(LSQR)应用到中子解谱中[5], 本文采用Elman神经网络进行尝试. 神经网络需要大量的样本训练, 经过训练才能根据不同的输入值预测出相应的输出值. 训练的过程就好比教人识字, 样本多了之后, 认识的“字”越多, 输出的值与真实值越靠近, 训练效果越好. 本文的训练数据来源于Geant4模拟输出的数据, 通过对神经网络的训练结果、预测精度、计算时间等因素判断Elman神经网络在中子解谱中的可行性.

2 Elman神经网络

考虑到神经网络在各个领域的广泛应用, 所以我们将大量能谱数据作为输入进行训练让神经网络自己找出规律并用实验所得数据进行验证. Elman神经网络是在前馈神经网络的基础上增加了一个承接层作为一步延时算子, 达到记忆的目的, 从而使系统具有适应时变特性的能力, 增强了网络的稳定性. 这相当于一个带反馈的BP网络, 但具有更强的计算能力, 可用来解决快速寻优问题.

Elman神经网络结构如图1所示, 分为4层:输入层、隐含层、承接层和输出层. 输入层的单元仅起到信号传输作用; 输出层仅用作线性加权; 隐含层用Signmoid非线性函数作为激励函数; 承接层接收隐含层前一时刻的输出值, 可认为是仅有一步延迟的延时算子. 隐含层的输出通过承接层的延迟和存储, 联系到隐含层的输入, 使其对历史数据具有敏感性, 内部反馈网络的加入增加了网络本身处理动态信息的能力, 从而达到动态建模的目的[6].

Elman神经网络的数学表达式为:

y(t)=g(w3x(t))

x(t)=f(w1xc(t)+w2(u(t-1)))

xc(t)=x(t-1)

其中y为m维输出节点向量; x为n维隐含层节点向量; u为r维输入向量; xc为n维反馈向量; w1、w2、w3分别为承接层到隐含层连接权值、输入层到隐含层连接权值以及隐含层到输出层连接权值. g()为输出层神经元的传递函数, 是隐含层输出的线性组合; f()为隐含层神经元的传递函数, 常采用Signmoid函数.

图1 Elman神经网络结构图

3 解 谱

3.1 训练过程

由于在实验中无法得到训练用的大量能谱数据, 而Geant4软件可以通过内置程序包设置不同探测条件下所得到的不同放射源能谱与探测器输出能谱[7], 并与之一一对应. 因此本文选择用Geant4模拟所得的能谱输入到Matlab的神经网络的工具箱中进行训练, 神经网络结构如上节所示.

图2 CJPL中子探测器示意图

训练神经网络的关键在于训练样本的正确性, 如果样本中的数据有错误或者模拟所得的数据不能真实反映中子能谱, 则相当于把“错”当成“对”教给了神经网络学习, 这样训练出的神经网络并非所需. 本文所用的中子探测器(图2)已在锦屏地下实验室长期采集数据, 数据处理以及模拟工作都已发展成熟, 可保证样本数据的正确性.

Matlab中的神经网络工具包可以对大量数据进行快速处理, 正符合我们对训练神经网络的大量样本数据批处理的需求, 并且输出的结果可以直接与原始数据进行对比, 可及时得知数据的正确性, 具体操作步骤如图3.

图3 训练、解谱及验证过程

图4252Cf 中子源作为输入时Geant4模拟与实验所得核反冲能谱的对比

Fig.4 Comparison of the nuclear recoil spectrum obtained by Geant4 simulation and experiment when the252Cf neutron source is used as input

由于实验中涉及到放射源的管理安全问题, 因此在验证样本数据的正确性时, 只能采用现有的252Cf中子源与Geant4模拟数据相对比.

如图4所示的模拟能谱与实验能谱对比, 经过归一化处理后仅在5 MeV以上部分模拟与实验有较大误差, 考虑到计数率已经10-2水平, 并不影响将模拟能谱放入神经网络中进行训练输出的结果.

3.2 验证结果

通过近千组数据的训练, 用训练完成的Elman神经网络对实验获取的核反冲能谱数据进行了反解, 并与已知中子源能谱对比, 结果如图5、6所示.

图5 Elman神经网络反解Am-Be中子源结果

Fig.5 The inverse solution of Am-Be neutron source by Elman neural network

图6 Elman神经网络反解252Cf中子源结果

Fig.6 The inverse solution of252Cf neutron source by Elman neural network

由图5、6可看出Elman神经网络解谱效果比较好, 其反解得到的Am-Be中子源能谱与真实值相对误差在0.1%~11.8%之间; 反解的252Cf中子源能谱与真实值相对误差在0.1%~8.9%之间,如表1所示.

表1 Elman神经网络解谱结果与真实值的相对误差

Tab. 1 The relative error between the spectrum decom-position result of Elman neural network and the real value

中子源误差范围Am-Be 0.1%~11.8%252Cf0.1%~8.9%

在解谱结果中, Am-Be中子源原始谱与反解谱基本一致,252Cf中子源能谱尾端基本重合, 仅在特征峰附近稍有偏差. 在训练神经网络时, Am-Be中子源的样本数据只能通过改变源的位置、粒子数以及Am、Be元素的占比获得, 但是以上条件的变化并不会使Am-Be中子源的原始谱发生太多变化, 所以解谱的结果与原始谱差别不大;252Cf中子源的样本数据只是通过改变发射粒子数、源的方向获得, 原始能谱的尾端并不会发生太大的变化, 只在特征峰附近有一些差别, 可以通过增加样本数的方式提升准确性.

在国内外类似的研究中, 训练神经网络的样本尤为重要, 虽然中子源的原始谱相同, 但不同的中子探测器给出的核反冲能谱是完全不一样的, 因此一定要注意样本数据的正确性. 提高样本数据量是有效提升解谱正确性的方法, 样本数据一定要各不相同, 否则样本无效. 国内外已经用径向基网络(RBF)以及BP(back propagation)神经网络研究过解谱, Elman网络暂未用于中子解谱中.

4 结 论

通过对Elman神经网络的训练, 其给出的中子能谱反解结果与真实能谱基本一致, 其结果完全可以表示输入能谱. 由于放射源的管理问题, 在实际实验中获得如此多训练数据难度很大, 而在Geant4中获取训练数据简单快捷, 因此可以用模拟所得数据进行训练, 实验所得数据用来验证. 本文训练所用数据上千组, 均为Geant4模拟所得. 实际训练及解谱时间较短, 主要耗费在获取Geant4模拟数据, 如果进一步发掘数据进行训练, 相信解谱结果会更好. 下一步可以保留样本用以训练其他类型的神经网络或者修改神经网络的算法并相互比较解谱精度, 挑选出更合适的、可用于中子解谱领域的神经网络.

猜你喜欢
能谱中子探测器
能谱CT成像定量分析在评估肺癌病理类型和分化程度中的应用价值
VVER机组反应堆压力容器中子输运计算程序系统的验证
第二章 探测器有反应
EN菌的引力波探测器
溴化镧探测器γ能谱本底扣除方法探讨
(70~100)MeV准单能中子参考辐射场设计
3D打印抗中子辐照钢研究取得新进展
第二章 探测器有反应
扫描电镜能谱法分析纸张的不均匀性
扫描电镜能谱法分析纸张的不均匀性