高春宇 汤秀章 陈欣南 李雨芃 吕建友
(中国原子能科学研究院 北京市 102413)
2003 年,美国洛斯-阿拉莫斯国家实验室LANL (Los Alamos National Laboratory) 根据模拟和实验结果,提出利用μ 子的多重库伦散射现象探测隐藏在集装箱中的核材料,引起世界上许多科学家的广泛关注,极大地推动了μ 子在核探测领域的研究应用。地球上的μ 子大都来自于太空中的宇宙射线,在地球海平面处平均能量为3GeV,平均通量约为10000m·min。μ 子作为一种天然辐射源,没有辐照危害,同时对高Z 物质敏感,穿透能力强,在核材料检测技术应用中具备天然优势。
根据μ 子穿过被探测物体后的散射角分布进行成像,LANL 等先后提出了多种图像重建算法,其中最典型的是PoCA 算法和MLSD 算法。由于天然μ 子的通量有限,为了提高μ 子成像的图像质量,通常需要较长的检测时间,而在集装箱、货物核材料走私检测等要求时效性的现场应用场景,需要快速地进行材料识别。对于μ 子材料识别,清华大学研究了基于支持向量机的聚类分析和分类器,根据散射密度的平均值和标准偏差进行物质识别。中国科学技术大学通过计算待识别目标物与参考物之间散射角的灰色关联度快速识别材料。
为提高宇宙射线μ 子探测核材料的实用性,缩短探测时间,我们提出一种将卷积神经网络应用于μ 子成像材料识别的方法。利用Geant4 蒙卡程序中的宇宙射线生成器CRY 软件包,加入角度和能量分布信息模拟产生天然环境μ 子源,μ 子成像探测器模型由上下两部分共4 层100cm×100cm 的探测器阵列构成,10cm×10cm×10cm 的铝、铁、钨作为被探测样品放入探测区域中心,使用PoCA 算法处理模拟数据得到μ 子散射角分布,构建基于卷积神经网络的材料识别模型,通过数据训练优化模型并测试样品在1 分钟、2 分钟、 5 分钟和10 分钟不同探测时间下的识别准确度。
宇宙线μ 子穿过被探测样品时,会发生多次小角度的库伦散射,每次小角度散射都会对粒子运动产生一定的影响,多次散射积累使得μ 子的运动方向产生了偏移,μ 子散射成像利用散射角分布与材料原子序数的关系进行成像和识别。根据莫里埃理论,μ 子的散射角θ 近似服从期望为0 的高斯分布,分布均方根RMS 为:
本文使用Geant4 程序进行宇宙射线μ 子散射成像的蒙特卡罗模拟,建立实验装置模型。在模拟中,定义上下两部分共4 层100cm×100cm 的探测器阵列记录μ 子的位置信息,上部分探测器用来拟合入射径迹,下部分探测器用来拟合出射径迹,每层探测器高度间隔30cm,上下两部分探测器之间为探测区域,高度100cm,探测面积100cm×100cm,分别将10cm×10cm×10cm 的铝、铁、钨块放入探测区域中心,使用宇宙射线生成器CRY 软件包,引入海平面宇宙线μ 子能谱及角分布源项进行天然环境模拟。
考虑到地球海平面处μ 子通量约为10000m·min,模拟显示在100cm×100cm 的探测区域上,1 分钟大约有1600个μ 子能够穿过四层探测器,重建有效径迹。在本模型中,1600 条μ 子散射角数据等效于1 分钟的探测时间,依次模拟不同的探测时间,输出各层探测器记录的μ 子位置信息。
径迹重建算法PoCA 假设μ 子的多次库伦散射为一次散射的结果,计算简单,运算量小,本文使用PoCA 算法处理Geant4 模拟数据并重建μ 子径迹。对经过探测区域的有效μ子的位置信息进行径迹拟合,重建μ 子入射、出射径迹,延长入射、出射径迹得到的交点认为是μ 子的近似散射点,即PoCA 点,两条径迹的夹角作为μ 子的散射角。
根据聚类分析的思想,将100cm×100cm 探测区域划分为50×50 的网格,每个网格为2cm×2cm,获取穿过每个网格的所有μ 子的散射角,计算该网格的散射密度。根据散射密度的定义,得到第i 个网格散射密度的估计值为:
卷积神经网络(Convolutional Neural Networks, CNN)是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一,通常由卷积层、池化层和全连接层三层结构组成。卷积神经网络中每个神经元只与输入神经元的部分区域连接,捕获局部数据信息,保证学习后的卷积核能够对局部特征有最强的响应。同时卷积核参数共享,用同一个卷积核提取特征,进一步减少了参数的数量。采用局部连接和权值共享能够降低网络的复杂度,提高学习速率。
我们将散射密度矩阵作为网络的输入数据,维度由50×50 重置为1×2500,定义了一个包含两个卷积层、两个池化层和一个全连接层的简单的卷积神经网络结构。第一个卷积层有64 个(3x3)卷积核,第二个卷积层有32 个(3x3)卷积核,卷积层通过卷积核与输入数据进行卷积计算,以扫描的方式对输入数据进行特征提取。卷积层输出的特征图被传递至池化层进行特征选择和信息过滤,进一步降低数据维度,加快模型训练速度。如图1 所示,经过多轮卷积层和池化层的处理后,50×50 的散射密度矩阵被抽象成高阶特征,由全连接层对提取的特征进行非线性组合以得到预测输出,给出分类结果。由于线性模型的表达能力不够,最后使用激活函数Softmax 加入非线性因素,把卷积层输出结果做非线性映射。
图1:基于卷积神经网络的材料识别模型
卷积神经网络通过迭代更新网络权重来优化模型,一次训练迭代包括前向传播、损失函数、反向传播和参数更新四个过程。前向传播是将训练数据从输入层经过卷积层、池化层与全连接层逐层变换最终到达输出层,得到网络对输入数据的预测。根据损失函数进行反向传播,即确定对损失贡献最大的权重,并使用交叉熵损失函数调整优化权重来减少损失,表达式为:其中η 为学习率。由式(10)可知,权重的更新速度与误差(a-y)呈线性关系,当误差大的时候,权重更新快,当误差小的时候,权重更新慢。程序重复这个过程,对每组训练数据进行迭代。图2 给出了模型材料识别的准确度和损失函数随迭代次数的变化曲线,随着不断迭代,准确度逐渐收敛,最终得到一个最优权重集合,获得一个训练好的预测模型,使用该模型执行材料分类任务。
图2:模型准确度和损失函数随迭代次数的变化
我们对10cm×10cm×10cm 的铝、铁和钨三种材料分别进行1 分钟、2 分钟、5 分钟和10 分钟探测时间的模拟,其中每分钟约有1600 条有效μ 子径迹。定义材料x正确识别的准确度为( X={铝,铁,钨}, x∈X):
定义总体准确度为:
分别用探测时间为1 分钟、2 分钟、5 分钟和10 分钟的散射密度矩阵测试网络的材料识别准确度。结果如下:
如表1 所示,取铝、铁、钨作为低、中、高原子序数的代表材料,探测时间为1 分钟时,由于μ 子的散射角数据量有限,材料识别的准确度较低。2 分钟时,由于重核材料钨与轻核材料铝的原子序数相差较大,Δ Z(W, Al)=61,材料识别准确度均已达到80%;而铁与铝、铁与钨均容易混淆,铁的识别准确度较低。5 分钟时,μ 子穿过被探测物体的散射角数据较多,用来训练网络的散射密度矩阵中非零网格的比例有所提高,三种材料识别的准确度均在80%之上,铝与钨的误报率t(Al,W)、t(W,Al)均为0,铁与铝也能较好地区分,而铁与钨之间的误报率仍在15%。探测时间为10 分钟时,总体材料识别准确度达到91.9%。
表1:不同探测时间下识别三种材料的准确度/%(密度单位:g/cm3)
我们根据宇宙射线μ 子穿过被探测物体时散射密度与材料原子序数的相关性,构建了包含两个卷积层、两个池化层和一个全连接层的卷积神经网络材料识别模型,最终测试样品在不同时间下的识别准确度。结果表明,对于10cm×10cm×10cm 的铝、铁、钨的探测样本,当探测时间为1 分钟、2 分钟、5 分钟和10 分钟时,总体识别准确度分别为66.4%、79.3%、86.8%和91.9%。
本文证明了采用卷积神经网络的方法用于μ 子成像材料识别的有效性,目前建立了简单的网络模型,还需要进一步优化算法。