基于KPCA-MPA-ELM的n/γ甄别方法研究

2024-04-29 12:44胡万平张贵宇张云龙庹先国李户林
核技术 2024年4期
关键词:捕食者降维偏置

胡万平 张贵宇,2,3 张云龙 庹先国,2 李户林

1(四川轻化工大学 自动化与信息工程学院 宜宾 644000)

2(四川轻化工大学 人工智能四川省重点实验室 宜宾 644000)

3(西南科技大学 信息工程学院 绵阳 621010)

4(成都惠利特自动化科技有限公司 成都 610000)

在使用有机闪烁体探测器对中子进行探测时,由于存在自发核裂变、非弹性散射和慢中子捕获等反应[1],往往会同时探测到中子和γ射线,因此,中子/伽马(n/γ)甄别在中子探测中是必不可少的。中子在有机闪烁体中诱发的延迟荧光比例大于γ射线[2],从而具有更长、更平坦的脉冲尾部,脉冲形状甄别(Pulse Shape Discriminarion,PSD)方法正是根据这一差异实现n/γ甄别的。传统的PSD方法包括:电荷比较法(Charge Comparison Method,CCM)[3]、脉冲梯度分析(Pulse Gradient Analysis,PGA)[4]、过零时间法[5]和上升时间法[6]等,这些方法通过时域特征实现n/γ甄别。随着数字化技术的发展,利用傅里叶变换[7]或小波变换[8]将时域上的脉冲信号转换到频域上,分析和对比各类频域特征亦可实现n/γ甄别。PSD方法原理简单,根据特定的脉冲形状甄别参数实现n/γ甄别,但是存在噪声干扰和不稳定性等缺点[9]。

近年来,人工智能技术迅速发展,K-means和高斯混合模型(Gaussian Mixture Model,GMM)[10]等无监督学习方法可直接对脉冲波形进行聚类,无须利用飞行时间实验对粒子进行标记。刘路峰等[10]分析了无监督学习在n/γ甄别中的优点,最显著的优点就是不需要真实标签数据集。Senteno[11]验证了GMM和变分贝叶斯GMM的聚类结果优于K-means。Blair等[9]研究了GMM中的对角协方差矩阵、全协方差矩阵和共享协方差矩阵对n/γ聚类的影响,并探索了一种狄利克雷过程的GMM。神经网络[12]和支持向量机[13]等监督学习方法在该领域应用也很广泛。张才勋等[14]提出一种基于Elman神经网络的n/γ甄别方法,获得了较高的品质因数(Figure of Merit,FOM)值。Gelfusa等[15]实现了热核聚变中的GMM纯无监督聚类,并在高能量下训练了一个概率支持向量机(Support Vector Machine,SVM)模型,两类机器学习模型在n/γ甄别中获得了良好的一致性。Liu等[16]引入一种脉冲耦合神经网络,获得比CCM、反向传播神经网络和分形谱法更优的FOM值,并在后续的研究中[17]验证了该网络的抗噪声能力显著优于电荷比较法和频域梯度分析法等。对于高维的脉冲信号特征,主成分分析(Principal Component Analysis,PCA)[18]和核主成分分析(Kernel Principal Component Analysis,KPCA)[19]通常用于减少脉冲信号特征的维数,选择最佳的特征数目用于训练机器学习模型。此外,PCA[20]也可在一定程度上甄别中子和γ射线。机器学习方法可灵活地根据脉冲差异特征实现n/γ甄别,甄别精度普遍提高,并且可通过分类精度和甄别错误率等指标进行定量评价。

在n/γ甄别中,常用的机器学习模型过于复杂。因此,本文选择了网络结构简单的极限学习机(Extreme Learning Machine,ELM)[21]作为基础模型,对KPCA降维后的脉冲数据进行训练,并利用海洋捕食者算法(Marine Predator Algorithm,MPA)[22]优化ELM的输入层权重和隐藏层偏置,提高n/γ甄别精度。

1 数据获取和处理

1.1 数据获取

实验数据来自中国原子能科学研究院串列终端。实验装置主要由钚碳(Pu-C)中子源、BC-501A液体闪烁体探测器、XIA数字化采集卡、高压电源以及计算机组成(图1)。中子探测器由5.08 cm×5.08 cm的BC-501A液体闪烁体耦合到XP-2020光电倍增管上,再封装在铝制的圆柱体中。BC-501A液体闪烁体中的氢原子数为4.82×1022cm-3,碳原子数为3.98×1022cm-3,电子数为2.87×1023cm-3。光输出量为蒽的78%,延迟荧光衰减时间为3.2 ns,适用于γ射线辐射下进行中子探测。首先,使用137Cs标准γ源进行能量校准,得到ADC通道与电子等效能量之间的关系。然后对12 mm×16 mm的Pu-C中子源进行探测,探测器与中子源之间的距离设置为20 cm。XIA的数字化采集卡为Pixie(16通道,14位),采用基于4个ADC子卡的6UPXI主板,以500 Ms·s-1的采样率采集10000组脉冲波形数据,每组数据间隔4 ns采集一个样本,总共采集250个脉冲波形离散点。

图1 实验流程图Fig.1 Experimental flowchart

1.2 数据处理

探测器采集的脉冲信号有250个离散点(图2),由于原始脉冲波形的前半部分和后半部分趋于平缓,截掉脉冲上升之前的前50个点和脉冲下降到平稳值之后的120个点,留脉冲差异较大的80个离散点。为了减小基线漂移和噪声干扰的影响,对原始脉冲波形进行基线校正、滑动平均滤波和幅度归一化等预处理(图3),作为ELM网络的输入特征。前期通过大量的实验数据分析,并结合PSD方法和聚类分析方法综合分析得到10000组脉冲信号中有3871组中子脉冲信号和6129组γ脉冲信号。

图2 中子和γ射线的脉冲样本Fig.2 Pulse samples of neutron and gamma rays

图3 截取后的脉冲波形(a)以及基线调整(b)、平滑滤波(c)和幅度归一化(d)Fig.3 Intercepted pulse waveform (a) and baseline adjustment (b), smoothing filtering (c), and amplitude normalization (d)

2 算法原理和实现

2.1 KPCA算法

与传统的线性变换方法PCA相比,KPCA是一种非线性的方法。KPCA使用核函数将线性不可分的输入空间映射到更高维度的线性可分特征空间[1],然后在特征空间中使用PCA的线性映射来减少特征的数量。大多数基于机器学习的n/γ甄别方法直接将全部或部分差异较大的脉冲样本点作为模型的输入特征,特征数量过多,容易造成过拟合。因此,该研究在尽可能保留数据差异的基础上,引入KPCA对脉冲波形特征降维,加快后续算法的运行速度。在KPCA降维中,常见的核函数主要有线性核函数、多项式核函数和高斯径向基核函数。线性核函数主要适用于线性可分的情况,而后两者皆适用于线性不可分的情况,相比多项式核函数,高斯径向基核函数参数少,应用范围广,因此,该研究引入了高斯径向基核函数计算特征向量,如式(1)。

2.2 ELM算法

ELM是Huang等[23]在2006年提出的单隐层前馈神经网络。与传统的前馈神经网络不同,ELM不采用基于梯度的学习算法,随机生成输入层权重和隐藏层偏置。根据广义逆矩阵理论,通过减少训练误差项和输出层权重范数规则项形成的损失函数,计算和分析输出层的权重,从而完成模型训练。近年来,随着人工神经网络的发展,ELM凭借其简单、运算速度快等优点逐渐应用于模式识别、回归预测和分类等领域[24]。ELM的单隐层和不需要反向传播的前馈神经网络结构适合解决二分类问题,因此,本文中采用KPCA-ELM模型实现n/γ甄别,结构如图4所示。

图4 KPCA-ELM模型结构图Fig.4 Diagram of the KPCA-ELM model structure

由图4可知,ELM网络结构主要由输入层、隐藏层以及输出层三部分组成。假如隐藏层节点数量为L,有n个不同的样本,其中xi=[xi1,xi2,…,xid]T是第i组训练样本,ti=[ti1,ti2,…,tim]T是第i组样本的期望输出,d是样本维度。含有L个隐藏层节点的输出矩阵H可以表示为:

式中:(wi,bi)是隐藏层第i个神经元的参数,W=(w1,w2,…,wL)和b=(b1,b2,…,bL)分别是随机化的输入层权重和隐藏层偏置。在该模型中,sigmoid作为隐藏层神经元的激活函数g(·),具体函数表达式如式(3):

ELM采用Hβ=T对输出矩阵T进行求解,其中隐藏层权重矩阵β=[β1,β2,…,βL]T∈βL×m,期望输出T=[t1,t2,…,tn]∈TL×m。ELM的训练目标是通过min‖Hβ-T‖2训练模型参数,使模型的输出最大限度地逼近训练样本,对隐藏层的权重矩阵β进行求解。最终输出权重结果为β*=H+T,H+是矩阵H的Moore-Penrose广义逆。经典ELM的输入层权重和隐藏层偏置都是随机的,不能保证预测和分类的精度,泛化能力不强,这也是ELM不可避免的一个缺陷。因此,采用了优化效率较高的MPA算法对ELM的输入层权重和隐藏层偏置进行优化。

2.3 MPA算法

MPA[22]是一种新型的元启发式智能优化算法。它的核心觅食策略结合了莱维运动和布朗运动。MPA通过迭代更新捕食者矩阵E和猎物矩阵P来得到目标的最优解。相较于遗传算法和粒子群等优化算法,MPA一般情况下具有更快的收敛速度和更优的收敛值。目前,MPA已成功应用于分类、聚类、特征选择、图像识别和信号处理等领域,如癌症分类和新冠肺炎预测等[25]。MPA算法的主要步骤如下:

1)种群初始化

式中:Xmax和Xmin是搜索范围的上界和下界,rand表示(0,1)之间的均匀分布的随机数。

2)优化阶段

迭代初期(Iter<13Max_Iter),猎物比捕食者移动得更快。捕食者最好的策略是不移动,猎物通常是莱维运动。该阶段的数学模型由式(5)给出:

式中:⊗符号表示矩阵中的逐项乘法;Si代表运动的步长;Q是等于0.5的常数;R是0~1之间均匀分布的随机数组成的向量;Iter是迭代次数,Max_Iter是最大迭代次数;RB是由布朗运动产生的随机数组成的向量。

迭代中期(13Max_Iter≤Iter<23Max_Iter),单位速度比为1,捕食者和猎物以大致相同的速度移动。猎物通常进行莱维运动,捕食者的最优策略是布朗运动。总体分为两个相等的部分,一个用于局部优化,另一个用于全局搜索。局部优化的数学模型由式(6)给出,全局搜索的数学模型由式(7)给出:

RL是莱维运动生成的随机向量。CF是步长的自适应参数,用于调整捕食者的运动步长,由式(8)定义:

迭代后期(Iter≥23Max_Iter),捕食者比猎物移动得更快。这个阶段是局部优化阶段,捕食者的最佳策略是莱维运动。该阶段的更新规则如等(9)所示:

3)鱼类聚集装置(Fish Aggregation Devices,FADs)

在每次迭代后,MPA通过利用鱼类聚集装置效应,使捕食者跳得更远,避免陷入局部最优。数学模型如下:

式中:r是(0,1)之间的随机数,FADs=0.2。r1和r2是猎物矩阵P的随机索引。U是包含0或1的二进制向量。

2.4 KPCA-MPA-ELM算法流程

KPCA对预处理之后的数据进行特征降维,MPA用于优化ELM的输入层权重和隐藏层偏置,KPCA-MPA-ELM模型的流程见图5。

图5 KPCA-MPA-ELM模型的具体算法流程图Fig.5 Specific algorithm flowchart of the KPCA-MPA-ELM model

1)对脉冲信号进行预处理(截取、基线调零、平滑滤波和幅度归一化)。

2)KPCA对特征点进行降维,前n个主成分代替原80个离散特征点。

3)10000个降维后的数据划分7000个训练样本和3000个测试样本。

4)随机生成ELM的输入层权重和隐含层偏置,设置激活函数为sigmoid函数。训练ELM网络,得到分类准确率。

5)初始种群数量设置为25,最大迭代次数设置为120。根据待优化的变量初始化猎物矩阵P,并以分类准确率作为MPA的适应度函数。

6)根据相应的数学模型更新猎物矩阵P,保存每次迭代的最优解,并更新捕食者矩阵E。

7)利用FADs效应对猎物矩阵进行更新,判断是否达到最大迭代次数。

8)以最优的输入层权重和隐藏层偏置对ELM网络重新进行训练,并输出分类结果。

3 分析和讨论

3.1 KPCA降维结果

对比多项式核函数和高斯核函数的降维结果发现,当KPCA的核函数设置为高斯径向基核函数,且对应的γ参数值设置为0.1时,降维效果更好。图6为前10个主成分的贡献率和累积贡献率。根据图6可发现,前3个主成分特征的累积贡献率已经大于90%,表明前3个主成分特征可以替换脉冲波形的80个数据点,因此,保留前3个主成分特征,输入到ELM中进行训练。

图6 前10个主成分特征的贡献率和累积贡献率Fig.6 Contribution rate and cumulative contribution rate of the first 10 principal component features

3.2 结果分析

经过KPCA降维后,10000×80数据矩阵压缩为10000×3数据矩阵。10000组样本随机划分为7000个训练样本和3000个测试样本。ELM的隐藏层节点数量设置为20,对输入层权重和隐藏层偏置进行随机初始化,输出层1代表中子,2代表γ射线。MPA最大迭代次数设置为120,种群大小设置为25,将FADs设置为0.2。分类精度作为MPA的适应度函数来优化输入层权重和隐藏层偏置。MPA优化ELM的适应度变化曲线如图7所示。KPCAELM和KPCA-MPA-ELM模型对应的甄别结果如图8和图9中的混淆矩阵表示。

图7 MPA-ELM的适应度变化曲线Fig.7 Fitness change curve of the MPA-ELM

图8 KPCA-ELM模型的3000组测试样本的混淆矩阵Fig.8 Confusion matrix of the 3000 test samples of the KPCA-ELM model

图9 KPCA-MPA-ELM模型的3000组测试样本的混淆矩阵Fig.9 Confusion matrix of the 3000 groups of the test samples of the KPCA-MPA-ELM model

从图7可以看出,对于KPCA降维之后的数据,MPA优化的ELM的最优分类精度从95.27%提高到99.27%左右。此外,还可以发现KPCA-MPA-ELM的收敛速度比MPA-ELM更快。图8和图9中的混淆矩阵直观地显示了真实数据和预测数据之间的差异。3000组测试样本中有1156组中子脉冲信号和1844组γ脉冲信号,图9中KPCA-MPA-ELM模型正确分类的中子和γ射线数量分别为1153和1825组。通过计算可知中子的甄别误差率从11.68%降低到0.26%,由此可见中子的甄别准确率明显提高。

为了充分验证KPCA-MPA-ELM的甄别效率,使用ELM和MPA-ELM模型对未降维和KPCA降维的数据进行了10次重复实验。对于未降维的数据,通过反复测试,选择了峰值之后脉冲波形差异较大的20个点作为特征点来训练ELM和MPA-ELM模型。重复10次实验之后4个模型的分类精度比较如图10所示。4个模型的平均分类准确率和运行时间的比较如表1所示。

表1 4种模型的分类效率对比Table 1 Comparison of the classification efficiency of four models

图10 4种模型的分类精度对比Fig.10 Comparison of the classification accuracy of four models

根据图10和表1,发现KPCA-ELM模型的平均运行时间最短为0.83 s,这是因为KPCA降维后的数据特征减少了,缩短了ELM模型的运行时间,分类精度相比于ELM也有明显提升。KPCA-MPA-ELM的分类精度总是4个模型中最好的,且甄别结果更加稳定。KPCA-MPA-ELM模型的运行时间较长,主要是由数据集过大和MPA优化过程复杂导致,但是其平均准确率最高为99.07%,相较于KPCA-ELM还是有1.56%左右的提升。此外,当未使用KPCA降维时,MPA-ELM的分类精度比ELM有显著提高,可见MPA的优化还是很有效的。因此,在实际n/γ甄别中,有必要综合考虑运行时间和分类精度两个影响因素,合理地选择模型,KPCA-ELM适用于大规模的数据集和实时性的甄别问题,而对于精度要求较高的甄别问题,KPCA-MPA-ELM依然更具有优势。

3.3 与传统PSD方法的比较

为了说明该模型的有效性,进一步实现了CCM和PGA甄别方法。CCM以峰值为起点,脉冲波形高度的1/4处为终点,作为短门积分Qtail;脉冲开始到结束作为总积分Qtotal。计算脉冲波形尾到总的电荷积分比Qtail/Qtotal,并绘制CCM甄别结果(图11)。PGA以峰值为起点,脉冲波形下降至平稳之后的第一个点为结束点计算脉冲波形的梯度,并绘制PGA甄别结果(图12)。品质因数(Figure of Merit,FOM)作为大多数PSD方法的评价指标,并不能对机器学习甄别结果进行定量评价。为了统一评价指标,分别以图中最优的红色虚线为分界线计算CCM和PGA的n/γ甄别准确率,与KPCA-ELM和KPCAMPA-ELM模型进行对比,如表2所示。

表2 机器学习模型与传统PSD方法的甄别效率对比Table 2 Comparison of the discrimination efficiency between the machine-learning model and traditional PSD method

图11 CCM甄别结果图(彩图见网络版)Fig.11 CCM discrimination result chart (color online)

图12 PGA甄别结果图Fig.12 PGA discrimination result chart

经对比,KPCA-MPA和KPCA-MPA-ELM的准确率明显优于CCM和PGA,KPCA-ELM在时间效率上更优,而KPCA-MPA-ELM具有更高的甄别准确率。

4 结语

本文结合KPCA、MPA和ELM各自的优点建立了一种KPCA-MPA-ELM的n/γ甄别模型,为实际n/γ甄别提供了一种新的方法,该方法泛化能力强,稳定性好。

KPCA特征提取降低数据特征维数,有效减少了分类模型的运行时间,提高模型的运行效率。MPA优化了ELM的随机初始化的输入层权重和隐藏层偏置,提高了ELM模型的分类精度和稳定性。与ELM、MPA-ELM和KPCA-ELM相比,KPCAMPA-ELM模型的分类精度和稳定性更好,但运行时间大于KPCA-ELM。KPCA-ELM和KPCA-MPAELM在甄别精度上都比传统PSD方法CMM和PGA更高,KPCA-MPA-ELM优势在于高精度,KPCA-ELM优势在于运行时间效率。在今后的实际n/γ甄别研究工作中,需要综合分析精度和运行时间两个影响因素;继续考虑如何平衡精度与时间;在保证精度的同时,减少模型的运行时间。模型的优化包括对初始种群进行混沌初始化或改进自适应步长参数等方法增加MPA的全局和局部寻优能力,从而达到减少运行时间并提高甄别准确率的效果。

作者贡献声明胡万平负责数据处理、模型的构建、实验结果分析和论文写作;张贵宇负责技术指导和审阅;张云龙负责模型训练;庹先国负责技术指导和校对;李户林负责提出相关问题。

猜你喜欢
捕食者降维偏置
混动成为降维打击的实力 东风风神皓极
基于40%正面偏置碰撞的某车型仿真及结构优化
基于双向线性插值的车道辅助系统障碍避让研究
交错扩散对具有Ivlev型功能反应的捕食模型共存解存在性的作用
降维打击
具有Allee效应随机追捕模型的灭绝性
一类随机食饵-捕食者模型的参数估计
一级旋流偏置对双旋流杯下游流场的影响
疯狂的捕食者
抛物化Navier-Stokes方程的降维仿真模型