高泽鹏 李庆峰
1(湖州师范学院 理学院 湖州 313000)
2(中山大学 中法核工程与技术学院 珠海 519082)
3(中国科学院近代物理研究所 兰州 730000)
机器学习是人工智能的子集,是运用不同算法从数据中“自动地”“智能地”寻找其内在关联并进而得到某种规则或映射,然后对一些新的事件作出决定或预测的一种方法。与传统人为的硬编码形式不同,机器学习有“自己的”程序模式。机器学习方法通常运用一定的数据来进行“训练”,这些数据信息依次反馈到模型参数中,实现参数的扩展或更新。当下,机器学习已在众多领域的研究中产生了许多有价值的研究成果。作为一种新的研究范式,机器学习与各个学科之间的交叉融合必将深刻影响科学研究的进程[1]。
原子核是一个量子多体系统,其相关数据的维数以及问题的复杂程度绝不亚于任何一个其他领域。将机器学习这一强大的工具应用于核物理问题的研究就显得尤为重要。近几年来,机器学习在核物理研究中的工作层出不穷[2],并呈现出指数形式的增长。这些工作多数利用了机器学习中的监督学习算法,其中包含多种机器学习模型。这些模型在研究核质量[3-5]、中子皮厚度[6]、电荷半径[7-8]、半衰期[9-11]、裂变产额[12-13]、散裂截面[14-15]、核数据评估[16]以及其他核物理热点问题[17-24]上都表现出强大的能力。本文对两类机器学习算法在预测原子核质量[25]、重构核反应碰撞参数[26-27]以及提取对称能斜率系数[28-29]问题放在一起进行分析探讨。
本文应用极端相对论量子分子动力学模型(Ultrarelativistic Quantum Molecular Dynamics,UrQMD)[30]模拟重离子碰撞事件。UrQMD 模型主要包括初始化、势修正、核子-核子碰撞以及末态碎片构建等部分。现版本通过在势修正部分引入Skyrme能量密度泛函,以及在碰撞项部分考虑散射截面介质修正、泡利阻塞等,已被广泛应用于研究多个能区的重离子碰撞[31-32]。
初始化是核反应模拟的基础和前提,因此,有必要首先构建好一个更加合理的初始化。原子核质量是初始化过程中基本输入量。利用机器学习算法对当前比较流行的几种原子核质量模型进行了修正,其预测以及外推能力将在下文中展示。同时,很多研究表明,弹、靶核中一些特殊的初始结构,譬如形变、中子皮以及团簇现象等也会在一定程度上影响核反应过程及结果。文献[33]中具体探讨了弹靶核四极形变对末态观测量的影响,并且结合机器学习方法识别出四极形变的信号。
此外,碰撞参数同样是初始化过程中重要的输入量,它直接影响核反应过程中弹靶核重叠区域的大小和形状,因而对反应末态的大部分观测量有很大影响。然而,实验上不能直接确定每次反应事件的碰撞参数,只能通过末态观测量进行反推,因而带有一定的不确定性。因此,提出了一种利用机器学习算法重构核反应初态碰撞参数的方法。在这个过程中,利用UrQMD 模拟不同碰撞参数下的核-核碰撞,筛选末态粒子信息构造一些特定的物理量作为机器学习的特征量,通过学习这些特征量与碰撞参数之间的关联来重构碰撞参数。
对于势修正部分,两体相互作用势能U由Skyrme 能量密度泛函给出的密度依赖部分、库仑项、动量相关项、表面能项、表面不对称项以及对称能项等共同描述。通过改变势能参数,可以得到不同的核物质不可压缩系数K0以及饱和密度处的对称能斜率系数L(ρ0)。其中,K0的数值大、小对应“硬”(HM)、“软”(SM)的状态方程。在文献[34]中,利用机器学习方法有效地识别了单次碰撞事件中的状态方程的“软硬”。当下,人们对K0的认识相对清晰。然而,对尤其在高密度区的对称能密度依赖形式的研究中则出现了很大分歧。图1 展示了6 组不同的参数设置下的对称能密度依赖形式,其范围覆盖了当前L0的最大不确定度。本文将UrQMD 在不同对称能参数设置下生成的粒子数据用作数据集,利用机器学习算法分类对称能的密度依赖形式,并从单事件中直接提取L(ρ0)。
图1 对称能(a)以及对称能斜率(b)随密度的变化Fig.1 The nuclear symmetry energy (a) and its slope parameter (b) plotted as a function of density
对于碰撞项部分,模型引入了介质修正以及泡利阻塞效应等。对于核子-核子弹性散射截面,采用密度、相对动量及同位旋不对称度三者均相关的参数化因子F(μ,pNN,δ)进行修正。然而,实际上,对于不同大小的碰撞体系和不同的入射能量,F因子不能被完整、细致描述。因此,也可以将F(μ,pNN,δ)的平均效应简单依赖于入射能量并寻找F(Elab)的具体形式。最近,也在探索机器学习方法在确定F(Elab)上的可行性。在本文的工作中,将截面介质修正视作模型参数,通过设置介质中有修正(In medium,I)以及自由空间无修正(Free space,F)两种参数来评估机器学习的泛化能力,即机器学习是否可以通过训练不同的参数设置下生成的数据来找出相似的规律并进行判断,以尽量避免对模型的依赖性。
本文主要使用两种机器学习算法,分别是卷积神经网络(Convolutional Neural Network,CNN)和一种基于决策树算法的轻量梯度提升机(Light Gradient Boosting Machine,LightGBM)。
神经网络(Neural Network,NN)算法是目前主流的机器学习算法,然而,传统的神经网络存在着对特殊任务的针对性较弱、收敛速度慢、容易丢失多维数据的空间关联等不足之处。CNN在NN的基础上添加了卷积层和池化层以实现提取主要特征的作用。因此,CNN能够有效地识别数据之间的空间关联,并通过共享权重的方式避免参数过度膨胀。文中主要采用2D-CNN 算法,并选择末态核子的横动量(pt)与快度(y0)的分布作为训练过程的特征量,标签为碰撞参数或对称能参数。为了优化训练的结果,解决在训练过程中出现的梯度弥散、数据分布不均衡、过拟合和欠拟合等问题,在层与层之间还充分考虑了批归一化(Batch Normalization)、随机失活(Dropout)、激活函数(Activation Function)以及正则化(Regularize)等过程。
LightGBM 是一种基于直方图思想的决策树算法,它对传统的GBDT(Gradient Boosting Decision Tree)算法进行了一系列的改进。“梯度提升”表示模型每次迭代时预测的目标为前一次的迭代结果与最终目标之间的偏差。区别于其他决策树算法,模型采用单边梯度采样、最大深度限制以及互斥特征捆绑等方法。这是LightGBM特有的在减少采样数据量和保证预测精度上平衡的算法。LightGBM 适用于任何类型的特征量,并具备运行速度快、可解释性强等特点。
首先讨论对原子核质量的预测结果。使用LightGBM 预测质量模型(包括LDM、DZ、WS4、FRDM)的理论值与实验值的偏差δ(Z,A)来修正这些模型。选用10 个与原子核质量相关的物理量作为特征量。随机选择AME2016[35]中80%的原子核的数据作为训练集,模型在剩余20%测试集上的预测值与实验值的均方根偏差(Root Mean Square Deviation,RMSD)分别为0.234 MeV、0.213 MeV、0.170 MeV、0.222 MeV,相比于修正前的质量模型,其RMSD值分别降低了约90%、65%、40%和60%。
相比于内插的预测,质量模型的外推能力是更值得关心的。在AME2016 的基础上,AME2020[36]新增了66个原子核的质量数据。训练AME2016得到了修正后的质量模型,并对新增的66个原子核的质量进行了预测,其结果展示在图2 中,其中:空心菱形为4 种质量模型的结果,实心正方形为LightGBM 修正后的4 种质量模型的结果;σpre和σpost表示原始模型以及LightGBM修正后的理论值与实验值之间的RMSD。可以看出,无论是原始模型,还是修正后的模型,其RMSD 都有不同程度的增加。这表明,质量模型在外推时,尤其是对于远离训练样本的对象,其性能和可靠性都会降低。但通过比较修正前后的RMSD,不可否认的是机器学习方法在这样大范围的外推任务中依然表现出强大的修正能力。
图2 AME2020中新测量的66个核素的结合能的理论值与实验值的偏差Fig.2 The results of 66 newly measured nuclei appeared in the AME2020 mass evaluation
接下来讨论对重构重离子反应碰撞参数的结果。 利用UrQMD 模拟了入射能量Elab=0.2~1.0 GeV·nucleon-1的Au+Au 反应,碰撞参数范围为0~10 fm。将反应末态质子的pt-y0谱分布划分为n×n个格子,计数落入每个格子的质子数作为训练过程的特征量。分别选用CNN与LightGBM重构碰撞参数b。以碰撞参数的预测值和真实值的平均绝对误差Δb作为重构性能的评估标准。文献[27]分别探究了Δb对机器学习模型、入射能量、训练集容量、划分的格子数n以及UrQMD 模型参数设置的依赖性。
这里主要讨论划分的格子数n的影响以及机器学习模型的对比。如图3 所示,三种机器学习算法在描述Δb随n的变化表现出类似的行为,均是先减小后趋于平缓,其中:NN 的结果取自文献[37]。这是由于过少的格子数会丢失不同碰撞参数下质子分布细节的信息,过多的格子数会导致涨落信号的增强淹没差异,并大幅度降低模型的训练速度。然而,不同算法的收敛位置不同。有趣的是,NN 与CNN之间的曲线存在交叉,意味着机器学习算法对数据类型的适用性和敏感程度不同。这也驱使测试更多的机器学习算法,寻找更丰富的特征量组合以及更多元的数据集类型。
图3 Δb对格子数n的依赖Fig.3 Δb dependence of the input grid dimension n
为了起到指导实验的目的,进一步对SπRIT 实验体系下的碰撞参数重构做了系统性研究。具体为入射能量Elab=0.27 GeV·nucleon-1的132Sn+124Sn 的反应体系,碰撞参数范围为0~7 fm。考虑到输运模型对核反应过程的描述与真实情况存在一定的差异,有必要评估机器学习模型的泛化能力。因此,文献[26]选用“软”“硬”状态方程以及有无截面介质修正交叉组合下的参数设置模拟生成4组数据集。选用三种机器学习方法(ANN、CNN 和LightGBM)以及两类特征量分别训练。其中,一类特征量为文献[27]提及的粒子谱分布(DATASET1),但改用所有带电粒子的信息;第二类特征量为末态粒子信息构建的7 个可观测量(DATASET2),包括电荷多重数(Mch),轻粒子的横向动能(E⊥)等。这些观测量对碰撞参数有较强的依赖。
对碰撞参数的重构准确度如图4 所示。其中,对角线上的训练数据与测试数据来自同一个模型参数,非对角线为不同模型参数间交叉测试的结果,反对角线为模型参数差异最大的结果。总体来说,在所有的模型选取、参数设置以及特征量类型下的重构碰撞参数的Δb在0.3~0.8 fm 之间。可以看出,所有子图中对角线的数值都是所在行与所在列中最小的。这表明,机器学习在自身参数设置下进行预测可以得到最好的结果,而交叉验证则在一定程度上都会损失部分精度。具体来说,散射截面与状态方程影响了机器学习重构碰撞参数的准确度。此外,通过分析每一行的数值可以发现,散射截面修正对碰撞参数的影响要大于状态方程软硬的影响,这是由于相比起状态方程,散射截面会直接影响反应过程中粒子的碰撞数、进而影响初始信息的传递。
图4 每个格子中的数值表示通过学习训练集(使用水平标记的模型生成的)得到的模型在测试集(使用竖直标记的模型生成的)的预测值的,左侧和右侧图分别采用第一和第二类特征量Fig.4 Number in each cell denotes Δb for the testing data(generated with the vertical labeled mode) by using the training data (generated with the horizontal labeled mode). The left panels (right panels) present the results of the first (second)type of characteristic quantity.
在最近的研究中发现,如果预先对特征量进行标准化,模型的泛化能力会大幅提升。甚至训练好的模型对“自身”测试集的预测结果要弱于“泛化”测试集的结果。这可以通过对小参数区间内、不同参数设置下观测量的涨落大小分析来解释。
最后讨论对称能参数的分类以及对提取L(ρ0)的结果。前者中采用CNN 识别末态质子谱或中子谱分布与对称能参数之间的关联。这里,利用UrQMD 分别模拟5 种对称能参数设置下的入射能量为Elab=0.4 GeV·nucleon-1,碰撞参数为b=5 fm 的Au+Au碰撞得到训练过程的数据集。首先,评估了不同对称能参数设置下的单事件以及100个事件叠加的粒子谱分布。对于单事件来说,初始化过程中粒子的相空间位置是在一定约束范围内随机抽取的。同时,核子-核子散射会进一步扩大不确定性,这就导致对称能的信号在核反应过程中被不断地湮没。多事件叠加能够有效地消除部分涨落信号,给出类似统计的结果。然而,尽管选用100 个事件叠加,也很难从谱中发现对称能的效应。
利用机器学习方法,首先,评估了二分类的结果。CNN 在二分类中分别得到了98%(SkI1 vs.Skz4)和63%(SkI2 vs. SV-sym34)的准确率,对应对称能差异最大和最小的两种情况,其他二分类结果均在它们中间。此外,发现二分类的准确率与两种对称能的差值存在较强的线性关联。这表明CNN能够从末态质子谱分布上捕捉对称能的密度依赖信息。
对于五分类任务,选用叠加事件作为数据集。利用质子谱分布CNN可以得到58%的准确率,相当于随机猜测的三倍,而训练中子谱分布则可以得到72%的准确率。混淆矩阵是显示多个分类模型预测性能的一种好方法。图5显示了五分类任务的混淆矩阵,其中:每个非对角元中的数值表示对称能(垂直标记)的对象被错误分类为水平标记对称能的概率;对角圆表示正确分类该对称能的概率;图5(a)和(b)分别为选用质子事件叠加与中子事件叠加作为特征量的结果。对角线数值表示水平标记对称能被正确分类的概率,可以看出,它们是每行中最大的。在质子分布的结果中,78%的SkI1 样本可以被正确识别,而其中20%被错误识别为SkI2,其余2%被错误识别成SV-sym34。此外,SLy230a和SV-sym34对称能接近,因此,将它们之间错误识别彼此的概率很高。
图5 五类分类任务的混淆矩阵Fig.5 Confusion matrix for the five-class classification task
以上的结果表明,机器学习在提取对称能参数的任务中具有一定的可行性。接下来,进一步利用LightGBM直接提取斜率系数L(ρ0)的数值。区别于上文所述,在这个任务中选取单事件反应末态质子、氘核分别在中心快度、弹靶快度区域的共计30个可观测量作为训练过程的特征量。标签为6种对称能参数对应的L(ρ0)。选取4种UrQMD参数设置生成数据集来评估模型的泛化能力,这些参数分别考虑了状态方程的“软硬”、核子-核子散射截面以及末态碎片构建的相空间约束方式。结果表明,LightGBM对4种参数设置下的预测值与真实值的平均绝对误差(Mean Absolute Error,MAE)均小于30 MeV。然而,如果仅选择4 个特征量进行预测,LightGBM 给出的结果如图6(a)所示。可以看出,曲线是对分布的高斯拟合,模型对6 种参数设置下的数据集给出的预测结果几乎重叠,无法仅从几个观测量在单事件中提取对称能系数。然而,若将特征量增加为30个,预测值分布明显分离,并且更接近于真实值。这些结果同时也表明,由于反应初态及输运过程都存在一定的涨落,仅通过独立特征量很难给出有效信息。但机器学习方法可以通过训练多个特征量,寻找它们之间的深层、多维的关联,从而给出更为准确的判断。这正是机器学习方法的优势所在,对于传统分析方法来说则是很难做到的。
图6 对称能斜率参数L(ρ0)预测值的分布(a, b) 分别为4个和30个观测量的结果Fig.6 Distributions of the predicted symmetry energy slope parameter L(ρ0)(a, b) The results obtained with 4 and 30 observables,respectively
本文将CNN与LightGBM分别应用于原子核质量模型的修正、碰撞参数的重构以及对称能参数的提取三个核物理问题,得到以下结果:1)优化了原子核质量公式,使均方根偏差小于0.2 MeV。在外推任务中依然给出很好的修正;2)对于1 GeV·nucleon-1的Au+Au碰撞,利用质子的pt-y0谱分布,重构碰撞参数的Δb小于0.1 fm;3)对于0.27 GeV·nucleon-1的Sn+Sn 碰撞,利用两种类型特征量,Δb在0.3~0.4 fm 之内;4)对5 种对称能的分类,叠加事件质子和中子谱的分类结果分别为58%与72%;5)对于对称能斜率系数的预测,使用30 个特征量得到的L(ρ0)预测值和真实值之间的平均绝对误差小于30 MeV。
机器学习方法在上述核物理问题上为提供了一种新的研究方案。此外,机器学习方法可以更广泛地利用于分析庞大的核数据、大能量范围的重离子反应实验数据等[38-39]。同时,机器学习的可解释性研究能力也为理论核物理的发展提供有价值的帮助。更进一步地,在机器学习的基础上加入物理约束,使人工智能更“懂”物理问题,进而为理论和实验研究提供更强有力的技术支撑。
致谢感谢C3S2集群计算中心对本工作的支持。
作者贡献声明高泽鹏为本研究执行人,负责文章初稿写作;李庆峰负责文章整体设计,理论研究指导,对文章作批评性审阅。