王雨芹
(北京师范大学物理学系 北京市 100875)
能源利用与环境保护已然成为我国和国际社会关注的焦点。2020年我国首次提出:“中国将提高国家自主贡献力度,采取更加有力的政策和措施,二氧化碳排放力争于2030年前达到峰值,努力争取2060年前实现碳中和。”要实现这一目标则需要加快我国能源的转型,解决好开发利用非化石能源这一关键问题。在此背景下,核能无疑会得到广泛的利用,如何安全利用核能,如何做好辐射防护,突破辐射防护的困境也会成为热门研究方向。而现代人工智能计算方法的发展给辐射防护的困境带来了新的突破,其中遗传算法更是众多算法中的佼佼者。
遗传算法(GA)是一种基于自然界遗传法则和适者生存规律而产生的算法,这一术语首次出现于1967年J.Holland教授的学生的博士论文中,1975年J. Holland教授出版了专著《自然系统和人工系统的适配》,系统阐述了遗传算法的基本理论和方法。经过几十年的发展,遗传算法凭借着其优点被广泛应用于自动控制、生产计划、图像处理等需要处理多目标优化问题的领域。而在辐射防护领域,遗传算法也在中子解谱、辐射屏蔽设计、放射治疗、强辐射场下人员工作安排等辐射防护工作领域中有着广泛的应用。
遗传算法的灵感来自于“自然选择,适者生存”的自然进化原则,是一个从种群的初始解决方案开始搜索,通过有选择地变化生成更优良的子代,最终满足目标的算法。群体中的每个个体,即一个可行解,被称为染色体,在循环迭代过程中染色体的不断更新称为遗传。而遗传算法主要分为筛选父本、交叉、变异几个阶段。染色体是否更满足要求通常通过适应性来评估,在算法中表现为适应度函数值。根据适合度函数值的大小,从当前所有染色体(父代和后代)中选择一定比例的个体作为下一代群体,然后再次进入循环,不断迭代计算直到收敛到全局最佳染色体,即得到解决问题需要的解。
遗传算法的流程图如图1所示,其主要组成部分包括编码方式,适应度函数,遗传操作和终止条件。在考虑辐射屏蔽等多目标优化问题时,常常补充罚函数来约束可行解。
图1:遗传算法流程图
1.2.1 编码方式
遗传算法通常根据问题本身进行编码,通俗而言就是根据实际问题的需求选择染色体的形式。常用的编码方法包括实数编码,即组成染色体的为一串实数;二进制编码,染色体为由0和1组成的数组;整数编码,即组成染色体的为一串整数和符号编码,即染色体由一些具有代码意义的符号组成。
1.2.2 适应度函数
适应度函数,即为目标函数,一般用F(i, j)表示,其中i表示该个体处于第i代,j表示个体为该代的第j个染色体,其中每代个体总数一般相同,一般用n表示。适应度函数是对个体与其适应度之间的对应关系的描述,也是遗传算法解决问题的关键。一般而言,适应度函数要满足其值越大,其所代表的个体在解决该问题上表现更佳。
1.2.3 遗传操作
基本的遗传操作包括:选择、交叉、变异。选择操作即对个体进行适应度评估,并根据自然选择的规律适应度高的个体基因被保留的概率高,适应度低的个体虽然更容易被淘汰,但仍有一定概率会被保留。具体的算法表达即为在选择用于遗传的父代时,父代个体被选择的概率p应与F(i, j)成正比。常见的选择策略原理及其优缺点见表1,合适的选择策略会显著提升算法的搜索效率和速度。
表1:三种常见选择策略及其优缺点
在自然界生物繁衍的过程中,下一代产生的核心环节为两条染色体通过基因重组形成新的染色体。作为来源于这一自然过程的算法,交叉操作也是遗传算法的核心环节。在算法中即将父代两条染色体的部分结构加以替换重组而生成新个体的操作。变异操作是用于生成新个体的辅助算法。变异在自然界为染色体上部分基因发生随机变化,这些变化与染色体的其他部分是无关的。表现在算法中为染色体数组中的两个随机选择的元素数值交换或者其中一个元素的数值发生随机变化等。和自然界中的变异相似,算法中也会有一个较低的变异概率(一般在0.3左右),只有当随机出来的概率小于变异概率才会发生变异。
1.2.4 算法终止条件
算法终止一般指适应度函数值的变化趋于稳定或者与已知理论值的误差极小,也可以是迭代到指定代数后停止进化。
1.2.5 罚函数
对于多目标优化问题,其众多约束条件很难在一个适应度函数中体现,故常通过引进一个惩罚因子把约束条件连接到适应度函数上,从而将有约束的最优化问题转化为无约束条件的问题。合理的罚函数可以在个体不满足约束条件时,使适应度函数值偏离预期,即对个体施行不满足约束条件的惩罚,离约束条件越远惩罚力度越大,偏离就越远。
与其他优化算法相比,遗传算法具有以下优点:
(1)由于遗传算法的初始种群一般为随机生成的多条染色体,故遗传算法的搜索是从多个初始点而不是单个初始点开始的,因此遗传算法前期收敛速度较快,能够较快找到一些较优的区域;
(2)由于一条染色体上有多个“基因”,故遗传算法具有天生的并行性,可以在对群体进行运算的同时对个体中的多个“基因”进行探索,也就是进行多目标探索;
(3)遗传算法具有良好的寻找全局最优解的能力。由于变异、交叉操作具有随机性,故遗传算法不会过于依赖探索环境,可以大概率在非连续,多峰和嘈杂的环境中收敛到满意的解。
但是遗传算法也有其缺点,最大的缺点为过早收敛,即“早熟”。研究表明遗传算法可以很快达到最优解的90%左右,即局部最优解,但要找到真正的最优解则需要花费很长时间。这很明显是由于面对已经很好的染色体,交叉和变异都很难形成更优的染色体了,即遗传算法后期探索不足。除此之外,遗传算法还存在运行效率低,稳定性差等缺点。
辐射屏蔽设计是一个典型的受辐射防护代价(防护层厚度,所用材料等)、辐射危害代价(辐射剂量)以及其他目标约束的多目标组合优化问题。一个优秀的辐射屏蔽方案可以应用于医疗器材防护,军用潜艇核动力和核电站安全等方面,在医学,军事,能源,航空航天等领域都能有所建树。但辐射屏蔽却是一个难题,其难点在于需要满足的各个目标之间往往是相互冲突的,某设计目标的改善可能会引起其他目标的劣化。例如,辐射防护效果变好或危险系数下降通常会导致用于辐射防护的成本上升……由此可以发现,对于辐射屏蔽问题,多个设计目标同时达到最优是很难甚至不可能实现的,故我们需要利用一些方法需找到各个目标都达到较优但综合起来最优的辐射屏蔽方案。
而利用遗传算法就可以通过设置合适的适应度函数,平衡各个因素的权重,进而在较短时间内得到较优的辐射屏蔽设计方案。其基本原理为设置一组染色体代表不同的设计方案,一条染色体中不同的基因代表一个设计方案中不同参数的具体设置,例如屏蔽层厚度,屏蔽材料,受辐射剂量等。设置综合考虑了辐射防护代价和辐射危害代价的适应度函数,使代价大小与适应度函数值满足一定比例关系。随后通过“交叉”,“变异”的遗传操作和适应度函数的筛选即可得到各个目标都达到较优且综合最优的辐射屏蔽方案。
目前,已经有不少研究致力于利用遗传算法得到更优的辐射屏蔽设计方案:越南的Pham Hong Thin,韩国的Byeong Soo Kima和Joo Hyun Moonb等人,利用遗传算法进行了辐射屏蔽问题的设计优化研究并取得了令人满意的结果。西安交通大学的胡华四等人用遗传算法建立了屏蔽材料的优化设计方案,并应用该方法对4种辐射屏蔽材料进行了检验,还探讨了该材料优化方案进一步应用于航空航天器和聚变中子、γ混合辐射场的辐射屏蔽设计中的可能性。清华大学的熊华等人引入了遗传算法建立了组合屏蔽自动设计方法。南华大学的廖伶元等人利用遗传算法对衰减公式进行了优化计算,得出了屏蔽材料组分含量的最佳配比,并发现了遗传算法计算得出的配比材料屏蔽效果最好……以上种种研究都表明了遗传算法在辐射屏蔽设计优化中有着重要应用。
中子剂量的测量与估算仍是辐射防护领域的一个难题。目前测量放射性工作场所中子能谱的主要方法为多球中子谱仪。多球谱仪用于测量不同尺寸聚乙烯球内探测器的计数,将计数和预先建立的探测器响应矩阵进行反卷积解谱运算,从而获得辐射场中子能谱信息,即根据测量结果反解得到中子能谱信息,如图2所示。
图2:中子能谱解谱原理示意图
图2中(cc……c)为各探头的计数,(ϕϕ……ϕ)为代表中子通量的矩阵(即中子谱),中间m×n的矩阵为探头响应矩阵。编程思路为先随机生成(ϕϕ……ϕ)矩阵,与响应矩阵作乘法后得到计算值(cc……c),不断筛选优化(ϕϕ……ϕ)矩阵后使得|c/c|≈1即可。
但在某些情况下需要对热中子到数百MeV范围内的中子谱进行解谱,工作难度很大。很多中子解谱程序如SAND-II、LOUHI-83等都需要在进行解谱过程前给出预置谱,解谱结果的精确度和准确度首先依赖于预置谱的给出。德国开发的ANDI-03程序则利用遗传算法避免了预置谱的给出过程。最终在不给出预置谱的情况下利用遗传算法对中子进行了解谱并与另外一个中子解谱程序SAND-II的结果进行了比较。结果表明在同一位置处在允许的误差范围内两者的结果是一致的,即可以利用遗传算法进行准确的中子解谱。
遗传算法还应用在辐射防护的其它领域,如:优化放射治疗射野参数,在提高对肿瘤控制率的同时保护正常组织受到最小的放射损伤;优化在强辐射场下人员的工作安排从而达到降低辐射剂量的目的;实现了放射性药物内照射生物动力学数据分析中的数据拟合等。
基于本人在研究燃烧场二维分布重建时创造性地发现了结合模拟退火算法的遗传算法能够有效地避免遗传算法最大的缺点——过早收敛。且在辐射防护领域也有很多将遗传算法与其他算法和模型相结合的先例,例如混沌算法,人工神经网络模型等。故接下来我将简单分析遗传模拟退火算法应用于辐射防护问题的可能性和优越性。
模拟退火算法是基于物理中固体物质的退火过程与一般组合优化问题之间的相似性而诞生的算法。其从某一较高初温出发,伴随温度参数的不断下降,结合概率突跳特性在解空间中随机寻找目标函数的全局最优解,即在陷入局部较优解时能概率性地跳出并最终趋于全局最优。
其基本编程思路为设置一个n维变量的“粒子”(xx……x),不同的维度代表不同的变量,在搜索空间内随机生成初始粒子。由于搜索空间较大,给粒子加扰动前后其适应度函数值可能发生很大的变化,因此需要设置一个较高的初温保证“粒子”具有足够大的搜索范围。设置主程序控制温度下降,一般采取指数降温的方式,在每个温度下粒子进行一定次数的探索,即(xx……x)发生变化。由于模拟退火算法仅有一个解在空间中进行探索,因此在搜索前期,应采用较大范围的搜索,即探索步长较大。可以令“粒子”在其与区域边界距离范围内随机移动,以搜索适应度值较低的区域。而到了探索后期则需要进行局部探索,即探索步长显著减小。探索后期容易出现连续降温但当前最优解不发生变化的情况,此时需要进行回温操作,即令温度升高,使“粒子”的与探索能力再次变强。
由编程思路可以发现模拟退火的优点是既能够大面积探索又能精细搜索,且不容易陷入局部较优解中。缺点是只有一个解在偌大的空间中探索,对于自变量维数多的问题随机游走达到最优解的概率低。
结合了模拟退火算法的遗传模拟退火算法的流程图如图3所示。其主要思路是利用遗传算法的大规模种群搜索到适应度函数值较优的区域,当适应度函数值达到一定值后再间隔一定的遗传代数对每个个体进行一次模拟退火操作,这一步的主要目的是使得每个解向着自己领域内的更优位置移动,尽管它不一定能直接导致全局最优的更新,但能让每个粒子尽量更新到自己领域内的局部最优,推动全局最后在遗传过程中更新。
图3:遗传模拟退火算法流程图
在研究燃烧场分布重建这一领域上,模拟遗传退火算法在重建精度,重建速度和稳定性各个方面都优于遗传算法。而在辐射防护领域,中子能谱解谱与燃烧场分布重建的原理极为相似,都是需要通过多个计数器的测量结果反演出实际的能量或者物质分布,故将遗传模拟退火算法应用于中子解谱中也应该能够更快更准确地得到更稳定的中子能谱信息。对于辐射屏蔽方案优化问题,由于模拟退火具有概率突跳特性,即它可以强制性地让算法去往不同空间进行探索,故模拟遗传退火算法能够很好地解决遗传算法收敛较快,陷入局部较优解的缺点。即能够更充分地探索解空间,得到更优秀的辐射屏蔽设计方案。总而言之,与模拟退火算法结合是从算法原理上解决了遗传算法的缺点,理论上会给所有应用遗传算法的领域,包括辐射防护,带来更高效更准确的研究工具。
随着环境和能源问题的日益严重,如何把握好核能这一双刃剑,解决建立辐射防护问题,安全和平地利用核能是迫在眉睫的。而随着人工智能和计算机的发展,遗传算法也发展迅速,并能够很好地解决辐射防护目前面对的问题。基于此,本文总结了遗传算法在辐射防护领域中的主要应用,并类比燃烧场重建分析了遗传模拟退火算法应用于辐射防护领域的可能性和优越性。虽然现在辐射防护领域应用遗传算法的发展主流方向结合蒙德卡罗方法,神经网络模型和遗传算法的混合算法。但我相信遗传模拟退火算法的优越性也可以为辐射防护的研究提供一条新的思路和更广阔的发展前景。