基于改进遗传算法的计算机数学模型构建研究

2022-05-09 01:05何庆钟维坚田风林锋唐苏东
中国新通信 2022年5期
关键词:数学模型构建计算机

何庆 钟维坚 田风 林锋 唐苏东

【摘要】    面向网络计算机中海量的数据信息,采取传统匹配搜索遗传算法进行匹配点、非匹配点的遍历,通常遍历到无效度更高的非匹配点较多,很难在短时间内找到与样本相近的最佳匹配点。基于此,针对基本遗传算法的无效遍历、数据冗余弊端,结合最小二乘法、Bagging集成聚类算法对原有遗传算法作出改进,建立起相似度匹配的计算机数学模型,确定高精度因子匹配的参数估算范围和辨识度,改进遗传算法关联矩阵编码、解码、交叉等集成学习与迭代环节,以扩展样本匹配的搜索空间与深度。

【关键词】    改进遗传算法    计算机    数学模型    构建

引言:

在企业工业化生产、计算机视觉处理数据匹配中,通常需要根据视觉数据因子、工作站的数量,设置n个样本数据为初始聚类中心,对多个相似对象进行最小误差求解,将不同对象分配至距离其最近的聚类中心,来完成算法最优解的搜索与匹配。因而面对传统遗传算法具有的无效遍历更多、搜索深度不足等特征,本文提出基于Bagging集成聚类的改进遗传算法,建立起企业装配线的计算机平衡优化数学模型,将双目装配线中的生产作业要素因子,合理分配到相应的工作站之中,进行种群聚类分析的编码、适应度计算,得到每个个体的搜索与聚类结果。

一、传统遗传算法的编码、数据搜索与交叉操作执行流程

傳统遗传算法为美国密歇根大学J.  H.Holland教授,根据达尔文“自然选择理论”提出的自适应数据信息搜索/优化技术,其初始群体编码是由二进制“0”和“1”字符组成的一连串字符串,将具有类似特征的字符串组合为特定子集,并利用随机搜索技术对多个字符串组成集合,进行交叉、变异等的迭代遗传操作,来确定全局最优解。

因而该遗传算法主要是对编码后的控制参数,作出编码串模式阶次的群体矢量搜索。在完成某一空间数据参量的编码后,先对群体P(t)展开选择、交叉、变异等遗传算法运算,再根据所求问题的目标函数(适应度函数),进行编码字符串集群中个体的适应度评估,得到下一代群体P(t+1)。传统遗传算法的编码、数据搜索与交叉操作的简单执行流程如下所示。

开始程序;

t←0;

初始化种群P(t) 编码;

评价种群P(t)编码;

如果不符合终止条件,则开始循环;

T←t+1;

从上一代种群P(t-1)中选择个体,形成新的群体P(t);

种群P(T)通过交叉和变异进化;

种群P(T)的适应度计算;

评价组P(T);

周期结束;

程序执行结束。

二、基于Bagging集成聚类的改进遗传算法

传统遗传算法在多个编码数据集群的搜索、交叉操作过程中,常常表现出无效遍历、数据冗余、搜索深度不足等问题,因而提出Bagging集成聚类算法,利用多个基学习器进行编码样本的综合学习,使聚类所有样本到聚类中心距离的平方和最小,由此得出每个集群个体的所属类别。

(一)Bagging并行式集成学习算法

Bagging是在统计学习采样技术的基础上,对多种不确定性样本进行统计、推断与学习的技术,具有多次抽样、并行集成的样本采集特征。如先给定样本容量为n的编码数据集群,从该集群中随机取出某一样本,放入Bagging采样数据集,再将该样本放回初始数据集,经过这样多次的随机抽样,重复抽样的过程为T次,得到涵盖v个样本的采样数据集,可记为Bagging样本Di=(x1,x2,…,xv),i=1,2,…,T。

针对以上T个采样出的训练样本集,选取多个基学习器对每个采样集的v个样本进行训练,再将以上多个基学习器的训练结果作出整合,输出为最终的Bagging并行式集成学习结果,完成Bagging算法的基本执行流程,具体集成学习结构如图1所示:

(二)Bagging与K均值聚类结合的遗传算法

集成聚类的遗传学习算法,是将Bagging集成学习算法、K均值聚类算法进行结合,生成K均值集成聚类算法,选定多个基学习器进行样本的训练学习,该机器训练学习流程属于无监督学习。也就是通常使用无标签的数据集、聚类准则函数,构建起用于聚类分析的准则函数:

(1)

具体集成聚类遗传算法的执行流程如图2所示。

第一步,给出n个混合样本,选取K个初始聚合中心Zj(I),j=1,2,...,K,其中I表示迭代次数。

第二步,利用Bagging集成学习算法采样数据训练集,将原始数据集的随机抽样放回原处,重复抽样过程T-1次,并获得涵盖v个样本的总共T-1抽样数据集,表示为Di=(x1,x2,…,xv),i=1,2,…,T-1。

第三步,在完成多个样本归类时,取出未抽样的w个样本,形成另一个取样集,记录为DT=(x1,x2,…,xv),则可以将以上的样本采样数据集总和为:

(2)

第四步,使用多个K均值基学习器,在T样本集上执行单独的聚类训练。将初始聚类类别数设置为K,将初始训练集中的样本数设置为z,建立K·z相关矩阵,并由基础学习者对样本进行聚类。记录基学习器的不同样本聚类类别投票的数据信息,如第i行和第j列的s数值,则表明存在有s个均值基学习器,对第i样本归类为第j类。

第五步,根据以上的K·z维关联矩阵,依照投票法则进行每个样本聚类类别的表示,其中投票数最多的聚类类别为样本类别,若投票数相同则随机选择某一类别,作为样本最终的聚类类别。

第六步,计算不同样本到聚合中心的距离D (xk,Zj(I))min={D(xk,Zj(I)),其中k=1 ,2,…,n,j=1,2,...,K,且xk∈wi。之后将得到的k个新的聚合中心,用

进行表示。

第七步,判断Zj(I+1)、Zj(I)之间的关系,若Zj(I+1)≠Zj(I)则将I+1的值赋给I,并返回第二步,否则结束算法。

图2    Bagging与K均值集成聚类遗传算法的执行流程

三、基于改进遗传算法的企业装配线计算机平衡优化数学模型

在企业装配线产线生产过程中,通常围绕工作站数、作业元素等的约束条件下,定义了装配线生产率和平滑因子的优化目标,建立了装配线多目标计算机平衡优化模型。

(一)装配流水线的作业约束

假设I为企业装配线作业元素的集合、J为工作站集合,设置装配线生产速率为C,m、n分别为装配线种群的工作站数目、作业元素个数,则Jk为第k个工作站的不同作业元素集合,k∈(1,M)。

因此,可设置企业装配线的作业元素集合为x=[x1,x2,…,xn],将所有满足工作站数、作业元素等的约束条件的作业元素,整合为X=M·n的关系矩阵,表示不同作业元素在装配工作站中的分配情况,其中X(i,k)∈X。若X(i,k)=0,则表示装配线元素i未被分配到工作站k中;若X(i,k)=1,则表示裝配线元素i被分配到工作站k之中。之后设置Ppred为装配线作业元素i的n×n维关系矩阵集合,Ppred(i,1)表示初始作业元素,Ppred(k,i)=1表示k为i的前序作业元素,Ppred(k,i)=0表示k为i的后序作业元素。那么在企业装配线生产作业过程中,将每个作业元素i分配至单一的工作站,需要满足以下的优先关系条件:

不同装配线工作站的作业元素分配、生产速率(作业总时间)等执行公式如下所示:

(二)装配线作业的优化目标

根据企业装配线作业生产速率C、平滑因子S等的优化目标,定义工作站作业时长的最大值为生产速率C,C=maxTk、k∈(1,M);定义平滑因子为企业装配线负荷利用率、人员利用率等平衡指标,平滑因子

因而依据以上约束条件下的企业装配线作业生产速率C、平滑因子S等优化目标,可以得出企业装配线计算机平衡优化的数学模型为:

(三)Bagging集成聚类的改进遗传算法执行流程

为了改进与提升传统遗传算法,所存在的数据搜索深度、数据遍历效率水平,主要利用Bagging集成聚类算法,对原有利用随机搜索技术的交叉、变异等迭代遗传操作,作出遗传算法种群聚类、交叉分析的改进。根据企业装配线的计算机平衡优化数学模型,将双目装配线中的生产作业要素因子,合理分配到相应的工作站之中,进行种群聚类分析的编码、适应度计算,得到每个个体的搜索与聚类结果,判定随机配对的个体是否属于同一种群聚类,以此来确定全局最优解。

记Spop为装配线生产速率C、平滑因子S等种群的数目;pop(t)为第t代种群、G为遗传代数;Pc表示交叉概率、Pm表示变异概率。则Bagging集成聚类的改进遗传算法执行流程如下所示:

第一步,设置包括Spop、G、C、S、M、Pc、Pm、T、v、K等的初始值。

第二步,令t=0,根据设置的初始化种群Ppop(0),随机产生种群Spop的多个个体数目量。

第三步,围绕第t代种群P(t)的多个个体,进行第t代种群适应度的计算,计算得出装配线作业生产速率C、平滑因子S等的适应度参考值。

第四步,惩罚项。检查每一代种群个体,是否满足装配线工作站数、作业元素等的约束条件。若不满足以M固定值为主的工作站数量约束条件,则需要向多个种群个体添加相应的适应行惩罚项,例如设置适应性参考值为500的极大值,淘汰掉那些不符合适应度要求的个体。

第五步,根据作业生产速率C、平滑因子S等的适应度参考值,进行双目标并列选择的操作,选出具有最优适应度参考值的种群个体,将其标记为S=Spop/2,然后对多个最优个体重组为第t+1代的新种群。

第六步,利用Bagging集成聚类算法,进行交叉与变异操作。依托Bagging集成聚类算法,采用单点交叉、单点变异规则,在个体编码字符串中设置交叉点、基因变异点,从对应基因范围内取一数值代替原有种群个体值。

第八步,循环操作。若满足工作站数为M的固定值约束,将t+1赋值给t,停止循环迭代计算;否则转向第三步。

四、基于改进遗传算法的计算机平衡优化模型的仿真实验分析

为对改进后的bagging集成聚类算法,进行深度搜索、交叉计算能力的验证,本文以某以制造业的变速箱装配线作业为例,设置变速箱装配线工作站M=12、作业元素数量n=27的优先关系,具体如下图所示。借助于MATLAB 2019b仿真模型,对该装配线生产速率C、平滑因子S的计算进行平衡优化,具体计算机数学模型的参量设定如下:装配线固定工作站M=12、作业元素数量n=27,以及生产速率初始值C=130s、平滑因子种群数量S=200、交叉概率Pc=0.6、变异概率Pm=0.05、遗传代数G=50。

当在每组实验中分别设定参数T=5~7、v=60~80、K=3~5时(如表1所示),得到的装配线生产速率C=120s、平滑因子S=18.3~18.4,具体优化过程如图3所示,优化时对不同代种群的生产速率C、平滑因子S最优值进行记录。

图3    基于Bagging改进遗传算法的生产速率C、平滑因子S优化过程

表1    仿真实验参数设定与结果分析

仿真实验设定参数 装配线生产速率C/s 平滑因子S

未改进遗传算法 130 19.71

T=5、v=60、K=3 120 18.36

T=5、v=80、K=5 120 18.27

T=7、v=60、K=5 120 18.43

T=7、v=80、K=3 120 18.41

从图3、表1可以得出,装配线作业生产速率的优化在5代以内得到最优值,平滑因子S分别在15代、40代后收敛,装配生产速率C、平滑因子S的双目标均得到优化。但由于在多次Bagging集成聚类算法的平衡优化过程中,得到的平滑因子S数值存在着变化性,因此可以认为在不同参数设置下,平滑因子S优化的搜索深度不同。从整体上看,在4次实验中分别设定不同参数背景下,最终平滑因子S=18.3~18.4优于未改进遗传算法的最优解,提高了装配效率、减少了总空闲时间,该Bagging集成聚类算法可用于对可行解进行深度搜索。

参  考  文  献

[1] 余航.计算机数学建模中改进遗传算法与最小二乘法应用[J].  电子设计工程. 2020(01):15-18.

[2] 陈军红.平面控制网的复数域最小二乘法估计研究[J].  华中师范大学学报(自然科学版). 2019(02):181-188.

[3] 李凤坤.改进AHP-GA算法的多目标配送路径优化[J].  计算机系统应用. 2019(02):152-157.

[4] 丁立超,黄枫,潘伟.基于改进混沌遗传算法的炮兵火力分配方法[J].  系统仿真技术. 2021(01):12-16.

[5] 钟育彬,邓文杰.基于复杂适应度函数的因素遗传算法[J].  广州大学学报(自然科学版). 2020(05):47-50.

[6] 葛晓梅,李世豪.基于改进遗传算法的多目标车间布局优化问题研究[J].  现代制造工程. 2021(03):10-14+9.

猜你喜欢
数学模型构建计算机
活用数学模型,理解排列组合
浅谈构建数学模型,建立千以内数的数感
中国计算机报202007、08合刊
中国计算机报2019年48、49期合刊
中国古代的“计算机”
对一个数学模型的思考
“费马点”数学模型在中考中的应用
环境生态类专业大学生创新创业能力培养体系的构建与实践
构建游戏课堂加强体育快乐教学的探究
共情教学模式在科学课堂的构建与实施研究