基于免疫遗传算法的自组织映射网络应用研究

2018-12-14 08:39李鹏松李俊达
东北电力大学学报 2018年6期
关键词:鲍鱼缺席遗传算法

李鹏松,刘 欣,李俊达

(东北电力大学 理学院,吉林 吉林 132012)

神经网络(Neural Network,NN)是一种模拟人脑大数据分析机制的计算方法,是目前大数据分析中较为成功的方法之一.近年来,随着当代计算机计算能力的不断提升,在神经网络的基础上研究的大数据分析方法取得了很多成果,主要体现在各应用领域,如语音大数据分析、图像大数据分析、医学大数据分析等[1],促进了人工智能的发展.在神经网络的领域里,广泛应用的反向传播(Back-Propagation)神经网络[2~3]是属于有监督的神经网络,其多层感知器的学习和分类是以一定的先验知识为条件的,即网络权值的调整是在有监督的情况下进行的.但在实际应用中,有时并不能提供所需的先验知识,这就需要网络具有足够的自学习能力.而自组织映射(The Self-Organizing Map,SOM)网络则是无监督的神经网络中较基础的一种神经网络,是通过自动寻找样本中的内在规律和本质属性,自组织、自适应地改变网络参数与结构.文献[4~6]分别将其应用在客户分类、任务分配、动作识别中,取得了较好的效果.

免疫遗传算法(Immune Genetic Algorithm,IGA)是将免疫理论(Immune Algorithm,IA)和基本遗传算法(Simple Genetic Algorithm,SGA)各自的优点结合起来的优化算法.保留了遗传算法的搜索特性,并利用了免疫算法的多机制求解多目标函数最优解的自适应特性,避免了因“早熟”现象而导致算法陷入局部极值.文献[7~11]主要研究了控制参数的选取、解的收敛等问题,丰富了免疫遗传算法的理论.

目前,国内外学者将智能优化算法与自组织映射网络相结合已取得一些成果,其中大部分都是对遗传算法自组织映射网络进行研究.文献[12~15]分别从不同层面出发,利用基于遗传算法的自组织映射网络,不同程度地提高了网络算法的分类准确度及训练效率.目前将免疫遗传算法和自组织映射网络相结合的研究结果尚不多见,本文构建了一种基于免疫遗传算法的自组织映射网络,利用免疫遗传算法的全局优化特征和自适应特性,分析如何用免疫遗传算法调整权值,优化自组织映射网络,使其充分发挥自组织映射网络的自学习能力以及自适应特性,提高了算法的分类准确度及训练效率.

本文主要关注以下2方面内容:

(1)构建了一种基于免疫遗传算法的自组织映射网络,采用免疫遗传算法对自组织映射网络的初始权值进行优化,然后运行自组织映射网络.

(2)将本文算法应用于员工缺席数据集以及鲍鱼数据集,得出分析结果,与基于遗传算法的自组织映射网络的分类结果进行比较,以说明本文算法的有效性.

1 基于免疫遗传算法的自组织映射网络

基于免疫遗传算法的自组织映射网络算法流程图,如图1所示.

图1 基于免疫遗传算法的自组织映射网络算法流程图

首先输入数据,将数据从矩阵形式化为编码形式,代入免疫遗传算法模型中,得到一个一维的权向量,将这个权向量作为自组织映射网络的初始权值.构建自组织映射网络结构,输入层神经元数量等于训练集样本数乘以数据维数,竞争层对于每一个输入数据,找到与它最相配的节点,即为优胜节点,判别函数为欧氏距离.找到激活节点之后,更新与它临近的节点,对于临近的节点,分配给它们一个更新的连接权值.在反复的竞争学习中,竞争层的各神经元对应的连接权向量逐渐被调整为输入样本空间的聚类中心.然后将测试集的样本数据输入模型中,得到测试集分类的结果,并与实际情况进行对比.自组织映射网络建立了每个样本和所分的类之间的激活关系,激活函数为sigmoid函数,有效地对数据集进行了分类.

2 结果分析

当学习率衰减到0时,网络完成训练,即分类结束.参数设定,如表1所示.

表1 参数设定表

2.1 员工缺席数据集分类结果分析

选取员工缺席数据集,数据样本为740,数据维数为21.将员工缺席数据集分为两部分,一部分为训练集,另一部分用做测试集和验证集,测试集分为2类,一类为员工缺席,一类为员工不缺席,再通过验证集来对比说明分类的准确度.在2类测试数据中分别使用不同记号.第1类出席标记为星号(*)、第2类缺席标记为加号(+).

基于遗传算法的自组织映射网络测试集分类结果,如图2所示.基于免疫遗传算法的自组织映射网络测试集分类结果,如图3所示.将测试集的缺席情况与验证集进行对比.

表2 算法结果对比表

根据实验结果,基于免疫遗传算法的自组织映射网络的分类效果较遗传算法的自组织映射网络的分类效果好,即本文算法的分类准确度、训练效率高于遗传算法的自组织映射网络,如表2所示.

图2 基于遗传算法的自组织映射网络对员工缺席数据的测试集分类结果图图3 基于免疫遗传算法的自组织映射网络对员工缺席数据的测试集分类结果图

2.2 鲍鱼数据集分类结果分析

选取鲍鱼数据集,数据样本为4177,数据维数为8.将鲍鱼数据集分为两部分,一部分为训练集,另一部分用做测试集和验证集,测试集分为3类,一类为鲍鱼年龄在0岁~10岁,一类为鲍鱼年龄在11岁~20岁,一类为鲍鱼年龄在21岁~30岁,再通过验证集来对比说明分类的准确度.在3类测试数据中分别使用不同记号.第1类鲍鱼年龄在0岁~10岁标记为圆圈(*)、第2类鲍鱼年龄在11岁~20岁标记为星星(+),第3类鲍鱼年龄在21岁~30岁标记为加量(+).

表3 算法结果对比表

基于遗传算法的自组织映射网络测试集分类结果,如图4所示.基于免疫遗传算法的自组织映射网络测试集分类结果,如图5所示.将测试集的鲍鱼年龄情况与验证集进行对比.

根据实验结果,基于免疫遗传算法的自组织映射网络的分类效果较遗传算法的自组织映射网络的分类效果好,即本文算法的分类准确度、训练效率高于遗传算法的自组织映射网络,如表3所示.

图4 基于遗传算法的自组织映射网络对鲍鱼数据的测试集分类结果图图5 基于免疫遗传算法的自组织映射网络对鲍鱼数据的测试集分类结果图

3 结 论

将本文提出的算法应用于员工缺席数据集与鲍鱼数据集,说明了算法的有效性,对员工缺席情况和鲍鱼年龄实现了更准确的分类.结果表明本文算法比基于遗传算法的自组织映射网络具有更高的训练效率.

猜你喜欢
鲍鱼缺席遗传算法
人生的鲍鱼
鲍鱼红烧肉
你缺席的那些年
骆浩:记录思考从不缺席
鲍鱼有什么营养价值
父母这一刻,你一定不要缺席
基于自适应遗传算法的CSAMT一维反演
新西兰地震震出上万只超级大鲍鱼
一种基于遗传算法的聚类分析方法在DNA序列比较中的应用
基于遗传算法和LS-SVM的财务危机预测