用社会情感算法提取分类规则

2015-11-30 08:20王俊艳
装备制造技术 2015年10期
关键词:个体规则群体

王俊艳

(太原科技大学复杂系统与智能计算实验室,山西 太原030024)

随着“大数据时代”的到来,由于它的信息量大、类型多、速度快时效高、价值密度低的特点,所以如何从大量数据提取出有用的信息并且被利用起来是一个比较重要的话题。分类是数据挖掘的一个重要技术,比较有名的算法有Bayes判别法、支持向量机和K-近邻法等。

传统的群智能优化算法大多模拟动物群体的社会行为,由于这些算法模拟的动物群体均只能较低,其个体难以进行有效决策,所以算法容易陷入局部极值点。而社会情感优化算法[1](SEOA)是通过模拟人类情感、情绪对行为的影响而构造的一种群智能优化算法,由于个体有情感因素的加入,能够利用每个人的情绪作为控制策略,从而提高了算法的性能,改善了算法的多样性和灵活性。它已被成功应用于电力系统无功优化[2]、团簇结构优化[3]等实际问题中。本文将把社会情感算法应用于分类问题,针对连续属性建立模型。

1 社会情感算法

在社会情感算法中,情感能力是人类智能的重要标志,它影响着人的决策、学习和交流,并在人类的决策中起着决定性的作用。社会情感算法模拟了理智情况下的人在参与某种社会活动时,感知周围环境对其影响,通过情绪的反馈采取相应的决策,进而指导下一步的活动。

在初始化阶段,将所有个体的情绪指数都设为0,所有个体根据不同的情绪值进行更新。

当Ej(t+1)<m1时,

此时个体情绪低落,因此在自己历史最好评价学习时,其行为更趋向于规避那些群体历史最差评价的个体,因此设置c代表个体历史最好社会评价值,

当时,

此时个体情绪平和,能够冷静思考并且学习积极性提高,除了自我学习外还会向整个种群里历史评价最好的个体学习,因此其行为更倾向于学习而非规避即表示群体历史最好社会评价值,

当E(jt+1)>m2时,

此时个体情绪高昂,学习的渴望非常强烈,而忽略群体历史较差评价的负面影响,只考虑外界环境的最好评价。

2 SEOA算法应用于分类

2.1 分类模型及结构图

分类模型有很多种表示方法,如决策树、神经网络、数学公式、规则和框架等。由于分类规则表示形式简单,容易理解,因此宜采用规则来描述分类问题。分类模型按功能可以分类规则发现和规则集验证两部分。

首先介绍分类的总体结构图,主要包含三层嵌套算法,每一层算法用来完成某种特定的任务。分类总体结构图如图1所示。

图1 分类总体结构图

最内层为分类规则探索算法Classification Rule Discovery Algorithm,在此采用社会情感优化算法。其任务是寻找并返回比较好的规则,该规则对已给定的训练实例具有较好的分类。

Covering Algorithm在接收到训练集实例集后,激发分类规则探索算法Classification Rule Discovery Algorithm,除去已被分类规则正确分类的实例来简化训练集,分类规则探索算法重复执行,直到训练集中剩余的实例数达到预先设置值为止或者已经全部正确分类,此时便生成了该类规则的规则集合。

最外层的算法是确认算法Validation Algorithm,它的目的不仅在于确定由Covering Algorithm所返回的规则集的准确度,计算其结果,如准确度、耗时等。

用社会情感算法进行提取分类规则时,由于每次都是针对某类进行的,所以现以第i类规则提取的算法实现步骤为:

(1)设置最大迭代次数,种群初始化且初始群体个体的情绪指数;

(2)根据公式(1)(3)(5)计算个体的社会评价值;

(3)计算每个个体的社会评价值;

(4)对于每个个体,将其社会评价值与所经历过的最好社会评价值进行比较,若较好,则将其作为当前的最好评价;

(5)对每个个体,将其社会评价与群体所经过的最好社会评价值进行比较,若较好,则将其作为当前的全局最好评价;

(6)是否达到最大的进化代数或者数据全部正确分类,若是进入(7),否则执行(2);

(7)将生成的第i类规则放入规则集中,然后在数据集中删除规则所覆盖的实例,查看剩余的数据数是否小于设定的值,若是,则该类规则提取完成,否则执行(1)。

2.2 适应值函数

适应值函数采用文献[4],即用准确度和精确度两者综合来评价分类规则的好坏。

w1和w2是权重系数,取值在0~1之间,且w1+w2=1.

3 仿真实验

本实验中数据集Iris Plant采用的是UCI[5]机器学习数据库提供的,采用的是随机测试,随机选择9/10数据作为训练集来进行分类规则的提取,其余的1/10用已经得到的分类规则作为测试集,验证分类的正确率。实验共运行十次,统计十次均值作为此分类的结果。在SEOA算法中,Gmax选取1000代,情绪指数w1、w2取值为0.49和0.6。下面给出用公式(6)为适应值函数对Iris Plant提取得到的分类规则:

If 4.554

then class=Iris Setosa

If 4.9

then class=Iris Versicolour

If 4.9

then class=Iris Virginica

其分类正确率达到了91.4%。

4 结束语

本文把社会情感算法应用于连续属性的分类问题中,进行分类规则的提取,取得了比较好的效果,由于社会情感算法在模拟情绪选择方式时采用了现行递减的方式,并不符合人的正常心理变化,因此可以对其改进然后再进行分类规则的提取,还可以尝试在更多数据集上实现分类。

[1]崔志华.社会情感优化算法[M].北京:电子工业出版社,2011.26-29.

[2]魏战红.社会情感优化算法及其在电力系统无功优化中的应用研究[D].太原:太原科技大学,2011.

[3]Yongjing Chen, Zhihua Cui, Jianchao Zeng.Structural Optimization of Lennard-Jones Clusters by Hybrid Social Cognitive Optimization Algorithm,Proceedings of 9th IEEE International Conference on Cognitive Informatics(ICCI 2010),July 7-9,Tsinghua University,beijing,China,pp.204-208.

[4]王俊艳.应用微粒群算法提取分类规则[D].太原:太原科技大学,2008.

[5]UCI repository of machine learning database [EB/OL].www.cgi.com/technology/m lc/db,2005-05.

猜你喜欢
个体规则群体
撑竿跳规则的制定
数独的规则和演变
通过自然感染获得群体免疫有多可怕
关注个体防护装备
明确“因材施教” 促进个体发展
“群体失语”需要警惕——“为官不言”也是腐败
让规则不规则
TPP反腐败规则对我国的启示
How Cats See the World
关爱特殊群体不畏难