基于WOA改进随机森林的大学生心理健康测评研究

2019-09-25 04:16杨欢欢张严心
微型电脑应用 2019年9期
关键词:决策树类别个体

杨欢欢, 张严心

(1.陕西财经职业技术学院 学生工作处, 咸阳 712046;2.西藏民族大学 外语学院, 咸阳 712082)

引言

随着生活节奏的加快和社会竞争的日益激烈,大学生面临的学习、生活、情感以及就业压力显著增强,导致大学生心理问题日益突出,直接关系和影响大学生的心理健康和校园稳定,因此研究大学生心理健康状况成为很多学者普遍关注的热点问题[1]。为弥补大学生心理健康测评研究传统方法的不足,运用鲸鱼优化算法[2](Whale Optimization Algorithm,WOA)改进随机森林(Random Forest,RF)进行大学生心理健康测评研究,挖掘出影响大学生心理健康的主要因素,为高校学生心理辅导提供科学决策的基础和依据。

1 随机森林分类

随机森林分类[3-4](Random Forest Classification,RFC)算法是基于决策树分类器的组合算法,其利用bootstrap重抽样方法从原始样本中抽取多个样本,对每个bootstrap样本构建决策树,然后将所有决策树中出现最多的投票结果最为最终预测结果。假设随机参数向量θ对应的决策树为T(θ),其叶节点为l(x,θ),RFC算法步骤如下。

Step1 利用bootstrap方法重采样,随机产生k个训练集θ1,θ2,…,θk;利用每个训练集生成对应的决策树集{T(x,θ1)},{T(x,θ2)},…,{T(x,θk)};

Step2 假设特征有M维,从M维特征中随机抽取m个特征作为当前节点的分裂特征集,并以m个特征中最好的分裂方式对该节点进行分裂;

Step3 每个决策树均得到最大限度的生长,在此过程中不进行剪枝;

Step4 对于测试集样本Z,运用每个决策树测试,获取对应的类别{T(z,θ1)},{T(z,θ2)},…,{T(z,θk)};

Step5 运用投票法,将k个决策树中输出最多的类别作为测试集样本Z所属类别。

2 鲸鱼优化算法

在WOA算法中,每只座头鲸的位置表示一个可行解,该算法具体描述如下:

(1) 环绕式捕食。座头鲸能够识别猎物的位置并进行包围。如果当前的最佳鲸群个体位置为目标猎物,则位置更新策略如式(1)、式(2)。

D=|C·X*(t)+X(t)|

(1)

X(t+1)=X(t)-A·D

(2)

其中,A和C为系数;t为当前迭代次数;X(t)为当前鲸鱼的位置向量;X*(t)为当前最佳的鲸鱼位置向量。

A和C计算公式如式(3)、式(4)。

A=2a·r1-a

(3)

C=2r2

(4)

其中,r1和r2为随机向量,处于[0,1]之间;a值由2线性下降到0。如式(5)。

a=2-2t/Tmax

(5)

其中,Tmax为最大迭代次数。

(2) 发泡网攻击。该阶段主要机制有收缩包围机制和螺旋式位置更新,通过座头鲸气泡网建立数学模型,具体描述如下:

1) 收缩包围机制:该机制通过减小a值实现,其中A是随机数,处于[-2,2]之间;当A处于[-1,1]之间时,新鲸群个体搜索位置是食物所在位置,此时鲸鱼靠近食物进行觅食;反之,则鲸鱼远离食物。

2) 螺旋式位置更新机制:先计算鲸群个体与猎物的距离,之后为模拟座头鲸的螺旋游走行为,在二者之间创建一个螺旋数学模型,该模型如式(6)。

X(t+1)=D′·ebl·cos(2πl)+X*(t)

(6)

其中,D′=|X*(t)-X(t)|为第i头鲸群个体当前最佳位置与猎物的距离;l为随机数,处于[-1,1]之间;b为对数螺旋形状参数。座头鲸在捕食猎物时,不但进行螺旋游动而且进行包围收缩,其在以50%的概率p在螺旋模型和收缩包围机制之间进行位置更新,其数学模型为式(7)。

(7)

其中,p为随机数,处于[0,1]之间。

3) 搜索捕食:当A>1或A<-1时,鲸群将进行移动搜索远离猎物,借此寻找一个更加合适的猎物,突出WOA算法在全局搜索中的勘探功能,数学模型如式(8)、式(9)。

D=|C·Xrand(t)-X|

(8)

X(t+1)=Xrand-A·D

(9)

其中,Xrand为从当前鲸群中随机选择的位置向量,也就是随机鲸群个体。WOA算法流程图如图1所示。

图1 WOA算法流程图

3 基于WOA-RFC的心理健康测评

3.1 适应度函数

针对RFR预测结果易受森林中树的数量Ntree、候选特征子集Mtry和叶节点的样本数Nodesize等参数影响[5-6],在保证云计算资源负载预测误差最小情况下,实现森林中树的数量Ntree、候选特征子集Mtry和叶节点的样本数Nodesize等参数的自适应选择,运用WOA算法对RFC参数进行优化选择,选择分类准确率T为适应度函数为式(10)。

(10)

其中,Total为样本总数量;right为正确分类的样本数量。

3.2 算法流程

基于WOA-RFC的大学生心理健康测评流程为:

Step1 读取大学生心理健康评价指标数据,产生RFC训练集和测试集,并进行数据归一化为式(11)。

(11)

其中,x′为归一化之后的数据;x,xmax,xmin分别原始数据、原始数据中的最大值和最小值;a、b为归一化之后的最小值和最大值。本文取a=-1,b=1。

Step2 WOA参数初始化。设定种群规模N、当前迭代次数t、最大迭代次数M和对数螺旋形状常数b,并随机初始化鲸群初始位置Xi(i=1,2,…,n);森林中树的数量Ntree、候选特征子集Mtry和叶节点的样本数Nodesize参数范围的初始化;

Step3 根据公式(10)计算每个鲸群个体的适应度,找到当前群体中最佳鲸群个体X*,并进行保存;

Step4 若t≤M时,则进行a、A、C、l和p更新;

Step5 当p<0.5时,若|A|<1,根据公式(2)更新当前鲸群个体的空间位置;当|A|≥1时,则从当前群体中随机选择鲸群个体位置Xrand,根据公式(9)更新当前鲸群个体的空间位置;

Step6 当p≥0.5时,根据公式(6)进行当前鲸群个体空间位置的更新;

Step7 进行鲸群个体搜索空间判断限制和修正;

Step8 根据公式(10)计算每个鲸群个体的适应度,找到当前群体中最佳鲸群个体X*,并进行保存;判断算法是否终止,若t≥M时,则转到Step9;反之,重复Step4-Step8;

Step9 输出最优鲸群个体适应度及其对应的空间位置X*,输出RFR模型的最优参数:森林中树的数量Ntree、候选特征子集Mtry和叶节点的样本数Nodesize,并将这三个最优参数用于大学生心理健康测评。基于WOA-RFC的心理健康测评流程图如图2所示。

图2 基于WOA-RFC的心理健康测评流程图

4 实证分析

4.1 数据来源

为了验证WOA-RFC的有效性,选择某高校2017年某学院300名入校大学生为研究对象,数据来源于入校所做的大学生心理健康测量表[7-8],该表涉及大学生心理健康状况的104个预设问题,其中男生212名、女生88名。根据SCL-90总分和中国常规模式评价指南和心理健康评价相关文献[9-14],大学生心理健康分为精神病、偏执、恐怖、敌对、抑郁、焦虑、人际关系敏感、强迫和躯体化9个维度[15-16],大学生心理健康评价标准如表1所示。

表1 大学生心理健康评价标准

对于“家庭月收入”等连续型数据进行离散化处理[12],家庭收入离散化结果如表2所示。

表2 家庭月收入离散化结果

4.2 结果分析

为保证结果的可靠性,随机抽取80%的数据作为训练样本集,剩下20%为测试样本集,将WOA-RFC和RFC[17]、支持向量机(support vector machine,SVM)[18]和前馈神经网络(back-propagation neutral network,BPNN)[19-20]进行对比,测试结果如表3和图3-图6所示。

表3 识别效果

图3 WOA-RFC识别结果

图4 RFC识别结果

图3-图6中,“*”表示大学生心理状态的预测类别,“○”表示大学生心理状态的实际类别,通过对比展示可以直观地显示大学生心理状态识别结果和实际大学生心理状态类别,其中1、2、3、4、5分别表示心理健康、强迫、焦虑、人际关系和抑郁。当“*”和“○”重合时,大学生心理状态的预测类别和实际类别一致,说明识别正确;当“*”和“○”不重合时,大学生心理状态的预测类别和实际类别不一致,此时大学生心理状态识别错误。由表3和图1-图4可知,WOA-RFC的识别准确率为99.41%,优于RFC的96.30%,SVM的96.50%和BP的92.33%,通过对比发现,WOA-RFC具有更高的大学生心理状态识别准确率,效果较好。通过WOA-RFC和RFC、SVM、BPNN的对比发现,WOA-RFC具有更高的识别准确率,提高了大学生心理状态识别的精度,同时为大学生心理状态识别研究和应用提供了新的方法。

图5 SVM识别结果

图6 BPNN识别结果

5 总结

为实现大学生心理健康状态评价,提出一种基于WOA-RFC的大学生心理健康测评研究方法。通过WOA-RFC和RFC、SVM、BPNN的对比发现,WOA-RFC具有更高的识别准确率,提高了大学生心理状态识别的精度,同时为大学生心理状态识别研究和应用提供了新的方法,为高校学生心理辅导提供科学决策的基础和依据。

猜你喜欢
决策树类别个体
论陶瓷刻划花艺术类别与特征
一起去图书馆吧
信息时代基于决策树对大学生情绪的分类
简述一种基于C4.5的随机决策树集成分类算法设计
关注个体防护装备
明确“因材施教” 促进个体发展
决策树学习的剪枝方法
How Cats See the World
决策树在施工项目管理中的应用
选相纸 打照片