混沌理论和支持向量机的就业率预测

2023-03-06 12:05吴苏礼雷双媛王冠卓刘大旭

微型电脑应用 2023年1期

吴苏礼，雷双媛，王冠卓，刘大旭

(黑龙江中医药大学，佳木斯学院，黑龙江，哈尔滨 150040)

0 引言

近年海量毕业生涌入社会，但是社会各行各业职位有限，就业压力逐年增大，就业竞争激烈[1]。社会各界与高校都越来越重视大学生的就业率情况，每个高校对于大学生就业情况的统计都有一套已经形成体系的大学生就业率统计信息管理系统或者管理模型[2-4]。高校信息管理水平不断提升，能够完整保存并汇总历年毕业生的就业情况数据与就业率统计结果，存储在高校的就业统计系统之中。高校为制定招生计划和教学计划，需要对毕业生历年就业情况进行预测，对于预测情况已经有众多学者做出研究：有学者使用灰色预测模型[5]预测大学生就业情况，该方法利用数字建模实现就业率预测，但在预测准确性方面仍需进一步研究；还有学者提出以立体数据作为基础的就业率预测方法[6]，该方法从横、纵两个方面实现就业率预测，同时也为大学生未来就业做出指导，但是存在计算过程较为复杂的情况，在未来研究中仍需进一步验证。

混沌理论是同时包含量化分析与质性思考的方法，决定论方程无规律运动也是混沌性的来源，分析有关混沌理论的各种方法总结出两个有关混沌理论的基本观点：混沌是一种对于非线性系统内在随机性的确定，也就是说混沌理论是一种表面上看似无规律但实际上却存在内在联系的非周期行为，在处理混沌理论时，使用非线性手段处理非线性问题[7-9]。

支持向量机是一种人工智能算法，最终目的是实现结构风险最小化，对于非线性以及局部极小点等现实问题能够具有较好的解决效果，在各类预测问题中应用广泛[10]。使用支持向量机实现预测时不但需要关联自身样本，同时还需要关联被预测的训练样本。在实际使用时，通过人工手段实现训练样本的输入与输出矩阵，评价模型预测效果与逼近能力的好坏采用均方根误差时进行衡量，但是这种方法仍然存在不足的地方，比如选取训练样本时没有正确的理论指导，若想实现模型修正必须不断调整真实值和预测值之间的误差，待模型预测精度达到一个满意值方可停止修正，这种情况导致模型需要经过长时间训练，这种长时间的训练极其容易造成模型出现过拟合，因此需要引入非线性的混沌理论实现修正，对预测对象实行建模。

本文主要研究基于混沌理论与支持向量机的就业率预测，为高校未来工作指明方向。

1 基于混沌理论和支持向量机的就业率预测

1.1 混沌优化算法

在就业率预测方法中使用混沌优化算法就是为了实现预测模型优化，搜索过程中使用混沌变量。式(1)为Logistic模型，通过该模型实现混沌映射：

zm+1=4zm(1-zm)

(1)

利用minf(x1,x2,…,xn)xi∈[ai,bi](i=1,2,…,n)表示连续对象的优化问题，待优化参数与xi的取值空间分别使用xi和[ai,bi]表示。

经式(1)获得混沌序列值，对该值载波，对应混沌变量与待优化参数，经迭代后将结果在[ai,bi]区间映射出来，同时获得与区间对应的xi值，由此求得f(x)的值，由此判断迭代结果是否最优，如果是最优迭代结果则停止迭代，反之继续迭代。通过以下步骤实现混沌优化算法改进。

(1) 对算法实行初始化，设M1与M2分别表示搜索次数与二次搜索迭代次数，把n个初值zi0(i=1,2,…,n)赋值到式(1)中(初值之间差异较小)，则混沌变量集合{zi}有n个差异轨迹，设j0表示迭代常数。

(2) 开始第一次载波。在第i个优化变量内，使用式(1)把已经确定的n个混沌变量zi,m引入，使优化变量转换为混沌变量：

xi,m=ai+(bi-ai)zi,m

(2)

通过式(2)放大混沌变量的变化范围，使变量取值范围在对应的优化量中。

(3) 实现粗略搜索。使xi,m与xi(k)相等，k等于0，针对性能指标fi(k)实行计算，计算目标函数获得fi(k)。

(4) 假如k小于M1，此时k与k+1相等，跳转至步骤(3)，否则就将第一次搜索停止。

(5) 依据式(3)开始第二次载波：

(3)

(7) 假如k′小于M1，此时k′与k′+1相等，跳转至步骤(6)。

(8) 假如j小于M2，此时j与j+1相等，跳转至步骤(6)，否则第二次搜索停止，将最优解输出。

由以上步骤能够看出，本文方法对混沌算法做出3点改进：把常见的混沌算法内的调节系数变更成关联迭代次数；步骤中增加越界处理；改进原有载波方法。通过以上步骤实现混沌优化算法的改进，提升模型寻优能力。

1.2 基于支持向量机的就业率预测模型

式(4)为训练数据点集：

(4)

其中，x1与yi分别为输入向量与输出值，1代表样本数量。支持向量机回归就是把数据x1通过非线性映射φ至高维特征空间F中，同时展开线性回归：

y=f(x)=wT*φ(x)+b

(5)

其中，b与w分别表示偏置项与超平面权重向量。

本文基于支持向量机[11]的就业率预测模型的回归过程中使用ε不敏感损失函数，使用式(6)描述ε：

(6)

(7)

(8)

所有大于0的常数都使用C表示，为了实现模型训练误差与复杂度的平衡，一旦超出ε的样本，设置惩罚参数。将式(7)和式(8)转化为对偶问题：

(9)

约束条件为

(10)

(11)

其中，p表示径向基核函数宽度。求解式(9)与式(10)，式(12)为

(12)

经过以上支持向量机回归函数获知径向基核函数宽度与惩罚参数决定支持向量机的预测性能，所以使用混沌粒子群算法对支持向量机的参数实行优化，图1为优化流程。初始化粒子群参数，为获得支持向量机参数，反编码粒子，对每个粒子的适应度实行计算，对于个体和全集合的最优值实行更新，判断是否需满足终止条件。如果不满足实行混沌操作粒子，并且更新粒子的位置和速度，重新计算粒子的适应度值；如果符合终止条件就反编码全局最优解获得支持向量机参数。

图1 支持向量机参数优化流程

1.3 改进支持向量机的预测模型

(1) 数据预处理

综上所述，喉源性咳嗽患者的局部病理改变与中医辨证分型有关，通过对患者局部病理改变进行相应检查，可从整体辨证认识患者病情，有利于为喉源性咳嗽的中医辨证论治提供可靠指导意见。

预测就业率时受到多种因素影响，数据之间存在较大差距，随机性与非线性较强，0～1之间的数据最能导致支持向量机敏感，先对数据归一化处理再输入到支持向量机中训练：

(13)

归一化处理预测结果，再将预测结果恢复成真实值：

X=X′(Xmax-Xmin)+Xmin

(14)

其中，X表示原始数据，Xmax表示就业率的极大值，Xmin表示就业率的极小值。

(2) 模型的输入与输出结构

使用函数关系表示混沌理论相空间的某个相点xi向下个相点xi+1演变：

f∶xi+1=f(xi)

(15)

相点的前m-1个分量均为已经获知的数据，为使模型更简洁，构建一个预测器(映射F)，也就是xi+1=f(xi)。韦氏数据具有动力学行为，将非线性映射F与支持向量机拟合，相空间饱和嵌入维数作为输入节点的数目，仅有一个输出节点。

(3) 为提升基于支持向量机的就业率预测模型的泛化推理能力，模型训练样本为预测中心的k个邻近点，依据欧式距离标准获得邻近相点：

(16)

其中，Xr与Xri分别表示预测中心相点与Xr的第i个邻近相点。

(4) 模型预测步骤

基于混沌理论与支持向量机的就业率预测如下：

步骤1 预处理原始数据；

步骤2 构建基于支持向量机的就业率预测模型输入向量与输出变量，选取样本时使用K邻近算法，构建样本训练集；

步骤3 训练模型：使用混沌粒子优化基于支持向量机的就业率预测模型参数，训练数据样本集；

步骤4 实现预测：在步骤3训练获得的改进支持向量机就业率预测模型中代入预测中心点数据，获得就业率预测值。

2 结果分析

以某高校作为研究对象，收集该校历届毕业生就业数据。该大学是我国著名211重点大学，近十年就业率保持在89%以上。在计算机中搭建测试平台，在该测试平台中同时使用同类预测模型：灰色预测模型(对比方法1)和立体数据预测模型(对比方法2)作为实验对照，这2个对照方法分别为参考文献[5]与参考文献[6]中的方法。

为验证混沌算法的寻优情况，使用Spher测试函数开展测试实验，比较3种方法的寻优搜索变化情况，结果见图2。从图2中能够看出，Spher测试函数实验中，本文方法展现出更加优异的全局搜索能力与更加快速的收敛速度，这主要是由于本文方法混沌优化过程中使用越界处理，具有精搜索能力，能够实现快速寻优，因此在函数测试中具有更加优异的效果。从图2中能够明显看出，2种对比方法收敛速度较慢且寻优能力较差，在函数测试中不具备优势。

图2 函数最优值变化趋势

使用2000年至2010年这10年的就业率数据作为训练样本对模型训练，训练对比结果见图3。从图3中能够看出，本文方法训练样本时，可以迅速收敛，迭代次数小于100次，训练曲线趋于平稳，说明本文方法具有较好的样本训练效果，以及较低模型计算复杂度。

图3 支持向量机模型训练过程

训练过程时间消耗对比结果见图4。从图4中能够看出，本文方法只需要较短时间就能完成模型训练，说明本文方法效率较高。2种对比方法所耗费的驯良时间较长，影响预测效率。

图4 训练时间消耗对比

收集研究对象近十年的就业率，使用本文方法对实验对象的就业率实行预测，将预测结果与实际对比，验证预测结果与实际值之间的均方误差与平均百分比误差，同时将本文方法与单独使用混沌理论预测就业率方法以及单独使用支持向量机的就业率预测方法相对比，结果见图5。从图5中能够看出，单纯使用混沌理论或者单纯使用支持向量机对研究对象毕业生就业率均方误差与平均百分比误差均较高，说明单独使用一种方法预测毕业生就业率存在不够精准的情况，而本文方法综合混沌理论与支持向量机的优点对高校毕业生就业率实行预测，误差指标均较低，由此可以看出，使用本文方法预测就业率时具有较高的准确率。

(a) 均方误差

3 总结

预测高校毕业生就业率，能够有利于高校制定教学管理计划与教学任务，是目前高校广泛研究的内容。为了降低高校毕业生的就业率预测误差，本文研究基于混沌理论与支持向量机的就业率预测方法。考虑到就业率预测的非线性特点，运用混沌理论优化支持向量机参数，在解空间搜索，跳出局部最优，实现高效率搜索。在支持向量机中训练数据集，训练模型中代入预测中心点数据实现最终就业率预测。将某高校历届毕业生数据作为研究对象开展实验，与同类方法相比，本文方法能够实现快速收敛与快速寻优，且样本训练时间较快。经过验证，本文方法在预测高校毕业生就业率时具有较高精度。