基于自适应参数的LSSVM高校学生信用评估方法

2020-02-03 05:48向燕飞

电子技术与软件工程 2020年11期

向燕飞

（广东东软学院广东省佛山市 528225）

1 引言

每个人是社会的组成部分，个人信用是社会信用的基础。如果个人发生个人失信行为，容易引起集体失信。近年来,信用问题已成为社会关注的一个重要问题。如何建设个人信用评价体系，特别针对作为未来社会的栋梁的高校学生，是本文研究的工作。通过建立高校学生个人信用评价体系，引导和督促学生重视个人信用记录、改善个人信用行为，是本文研究的意义所在。

关于个人信用评估的研究较多，如李娴[1]基于GCV 准则和Newton-Raphson 算法的正则化参数快速选择方法，利用最小二乘支持向量机中建立个人信用风险预测模型；刘太安[2]在银行个人信用特征数据基础上,将LSVM 算法应用于个人信用评估中；魏志静[3]在对信用数据进行多种数据操作的基础上，其中，数据处理操作包括数据预处理、指标优化、格式转换、归一化等，利用网格搜索和交互检验选择最佳核函数与核参数，同时使用SVM-KNN 方法进行分类预测并应用于个人信用评估中；张澜觉[4]在P2P 信贷个人信用评价中引入BP 神经网络，利用附加动量法和弹性梯度下降法调整权值，提出了一个适用于P2P 信贷个人信用评价模型；肖文兵等[5]运用网格5-折交叉确认来寻找不同核函数的最优参数，以此建立了一个基于支持向量机的个人信用评估预测方法；史小伍[6]运用组合代价敏感支持向量机模型，结合统计分析和神经网络技术构建模型个人信用评价方法。

虽然个人信用评估研究较多，但针对高校学生群体的研究较少，且各类方法各有其优缺点。为了解决高校学生群体的信用评估问题，本文采用最小二乘支持向量机算法（简称LSSVM）进行信用评估，同时采用微粒群算法（简称PSO）优选LSSVM 算法参数。

由于PSO 算法是一种利用群体智能的随机全局优化方法，它易实现、全局搜索能力较强，但线性递减的惯性权重进化策略使算法存在初期局部搜索能力较弱、易错过全局最优值及算法后期全局搜索能力较弱、易陷入局部极值等问题。因此，本文在普通PSO算法基础上，定义了一种动态自适应的惯性权重方程，建立了一种自适应PSO 算法，利用自适应PSO 算法优选LSSVM 参数，克服了LSSVM 算法参数敏感性问题，提高了算法的全局搜索能力，并根据高校学生信用评估指标建立了自适应参数的LSSVM 信用评估模型，为高校学生信用评估提供了一种新的方法。

2 基于自适应参数的LSSVM算法

2.1 LSSVM算法参数

LSSVM 算法是SVM 算法的一种改进算法，改进之处在于：将结构风险最小化式中容许误差由一次方变为平方，其不等式约束条件变为等式约束条件，从而将求解凸二次规划问题转化为求解线性方程组问题。

图1：个人信用评估流程

LSSVM 法通过引入对偶理论建立Lagrange 方程求解优化问题[7-10]：

上式中αi为Lagrange 乘子，C 为正则化参数，按优化条件可解得权向量w 的表达式，并利用核函数K(xk, xl)替换，将优化问题转化为求解线性方程组问题，并通过最小二乘法求解线性方程组，避免了SVM 算法中求解凸二次规划问题，提高了求解问题的速度和收敛精度，LSSVM 客户核函数一般选择径向基函数，即，其δ 为核参数。

通过以上分析，LSSVM 算法受核参数δ 及正则化参数C 影响较大，存在参数敏感性问题。因此本文拟采用PSO 算法优选LSSVM 算法参数。

2.2 PSO算法优选参数

由于PSO 算法具有较好的全局搜索能力，但其惯性权重的线性递减策略过于简单，无法满足实际问题的需要，同时它也无法协调好算法局部搜索能力与全局搜索能力之间的关系，因此，本文定义了一种动态自适应的惯性权重方程，建立了一种自适应微粒群算法APSO，可根据实际问题动态改变PSO 算法的全局搜索能力。

表1：信用评估结果对比表

在PSO 算法中，其惯性权重主要起到调节粒子局部搜索能力与全局搜索能力的作用，如果惯性权重较大则表示有较好的全局搜索能力，或者则具有较好的局部收敛能力。可将惯性权重方程定义为：

在式（2）中，wmax、wmin分别表示惯性权重的最大和最小值，t 表示迭代次数，N 表示最大迭代代数。该式表示每惯性权重随迭代代数线性减少，同一迭代代数下粒子之间的惯性权重是相同的。但在实际问题中，每一迭代代数下每个粒子所需要的全局搜索能力并不相同，所以必须根据粒子自身的性质来动态改其惯性权重值，从而将该粒子的全局搜索能力与局部搜索能力的有效地结合起来。

因此本文定义了一种自适应微粒群算法APSO，其自适应惯性权重进化方程定义为：

在式（3）中，本文定义了一个函数Rij，表示信息自适应函数，其具体形式如式（4）所示。式(1+di)/(1+dmax)将惯性权重与微粒隶属于全局最优位置的距离联系起来，越靠近全局最优粒子，惯性权重应越小，局部收敛能力应越好。di表示该微粒与全局最优粒子之间的距离，dmax表示该代微粒中离全局最优粒子最远的距离，分子分母都加1 是为了避免分母为零。式(fi-fmin+1)/(fmax-fmin+1)将惯性权重与微粒的适应值联系起来，适应值越小，惯性权重应越小，局部收敛能力应越好。fi表示该微粒的适应值，fmin表示该代微粒中的最小适应值，fmax表示该代微粒中的最大适应值。通过APSO 算法惯性权重的动态自适应过程，从而影响该算法的全局搜索能力。

3 基于自适应参数的LSSVM高校学生信用评估

本文通过建立高校学生信用评估指标，根据历史信用数据构建学习样本，利用本文提出的自适应PSO 算法优选LSSVM 参数，同时构建LSSVM 评估模型进行个人信用评估，其构建流程如图1 所示。

本文根据高校学生个人信用特点，所建立的高校学生信用评估指标包括：

（1）个人基本信息：包含学生年龄，性别及生源地等；

（2）学校基本信息：包含学校类型（985 学校、211 学校及其他大学），学生所学专业情况等；

（3）学生在校表现：包括学生学科成绩、学科排名、借还图书、获奖情况、人际交往等；

（4）学生经济情况：主要指学生经济来源，包括父母供给、助学贷款、兼职收入、奖学金、研究经费等；

（5）学生日常表现：包含考试作弊、诚实守信等方面；

（6）信用卡情况：包含信用卡张数、刷卡金额及还款情况等。

本文利用学校助学贷款个人数据，构建个人信用特征数据的学习样本进行验证，同时将本文算法与KNN 算法，LSSVM 算法预测结果进行对比，对比结果如表1 所示。

通过评估结果对比，表明了本文所提出来的自适应参数的LSSVM 高校学生信用评估系统是合理有效性的，为高校学生信用评估提供了一种新的方法。

4 结论

本文针对LSSVM 算法参数敏感性问题，在PSO 算法基础上，定义了一种动态自适应的惯性权重方程，建立了一种自适应PSO算法，利用自适应PSO 算法优选LSSVM 参数，克服了LSSVM 法对其参数的敏感性问题，提高了算法的全局搜索能力；并根据高校学生信用评估指标建立了自适应参数的LSSVM 信用评估模型，为高校学生信用评估提供了一种新的方法。