向燕飞
(广东东软学院 广东省佛山市 528225)
每个人是社会的组成部分,个人信用是社会信用的基础。如果个人发生个人失信行为,容易引起集体失信。近年来,信用问题已成为社会关注的一个重要问题。如何建设个人信用评价体系,特别针对作为未来社会的栋梁的高校学生,是本文研究的工作。通过建立高校学生个人信用评价体系,引导和督促学生重视个人信用记录、改善个人信用行为,是本文研究的意义所在。
关于个人信用评估的研究较多,如李娴[1]基于GCV 准则和Newton-Raphson 算法的正则化参数快速选择方法,利用最小二乘支持向量机中建立个人信用风险预测模型;刘太安[2]在银行个人信用特征数据基础上,将LSVM 算法应用于个人信用评估中;魏志静[3]在对信用数据进行多种数据操作的基础上,其中,数据处理操作包括数据预处理、指标优化、格式转换、归一化等,利用网格搜索和交互检验选择最佳核函数与核参数,同时使用SVM-KNN 方法进行分类预测并应用于个人信用评估中;张澜觉[4]在P2P 信贷个人信用评价中引入BP 神经网络,利用附加动量法和弹性梯度下降法调整权值,提出了一个适用于P2P 信贷个人信用评价模型;肖文兵等[5]运用网格5-折交叉确认来寻找不同核函数的最优参数,以此建立了一个基于支持向量机的个人信用评估预测方法;史小伍[6]运用组合代价敏感支持向量机模型,结合统计分析和神经网络技术构建模型个人信用评价方法。
虽然个人信用评估研究较多,但针对高校学生群体的研究较少,且各类方法各有其优缺点。为了解决高校学生群体的信用评估问题,本文采用最小二乘支持向量机算法(简称LSSVM)进行信用评估,同时采用微粒群算法(简称PSO)优选LSSVM 算法参数。
由于PSO 算法是一种利用群体智能的随机全局优化方法,它易实现、全局搜索能力较强,但线性递减的惯性权重进化策略使算法存在初期局部搜索能力较弱、易错过全局最优值及算法后期全局搜索能力较弱、易陷入局部极值等问题。因此,本文在普通PSO算法基础上,定义了一种动态自适应的惯性权重方程,建立了一种自适应PSO 算法,利用自适应PSO 算法优选LSSVM 参数,克服了LSSVM 算法参数敏感性问题,提高了算法的全局搜索能力,并根据高校学生信用评估指标建立了自适应参数的LSSVM 信用评估模型,为高校学生信用评估提供了一种新的方法。
LSSVM 算法是SVM 算法的一种改进算法,改进之处在于:将结构风险最小化式中容许误差由一次方变为平方,其不等式约束条件变为等式约束条件,从而将求解凸二次规划问题转化为求解线性方程组问题。
图1:个人信用评估流程
LSSVM 法通过引入对偶理论建立Lagrange 方程求解优化问题[7-10]:
上式中αi为Lagrange 乘子,C 为正则化参数,按优化条件可解得权向量w 的表达式,并利用核函数K(xk, xl)替换,将优化问题转化为求解线性方程组问题,并通过最小二乘法求解线性方程组,避免了SVM 算法中求解凸二次规划问题,提高了求解问题的速度和收敛精度,LSSVM 客户核函数一般选择径向基函数,即,其δ 为核参数。
通过以上分析,LSSVM 算法受核参数δ 及正则化参数C 影响较大,存在参数敏感性问题 。因此本文拟采用PSO 算法优选LSSVM 算法参数。
由于PSO 算法具有较好的全局搜索能力,但其惯性权重的线性递减策略过于简单,无法满足实际问题的需要,同时它也无法协调好算法局部搜索能力与全局搜索能力之间的关系,因此,本文定义了一种动态自适应的惯性权重方程,建立了一种自适应微粒群算法APSO,可根据实际问题动态改变PSO 算法的全局搜索能力。
表1:信用评估结果对比表
在PSO 算法中,其惯性权重主要起到调节粒子局部搜索能力与全局搜索能力的作用,如果惯性权重较大则表示有较好的全局搜索能力,或者则具有较好的局部收敛能力。可将惯性权重方程定义为:
在式(2)中,wmax、wmin分别表示惯性权重的最大和最小值,t 表示迭代次数,N 表示最大迭代代数。该式表示每惯性权重随迭代代数线性减少,同一迭代代数下粒子之间的惯性权重是相同的。但在实际问题中,每一迭代代数下每个粒子所需要的全局搜索能力并不相同,所以必须根据粒子自身的性质来动态改其惯性权重值,从而将该粒子的全局搜索能力与局部搜索能力的有效地结合起来。
因此本文定义了一种自适应微粒群算法APSO,其自适应惯性权重进化方程定义为:
在式(3)中,本文定义了一个函数Rij,表示信息自适应函数,其具体形式如式(4)所示。式(1+di)/(1+dmax)将惯性权重与微粒隶属于全局最优位置的距离联系起来,越靠近全局最优粒子,惯性权重应越小,局部收敛能力应越好。di表示该微粒与全局最优粒子之间的距离,dmax表示该代微粒中离全局最优粒子最远的距离,分子分母都加1 是为了避免分母为零。式(fi-fmin+1)/(fmax-fmin+1)将惯性权重与微粒的适应值联系起来,适应值越小,惯性权重应越小,局部收敛能力应越好。fi表示该微粒的适应值,fmin表示该代微粒中的最小适应值,fmax表示该代微粒中的最大适应值。通过APSO 算法惯性权重的动态自适应过程,从而影响该算法的全局搜索能力。
本文通过建立高校学生信用评估指标,根据历史信用数据构建学习样本,利用本文提出的自适应PSO 算法优选LSSVM 参数,同时构建LSSVM 评估模型进行个人信用评估,其构建流程如图1 所示。
本文根据高校学生个人信用特点,所建立的高校学生信用评估指标包括:
(1)个人基本信息:包含学生年龄,性别及生源地等;
(2)学校基本信息:包含学校类型(985 学校、211 学校及其他大学),学生所学专业情况等;
(3)学生在校表现:包括学生学科成绩、学科排名、借还图书、获奖情况、人际交往等;
(4)学生经济情况:主要指学生经济来源,包括父母供给、助学贷款、兼职收入、奖学金、研究经费等;
(5)学生日常表现:包含考试作弊、诚实守信等方面;
(6)信用卡情况:包含信用卡张数、刷卡金额及还款情况等。
本文利用学校助学贷款个人数据,构建个人信用特征数据的学习样本进行验证,同时将本文算法与KNN 算法,LSSVM 算法预测结果进行对比,对比结果如表1 所示。
通过评估结果对比,表明了本文所提出来的自适应参数的LSSVM 高校学生信用评估系统是合理有效性的,为高校学生信用评估提供了一种新的方法。
本文针对LSSVM 算法参数敏感性问题,在PSO 算法基础上,定义了一种动态自适应的惯性权重方程,建立了一种自适应PSO算法,利用自适应PSO 算法优选LSSVM 参数,克服了LSSVM 法对其参数的敏感性问题,提高了算法的全局搜索能力;并根据高校学生信用评估指标建立了自适应参数的LSSVM 信用评估模型,为高校学生信用评估提供了一种新的方法。