袁章帅, 李敬明, 闫瑞林, 严 升
(安徽财经大学 管理科学与工程学院, 安徽 蚌埠 233030)
个人信用作为社会信用体系的基础与核心,一直是社会关注的热点。作为社会未来的栋梁和中流砥柱的大学生,如何评价其个人信用尤为重要。因此,构建一个稳定、可靠的大学生信用评价指标模型有很高的应用价值,如为国家各项奖助学金、贷款的发放提供信用数据,为招聘单位提供大学生的信用参考,引导大学生重视个人信用记录等,可以有效改善大学生的信用状况。
当前国内信用评估方法主要分为五类,即古典信用评价、统计学方法、运筹学方法、人工智能方法以及混合集成方法。在古典信用评价方面,戴大双等[1]基于古典信用评分法,通过分析影响企业家信用的因素,并结合中小企业家的信用特征构建出信用评价指标体系。在统计学方法方面,金风[2]基于线性分类法构建个人信用评价指标体系,并通过判别分析和Logistic回归建立个人信用评分模型。在运筹学方法方面,孟昭睿[3]选用决策树并通过剪枝合理地构建个人信用评价模型。在人工智能方法方面,代婷婷等[4]提出基于SVM的统计方法评估个人信用,解决了单一SVM模型训练时运算量大、学习速率低的问题。而在混合优化方面,林娟等[5]运用遗传算法结合ANFIS优化构建出个人信用评分模型,少量的属性变量就会有较好的评分结果。虽然大量学者运用了多种方法对所构模型进行优化,但学习的速度与精度还有待提高,由于BP神经网络对处理非线性问题具有一定的优势,因此,文中采用离散型改进GSO(Improved GSO)结合BP神经网络构建协同集成算法,能有效提高网络收敛的速率及网络分类的速率,构建出准确、稳定的针对高校学生的个人信用评价模型。
构建合理、高效又完善的信用评价指标体系,首先要确定信用评级内容的核心要素。国际上评级一般选用5C要素分析法,国内评级通常使用具有安全性、盈利性、增长性和生产率等信用状况分析方法。两种评估分析方法都体现了决定信用评级的主要评价因素,为构建大学生个人信用评估指标体系提供了基础理论与框架。
国内众多学者对大学生个人信用评价指标体系构建主要分为两方面:在评价的指标内容方面,李晓芳[6]结合国内实际情况进行实证分析,并参考美国FICO评价指标体系的经验构建了评价指标体系。张阳红[7]通过创建大学生个人诚信档案等一系列具体措施,建立了评价指标体系。在构建信用评价指标体系的方法方面,柳劲松等[8]提出基于层次分析法(AHP)的模糊综合评价指标体系。王众等[9]基于FA_BP算法构建了大学生信用评价指标体系。
文中通过综合分析大量文献资料,利用频数统计分析挑选出3个一级指标、20个二级指标。并通过因子分析法降维处理,最终确定影响大学生个人信用评价指标。涵盖3个一级指标,个人及家庭情况、在校表现和经济情况。16个二级指标,其中个人及家庭情况包含年龄、性别、家庭月收入;在校表现包含旷课频率、借书超期情况、成绩及排名、奖学金收入、获表彰次数、竞赛获奖情况、他人评价情况、毕业论文抄袭、学生工作情况;经济情况包含个人芝麻信用积分、月生活消费结构、贷款情况、学费未缴纳次数。通过分析数据特征并综合专家学者观点意见,剔除了实用性差、随机性高的指标,确保各指标具有独立性、时效性与重要性,使得指标体系更符合专业解释。
文献[10]提出了萤火虫群优化算法,其主要思想是:每个萤火虫被模拟为解空间中的可行解,且每只萤火虫都有荧光素和感测半径,并且会根据它们周边的同伴数量来调整它们的感知半径。最终,大多数萤火虫聚集在同一位置上,该位置具有更好的目标函数值。具体算法流程主要包括:更新荧光素、选择运动目标、萤火虫位置及动态决策域的更新。具体数学描述如下:
li(t)=(1-p)li(t-1)+γJ(xi(t)),
(1)
Ni(t)={j:‖xj(t)-xi(t)‖<
(2)
(3)
(4)
β(nt-|Ni(t)|)}}。
(5)
IGSO-BP协同算法[11]的基本原理是:BP神经网络的结构由输入输出的参数决定,神经网络中全部的权值和阈值构成萤火虫个体的编码,计算每只个体的适应度函数值。通过不断迭代更新萤火虫位置、决策半径和荧光素,以此找出与萤火虫相对应的最佳适应度函数,最后将优化后并携带神经网络全部权值和阈值的萤火虫个体重新赋予给BP神经网络,即得到IGSO与BP神经网络结合的学习算法,以此构建高校大学生个人信用评价模型。算法流程如图1所示。
图1 IGSO-BP算法流程
具体算法步骤如下:
1)编码。通过挑选的大学生个人信用评价指标来构建BP神经网络结构,同时对神经网络中所有的权值和阈值作为整体为每只萤火虫个体进行编码。
2)参数初始化。随机生成萤火虫种群,并为每个萤火虫设置荧光素、荧光素挥发系数、荧光素更新率、感测半径、步长等初始参数。迭代计数器的初始值则为IGSO算法的最大迭代次数。
3)计算适应度函数值。通过对每只编码的萤火虫进行解码,不断将BP神经网络中的权值和阈值进行更新,同时训练和测试该网络,得到网络测试误差。选择预测值和期望值的均方误差作为适应度函数,并根据式(1)对每一代萤火虫个体的荧光素值进行更新。
4)萤火虫位置更新。用Hamming距离公式计算两个萤火虫之间的距离。式(2)用于计算邻域集。在邻域集合中,式(3)用于计算移动概率。采用轮盘赌法对目标对象进行选择,根据萤火虫的移动策略进行移动,同时更新每个维度的值。
5)决策半径更新。基于式(5)更新萤火虫的动态感知半径。
6)判断结束条件。当迭代次数小于最大迭代次数时,则重新计算适应度函数值,并进行下一次迭代;否则,得到的该神经网络最佳的权值和阈值赋予BP神经网络,获得输出结果。
由于指标之间具有存在着不同量纲的差异,所以文中利用公式
将指标数据标准化到[0,1]之间。同时对数据进行平滑处理,得到1 000个标准化数据。大学生个人信用评价部分样本数据见表1。
表1 大学生个人信用评价部分样本数据
其中,X1~X16表示样本的16个指标,Y为信用评价。采用2位二进编码:y1表示信用良好(0,1);y2表示信用较差(1,0)。
通过对大学生个人信用评价指标体系的研究,该BP神经网络的输入层n1=16,则隐含层n2=2n1+1=33,输出层n3=2。即该神经网络输入层有16个神经元结点、隐含层有33个神经元结点、输出层2个神经元结点,因此该BP神经网络的结构为16-32-2。且该神经网络共包含594(33n1+2n2)个权值和35(n2+n3)个阈值,IGSO优化参数为629。
由于BP神经网络的权值和阈值为10位二进制数,所以离散型的每只萤火虫长度为6 290位。同时,分别选用S型切线、S型对数函数作为神经网络隐含层神经元和输出层神经元的传递函数。
IGSO相关参数如下:γ=0.6,ρ=0.4,β=0.08,γs=1 800,初始γd=1 800,nt=3,l0=5,s=0.5,种群规模n=30,最大迭代次数Nmax=30。
根据上述构建的网络模型,文中选取大学生个人信用评价相关数据1 000条作为样本,前800名学生数据作为训练样本,后200名学生数据作为测试样本。神经网络训练结果迭代曲线如图2所示。
网络训练最小误差err=4.117 9 e-04。
IGSO算法在第26次迭代优化后,该网络的训练样本误差几乎趋近于0。综合实验结果表明,IGSO-BP算法在计算精度与收敛速率方面相比较传统BP神经网络有着明显的优势,有效提高了对大学生个人信用评价的准确性,同时合理准确地构建了高校大学生个人信用评价模型。
图2 IGSO-BP寻优过程曲线
通过借鉴传统萤火虫优化算法,并对其进行进一步优化,实现了改进的离散型萤火虫算法(IGSO),结合BP神经网络构建协同集成并行学习算法,以此构建基于IGSO-BP算法的大学生个人信用评价模型。借助工具作为实验平台,实验结果表明,该模型能够很好地克服BP模型收敛速度慢、易陷入局部最优等缺陷,达到了很好的训练效果。文中研究成果对未来建立统一高校大学生信用评价模型提供一定的参考和借鉴作用。