基于多元统计分析的大学生信用评估研究

2015-07-09 12:51戴猷娟刘文妮王访陈钥围
经济研究导刊 2015年18期
关键词:主成分分析因子分析大学生

戴猷娟+刘文妮+王访+陈钥围

摘 要:结合主成分分析、因子分析与聚类分析的思想,利用SPSS软件对大学生信用评估问题进行研究。利用网上问卷调查得到的126名本科生反馈信息,对大学生的信用度进行评估,建立大学生信用评估体系,得到大学生群体中女性的诚信度要高于男性,并且随着年级升高大学生的诚信度也逐渐增高的结论。

关键词:大学生;信用评估;主成分分析;因子分析;聚类分析法

引言

本文在国内外个人信用评价相关理论和生活经验的基础上,结合大学生相关特质,确定各指标的重要程度,并用层次分析方法确定各指标的评分值,构建大学生信用评价指标体系,通过对湖南农业大学本科生进行问卷调查,获得客观的原始数据;将多元统计分析中的主成分分析、因子分析和聚类分析作为主要研究方法,构建大学生信用评估模型,运用SPSS统计软件进行相关操作来评估大学生信用好坏情况,并验证所建指标体系的可行性。

一、研究方法

1.主成分分析。主成分方法由Hotelling于1933年提出,是利用降维的思想将多指标转化为少数几个综合指标的多元统计分析方法。主成分分析是对原有所有变量进行简化,建立尽可能少的新变量,使得这些新变量两两不相关,并在反映研究的信息方面尽可能保持原有的信息。

2.因子分析。因子分析是用于数据化简和降维的多元统计分析方法,是在主成分分析的基础上构筑若干意义较为明确的公因子,以它们为框架分解原变量,以此考察原变量间的联系与区别,主要研究的是相关阵或协方差阵内部依赖关系。

3.聚类分析。聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。目标是在相似的基础上对收集的数据进行分类。

利用系统聚类与主成分分析和因子分析相结合的思想,分别将通过主成分分析和因子分析得到的各位同学的最终得分进行聚类,将聚类结果进行比较分析,得到大学生中信用度的集中趋势并进行深入研究。

二、大学生信用评估体系的建立

1.数据选取与处理。本文数据通过网上调查的方法获得,对湖南农业大学各年级本科生进行《大学生诚信情况调查问卷》随机问卷调查,共发放问卷126份,收回有效问卷126份,有效回收率达100%。通过调查问卷收集了大学生学习、经济、社会实践、生活、就业等六大方面诚信情况的数据。

将研究的六大因素作为一级指标、并设置具体问题作为二级指标,建立大学生信用评估体系,在此基础上借鉴国内外个人信用评价指标体系的研究成果和专家评分,同时根据生活实际,对各级指标的重要程度以0~10(分值越高,表示该因素对诚信更重要)进行评分,并赋予相应分值。

2.实证研究过程。首先用主成分分析法对19个变量信息提取主成分解释总方差百分比达到90%的前n个主成分,在操作过程中,发现抽取特征值大于0.6时,主成分解释总方差百分比达90.964%,满足原定的期望值,此时共提取了15个主成分,将得到的因子载荷矩阵复制到数据库中,用依次命名,再将ai对应的特征向量zi计算出来,从而计算各主成分yi,最后计算得到每位同学的综合得分y。再用因子分析来对数据进行处理。选择降维——因子分析,同样抽取特征值为0.6,得到90.964%的方差累积贡献率。

在运行后得到15个公共因子的得分,最后通过公式:

F=(8.359*FAC1_1+6.708*FAC2_1+6.459*FAC3_1+6.41*

FAC4_1+6.363*FAC5_1+6.246*FAC6_1+5.973*FAC7_1+5.777*

FAC8_1+5.725*FAC9_1+5.72*FAC10_1+5.503*FAC11_1+5.472*

FAC12_1+5.422*FAC13_1+5.414*FAC14_1+5.413*FAC15_1)/90.964

计算得到每位同学的因子得分F。用系统聚类法分别将主成分分析法和因子分析法得到的每位同学的因子分F分成三类:第一类,信用度高;第二类,信用度中等;第三类,信用度偏低。再对各类别中男女组成及年级组成进行分析,得到相关结论。

三、结果分析

模型的调试:

考虑到问卷调查是随机的,在男女及各年级的比例上存在较大的差距,得出的结果可能与实际情况不相符,因此,对实验结果进行进一步分析前,先要使这两组定性变量构成比例各自相同。

在调查的126份问卷中,参与调查的性别组成为男生57人、女生69人。因此,在调试时需将实验结果性别组成中的男生乘上126/114、女生乘上126/138,使男女总比例为1∶1,得到最终结果。

参与调查的年级组成为大一21人、大二39人、大三57人、大四9人。因此,需将实验得出的各类别在大一、大二、大三、大四数分别乘上126/84、126/156、126/228、126/36进行调整,得到最后的结果。

四、结果分析与讨论

表1                主成分分析调试后性别分析的结果

由表1可得,类别1是诚信度高的,有40人,类别2是诚信度中等的,有51人,类别3是诚信度较差的,有35人。其中,类别1和2共91人,占总体的70%,可见大学生中诚信度较高的人还是居多。在诚信度较高的人群里,男性占43人,女性占48人,可见女性诚信度要高于男性。

根据表2计算得,大一中类别1和2占大一总体的62.5%,大二中的类别1和2占大二总体的77.4%,大三中的类别1和2占大三总体的74.2%,大四中的类别1和2占大四总体的78.1%。可见,大学生的诚信水平是普遍较高的,诚信水平大致上随着年级的升高而增加,且大四学生的诚信水平最高。

因子分析法的结果研究的实验结果:

表3                          不同分类下的人数

由表3可知,第三类为诚信度最低的,占总人数的80.2%;第二类为诚信度中等的,占总人数的9.5%;第一类为诚信度最高的人,仅占总人数的10.3%。运用因子分析得到的结果与主成分分析结果差异较大,且与现实不符,因此舍弃运用因子分析得到的结果。

结语

本文根据主成分分析与因子分析两种方法对大学生的诚信调查问卷进行分析,经对比可知,主成分分析的新变量是原始变量的线性组合,每个主成分都是由原有所有变量线性组合得到,但是因子分析不是对原始变量的重新组合,而是对原始变量进行分解,利用少数几个公共因子去解释较多个案观测变量中存在的复杂关系。最终发现主成分分析的结果更符合实际情况,从而剔除因子分析的结果,保留主成分分析计算的结果,得到大学生群体中女性的诚信度要高于男性,同时随着年级升高大学生的诚信度也逐渐增高的结论,这一结论与事实吻合,一般来说,女性比男性更有还贷意识,而且随着年级的升高学生的阅历也逐渐增加,使他们更有责任感。最后给银行发卡部门提出了有建设性的建议,即银行发卡时可注重向女性或者高年级学生多发卡,可减少男性或低年级学生的发卡数。

参考文献:

[1]  王莉.基于SOM自组织神经网络的企业信用评估模型[D].太原:太原理工大学计算机应用技术学院硕士学位论文,2005.

[2]  赵静娴,杨宝臣.一种基于神经网络和决策树的信用评估新方法[J].武汉科技大学学报:社会科学版,2005,(7).

[3]  牟太勇.商业银行客户信用评估方法及其应用研究[D].成都:电子科技大学数量经济学院硕士学位论文,2004.endprint

猜你喜欢
主成分分析因子分析大学生
带父求学的大学生
大学生之歌
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
让大学生梦想成真
他把孤儿院办成大学生摇篮