李苹+王丽花+陶燕林
摘要:将逻辑回归方法,引入到学生综合素质量化评估领域。以一个班学生的综合素质评估成绩为训练样本,构造预测模型、假设函数,并用梯度下降法得到模型的参数向量。根据参数向量构造评选“省级三好学生”的逻辑回归模型,对模型中各个特征的权重进行分析。
关键词:逻辑回归;综合素质量化
中图分类号:TP301 文献标识码:A 文章编号:1009-3044(2016)25-0183-01
学生综合素质量化评估是促进学生全面发展的重要手段。通过科学的综合素质量化评估体系可以帮助学生了解自己的长处和不足,找准努力的方向,也是对学生进行评优的依据[1]。在综合素质评估系统中,不同的指标由于权重不同,导致评价不同[2]。根据学生培养目标的要求,量化评估的指标包括:思想道德评价,文化知识素质评价,身体心理素质的评价,创新发展能力评价。
目前我校各个指标在综合素质量化评估中的比重分别为20%、10%、10%、60%,表明我校学生在综合素质量化评估中各个特征的重要性。
然而,不同的评优标准要求不完全一致,推优时应该有针对性。例如,省级三好学生的评选标准是“具有坚定正确的政治方向,坚持党的基本路线……善于学习和吸收新知识,热爱所学专业,勤奋学习,成绩优异……有较强的实践能力……有健康的身体、良好的心理素质……”。省级优秀学生干部的评选标准是“有较高的思想政治素质……热心承担社会工作……有很强的工作能力……”。
大四毕业之际,能否根据以往的综合成绩公平公正推选各种优秀,是每个毕业生关注的焦点。因此,本研究从已有的综合素质量化评估成绩出发,得出逻辑回归模型,分析各个特征的权重,并与现有的指标量化权重进行比较,为有针对性地推优提供参考依据。
1 逻辑回归的基本原理
逻辑回归是机器学习算法中的一种分类算法,适用于标签取值离散的情况。假设函数可以表示为:
其中,为逻辑回归模型参数向量,x为该数据样本特征值向量。为设定一个阈值,当大于阈值时,判定该样本属于某一特定分类,反之亦然[3]。
逻辑回归分类模型使用代价函数来衡量模型的精确度,正则化后的代价函数表示为:
其中,表示第i个数据样本的特征向量。表示第i个样本在训练集中的分类标注,取值分别为1时表示样本属于某一类别,为0时表示样本不属于该类别。为正则化参数,控制在两个不同的目标中的平衡关系。正则化化后的代价函数可以保持假设的形式相对简单,避免过度的拟合。能使取极小值的逻辑回归模型参数向量就可以用于对新样本的预测。
可以采用梯度下降法来求解参数最小化正则化代价函数的更新公式为:
其中,是学习速率,用于控制梯度下降的步长值。
2预测模型的建立
收集一个班50名学生7个学期的综合素质评估成绩,取各个特征7个学期的平均值形成训练集样本集,以评选“省级三好学生”为例建立测评模型,分析以往的推优结果是否体现了“思想道德和文化知识素质”为主要指标的评价方式。
2.1变量说明
(1)y:测评结果,y=0表示没有选中,y=1表示选中为省级三好学生
(2)x1:思想道德评估成绩
(3)x2:文化知识素质评价成绩
(4)x3:身体心理素质评价成绩
(5)x4:创新发展评价成绩
对50名学生的成绩获得50组数据(),i=1,2,…,50
2.2算法步骤
(1)构造假设函数
(2)构造代价函数
(3)最小化代价函数。用梯度下降法求出初始代价值和梯度值,然后调用Octave中的无线约束最小化函数fminunc,找到最佳值。
获得
(4)根据构造评选“省级三好学生”的预测模型为:
2.3模型评价
用该模型进行预测,得到该模型的准确率为98.08,查准率为0.5,召回率为1,F值为0.67,所以即便训练数据集拥有偏斜类,但是算法表现很好。
3 逻辑回归结论分析
通过逻辑回归模型分析发现,权重从大到小分别是。表明该班在评选省级三好学生时,没有完全把思想道德和文化知识素质作为评价的标准,只是简单按照综合素质量化评估的成绩打分进行评价,没有针对性。所以,建议各班级在以后在各种推优过程中应该根据评选标准,有针对性的调整各个量化指标的比重,而不能单纯根据综合素质量化评估的原有成绩。
参考文献:
[1]李瑞勤.大学生综合素质量化评估初探[J].云南民族学院学报,2002,19(3):118-119.
[2]梁宝华.基于数据挖掘的大学生综合素质评价系统的设计与实现[D].广西:广西师范大学,2007.
[3]高婕.逻辑回归参数训练过程的MapReduce并行化实现[J].广西技术师范学院学报,2015(5):39.