苏瑾
摘 要 为了掌握高校家庭经济困难学生数的变化趋势,从而帮助高校乃至教育行政部门制定资助政策的正确决策,本文通过运用灰色Verhulst 模型与BP 神经网络相结合的方法来预测这一数据的变化。实例证明,单独使用这两个模型,预测值的平均相对误差率均大于组合模型,因此,组合模型精度准确性较高,有一定的应用价值。
关键词 灰色Verhulst 神经网络 家庭经济困难学生 预测
中图分类号:TP391 文献标识码:A
Study on Students Forecasting from Poor
Families Based on Verhulst-BP Model
SU Jin
(Department of Academic Affairs, Tianjin Foreign Studies University, Tianjin 300204)
Abstract In order to grasp the trend of the number of university students from poor families, to help colleges and universities as well as educational and administrative departments to make the right decisions subsidy policy, the paper through the use of gray Verhulst model and BP neural network combined method to predict changes in the data. Examples prove that the use of these two models alone, the average relative error rate is greater than the combined model predicted values, and therefore, higher precision accuracy combined model, there is a certain value.
Key words grey; Verhulst; neural networks; students from poor families; forecasting
随着高校的不断扩招,家庭经济困难学生数也迅速上升。2007年5月,国务院出台了《关于建立健全普通本科高校高等职业学校和中等职业学校家庭经济困难学生资助政策体系的意见》,进一步明确规定擴大家庭经济困难生的资助对象和比例,更是从政策上明确了对这一特殊群体的关注力度。新资助体系建立后,为了保证国家制定的各项资助政策和措施落实到每一位家庭经济困难学生身上,掌握高校家庭经济困难学生数以及其未来变化趋势就成为此项工作的重要环节。本文将灰色Verhulst 模型与BP 神经网络的方法相互拟合,来预测高校家庭经济困难生数,对制定资助方案都有很强的指导意义。
1 BP神经网络原理
1986年,科学家Rumelhart和McCelland领导的小组提出了BP(Back Propagation)神经网络这一模型,它是一种由输入层、隐含层和输出层构成的多层前馈网络,该网络按照误差逆传播算法训练将前向传递模型信号,反向传播模型误差。如果输出层得不到期望输出,则通过反向传播模型的误差来时时调整网络的权值和阈值,最终达到最小的网络误差平方和。
2 灰色模型原理
灰色系统是一种研究“少数据、不确定性问题”的理论,以小样本不确定的系统为研究对象,通过少数据建立序列模型的方法,预测未知领域而达到了解整个系统的目的。灰色系统理论其中之一,Verhulst 模型用于研究非单调的摆动发展序列或者具有饱和状态的S 形序列,其原理如下:
假设原始数据的时间序列为:
= {(1), (2), …,()} (1)
对做一次累加(1-AGO),得到新的数据序列, 即前项之和为新的数据序列的第项。根据新的数据序列建立灰色Verhulst 模型的白化方程为:
+ () = (())2 (2)
灰色Verhulst 模型中有以下定理。
定理:模型中的a为待辨识参数,也称发展系数,b为灰作用量,且
则模型参数的最小二乘估为:
= [] = () (5)
求解(2)式可得白化方程的解为,成为时间相应序列:
(6)
累减得到还原值为:
(7)
这里有一点需要特别注意的是:灰色预测模型在预测长期系统时,系统的时间序列长短以及数据变化对其有效性明显影响。随着时间序列的不断推移,模型应该在不断地去掉老信息,随时补充新信息,以提高模型精度,预测数据的结果也更能反映系统当前的特征。
3 灰色神经网络预测模型
灰色Verhulst 模型重点的研究对象为“小样本”的不确定性系统为研究对象,其具有建模简单、运算方便等特点,但由于对非线性信息的处理能力较弱。而人工神经网络能够处理在复杂的非线性系统里的信息,具有良好的非线性函数逼近能力。将两种模型有机融合,弥补了单一模型的不足,使得到的预测结果更为精准。本文采用嵌入式组合的方法,即将灰色Verhulst 模型先做前期的数据处理,再将其作为,即将原始数据进行一次累加或多次累加成为下一次模型处理的原始数据。组合模型构建步骤如下:
(1) 运用灰色Verhulst 模型将原始数据序列()计算预测值序列;
(2) 根据()和求解残差值序列()( = 1,2,…,),即。 (8)
(3) 本文中将残差值序列()数据进行归一化处理,降低噪音,得到残差值序列()。
(4) 假设预测的阶数为,用时刻之前的信息(),(),…,()( = 2,3,…,)来预测时刻的值。即这三项为神经网络模型的输入样本,()作为训练的期望输出值,将神经网络训练足够多次,根据预测结果不断调整网络的权系数和阈值,从而使不同的输入样本与其输出值一一对应。
(5) 将残差预测值进行反归一化处理,得到新的残差预测值序列。运用BP模型将残差预测值序列进行归一化得到,新的残差预测值序列,为对做反归一化操作得到的。得到运用公式(9)构造Verhulst-BP模型的预测值,
(9)
4 组合模型的实例分析
如表1所示,本文的研究样本是某高校2004年至2013年共10年的家庭经济困难生数(数据已做等比例处理)。
运用Verhulst 模型,利用前3个年份的家庭经济困难生数来求第4个年份的预测值,即BP神经网络的输入层为每三个年份的归一化的残差值,输出变量为第四个年份的归一化的残差值,构成了3-10-1结构的神经网络。表2极为组合模型的预测值。可以看到,单纯利用BP神经网络模型或者灰色Venhulst 模型来预测家庭经济困难生,模型的平均相对预测误差率分别为1.84%和11.18%,而Verhulst-BP模型的相对误差率仅为0.13%,预测精度有了大幅度的提高。
表1 某高校2004年-2013年的家庭经济困难生数
5 总结
模型的预测结果,2014年该校会有2866名家庭经济困难学生,比2013年增加了159名,為了能保证每名学生享受到政策资助,学校应该提早调整资助方案,制定出合理的预算分配计划。本文利用灰色Verhulst 模型先对高校家庭经济困难学生数进行了模型计算,再利用神经网络训练修正残差,然后得到了新的预测值,这两种方法如果单独使用,其分别的预测结果都不如混合模型的结果,提高了预测的精度。
参考文献
[1] 国务院.关于建立健全普通本科高校高等职业学校和中等职业学校家庭经济困难学生资助政策体系的意见[EB/OL].2007(5).
[2] 张剑峰,罗浪,赵燕.高校贫困生的界定[J].江西教育研究,2005(5):19-20.
[3] 任海华,王鑫明,陆小峰,等.基于熵值分析模型的高职院校困难学生认定[J].南通职业大学学报,2013(1):59-62.
[4] 薛建航,王雪峰,等.层次分析法(AHP)在学校家庭经济困难学生认定工作中的应用探索[J].中国校外教育,2011(8):25.