基于指数平滑模型的学习能力变化趋势评价方法研究

2018-08-09 04:53
中国林业教育 2018年5期
关键词:预测值均值线性

(北京林业大学信息学院,北京 100083)

对高等院校而言,大学生学习能力的评价在自主招生、研究生推免、研究生培养潜力分析等方面具有非常重要的参考价值。通常习惯于把核心课程成绩的加权平均法作为大学生学习能力的评价方法,即通过对历次测验成绩进行算术平均或按固定比例将平时成绩与考试成绩进行加权平均取得核心课程成绩并以此评价学生的学习能力。但是,这一评价方法不能准确地反映学生在学习中的努力“趋势”。而且,在对大学生学习能力进行综合评价时,往往采取定性描述的方法,而不能予以定量化。

随着我国高等教育改革的不断深入,对本科生和研究生的学习能力、适应能力、培养前途等的综合性评价结果成为越来越重要的考核指标。因此,研究大学生在学习过程中的努力趋势以及学习能力和适应性的发展趋势,并基于这些变化趋势准确地对大学生的综合能力做出科学可靠的评价,正成为大学生综合能力评价方法研究的一个重要发展方向。为此,笔者提出采用不包含周期性变动的非季节性时间序列分析方法——指数平滑模型来反映大学生在学习过程中的能力变化趋势,并基于此对大学生的综合能力做出较为可靠的预测。

一、指数平滑模型

指数平滑模型是C.C.Holt于1958年提出的[1],后经统计学家的深入研究,针对非季节性时间序列指数平滑模型形成了简单指数平滑法(也称基本指数平滑法)、Holt线性趋势分析法和Brown线性趋势分析法、阻尼趋势分析法等多种平滑分析方法。其中,简单指数平滑法适用于具有水平发展趋势的时间序列分析,但是如果时间序列具有上升或下降趋势时,会产生比较大的预测偏差[1];阻尼趋势分析法适用于处理具有逐渐消失的不包含季节成分的时间序列线性趋势数据[2]。因此,简单指数平滑法和阻尼趋势分析法不适用于反映学习能力变化趋势的研究。而Brown线性趋势分析法是Holt模型的一种特殊情况[2],所以笔者采用Holt线性趋势分析法作为大学生学习能力变化趋势的分析方法。

为了清晰地说明指数平滑模型的“指数”与“平滑”的含义,笔者从简单指数平滑模型开始推证。

(一)简单指数平滑模型

简单指数平滑模型在用于分析不含趋势成分和季节成分的序列时,具有十分良好的效果。其平滑公式如下:

Ft+1=aYt+(1-a)Ft

(1)

式(1)中:Ft+1为t+1期的指数平滑趋势预测值,Ft为t期的指数平滑趋势预测值;Yt为t期的实际观测值;a为平滑系数(也称权重系数),取值为[0,1]。

依据式(1),从Ft=aYt-1+(1-a)Ft-1可得到t期的指数平滑预测值,代入式(1)中则得到:

Ft+1=aYt+(1-a)[aYt-1+(1-a)Ft-1]=aYt+(1-a)aYt-1+(1-a)2Ft-1

(2)

同理,依次类推,得到简单平滑指数模型的通用公式:

Ft+1=aYt+(1-a)aYt-1+(1-a)aYt-2+(1-a)2aYt-2+(1-a)3aYt-3+…+(1-a)naYt-n+…+(1-a)tF1

(3)

式(3)中:F1是第1期的预测值,但由于数据序列中并没有第1期的预测值,所以一般以前3期实际观测值的算术平均值代替。同时,由于权重系数为[0,1],所以(1-a)tF1接近于0[3],对式(3)基本没有影响。

由式(3)可以看出,t+1期的预测值和t期及之前所有期的实际观测值按(1-a)n的n指数递增,即“指数”的含义。

由于(1-a)n的n指数按步长1递增,而(1-a)为[0,1],所以(1-a)n的值会越来越小。也就是说,对离预测值较近的观测值赋予较大的权数,对离预测值较远的观测值赋予较小的权数,权数由近到远按指数规律递减,即“平滑”的含义。

(二)Holt线性趋势模型

Holt线性趋势模型保留了趋势信息,适用于处理具有线性趋势成分但不含季节性成分的时间序列数据。该模型由1个预测公式和2个平滑公式组成,其中2个平滑公式一个反映的是线性平滑信息,另一个反映的是平滑后的趋势(增量)。

线性平滑公式:Ft=aYt+(1-a)(Ft-1+bt-1)

(5)

趋势(增量)平滑公式:bt=β(Ft-Ft-1)+(1-β)bt-1

(6)

将式(6)展开得到下式:

bt=β(Ft-Ft-1)+(1-β)β(Ft-1-Ft-2)+(1-β)2β(Ft-2-Ft-3)+(1-β)3β(Ft-3-Ft-4)+…+(1-β)tβb1

(7)

式(7)中:b1是第1期的趋势增量值,但数据序列中并没有第1期的预测值,所以一般取前3期趋势增量值的算术平均值代替;同时,由于权重系数为[0,1],所以(1-β)tβb1接近于0,对式(7)基本没有影响[3]。

从式(7)得到:对离预测值较近的趋势增量被赋予了较大的权数,对离预测值较远的趋势增量被赋予了较小的权数,权数由近到远按指数规律递减,即趋势增量平滑。

(三)平滑系数取值的确定

指数平滑法的估计是非线性的,其目标是使预测值与观测值之间的均方误差(MSE)达到最小[2]。因此,a、β的取值原则是使预测值与观测值间的均方误差达到最小。在实际计算中,平滑系数取值的确定一般采用试算法,即根据时间序列情况,取a、β值进行试算,比较不同的均方误差,使其达到最小。

二、指数平滑模型检验指标

指数平滑模型拟合常用检验指标有R方统计量、平稳的R方统计量和均方根误差(RMSE)。

(一)R方统计量(R-Squre)

R方统计量用来估计由模型解释的变异在总变异中的比例,计算公式为:

R方统计量为负值时,表示当前模型没有基本均值模型可靠;为正值时(小于1),表示当前模型优于基本均值模型[3]。

(二)平稳的R方统计量(Stationary R-Squre)

平稳的R方统计量用来比较模型中的固定成分与简单均值模型的差别。当原始序列中有趋势成分或季节性成分时,其优于R方统计量。其计算公式为:

平稳的R方统计量为负值时,表示当前模型没有基本均值模型可靠;为正值时(小于1),表示当前模型要优于基本均值模型[2]。

(三)均方根误差(Root Mean Square Error,RMSE)

均方根误差(RMSE)用来度量原始因变量序列与它的模型预测值之间的差异[3],计算公式为:

三、指数平滑模型在学习能力变化趋势评价中的应用

(一)数据来源

为了评价大学生学习能力发展变化趋势,笔者在积累网络工程专业某专业课一学期的学生平时测验成绩的基础上,采用简单指数平滑模型和Holt线性趋势模型分别估计学生学习能力发展趋势的预测值;然后将预测值与均值进行比较,用以评价指数平滑模型在学生学习能力发展变化趋势评价中的适用性。具体操作如下:首先,采用机械抽样方法,从网络工程专业某专业课29人的教学班级中抽取学号为奇数的14组课程平时测验成绩作为时间序列样本(样本编号为S1、S3、S5……S27);其次,选取每周进行一次的课程测验时间构成符合无季节性变动的随机时间序列数据;最后,基于样本数据(详见表1),采用简单指数平滑模型与Holt线性趋势模型分别估计学生学习能力发展趋势的预测值。

表1 网络工程专业某专业课平时测验时间序列样本数据

(二)数据预处理

指数平滑模型要求时间序列拟合样本数据具有平稳性。数据平稳性的判断条件是:均值不随时间变化,方差不随时间变化,自相关系数只与时间间隔有关而与所处的具体时刻无关。

为了获得时间序列数据的平稳性,需对原始数据进行平稳性预处理,可采取的方法有差分法、中心移动平均法、平滑法等。笔者采用中心移动平均方法(MA(var,1,1))来获得样本时间序列数据的平稳性。

(三)指数平滑模型数据处理结果

笔者采用SPSS统计分析软件对上述14组时间序列样本数据分别进行了简单指数平滑模型和Holt线性趋势模型的拟合,从而获得分别以Simple预测值和Holt预测值表示的学生学习能力发展趋势的预测值;然后将预测值与样本数据的均值进行比较,获得反映学生学习能力变化趋势的结果,详见表2。

表2 基于网络工程专业某专业课平时测验时间序列样本数据的指数平滑模型数据处理结果

(四)结果分析

1.与基本均值模型的比较分析

由于采用带有趋势增量的Holt线性趋势模型,所以在检验指标中主要参考平稳的R方指标。从表2可以得到,所有样本的平稳R方值均大于0且接近于1,这说明Holt线性趋势模型要优于基本均值模型。

2.样本学习能力发展趋势评价分析

从表2可以得到,在14个样本时间序列数据中,有1个样本的变化趋势是“下降”,即样本的学习能力出现下降趋势,下降幅度为8.9%;有3个样本的变化趋势是“持平”;有10个样本的变化趋势是“上升”,其中样本学习能力变化最大的,上升幅度为21.6%。

笔者从变化趋势为“上升”“持平”“下降”的样本中各随机选取了1个样本,即S7、S15、S23样本;然后使用Holt线性趋势模型拟合出10次课程平时测验的趋势预测值,并绘制了实际数据与Holt线性趋势模型预测值的对比折线图(详见图1)。

图1 变化趋势为“上升”“持平”“下降”样本的课程平时测验实际观测值与Holt线性趋势模型预测值的对比结果

以图1中的实际观测值与预测值的对比结果可以发现,Holt线性趋势模型能够明显地反映S7样本学习能力变化的下降趋势、S15样本学习能力变化的持平趋势、S23样本学习能力变化的上升趋势。

3.Holt线性趋势模型与简单指数平滑模型的比较

从表2中的Simple预测值和均值的数据可以发现,简单指数平滑模型反映的样本学习能力变化趋势较为滞后,且预测值更加接近于均值。

4.Holt线性趋势模型预测的效果验证

为了验证Holt线性趋势模型预测的实际效果,笔者将14个样本的课程期未总评成绩作为真值,与Holt线性趋势模型预测值、平时10次课程测验成绩的算术平均值(即“均值”)进行比较,得到的结果详见表3。

由表3可以看出,与课程期末总评成绩相比较,Holt线性趋势模型预测值比平时课程测验成绩的均值更能反映样本学习能力发展趋势的变化,且对趋势的变化更加敏感;即便Holt预测值与期末总评成绩间存在着[-10%,10%〗的误差,但在与期末总评成绩存在±10%的误差概率条件下仍能较好地反映样本学习能力发展的变化趋势。

表3 14个样本的课程期未总评成绩与Holt线性趋势模型预测值和平时课程测验成绩均值的比较结果

四、基于指数平滑模型的学习能力变化趋势评价方法的研究结论

笔者认为,在对学生的学习能力、努力程度、学习适应性等进行评价时,应通过观察一定时期内的时间序列数据,给出具有发展趋势性的评价。然而,当前广泛使用的基于算术平均的基本均值模型评价机制掩盖了学生在学习过程中的发展趋势,不能准确地反映学生的努力程度和持续性,更不能完整地反映学生学习能力的发展变化过程。而在学生学习能力变化趋势评价方法的研究过程中,笔者发现运用指数平滑模型对学生的学习能力、努力程度、学习适应性等的发展趋势进行评价时,指数平滑模型中的Holt线性趋势模型能够较为准确地给出模型预测值,既优于简单指数平滑模型,也优于基本均值模型;而且经效果验证发现,将带有趋势的Holt预测值与均值相比较,能够比较准确、定量化地反映学生学习能力的发展变化趋势,从而较好地对学生的综合能力进行客观的评价。

猜你喜欢
预测值均值线性
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
线性回归方程的求解与应用
AI讲座:ML的分类方法
均值—方差分析及CAPM模型的运用
均值—方差分析及CAPM模型的运用
二阶线性微分方程的解法
非齐次线性微分方程的常数变易法
ℝN上带Hardy项的拟线性椭圆方程两个解的存在性
关于均值有界变差函数的重要不等式