基于ARIMA模型对我国升学率的研究

2018-05-14 08:55张燕妮
财讯 2018年6期
关键词:差分升学率预测

张燕妮

为分析近几年我国教育部门高中升学率的变动趋势,并预测未来几年的升学率情况,为今后教育事业的发展提供相应对策建议。文章采取1990-2012年的教育部门高中升学率数据建立ARIMA模型,利用2013年度数据检验模型的预测精度,利用最终模型预测2014年的升学率。通过EVIEWS对序列进行检验估计,最终选择ARIMA((5,6,8),2,(7))疏系数模型对序列进行分析预测。研究结果表明,我国升学率呈现一个先增加后下降的趋势,但是增加的幅度超过降低的幅度。2014年的升学率预测值为84.5%。

ARIMA模型 升学率 预测

前言

在当今的教育形势下,教育的任务不单单是传道和解惑,升学率也成为一个学校的主要追求目标,这彰显了一个学校的地位。升学率可以说是应试教育的产物,一个学校的吸引力就在于升学率的高低,这可以说是一个学校的“招牌”。在这种形势下,导致学校把教育的重心放在升学率上,狠抓学生成绩,成绩代表一切,忽略学生伞面发展。而我国一再强调的素质教育被抛之脑后,我们虽然不能否定素质教育在近些年的确取得了进步,但愈演愈烈的仍然是升学率。因此,我们基于ARIMA模型分析我国高中升学率现状,并对升学率做出预测。

ARIMA模型在升学率分析预测中的应用

(1)文献回顾

有关升学率方面的研究文献并不多,而且已有文献多数是在理论上讨论如何提升绿色升学率以及升学率的影响因素等。有学者以初中毕业生为研究对象,分析了升学率现状以及影响因素,研究表明,初中升学率逐年递增,并且衡量了教育资源和经济因素对升学率的影响,各种因素对升学率的影响表现出了性别差异。还有学者从社会教育分析追求升学率的原因,研究对象集中在中小学,研究表明,追求升学率是我国国情和现行教育体制及考试制度下的必然结果。还有部分作者对片面追求升学率的严重后果进行了探讨,这一定程度上会导致学生体质下降、创造力泯灭、教育价值取向出错等后果,应该重视素质教育。有作者从实证方面人手,对我国基础教育经费投入与小学升学率的关系机制进行统计分析,但几乎没有文献专门就高中升学率进行过研究。

(2) ARIMA模型

ARIMA模型又称为白回归积分滑动平均模型(Autoregressive IntegratedMoving Average Model,简记ARIMA),是指将非平稳时间序列转化为平稳时间序列,然后将因变量仅对它的滞后值以及随机误差项的现值和滞后值进行回归所建立的模型。根据原序列是否平稳以及回归中所含部分的不同,包括移动平均过程(MA)、自回归过程(AR)、自回归移动平均过程(ARMA)以及ARIMA过程。其中AR是自回归,p为自回归项;MA为移动平均,q为移动平均项数,d为差分次数。

设yt是d阶单整序列,及yt~I(d),则:wt=△dyt=(1-L)dyt,其中wt为平稳序列,对其建立ARMA(p.q)模型:wt=c+Φ1wt-1+…+Φpwt-pt+θεt-1+…+θqεt-q

用滞后算子表示为:Φ(L)wt=c+Θ(L)εt。經过d阶差分的ARMA(p,q)模型称为ARIMA(p,d,q)模型。

模型的应用

(1)序列平稳性检验

检验结果表明,ADF单位根检验值均大于临界值1%、5%和10%,说明高中升学率在33.95%的显著性水平下接受原假设,不能拒绝单位根的存在,因而时间序列是非平稳的。接下来,我们对序列进行差分,消除不平稳性。经过单位根检验,最终经过2阶差分后,序列达到平稳性。模型的ADF检验结果如下:结果表明,升学率的二阶差分序列在0.03%的显著性水平下拒绝原假设,单位根不存在,序列是平稳的。

(2)模型定阶及建立

序列经过两次差分后,成为平稳序列,因此可以确定d为2。再利用二阶差分后序列的白相关函数和偏自相关函数图像或者AC和PAC值,初步确定AR和MA的阶数,如图所示:

根据AC和PAC的拖尾和截尾性质判断。AR过程具有AC截尾、PAC拖尾的特征,而MA过程具有AC拖尾、PAC截尾的特征,从图中可以看出AC和PAC都具有拖尾性质,因此我们设置ARIMA模型,但具体模型的设定还需要尝试,并没有没有一个统一的准则。

通过二阶差分后的升学率的相关图和偏白相关图可以看出,在1阶后,自相关系数开始逐渐趋于0,但是在5,7,8,9阶系数显著不为零。偏自相关系数在1阶后逐渐减小,但在5,6,8阶处显著不为零,因此为了设置更加合理的模型,我们可以选择将不显著的阶数剔除。经过不断尝试,保证AIC和SC值最小的前提下,最终确定ARIMA((5,6,8),2,(7))模型作为最终预测升学率的最优模型。

(3)模型参数估计及检验

通过Eviews软件对模型ARIMA((5,6,8),2,(7))进行估计,模型的估计结果显示,在5%的显著性水平下,ma(7),ar (5),ar (6),ar (8)的系数均显著,系数分别为:-0.98,-0.9,-0.67,-0.26。sc值为3.84,AIC值为3.62。样本的拟合优度达到了94.1%,说明二阶差分后的升学率的绝大部分信息都可以南ARIMA((5,6,8),2,(7))模型予以解释。由模型的估计结果,可以确定模型的具体形式:

接下来对建立的模型进行检验,主要是检验残差序列是否为白噪声系列,检验自噪声序列的方法有多种。我们可以检验序列均值是否为零。检验结果显示P=1,接受原假设,即期望值为0,说明残差是一个白噪声序列。我们还可以检验序列的纯随机性,通过残差序列的Q量对应的P>0.05值可以判断,序列为白噪声序列。以上结果可以说明模型通过检验。

模型的预测

利用我国升学率前几年的数据建立模型,分析高中升学率的变动趋势。模型预测前,我们需要先对模型进行检验分析,以便了解模型是否合适,即证明所建立的模型与数据真实值相符。

(1)模型拟合效果

首先,我们用建立的ARIMA((5,6,8),2,(7》模型来对2000年-2012年度数据进行预测,比较真实值与拟合值之间的残差,由图表可以看出,随着预测是时间的增加,升学率真实值与拟合值之间的差值越来越小,绝对误差逐渐趋于0,拟合精度提高。然后我们继续用2013年度数据对这个模型的拟合精度进行验证。2013年度升学率真实值为87.6%,预测值为89.5%,相对误差为2 .1010,说明模型的拟合预测效果较好,可以作为预测2014年升学率,结果的可信度较高。

(2)模型预测结果。

针对我国教育部门提供的高中升学率数据,目前最新数据为2013年数据。我们通过ARIMA模型,我们对2014年数据进行预测。预测结果显示2014年升学率为84.5%,相比2013年来讲,升学率下降。

结论

(1)文章结果表明我国高中升学率在1990年-2007年是一个先增加后下降的趋势,2008年-2013年呈现上升趋势。但总的来说,1990年-2012年间,我国升学率增加了59.7%。在这期间,升学率达到两次顶峰,分别是在1990年-1998年、1999年-2007年期间的1996年(51%)和2002年(83.5%),这从侧面反映了我国对教育事业的重视,增加教育投入,师资队伍都可以提升文化软实力,这也为是其他领域发展的奠定了文化基础。

(2)升学率这一不断增加的趋势,也反映了我国过于追求学生成绩的一个不良现象,我们应该注重提升绿色升学率,注重培养学生创新精神和实践能力,提高学生自身素养和能力是提高绿色升学率的根本。同时,老师注重德育方法,培养高尚品德的学生。

[1]田立勇,杜宪素,王素娟.我国基础教育经费投入对小学升学率影响的实证研究[J].长春教育学院学报,2014, 30(09):113-114+125.

[2]孙志军.我国初中升学率的基本状况及影响因素研究[J].教育与经济,2012(03):9-13.

[3]吴明礼.片面追求升学率之我见[J].兰州教育学院学报,2010,26( 01):145-146+159.

[4]张宝昆,黎春进.中国学校追求升学率的理论思考[J].云南师范大学学报(哲学社会科学版),1997(02):4-10.

[5]熊志斌.ARIMA融合神经网络的人民币汇率预测模型研究[J].数量经济技术经济研究,2011,28( 06):64-76.

[6]张越,王胜难,刘媛,王伟炳.应用ARIMA模型对呼吸系统疾病月住院量及住院费用的预测[J].中国卫生统计,2015,32(02):197-200.

[7]張勃,刘秀丽.基于ARIMA模型的生态足迹动态模拟和预测一一以甘肃省为例[J].生态学报,2011,31(20):6251-6260.

猜你喜欢
差分升学率预测
一类分数阶q-差分方程正解的存在性与不存在性(英文)
选修2—2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
一个求非线性差分方程所有多项式解的算法(英)
一类caputo分数阶差分方程依赖于参数的正解存在和不存在性
基于差分隐私的数据匿名化隐私保护方法
大道至简 文化自觉
《福彩3D中奖公式》:提前一月预测号码的惊人技巧!
实现升学率与素质教育的辩证统一
预测高考