基于时间序列模型的微信公众号关注量的预测研究

2022-09-20 02:34卢成晓
内蒙古科技与经济 2022年14期
关键词:预测值残差公众

卢成晓

(闽南师范大学 图书馆,福建 漳州 363000)

微信公众号作为高校图书馆服务读者的主要工具之一,其用户的数量和活跃度是反映图书馆服务成效的关键指标之一。由于受多种因素,如微信公众号推广工作的力度、推送图文消息的频率、图文内容等的影响[1],用户关注量会时刻发生变化。为了准确把握高校图书馆微服务规律及特征,提升服务质量,对用户关注量的变化趋势做出精准预测是非常有必要的。

目前有关时间序列模型应用于高校图书馆微信公众号用户关注量预测研究的文献比较少。熊枫等人采用时间序列ARIMA模型对微信公众号用户量进行了预测分析。ARIMA模型采用差分方法建模,可以比较充分地提取确定性信息,不足之处是不易对模型做出直观解释。残差自回归模型弥补了ARIMA模型的这一缺点,不仅提取了确定性信息,还拟合了残差序列,其优点是结果便于解释、拟合精度高等,被广泛应用于确定性趋势明显的时间序列数据[2-4],如传染病发病数预测[4]、GDP预测[5]等。二次指数平滑法适用于线性趋势预测[6],如GDP预测[7]、价格预测[8]等,其计算结果能应用统计软件快速得到。

笔者拟采用残差自回归模型和二次指数平滑法,运用计量经济学软件Eviews 10对某高校图书馆微信公众号关注量进行拟合预测,探索能反映其实际变化趋势且精度较高的预测模型。

1 模型简介

1.1 残差自回归模型

残差自回归模型是先利用确定性因素分解法提取序列中的主要确定性信息趋势效应和季节效应,然后采用Durbin-Waston检验(简称“DW检验”)来检验确定性模型拟合后的残差序列{εt}的自相关性,若残差序列不存在自相关性,则说明回归模型对原始序列的信息提取比较充分,模型拟合停止;若残差序列自相关性显著,为了提高拟合精度,需进一步对残差序列进行拟合来提取相关信息。该模型具体公式如下[2]:

(1)

式中,Tt为趋势效应拟合,St为季节效应拟合,θi为回归系数,εt为残差序列,且满足E(vt)=0,D(vt)=σ2,CoV(vt,vt-i)=0,∀i≥1。

1.2 二次指数平滑

二次指数平滑是在一次指数的基础上对数据再做一次指数平滑。该方法适用于线性趋势预测。计算公式如下[6]:

St=αyt+(1-α)St-1,Dt=αSt+(1-α)Dt-1

(2)

其中:St是一次指数平滑值;Dt是二次指数平滑值;α(0≤α≤1)是平滑系数。

预测公式为:

(3)

2 实证分析

2.1 数据来源及选取

从某高校微信后台获取2016年1月—2021年3月的图书馆微信用户日增长数据,整理得到2016年1月—2021年3月共63个月的微信公众号累计关注人数的月数据,并将其作为微信公众号关注量。

本文选取前60个月数据作为训练样本建立预测模型,后3个月数据作为测试样本检验模型的有效性,最后利用选取的模型预测2021年4月—6月的微信公众号关注量。

2.2 模型评价标准

2.3 模型建立

2.3.1 残差自回归模型建立。利用Eviews 10软件绘制出2016年1月—2020年12月的微信公众号关注量的时序图,如图1所示。

图1 微信关注量Y的时序图

由图1可以看出,序列Y整体上呈明显的线性增长趋势。

将2016年1月—2020年12月依次对应为时间变量t=1,2,3,…,60, 建立以时间变量t为自变量,Y为因变量的线性回归模型,估计结果如图2所示。

图2 线性回归模型估计结果

由图2可以看出,该模型参数都具有统计意义,R2=0.985说明该模型提取了Y序列98.5%的信息,模型拟合度高;DW=0.498说明该模型的残差序列{εt}具有很强的自相关性,需进一步对残差序列建立自回归模型,提取相关信息。

残差序列{εt}的自相关函数(ACF)和偏自相关函数 (PACF)图,如图3所示。

图3 残差序列{εt}的ACF与PACF图

由图3可以看出,此序列的自相关函数拖尾,偏自相关函数截尾,可以考虑建立AR(p)模型,其中p选择1或2。经过模型结果对比,最终选择建立AR(1)模型。模型估计结果如图4所示。

图4 AR(1)模型估计结果

由图4可以看出,该模型参数具有统计意义,R2=0.555说明该模型拟合度较高。进一步利用DW检验法检验此模型残差序列的自相关性。判断标准为dU

(4)

2.3.2 二次指数平滑法预测。由于序列Y呈明显的线性增长趋势,故可选择二次指数平滑法进行预测。根据经验判断法,当时间序列呈现下降 (上升) 的发展趋势时,α的值可在0.6~1中选择[7]。本文分别选取α=0.6,0.65,0.7,0.75,0.8,0.85,0.9,0.95,利用Eviews 10中的Double(二次指数平滑)方法得到2021年1月—2021年3月的公众号关注量的预测值,计算不同α值的平均绝对百分误差分别为5.51、4.92、4.22、3.45、2.70、2.01、1.44、1.06。由此可见,随着α的增加,预测的平均绝对百分误差呈递减趋势,说明预测精度越来越高。故最终选取α=0.95的二次指数平滑法。

2.4 模型预测结果对比分析

利用上述残差自回归模型(4)和α=0.95的二次指数平滑法计算2021年1月—6月的公众号关注量的预测值,并将2021年1月—4月的预测值与真实值做比较。分析结果如表1所示。

表1 残差自回归模型、二次指数平滑法

由表1中的2021年1月—2021年3月的残差自回归模型的相对误差可计算得到预测值的平均绝对百分误差为0.79,对比由二次指数平滑法得到的平均绝对百分误差1.06,结果显示1月—3月两种方法预测精度都很高,残差自回归模型预测结果更优。观察两种预测方法的相对误差变化趋势发现2月开始残差自回归模型的上升幅度明显高于二次指数平滑法的上升幅度;4月份二次指数平滑法的相对误差为1.7%,小于残差自回归模型的相对误差1.83%,预测值更接近于真实值。二次指数平滑法计算得到的5月份、6月份的预测值也更优于残差自回归模型的预测值,说明二次指数平滑法的预测结果更优。

3 结论

本研究采用残差自回归模型和二次指数平滑法对某高校图书馆微信公众号关注量2016年1月—2020年12月的数据进行了拟合分析,并得到了2021年1月—6月微信公众号关注量的预测值。预测结果显示该校图书馆微信公众号关注量在未来仍将呈递增趋势;两种方法的预测精度都很高,短期内残差自回归模型预测结果更优,较长期内二次指数平滑法预测结果更优。

猜你喜欢
预测值残差公众
基于双向GRU与残差拟合的车辆跟驰建模
加拿大农业部下调2021/22年度油菜籽和小麦产量预测值
±800kV直流输电工程合成电场夏季实测值与预测值比对分析
公众号3月热榜
AI讲座:ML的分类方法
公众号9月热榜
基于残差学习的自适应无人机目标跟踪算法
公众号8月热榜
公众号5月热榜
基于递归残差网络的图像超分辨率重建