张雨晴,李逸波,肖阔
(河北农业大学,保定 071000)
我国是乳制品生产大国,2021年我国生鲜乳生产量达到了3 683万t。奶牛养殖规模虽然在不断扩大,但生鲜乳价格不断波动,时刻影响着奶业生产者的信心。2020年上半年,生鲜乳价格一路下降,价格下调了近8%,之后生鲜乳价格又不断上调,至2022年1月上调近20%。生鲜乳价格的不稳定性大大影响了奶业生产者的生产决策,同时对居民的生活造成了不良的影响。运用科学的方法对生鲜乳价格进行相对准确的预测,对于保障生鲜乳生产企业收益、方便国家宏观调控,具有重要的现实意义。基于此,本文根据2019年1月至2022年5月生鲜乳周度价格统计数据,运用ARIMA预测模型对未来一个季度的生鲜乳周度价格数据进行预测,探究内在规律的演变,以期为奶业稳定持续发展提供理论支持。
目前学者对我国乳制品价格的研究大多分为两部分。第一部分为对乳制品价格波动的研究:李胜利等多位学者认为乳制品价格与国际乳制品价格有关[1~3]。董晓霞等[4]认为生鲜乳价格波动与玉米价格、豆粕价格等有关。花俊国[5]、于海龙等[6]、杨辉等[7]运用实证分析说明了乳制品价格波动呈周期性。研究人员在中国奶价波动的背景下进行实证研究,认为原料奶价格波动具有非对称性和持续性[8~10]。闫桂权等[11]、杨钰莹等[12]认为中国原料奶价格波动具有显著的集簇性。第二部分为对乳制品价格预测的研究:刘秀娟等根据ARIMA、灰色预测模型建立综合集成预测模型,对2016年的原料奶价格进行预测[13]。李兆使用2009年1月至2017年11月的原料奶价格数据,采用Elman神经网络模型预测了原料奶价格走势[14]。
以上研究大多针对乳制品价格波动的研究,对乳制品价格预测的文章较少,而乳制品价格预测具有很强的时效性,且近期并没有学者对生鲜乳价格进行预测研究。对乳制品价格波动进行研究很难精准地反映出特定时间段的价格趋势,而对短期价格进行预测更能直接反映出下一生产阶段会面临的价格变化,为生产决策者和政府宏观调控提供清晰明了的思路。ARIMA预测模型无需考虑生鲜乳周度价格的影响因素,也不用考虑随时间变化的生产投入要素的变化情况,是被学者广泛使用的预测方法。本文通过ARIMA预测模型能够预测出下个季度生鲜乳周次的价格变化以及价格变动趋势,对之后的生产决策具有重要的现实意义。
本研究所用数据来源于农业农村部畜牧兽医局。选取时间段为2019年1月至2022年5月全国生鲜乳周度价格的序列,共175个统计数据。其中运用2022年3~4月的周度数列作为拟合数据,共9期数据。
该生鲜乳周度价格中,选取了内蒙古、河北等10个主产省份生鲜乳平均价格,其更加能够代表中国其他零散地区生鲜乳价格,减少了因为各个地区小范围特殊情况影响造成的价格波动情况。生鲜乳平均收购价格更加贴近生产者,直接影响奶牛养殖户的既得利益。同时,生鲜乳周度价格与年度、月度数据相比,生鲜乳价格的波动状况与实际情况更加符合,能够细致、清晰地反映出生鲜乳价格的变化趋势。
本文选取ARIMA模型对生鲜乳周度价格进行预测,该模型是近年来最适合对价格进行短期预测的模型之一。ARIMA(p,d,q)为该模型的标准式,其中的p指代的是AR的阶数、q指代的是MA的阶数、d指代的是价格数列通过平稳性检验时进行差分的次数。
ARIMA模型分析流程如下:通过对生鲜乳周度价格进行初步观察,并作线型图简单判断该价格序列是否平稳;无法判断时对原始生鲜乳周度价格数列进行ADF检验,根据所得结果确定该价格数列是否平稳;如果生鲜乳周度价格数列不平稳,就将时间序列进行差分并进行ADF检验,直到通过ADF检验;通过AIC和SC确定模型的滞后阶数,对模型进行定阶,并对所建立的模型进行检验,根据验证其拟合优度,确定是否可行;接着进行残差检验,确定模型是否存在自相关性;最后模型通过检验后,根据所建立的模型来对价格序列进行短期的预测和分析。
假设经过d次差分处理后,目标序列可以生成平稳序列,那么ARIMA(p,d,q)模型的数学表达式可以写成如下形式:
其中,c代表常数;Øp和θq代表自回归系数和移动平均回归系数;p和q为自回归模型阶数和移动平均阶数;εt为白噪声序列。
建立ARIMA(p,d,q)模型要求时间序列必须是平稳的,如果时间序列非平稳,建立的模型容易出现虚假回归的现象,使得统计量的拒绝域超过检验的正常值,导致检验出的结果出现错误。本文运用EViews8.0软件对2019年1月至2022年5月的生鲜乳周度价格序列进行处理。如图1所示,可以看出生鲜乳月度均价时间序列Y呈波动趋势,显然是不平稳的。为了实现数据的平稳性,将时间序列进行差分,直到得到图2二阶差分后的时间序列DDY的趋势图,可以初步判断数列平稳,但仍需进行ADF检验。
图1 2019年1月—2022年5月生鲜乳月度均价趋势图
图2 二阶差分后所得序列趋势图
从结果可以看出,序列Y中无论有无截距项或趋势项,该序列都不平稳,经过二阶差分后的序列DDY在三种类型中都能达到平稳。从表1中可以得出t统计量的值大于1%的临界值,不能拒绝存在单位根的原假设,而在95%的置信区间内,拒绝存在单位根的原假设,有95%的可信度可以确定生鲜乳周度价格的时间序列是二阶单整平稳序列。综合分析各数值结果以及参考序列趋势图,选择二阶差分后进行预测,同时可以对模型定阶d=2。
表1 时间序列二阶差分后ADF检验统计量
为了确定ARIMA(p,d,q)模型中的参数p,q,根据生鲜乳周度均价序列的自相关图和偏自相关图可知,价格序列偏相关系数稳定在±2倍;价格序列1阶自相关系数超出±2倍估计标准差,1阶以后自相关系数稳定在±2倍估计标准差以内,即自相关系数1阶以后拖尾。所以可初步确定p=0,q=1,即可建立ARIMA(0,2,1)模型。
对拟建立的ARIMA(0,2,1)模型进行参数估计,结果如表2显示。MA(1)的P值通过检验,而C的P值未通过检验,可初步确定ARIMA模型应包括MA(1)一个自回归项。
表2 ARIMA(0,2,1)模型估计结果
基于前面的结论,再对MA(1)进行回归,结果如表3所示。通过比较两个模型的精度指标,确定模型的最终表达式,如表4。在两种模型调整后的拟合优度和回归标准差相同的情况下,根据AIC、SC以及HQ较小为优的原则,拟选定调整后的ARIMA(0,2,1)模型为生鲜乳周度价格的预测模型。
表3 调整后的ARIMA(0,2,1)模型估计结果
表4 两种模型精度指标对比
对模型进行残差序列白噪声检验,即Q统计量检验,结果如图3。模型残差的自相关和偏自相关值都小于临界值,对应Q统计量的P值大于0.05,即接受原始假设,在5%的有效性水平下,表明模型可以较好地描述数据。因此,认为模型ARIMA(0,2,1)建模时,其残差序列是白噪声序列,该模型为优选预测模型。
图3 残差序列白噪声检验
根据上述模型对2019年1月至2022年5月生鲜乳周度价格进行预测分析,拟合效果如图4,实际值与预测值差距较小,由上文分析结论确定运用数列ARIMA(0,2,1)。同时根据所得的预测图4进行处理分析,其真实价格处于预测的置信区间之中,这个结果证明了所建立的模型有着良好的拟合度,能够较为准确地对生鲜乳周度价格作出预测。同时对2022年3~4月的生鲜乳周度价格数据进行了分析,计算生鲜乳周度价格实际值与拟合值绝对误差(AE)、绝对误差百分比(APE)见表5,真实值与拟合值绝对误差百分比均在5%之内,拟合精度较好,因此可以利用ARIMA(0,2,1)模型对未来生鲜乳周度价格进行预测。利用EViews8.0软件预测2022年6~9月份生鲜乳周度价格分别为4.15元/kg、4.15元/kg、4.14元/kg、4.14元/kg、4.13元/kg、4.13元/kg、4.12元/kg、4.12元/kg、4.11元/kg、4.11元/kg、4.10元/kg、4.10元/kg、4.09元/kg、4.09元/kg、4.08元/kg、4.08元/kg、4.07元/kg、4.07元/kg、4.06元/kg、4.06元/kg。
图4 ARIMA(0,2,1)模型拟合图
表5 ARIMA(0,2,1)模型拟合结果
本文通过利用2019年1月至2022年5月,共175个生鲜乳周度价格组成的序列进行ARIMA预测分析,建立了ARIMA(0,2,1)预测模型,同时对2022年3~4月的数据进行了拟合,拟合效果较好;对2022年6~9月共20期的数据进行了预测,预测结果符合生鲜乳价格变动的趋势。
通过生鲜乳下一季度周度平均价格的预测结果来看,在下一季度我国生鲜乳周度价格呈回落趋势,维持在4.10元/kg左右。综合前人研究生鲜乳价格下降可能是由于国家对新冠肺炎疫情的管制逐渐常态化,疫情对奶业的生产以及国人的消费能力影响逐渐减小以及自然环境、奶牛疫病、突发事件、政策导向等原因造成的。
生鲜乳价格回落在一定程度上会刺激消费,但对于生鲜乳生产企业或奶牛养殖者来讲,在一定程度上会受到不良影响,减少一部分可观收益。因此生鲜乳生产者应适当调整奶牛养殖计划,在下一季度尽量降低奶牛规模扩充等计划,保证利益最大化;采取多种销售预案,延长产业链,提高产品附加值,尽可能地减少损失;优化产业结构,鼓励低温奶消费,提升国内原料奶的需求空间。政府应该进行适当宏观调控,减少市场信息不对称的弊端;对相关企业进行引导,为小型企业生产决策提供相应的帮扶;推广价格保险,保障企业收入;提前建立预警机制,以防“倒奶杀牛”和“争抢奶源”等现象发生。