舒服华
(武汉理工大学继续教育学院,湖北 武汉430070 )
棉花是常见的经济作物,也是传统的纺织原料,目前占所有纺织原材料的40%以上,并且这一比例还在持续增大,其主要原因是棉花纺织品得到了人们的重新认识。棉花纺织品是一种透气良好的纯天然织物,对人的皮肤无刺激作用,不会使人产生过敏反应。棉质服装还具有良好的吸湿性、保温性、耐热性,穿在身上舒适健康。同时,棉花纺织品也是一种环保型的面料,焚烧时释放的有害物少,丢弃时容易降解,对环境污染小。在当今人们普遍追求绿色健康生活方式的时代,棉织品又再次受到了消费者的青睐,成为纺织舞台的新宠,且纺织行业对于棉花的依赖度持续增高。科学预测我国棉花产量,对制定棉花产业发展战略,统筹农业生产,做好市场宏观调控,确保纺织原料稳定供应,保持棉花市场供需总体平衡,推进少数民族地区经济发展,促进农业产业化和纺织行业健康发展具有重要的意义。由于棉花产量和棉花种植面积具有密切的关系,将二者联系在一起预测,更具现实性和参考价值。向量自回归模型(VAR)常用于多个相关联的时间序的预测,它以历史数据为基础,通过挖掘系统内部所隐含信息对时间序列未来的发展趋势进行判断,并且能够揭示关联时间序列之间的联系,比孤立地对多时间系列进行单独预测更加客观、可信。因此,运用VAR模型对我国棉花产量和棉花种植面积进行预测,以促进农业和纺织行业健康发展。
VAR模型常用于对2个或多个相关联的时间系列的预测,VAR模型一般可用下式表示,称为限制性向量自回归模型。
=-1+-2+…+-++
(1)
式中,y为n维内生向量;x为m维外生向量;ε为n维随机扰动向量;A(i=1,2,…,p)和B为系数矩阵。
特别时(当外生向量为常数矩阵C时)VAR模型变为下式(2),称为非限制性向量自回归模型。
=+-1+-2+…+-+
(2)
图1为2006—2021年我国棉花种植面积和棉花产量统计数据(数据来自国家统计局)。从中看见,在这16年中我国棉花种植面积呈逐渐下降的趋势,而棉花产量在经过一段时间的小幅下降后,近些年基本保持稳定。一方面反映加入WTO后,我国纺织品市场逐步对外开放,国内部分市场被国外抢占,同时,加上国内劳动力成本的上升,使我国纺织品成本优势减弱,出口贸易承压,纺织行业治理整顿,淘汰落后产能,使国内棉花消费量减少,市场供求关系失衡,棉花价格下滑,导致棉花种植的效益下降,使棉农的生产积极性不高,种植面积逐步萎缩;另一方面,反映我国棉花生产技术在不断提高,包括种子、农田质量、灌溉设施、田间管理技术都在大力改善,使棉花的单产得到了大幅提高,虽然棉花种植面积在减少,但总产量下降不太明显。
图1 我国棉花种植面和产量统计数据
将我国棉花种植面积设为内生变量为y,棉花产量设为内生变量y,则y,y组成二维向量时间序列Y=(y,y),以2006—2021年Y序列数据为样本,然后建立VAR预测模型。
单位根检验目的是判断序列是否为平稳序列,否则容易导致伪回归。如果序列为非平稳序列,可通过一次或多次差分使其变为平稳序列,若序列通过n次差分后才变为平稳序列,则称其为n阶单整。单位根检验见表1,从表1知, y的ADF值为-0.161610,大于1%、5%、10%的临界值,y的ADF值-1.514344,为大于1%、5%、10%的临界值,表明y、y均为非平稳序列。故对y、y进行一次差分,则 d(y)的ADF值为-2.895604,小于10%临界值,d(y)为平稳时间系列,d(y)的ADF值为-3.664002小于5%、10%临界值,d(y)也为平稳时间序列,y、y经过一次差分后,皆变为平稳系列,即内生变量y、y为一阶单整,满足协整检验的条件。建立模型VAR(2)以检验d(y)、d(y)协整性、格兰杰因果关系、模型的最佳滞后期。
表1 单位根检验结果
协整性检验主要是考察所研究变量组是否存在长期的均衡关系,只有存在一定的联系,将它们联合起来研究才有意义。协整性检验结果如表2。从表2可知,对于“无协整性”假设,似然概率为0.0129,小于 5%的置信水平,故拒绝原假设;对于“最多一个协整关系”假设,似然概率为0.2981,大于5%的置信水平,故接受原假设。说明二者存在一个协整关系,即棉花种植面积与棉花产量存在长期的均衡关系,将它们一同研究是有意义的。
表2 协整性检验结果
对d(y)、d(y)进行格兰杰检验,在滞后2阶的条件下,结果如表3。从表3可知,两个假设的显著性概率都大于5%的置信水平,故均接受原假设,即d(y)、d(y)之间双向不存在格兰杰因果关系,d (y)不是d(y)的格兰杰原因,d(y)也不是d(y)的格兰杰原因。值得注意的是,格兰杰因果关系并非现实生活中的因果关系,而是统计学上的因果关系,它仅说明在短期内,一个变量的变化对另一个变量的变化解释的有利性。所以,这并不代表棉花产量和棉花种植面积之间没有关系,而只是在短时期内,二者的变化不一定立刻一一对应。这也是可以理解的,如棉花种植面积一时的增减,有时并不能马上影响棉花产量的增减,如种子、种植结构、旱涝等自然灾害、病虫害、管理技术等,都会导致棉花单产的不确定性,总产量的增减就很难说得准。即在短期内,棉花产量不一定随种植面积同步变化。
表3 格兰杰检验结果
滞后阶确定一般以AIC值(赤池信息准则值)和SC值(施瓦兹准则值)在同一滞后阶最小为原则。当AIC值、SC值不在同一滞后阶最小时,则以 LR值(似然比统计量值)最大为准则。滞后阶数越大,模型的自由度越小,模型的参数越多,越复杂,并不能得到好的预测效果,对于样本容量不大时序,滞后期在4以内考察基本可以满足。模型滞后阶判别结果如表4。在考察的4个滞后阶中, AIC=15.00703和SC=15.65813同时在滞后4期最小(带*号),故最佳滞后期应该为4,即模型最佳阶数为p=4,因此确定的模型为VAR(4)。
表4 模型滞后阶判别结果
建立VAR(4)模型,对模型的参数进行估计,结果如表5,其中,参数第一项为系数,第二项为标准差(带小括号),第三项t统计量(带中括号)。根据估计的参数得到预测方程如式(3),即我国棉花种植面积产量的VAR预测方程。
表5 模型的参数估计结果
(3)
对建立的VAR(4)模进行稳健性检验,结果如图2所示。从图2可知,模型的8个特征值都位于单位圆内,即所有特征值模的倒数都小于1,说明模型是稳定和可靠的。可以用于棉花种植面积和产量预测。
图2 模型的稳健性检验结果
根据预测方程(3)对我国棉花种植面积和棉花产量进行预测,结果如表6(由于数据进行了一次差分处理,并且后期值与前期的值和预测误差有关,因此前5期的值不能预测)。从表6可知,模型对棉花种植面积的平均预测误差为1.21186%,对棉花产量的平均预测误差2.74908%,两个指标的平均预测误差都在公认的优良级标准3%以内,表明运用VAR模型预测我国棉花产量和种植面积不仅是可行,而且效果良好。预测曲线如图3,由模型预测得到2022年我国棉花种植面积为303.8344万公顷,棉花产量为631.1209万吨,两项指标比2021年都有所增加。由于2020年、2021年全球广受新冠肺炎疫情影响,特别是2020年,除中国外,世界主要经济体都出现较大的负增长,导致棉花市场疲软,传导到我国,种植面积和产量也出现了双降。2021年全球经济开始缓慢复苏,2022年会进行一步加快恢复,对纺织品的需求有所增加,将推动了对棉花的需求上升,加上这两年国内棉花种植面积和产量出现下降后,引起国家的高度重视,出台了一系列出台鼓励和稳定棉花生产的政策。2022年我国棉花种植面积和产量可能会出现一定程度的增长,这一预测结果有较大的可信度。
图3 棉花种植面积和产量的预测曲线及对比
表6 模型预测结果及比较
脉冲分析的方法是给模型加一个单位标准差的干扰信号,考察干扰信号运行情况。脉冲分析如图4所示。给d(y)加一个d(y)的标准差大小的干扰信号,d(y)沿着0线上下振动,均值趋于0,干扰信号随期数震荡减弱大约在第10期左右就消退,最终收敛;给d(y)加一个d(y)的标准差大小的干扰信号,d(y)沿着0线上下宽幅振动,但均值基本趋于0,干扰信号也随期数震荡减弱,不过收敛的期数有所延长;但应该也是收敛的。说明 d(y)受 d(y)影响较大,即棉花产量长期来看主要受种植面积的影响。脉冲分析表明模型是合适和正确的。
图4 脉冲分析结果
由于两个变量存在协整关系,对二者进行预测牵涉到彼此之间的信息。预测精度不仅与自身有关,还与相对应的另一个变量有关。方差分解的目的就是分析各变量预测误差的组成与来源。方差分解结果如图5。从图5可知,d(y)的预测误差主要来源于自己,占98%,2%来源于d(y);d(y)的预测误差主要来源于d(y),占95%。5%来源自己,再次反映棉花种植面积是决定棉花产量的主要因素。
图5 方差分解结果
棉花在我国有悠久的种植历史,是重要的经济作物,是主要的纺织原料,也是重要的战略物资。棉花安全是粮食安全、国家安全的重要组成部分。众所周知,我国是世界上的纺织大国,是全球最大的纺织品出口国,因此,中国既是第一大棉花消费国,同时也是棉花生产大国。2020年我国棉花产量位居世界第一,占全世界的22%,消费量约为595万吨,保持了供需总体平衡。稳定的棉花供应不仅保证了我国纺织行业的健康发展,而且为我国纺织品服装出口提供了有力的支持。同时,种植棉花也为老少边穷欠发达地区提供一条重要的致富门路。棉花作为国家战略物资,事关国计民生、经济发展、国防建设、国家安全。因而我国棉花主产区要切实有目标、有计划、有措施、有行动抓好棉花生产,稳定棉花产量,保障棉花安全,以免受制于人,维护国家核心利益。同时,搞好棉花生产对推动城乡经济发展、农民增收致富、满足居民衣着需求、促进对外贸易发展等具有深远的意义。准确预测我国棉花产量,对推进棉花生产稳步进行,确保供求关系协调,促进棉花行业有序、有效发展,更好地服务于纺织行业,保障经济社会的发展等具有重要的意义。运用VAR模型对我国棉花种植面积和棉花产量的预测取得了令人满意的效果,棉花种植面积平均预测误差仅为1.21186%,棉花产量平均预测误差为2.74908%。根据模型预测得到2022年我国棉花种植面积为303.8344万公顷,棉花产量为631.1209万吨。