侯英杰,张立杰
(1.新疆大学经济与管理学院,新疆乌鲁木齐830047;2.新疆大学纺织与服装学院,新疆乌鲁木齐830046)
中国是世界上最大的产棉国之一,据统计数据显示,截止到2016年,我国棉花产量达534万吨,居世界首位,棉纺织品出口2 733.93亿美元,棉布产量也位居第一,棉花已成为我国重要的纺织原料和战略性物资.棉花生产的稳定性和充足程度不但影响我国纺织服装业的生产和出口,还极大影响中国乃至世界纺织服装类市场的发展.但是,近几年来,由于经济环境、进出口量和自然环境等因素的制约,我国棉花生产风险加大,使得棉花产量呈现出较大的波动性.2001―2016年,我国棉花产量从532.35万吨上涨至2008年的749.19万吨,由于2008年以后经济形势的下滑,棉花市场出现一定程度的紧缩,虽部分年份产量缓慢上升,但整体呈下行趋势,到2016年产量已跌至534万吨,整个过程波动明显.但是同期,我国棉纱产量从760.68万吨上涨至3 732.6万吨,年平均增长率达到11.19%,远远超过棉花产量1.12%的增长率.棉花产量并未随着我国纺织品行业生产能力的提高以及棉花需求量不断增加的趋势实现持续上涨,这种供求之间的非同步性,大大影响生产者的决策行为和消费者的购买意愿,不利于我国棉花生产及相关行业的稳定发展.如何转变调控方式,降低棉花生产和市场的不确定性,使得棉农棉企在面对如此复杂多变的市场环境时避免陷入生产困境并实现稳定发展,是目前我国棉花产业亟待解决的问题.
农业预警是对农业未来状态进行测度,预报不正常状态的时空范围和危害程度,并提出防范措施.合理的农业预警机制能够预报农业风险,预防农业警情,进而降低农业生产风险和市场的不稳定性.农业预警研究是目前我国农业风险研究领域中的重点和热点,从研究对象来看,我国农业预警研究主要集中在粮食、蔬菜水果等经济作物以及生猪等农产品的价格风险、产业安全及生产风险等方面,如徐磊等[1]和侯晓磊等[2]分别运用粮食单产波动概率分布模型和山东小麦生产预警系统对粮食生产风险进行了度量和分析,李优柱等[3]对蔬菜价格风险进行预警研究.熊巍等[4]以柑橘为例构建水果类农产品的产销预警指标体系,刘芳等[5]研究了我国生猪价格波动风险.张立杰等[6]改进了自回归移动平均模型,构建基于自回归移动平均和支持向量机的组合模型对我国棉花价格进行了预测.张淑芬等[7]评价了我国棉花产业安全状况,结果表明我国棉花产业处于偏低的安全度范围,棉花产业安全还需通过对棉花预警监测系统及相关政策制度的的进一步完善来提高.我国农业预警研究对象的选取较为广泛,但是总体来看以我国棉花为预警对象的研究相对较少,棉花预警领域的研究亟待补充和完善.从研究方法来看,我国农业预警大多从指标设置和模型构建出发对农业风险状况进行探讨.如赵瑞莹等[8]以生猪价格波动率为警情指标,从供给、需求和供给环境三方面出发,以指标变化率和增长率为警兆指标,构建基于BP神经网络的生猪价格风险预警模型.吴清华等[9]以油菜籽收购价格的波动率作为警情指标,从供给、需求、自然经济和政策与国际环境几方面选取警兆指标,并运用BP神经网络对油菜产业进行了实证研究,验证了利用BP神经网络构建的风险预警模型的实用性和可行性.罗永恒[10]和程彬等[11]利用ARMA模型分别对农产品价格指数和生猪生产风险状况进行了预测分析,预测结果表明ARMA模型在预测问题中有较高的预测精度.李芳凤等[12]引入改进后的灰色预测模型对城市蔬菜污染问题进行了预警研究,并对模型的预测精度进行了验证.闵锐[13]采用多元自回归模型对湖北省粮食安全状况进行了预警分析.
总体来看,学者对农产品预警指标选取主要集中在供需水平、市场价格、生产、经济环境和自然环境几方面,但是从现有研究来看普遍存在指标设置不全面的问题,指标选取中并未将上述几方面内容全部考虑到,因此本文在综合考虑供需水平、市场价格、生产、经济环境和自然环境的基础上,尽可能全面的构建出我国棉花生产风险预警指标体系.另外,从模型选取来看,目前以单一模型为主进行预警研究,其中BP神经网络和ARMA模型相较其他预测模型,在我国农业预警研究中使用更为广泛.BP神经网络具有较强的非线性逼近能力和自学习能力,能够较好的处理影响因素较多的复杂非线性问题,但是从预测的时间维度来看,许多学者在农业预警研究中未考虑BP神经网络在预测中的局限性,仅使用单一BP神经网络利用现有数据对结果进行拟合,并未做到对未来状态的预测.而ARMA模型作为单指标预测模型,仅需考虑预测序列历史数据信息,预测方法相对来说简单明了,但是在面对棉花生产这种过程复杂影响因素较多的农业生产问题时,其单指标历史数据信息并不能真实全面地反映棉花生产过程.因此本文在综合考虑两类预警模型优缺点基础上,选取ARMA-BP网络组合模型,既能保留ARMA模型和BP网络在预警问题中的优点,又能互补缺点,提高模型预测精度.
在总结以往研究文献和我国棉花生产特点的基础上,从指标的实际意义和数据的可获得性考虑,选取20个指标构建我国棉花生产预警评价指标体系.如表1所示,包括5个一级指标,15个二级指标,对我国2001―2015年棉花生产状况进行分析研究.
表1 我国棉花生产风险预警指标体系Tab 1 The early warning indicator system of China cotton production risk
1.1.1 供给指标的设置
(1)棉花供给量.棉花供给量用以反映我国棉花供给水平,是衡量我国棉花供给市场是否平衡的重要指标.统计数据显示,2001―2010年,我国棉花供给量与棉花消费量保持同步上升趋势,棉花供给市场基本平衡,但2010年后,为了稳定棉花市场,我国实行棉花临时收储政策,棉花供应量持续上涨,而经济形势的下滑,使得国内棉花消费量下跌,这就造成了棉花市场供需不平衡,影响国内棉花生产.
(2)棉花人均占有量.棉花人均占有量用以反映棉花人均占有水平.该指标的设立对于衡量我国棉花供应是否充足具有重要的现实意义.作为人口大国,我国人口基数大,棉花供给总量不足以说明我国棉花供给的充足度.棉花人均占有量是将供给总量分摊到个人,用以衡量棉花人均占有水平,反映棉花供给充足与否.而棉花供给的充足度对我国棉花生产有较大影响.
(3)棉花期末库存.棉花期末库存用以反映我国棉花当年期末库存数量,是衡量我国棉花供给市场是否平衡的重要指标之一.如图1所示,我国棉花期末库存量在2010年后直线上升,但是我国棉花消费量在同一时期却呈下降趋势,期末库存量逐步高于消费量,这意味着我国棉花生产出现供大于求的趋势,在一定程度上打破了棉花供给市场的平衡,这对棉花生产计划的调整和决策有很大影响.
图1 2001―2016年我国棉花消费量和棉花期末库存Fig 1 2001―2016 China’s cotton consumption and cotton ending stocks
(4)棉花进口数量.作为棉纺织生产及出口大国,国内市场对棉花需求量大,需较多的进口棉供应棉纺织行业.棉花供给市场除进口棉外,还包括国产棉,两类棉互为竞争关系.加之进口棉在价格和质量上较国产棉有一定的优势,对国产棉供给市场造成冲击,这就使得国产棉相较于进口棉的需求降低,致使国内棉花生产受到影响.
1.1.2 需求指标的设置
(1)棉花消费量.反映我国棉花消费情况.国内消费量是需求指标中最重要的二级指标,它能直观反映我国棉花消费情况,决定国内棉花市场需求量,因此直接影响我国棉花生产.如图2所示,2001―2016年我国棉花产量增减趋势与国内棉花消费量趋同,国内棉花消费量和棉花生产呈正相关关系.
(2)城镇和农村居民人均衣着支出.这两个指标分别用以衡量我国城镇居民和农村居民衣着类消费品的平均支出水平.据统计局数据显示,我国城镇居民人均衣着支出已从2001年的533.66元上涨到2016年的1 739元,涨幅超过3倍,农村居民人均衣着支出涨幅超过5倍,服装类产品消费支出不断增加.我国居民生活质量和收入水平的提高,人们对服装的舒适性要求普遍增加,很大程度的促进了棉花需求,使得棉花类服装制品的占比不断增加.该指标间接反映我国棉花需求状况,对国内棉花生产存在一定影响.
(3)棉花出口量.反映我国棉花出口情况.随着国际市场的开放和国际经济形势的下滑,国际棉花市场竞争日益激烈,我国棉花在出口方面受到一定程度的冲击,这对我国棉花需求总量产生影响,进而影响我国棉花生产.
图2 2001―2016年我国棉花产量和棉花消费量Fig 2 2001―2016 cotton production and cotton consumption
1.1.3 经济环境和价格指标的设置
(1)GDP(年度).反映我国年度经济表现.GDP是国家或地区一定时期内产品和劳务价值的总和,是衡量国家经济状况的最佳指标.棉花供求市场通常受国内经济走势的影响,在良好的经济形势下,需求呈上升趋势,会刺激棉花生产,反之经济衰退则会对棉花生产产生负面影响.
(2)国内棉花价格A指数.反映国内主要地区棉花平均成交价格水平.我国棉花价格指数主要包括A、B指数,分别代表229级和328级两种国内主要皮棉的市场交易均价.两种价格指数变化及价格走向基本趋同,因此选择一种反映棉花交易价格即可,本文选择A指数.棉花交易价格的高低能直观反映市场供需情况,对棉花生产起到促进和遏止作用.
1.1.4 生产指标的设置
(1)棉花产量.反映我国棉花每年的产出情况,是评价我国棉花生产状况的核心指标,也是直接反映我国棉花生产是否有警的预警指标.从图2可以看出,我国棉花生产波动性大,生产并不稳定,存在一定的生产风险.
(2)棉花单面积产量.反映我国棉花生产单位面积产出效率.棉花生产受机械化程度、灌溉水平、受灾状况影响,棉花单位面积产量是影响棉花生产因素的综合反映,能够同步反映棉花生产水平.
(3)棉花播种面积.反映我国棉花播种生产情况.由于上年度的市场供求状况对本年度棉花播种面积有很大的影响,因此它既是上年度棉花市场供求状况的市场供需指标,又是反映本年度棉花生产状况的生产指标,决定我国棉花生产在本年度的产出水平.
(4)棉花有效灌溉面积.反映我国棉花生产灌溉情况.棉花生产过程中,有效灌溉面积对棉花生长有极大的影响,会直接影响棉花生产及棉花产出状况,由于数据来源有限,本文对棉花有效灌溉面积在统计上做了处理:棉花有效灌溉面积=有效灌溉面积×(棉花播种面积/农作物总播种面积).
(5)棉花受灾面积.反映棉花因灾害损失面积.农业生产中,存在气象灾害等不可控因素,会影响农业生产,造成减产.棉花受灾面积可以反映棉花生产受灾害情况,是衡量棉花生产状况的重要指标.由于数据来源有限,本文对棉花受灾情况也做了一定的统计处理:棉花受灾面积=受灾面积×(棉花播种面积/农作物总播种面积).
指标进行预选取后,需要进一步对所选取指标的合理性进行评估.棉花生产通常处于一种复杂的系统中,受社会、经济、自然等因素的影响较大,本文在考虑棉花生产环境复杂性的基础上结合指标选取原则,对指标进行了预选取.根据预警基本原理,在预选取的指标中需要设定棉花生产警情指标,作为监测风险的一项基准指标来判断棉花生产是否存在过热或过冷现象,影响棉花行业发展,导致棉花供求失衡.棉花产量能够直观的反映棉花生产情况.是棉花行业是否正常发展的导向指标,可以作为警情指标,剩余的指标我们作为警兆指标进行预警研究.警兆指标的选取在满足了上述指标选取要求外,还需考虑各指标与警情指标之间的关联程度,也就是考察各指标是否能够反映警情指标,警情指标能够直观描述棉花生产状况,因此其关联程度决定了所选取的警兆指标是否能作为反映棉花生产真实状况的影响因子.
本文引入灰色关联度分析对棉花生产预警指标体系中警情指标和各相关指标间的关联程度进行评价,进一步判断该指标体系构建的合理性.选取我国棉花2001―2016年数据,建立灰色关联度评价模型来考察我国棉花生产指标体系是否合理有效.
首先确定系统行为序列.设我国2001―2016年棉花产量序列为X0=(x0(1),x0(2),...,x0(k),...,x0(16)),其中x0(k)表示第2 000+k年的国内棉花产量,k=1,2,...,16.
该指标序列为模型的特征行为数列,其他指标设为相关因素行为数列,具体如表2所示.本文所选取指标数量多,包含的信息差异较大,因此各指标间存在量纲和数量级上的不同,为了避免量纲和数量级差异带来的计算误差和指标间比较不便的问题,本文在计算关联度之前,对各指标原始数据进行无量纲化处理,尽可能的降低数据量纲差异带来的影响.本文采用初值法对各指标与特征指标间灰色关联度进行分析,并将灰色关联度的分辨系数ξ取为0.5.
表2 棉花生产预警指标系统行为序列Tab 2 The behavior sequence of cotton production early warning indicator system
通过软件计算,可得棉花产量指标与其他警兆指标的关联度,如表3所示.
关联度数据表明除棉花进口量指标外,各警兆指标与棉花产量指标的关联度均大于0.9,关联度较强,说明这些指标对棉花生产均有较大的影响.我国棉花市场的发展受国内棉花政策影响明显,2011年我国出台了棉花收储政策以及目标价格改革政策,国内棉花价格与国际棉花价差进一步拉开,国内棉企对国产棉需求降低,进口棉需求量不断上涨.2014年以后国家为抑制国内外棉价倒挂现象,取消该项政策,并试点棉花目标价格补贴政策,这使得国内棉花差价逐步降低,棉企对国产棉需求增加,进口棉数量则产生了下跌现象.也就是说政策原因造成进口量的较大幅度波动,使得关联度评价中出现棉花进口数量与棉花产量两项指标的关联度较低.
表3 相关因素关联度Tab 3 Relevance factor correlation
从总体来看,警情指标与警兆之间的关联程度较好,警兆指标能够对棉花生产产生较大的影响,将这些指标作为反映棉花状况的因子是合理的.
2.1.1 ARMA模型原理
作为描述时间序列的重要方法,ARMA模型凭借其高预测精度,常被用于短期预测问题中.该模型认为虽然时间序列中单个序列值是随机不确定的,但是整个序列是一组随时间变化具有一定规律的序列簇,可以通过构建函数对该变化规律进行描述,并对结果做出最优预测,ARMA模型可表示为
该模型被称为(p,q)阶自回归移动平均模型,记为ARMA(p,q).其中,φ1,φ2,...,φp为自回归参数,θ1,θ2,...,θP为移动平均参数,是模型的待估参数,εt是相互独立的白噪声序列.
2.1.2 ARMA模型的建立与预测
选取中国统计局全国棉花产量1949―2016年年度数据,利用ARMA模型的建模原理结合1949―2015年数据建立ARMA模型,并预测2016年全国棉花产量,与实际值对比考察ARMA模型的预测精度,然后利用该模型预测2017―2018年全国棉花产量.
原始数据平稳化处理.ARMA模型构建要求数据具有平稳性,我国棉花生产波动性大,数据序列通常为非平稳数据,因此,在构建模型前,需先对数据的平稳性进行检验,对非平稳数据进行平稳化处理.
图3 全国棉花产量原始数据时间序列图Fig 3 Time series chart of cotton production raw data
首先,绘制原始数据x的时间序列图,如图3所示.可以看出,1949―2015年全国棉花产量序列具有明显的上升趋势,可以判定序列x为非平稳序列,无法满足ARMA模型的序列要求,故需进一步考察序列x的差分序列,经考察一阶差分序列dx为平稳纯随机序列,二阶差分序列ddx为平稳非纯随机序列,如图4所示,故选择二阶差分序列ddx进行ARMA模型的建立.至此,完成了原始数据的平稳化处理.
2.1.3 ARMA模型的模式识别
原始数据平稳化处理后,需对模型的各阶数进行确定来识别模型模式,即确定ARMA(p,d,q)中p,d和q的值,由平稳化处理过程可知d=2.p和q主要由二阶差分ddx的自相关系数图和偏相关系数图来确定.根据图4可知,自相关系数自1阶后,基本都能落在2倍的标准差范围内,并逐渐减弱到零,具有一定的拖尾性,偏自相关系数在延迟6阶之后,全部落到2倍的标准差范围内,同样具有一定的拖尾性,即二者都不具有明显的截尾性,这样就难以用传统的方法具体确定模型的阶数,对于这种情况,需要通过反复对比模型进行估计来确定最佳模型.尝试不同的ARIMA(p,d,q)模型,取p=1,2,3,4,5,6,d=2,q=1,并将其参数的t统计量的显著性检验值P、AIC值和SBC 值列表,如表4所示.同时由于二阶差分序列绕着零轴上下波动,可视其均值为零,故在对其建模时不再考虑常数项C.
图4 序列x二阶差分时间序列图和相关系数图Fig 4 Second-order differential time series graph and correlation coefficient graph of sequence x
剔除参数不显著的模型,剩余MX_2、MX_4以及MX_5模型符合条件,其中MX_2的AIC值最小,因此,MX_2模型更好的提取了序列的信息.故利用MX_2模型对全国棉花产量进行建模.
表4 不同ARMA模型参数的t统计量的显著性检验值P、AIC值和SBC值Tab 4 Significance test value P,AIC value and SBC value of t statistic of different ARMA model parameters
2.1.4 ARMA模型的建立和残差检验
根据模型识别与选择,选用ARIMA(6,2,0)作为最佳预测模型,使用最小二乘法估计该模型的参数及模型的相关检验,结果表明,模型中的各个系数具有明显的统计意义,对应的模型表达式为
式中,εt为残差序列.
参数估计后,还需要对模型的残差序列进行白噪声检验,若残差序列不是白噪声序列,那么残差序列中还存在有用信息未被提取,需要进一步改进模型,若残差序列为白噪声序列,则说明信息已被完全提取,说明建立的模型是有效的.对残差进行检验,结果如图5所示.
图5 ARMA模型的残差序列的相关系数图Fig 5 Correlation coefficient diagram of residual sequence of ARMA model
由图5可知,检验Q统计量的P值全部显著的大于显著性水平0.05,即说明模型的残差序列是纯随机序列,因此,该模型的建立是有效的.
2.1.5 ARMA模型的预测分析
模型建立后,就可以用建立的模型对未来的全国棉花产量进行预测,首先对2016年的棉花产量进行预测,检验模型预测的精准度,如图6所示.通过该模型预测的2016年全国棉花产量为503.27万吨,与2016年实际全国棉花产量534万吨的误差为5.75%,预测精度良好.利用该模型预测2017年和2018年的全国棉花产量,分别为520.776万吨和536.164万吨.
图6 ARMA模型的预测图Fig 6 Prediction map of ARMA model
BP网络是一种常用的单向多层前馈网络,其形式一般为三层或三层以上的层级结构,包括一个输入层、一个输出层和一个或多个隐含层.各层由若干个神经元(节点)构成,同层神经元间无关联,不同层间各神经元以权向前连接.BP神经网络是通过BP算法来实现的,BP算法又被称作误差反向传播算法,是一种监督式的学习算法,它是根据研究对象的不同,选择适当的网络结构和作用函数,利用输入和输出样本集对网络进行训练,并通过误差的逐层往回传递,不断调整和修正层间的阈值和权值,逐层逼近目标值,以实现输入到输出的任意非线性映射.BP神经网络是通过输入指标和其内部函数及参数来拟合输出,结果预测需要借助输入端数据的预测值,因此本文选择与ARMA模型相结合,弥补单一模型无法全面反映变量变化规律的不足,提高模型预测精度.
2.2.1 ARMA-BP网络的构建
ARMA-BP网络的构建主要包括警兆指标预测模型的构建和ARMA-BP网络层次、各节点数及网络计算函数的确定
(1)基于ARMA的警兆指标预测模型的构建
BP网络对数据的预测建立在输入指标的基础上,在对棉花生产状况进行预测前,需先对警兆指标作出预测,通过预测出的警兆指标进一步拟合得出警兆指标值,因此先构建警兆指标预测模型,对各警兆指标2017―2018年的数据值进行预测.具体步骤与棉花产量的预测类似.
(2)ARMA-BP网络结构及函数的确定
ARMA-BP网络的构建包括确定网络层次、各节点数及网络计算函数.
a 网络层次结构的确定
BP网络的隐层数量可以根据具体问题进行选择,通常来看,一个单隐层的BP网络即可完成对任何一个闭区间内的连续函数逼近,单隐层网络即三层网络即可完成任意的n维到m维的映射,因此,本文采用三层网络拓扑结构,如图7所示.其中输入层有n个神经元,输入向量为U (u1...,ui...,un)T,隐层有n1个神经元,隐层输出向量为X(x1,...xj,...xn1)T,输出层有n2个神经元,输出向量为Y(y1,...,ym,...,yn2)T;输入层神经元ui与隐层神经元xj之间的权值为Wij,阈值为θj(i=1...,n;j=1,...,n1);隐层神经元j与输出层神经元m之间连接权值为wjm,阈值为θm(m=1...,n2).
图7 网络结构图Fig 7 Network structure
b 网络各层级节点数的确定
(1)输入层节点数的确定.根据上节确定的棉花生产预警指标体系,从供给、需求、经济环境、价格和生产指标中选取除棉花产量以外的14个二级指标作为描述棉花生产风险的输入指标.因此,本文的输入层初步确定为n=14,具体选取情况还需考虑ARMA模型的预测情况.
(2)输出层节点数的确定.输出层的选取对应于最后的评价结果,为此,节点数的确定也应与评价结果相对应.本文以棉花产量作为我国棉花生产预警风险指标.所以,输出节点数m=1.
(3)隐含层节点数的确定.隐层的神经元数目的选取是一个复杂的问题,选取数量过少,会导致网络训练效果不佳,预测精度较低,选取数量过多,网络映射关系复杂性增加,会造成学习时间过长且预测精度不一定最佳.因此,网络应设有一个最佳隐含层节点数.本文根据式(3)确定隐层节点数范围,并经过多次试验确定最佳隐层节点数n1=6.
其中,n为输入层节点数,m为输出层节点数,a为[0,10]之间的常数.
c 网络函数的确定
BP神经网络的构建需要通过一系列函数来完成.
(1)传递函数.传递函数又称为激活函数,是用以传递输入信息的重要组成部分,常用S型的对数或正切函数,本文采用“transig”双曲正切S型函数进行信息传递.
(2)训练函数.BP网络是一种反向传播网络,传统的基于梯度下降法的反向传播算法(traind)应用广泛,但是传统算法存在一定的缺陷.为了克服传统算法带来的缺陷,本文采用动量及自适应lr的梯度递减算法.因此,文中采用“traindx”作为网络训练函数.
(3)学习函数.学习函数用于进行网络权值和阈值的学习.本文采用“learndm”梯度下降动量学习函数计算权值和阈值的变化率.
2.2.2 模型预测
(1)数据来源及处理
预警指标体系中选取的15项指标数据均为年度数据,来源于中国统计局及中国棉花网和前瞻数据库,所能收集到的各指标数据量具有差异性,但均取自1949―2016年间,其中用以建立ARMA模型的14个警兆指标数据需先进行平稳性检验和平稳化处理,具体步骤与上文棉花产量序列的平稳化处理相同.除此之外,为了避免不同变量之间的量纲差异对ARMA-BP网络的预测效果产生影响,加快网络收敛速度,还需对各数据做归一化处理.
其中,Y为预处理后的样本值,Xi为原始输入样本值,Xmax,Xmin分别为原始输入样本值中的最大值和最小值.
(2)ARMA模型的预测
本文以2015年以前各指标数据作为训练样本,2016年数据作为测试样本,分别对14组警兆指标进行训练和验证,剔除未通过模型检验和误差较大指标数据,测试结果如表5所示.
表5 模型测试结果Tab 5 The test result of model
从表5的测试结果来看,这12个指标的测试误差相对较小,大部分指标的误差率在10%以下,总体都能保持在15%以下,说明模型预测精度较高,这几项指标可以通过ARMA模型进一步预测.本文在进行ARMA模型的测试和检验中剔除了棉花出口量和期末库存两项指标,观察棉花出口量指标的自相关-偏自相关图,棉花出口量数据列是一组纯随机变量,无法使用ARMA模型预测.由于我国棉花出口量少,尤其在2009年以后棉花出口量维持在1万吨不变,对于棉花产量的影响极弱,所以,综合这两部分考虑,本文剔除该项指标;观察棉花期末库存指标,发现该项指标的测试值误差达到108.46%.误差极大,究其原因是由于近几年来我国各项棉花政策的出台,导致我国棉花库存大范围的波动,而已有的数据相对较少,也不适合ARMA模型,因此也剔除该项指标.最后保留剩余的12项指标,再通过建立模型函数分别对各警兆指标预测出2017―2018年的数据.
(3)ARMA-BP网络预测
a 网络训练
本文以2000―2014年数据作为训练样本,建立结构为12-6-1的3层BP神经网络,设网络学习率为0.5,目标训练误差为0.001,训练次数为2 000次.得到训练误差曲线,如图8在654次达到训练误差.训练样本仿真输出和实际输出之间的线性回归关系如图9所示.最佳拟合方程为Output=0.99×Target+0.00063,拟合优度为99.86%,网络训练良好.训练样本实际输出和训练仿真输出如表6所示.
图8 训练误差曲线Fig 8 Training error curve
图9 训练样本仿真输出与实际输出线性回归拟合图Fig 9 Training sample simulation output and actual output linear regression fit map
表6 模型训练结果Tab 6 The training result of model
从表6可以看出,训练样本实际输出和仿真输出间的训练误差基本都低于0.05,网络训练结果良好,能够进一步的测试和预测工作.
b 模型测试及结果
以2015、2016年数据作为测试样本,对模型的预测精度进行测试,测试结果如表7所示.
表7 模型测试结果Tab 7 The test result of model
从测试结果来看,模型输出值和实际输出值非常接近,具有较好的预测精度,且可以看出ARMA-BP网络的误差率远远低于ARMA单一模型预测出的误差率,表明ARMA-BP组合模型在棉花生产预测中具有更好的预测效果.
c 模型预测及结果
以2017―2018年ARMA模型预测数据作为网络输入数据,调用训练好的网络对2017―2018年我国棉花产量进行预测,预测结果如表8所示.
表8 模型预测结果Tab 8 The prediction test of model
对棉花生产状况进行模型研究后,需为我国棉花生产状况划分警限,确定警度来分析模型结果,并对棉花生产状况进行合理预警.警限划分的主要原则有:多数原则、少数原则、半数原则等.由于棉花生产会出现供大于求和供不应求两种不正常状况,因此,我们在制定警限警度时需定为双侧有警,即负向有警和正向有警,对比来看,多数原则和少数原则的制定方法将数据从小到大排列,从最小值或者最大值来选取无警状态,对棉花数据这种仅有正值的数据无法制定双侧有警,因此本文选择半数原则划分警限.
我国棉花生产在不同时期由于经济环境和政策环境的不同,棉花产量存在较大的差异,为了降低异常时间段对棉花生产的影响,本文选取1985―2016年数据,作为警限区间划分样本.首先将棉花生产警情指标棉花产量时间序列数据分别按照大小顺序进行排列,从中间开始向两边共选取一半的区间作为无警区间,剩余区间划分为有警区间,划分结果为:负向重警(0,350),负向轻警(350,425),负无警(425,625),正向轻警(625,765),正向重警(765,+∞).在确定警限区间后,根据警限与警度对应划分的原则,将警度划分为5种,为了更好的的描述警度,本文利用信号灯标识法表示各警度,具体如表9所示.
表9 棉花生产预警警限和警度Tab 9 The early warning risk limits and levels of cotton production
根据表9棉花生产预警警限和警度的建立,对1985―2018年棉花生产状况进行划分,具体预警结果如表10所示.
表10 棉花产量预警信号灯Tab 10 The early warning blinker of cotton production
1989―2016年中无警年份为16年,负向轻警年份为7年,正向轻警年份为6年,负向重警为1年,正向重警年份为2年.国内棉花整体态势良好,其中2000年以后,随着棉花种植技术的提升和灾害预防能力的提高,棉花产量有了大幅度的提高,棉花产量开始出现供过于求的状况,但是从表10我们可以看出,在2006―2007年,棉花产量达到了高峰,对此通过比较其他数据发现,在经过2004年棉花价格的突降后,2005年棉花价格迅速提高,这就使得棉农种棉积极性大大增强,到2016年棉花播种面积较上年上涨14.9%,棉花产量大幅度提高.但随后,棉花种植过热导致供求不平衡,棉花价格开始下跌,棉花播种面积也随之下降.总体来看这一阶段,尽管棉花生产围绕供求关系出现轻微波动,但整体形势良好.从2017―2018年预测指标的警度状态划分来看,我国棉花生产状态良好,在未来一段时间能够保持我国棉花市场供求的平衡.
对我国棉花生产进行预警研究,能够指导农产品生产者提前做出风险应对措施,降低棉花生产风险给棉花生产者及棉花相关行业生产者及投资者带来的损失.对此,针对不同生产状态,本文提出如下政策建议:
(1)正常状态.如果预警结果是我国棉花生产处于正常状态,说明国内棉花生产稳定,能保证棉花市场需求,基本维持我国棉花市场的供需平衡.在这种正常年份,除了继续维持这种良好的生产平衡外,还应尽可能的保证我国棉花生产各环节运行良好,保证棉花生产保持持续发展态势.
(2)正向轻警及重警.棉花生产处在这一警度范围,就意味着棉花供给过量,造成市场供大于求.通常在这一阶段会伴随价格下跌,棉农生产利益受损,国家相关部门需通过收购及刺激棉花消费,尽可能拉动需求,降低供求差距,除此之外,还应减少进口棉数量,使棉价回升,防止“棉贱伤农”降低棉农的生产积极性,为下一年棉花种植危机埋下伏笔,在这种年份,国家相关部门虽然在促进市场供给平衡方面有积极影响,但要防止干预过度,进而造成市场异常,无法正常运行的现象发生.
(3)负向轻警及重警.如果预警结果是我国棉花生产处于供给不足状态,无法满足市场的需求.供不应求会使棉价抬高,影响棉企及其他棉花需求行业,这就要求国家尽快向市场投放国家库存棉来增加棉花供应,并提高进口棉数量,增加棉花供给量,逐步平抑价格,保障棉企和其他相关需求商的正常生产和投资.在这一阶段,国家在政策干预时也要把握好度,防止干预过度造成市场异常.
在现实运用中,不可简单的根据市场表现盲目行动,还需针对各种警情深入分析,明确各环节存在的问题,并从中找出最主要的原因,对症下药.同时在各项措施实施过程中,还应持续监控棉花生产状况和市场具体表现,及时调整应对措施,使其适应各个阶段的棉花生产情况.