石建辉,张君亚,李 宏
(云南农业大学经济管理学院,云南昆明650201)
甘蔗是世界上最重要的糖料作物、食糖最重要的来源之一,目前中国甘蔗种植面积占全部糖料作物种植面积的 85%以上,产糖量约占食糖产量的88%,是全国糖业的重要支柱[1]。云南是仅次于广西的全国第2大甘蔗产区,2017年云南省蔗糖产业经济研究室数据显示,全省约有 150万户、600万蔗农从事甘蔗种植,历年平均种植面积超过30万hm2,平均产糖量超过200万t,对于保障我国食糖供给、满足食糖需求发挥了重要作用。然而由于农业生产的弱质性和蔗糖产业的特殊性,面对种植、市场和贸易等风险,会出现蔗农生产积极性降低和制糖企业亏损现象,加大了国内糖市风险,因此蔗糖产业的风险预警就显得十分必要。
蔗糖产业风险包括了甘蔗生产、加工和经营过程中所面临的来自于自然和社会经济等方面并最终反映到市场和甘蔗生产上的一切危害和损失。甘蔗预警系统可以根据甘蔗生产和经营过程所出现的细微趋势或迹象进行预测和警报,从而为生产和经营者进行调控提供参考,减少反应时间,及时规避风险。
近些年来,国内许多学者对农业领域进行了风险预警的研究。安晓宁[2]、马九杰等[3]分别从粮食安全预警的系统设计和指标体系进行了研究,前者认为政府应借助预警理论相关方法,加强预警系统在宏观调控中的作用,提出在中国早期的粮食安全预警系统设计上应包括信息员系统、信息分析系统和信息反馈系统;后者分别在宏、微观2个方面对粮食安全进行度量,提出了使用食物及膳食能量供求平衡指标、粮食及食物生产和需求状况指标、安全储备状况指标、进出口状况指标、市场价格稳定性指标、粮食安全综合衡量指标、反映粮食安全的补充性指标的不同区间代表不同安全程度,建立警戒系统。吴清华、高峰、冯中朝[4]运用BP神经网络对中国油菜产业风险进行了预测研究,以油菜籽收购价格波动率为警情指标,验证得出 BP神经网络对于油菜价格的波动预测与期望值十分接近,可利用神经网络模型设计预警系统,规避油菜产业风险。赵瑞莹、杨学成[5]以生猪价格波动率为警情指标,建立了基于 BP神经网络的农产品风险预警模型,认为 BP神经网络对于农产品风险预警十分可行,可推广至对其他农产品的警情预报。
通过对比分析诸多学者关于农业领域预警的研究,结合研究所面临的实际情况,本文尝试采用BP神经网络,对云南蔗糖产业进行预警分析。首先,结合云南省蔗糖产业的实际情况,构建蔗糖产业预警机制的指标体系;其次,通过因子分析判断云南省蔗糖产业的主要风险因子,以主要风险因子按其方差贡献度占总方差百分比为权重,加总得到综合因子得分为警情指标;最后,依据预测所得的2019/20年榨季的因子得分所处的风险区间,判断2019/20年榨季云南蔗糖产业风险情况。警界范围的选择使用3σ原理,即跟据正态分布特征,以指标因子综合得分均值μ为中心,以综合得分的正负一倍标准差、二倍标准差和三倍标准差作为区间分割点,将所有可能的综合得分划分为 5个警报区间,从左至右依次为:高度风险 1(-3σ,-2σ]、一般风险 1(-2σ,-σ]、无风险(-σ,σ],一般风险 2(σ,2σ]、高度风险2(2σ,3σ]。
1.1.1 因子分析
因子分析通过对原始数据的相关系数矩阵内部结构的分析,将多个关联的指标转化为少数不相关的综合指标,其目的是用少量无关指标代替原来存在多重共线的多个指标,消除共线性,综合反映原来较多的信息[6]。因子分析认为所有的原始变量都是由公共因子和唯一因子所构成,其中由所有原始变量所共有,并且用以解释变量之间关系的变量称为公共因子,不能解释变量之间关系、由原始变量特有的变量称为唯一因子。因子分析可以通过提取变量公共因子,对原始变量进行解释,并通过因子方差贡献率占总方差的比重和对应因子的得分,计算得出综合因子得分。
1.1.2 BP神经网络模型
神经网络是一种模拟生物神经网络系统的人工智能技术,有非常强的自学习、自组织、自适应和非线性映射能力,适合于因果关系复杂的非确定性推理、判断、识别和分类等问题[7]。BP神经网络是一种误差反方向传播网络,由输入层、隐层、输出层组成,分为正向传播的学习信号和反向传播的误差信号。训练过程中,当实际输出与期望输出大于规定误差范围时,进入反向传播,调整权值,直到误差减少至允许的范围。在对蔗糖产业风险进行预警时,由于需要考虑的因素很多,很难建立有效的模型进行预测,BP神经网络凭借其非线性逼近能力、强大的学习能力和容错能力等优势,能准确的对所面临的风险进行预测。
本研究所采用的数据来源于《云南农业年鉴》和《云南省统计年鉴》以及云南糖网、沐甜科技、中国糖业协会等权威数据统计资料和实地调研所得,个别数据的缺失由相关数据计算得出。通过2009/10~2018/19年榨季 10年间的相关统计数据,对云南省蔗糖产业面临的风险进行评估预测。根据云南蔗糖产业发展所面临的实际情况以及对国内外产业风险的归纳总结,本研究将在种植风险、市场风险和贸易风险等3个方面选取评价指标,评价指标设置分为三级,总指标下分3个一级指标,12个二级指标,14个三级指标。具体指标设置如表1。
表1 指标设置
Z-score法是为消除变量间的量纲关系,使数据更有可比性,对数据进行标准化处理一种方法,可通过将数据代入以下公式得到标准化数据结果:
公式(1)为标准化公式,其中,x~为标准化后的数值,xj为第j个榨季指标的数值,μj为第j个榨季指标的均值,sj为第j个榨季指标的标准差;公式(2)为均值公式,其中,m为指标数量,xij为第j个榨季中第i个指标数值;公式(3)为标准差公式,字母含义同上。标准化处理结果如下表2所示。
表2 指标变量标准化处理结果
表3 解释总方差
利用SPSS 25.0进行因子分析,解释总方差如表3。通过因子分析,共提出 3个因子,分别记作F1、F2、F3,累计得分为 89.823%,综合得分记作Ft。其中,F1主要描述种植风险中旱地成本、水田成本和水浇地成本;F2主要描述入榨量和产糖量;F3主要描述自然灾害。根据方差贡献率确定各因子权重,则3个公因子的权重为:
公式(4)中αi为第i个因子占因子综合得分的权重,θi为第i个因子的方差百分比。综合得分Ft=α1F1+α2F2+α3F3。通过因子得分的均值和标准差,设定高度风险、一般风险和无风险区间,假设高度风险1为A(10000)、一般风险1为B(01000)、无风险为C(00100)、一般风险2为D(00010)、高度风险2为E(00001),然后根据3σ法,设置风险区间。具体因子得分和风险区间上下限如下表4和表5所示。
表4 因子得分表
表5 风险区间表
结合所获得的数据资料和研究目的,本研究以2009/10~2016/17年榨季云南省甘蔗的市场风险、种植风险和贸易风险指标数据为训练样本,其因子综合得分对应的区间值为实际输出,以2017/18年榨季因子得分作为训练样本的检验值,最后以2018/19年榨季蔗糖产业的指标数据为基础对2019/20年榨季产业风险进行预测。
以2009/10年榨季至2016/17年榨季数据为预警研究的样本建立模型。警兆指标包括:种植面积、种植成本(水田成本、旱地成本、水浇地成本)、总产量、入榨量、产糖量、产糖率、自然灾害、食糖价格、平均收购价、白砂糖含税成本、进口量、出口量。
结合分析需要及神经网络,研究设置输入 14个特征向量,输出 5个向量。3层神经网络,其中包括2个隐含层和1个输出层,每个隐含层5个神经元,输出层 5个神经元,隐含层传递函数 tansig函数,输出层传递函数 purelin函数。学习率0.05,学习函数 trainscg函数。最大迭代次数为 5000次,神经网络的验证数据的 RMSE最小,训练收敛于0.00225。
表6 模型精度确认
根据2009/10~2018/19年榨季指标数据,依托Matlab 12软件,建立BP神经网络模型,模型输出为因子综合得分值,将综合得分与风险区间表进行对照,可以判断风险程度。通过对比模型预测输出与实际值验证模型预测精度,表6可得 2010/11~2016/17年榨季神经网络预测输出与实际输出一致,满足模型预测精度要求。
以2016/17年榨季14个指标数据为输入值,验证2017/18年榨季风险情况,得出2017/18年榨季云南省蔗糖产业处于无风险区间C(00100),期望输出与实际输出一致,模型验证成功,可用于 2018/19年榨季数据对 2019/20年榨季云南省蔗糖产业风险情况进行预测。以 2018/19年榨季云南蔗糖产业的种植、市场和贸易指标数据为输入数据,可得2019/20年榨季云南省蔗糖产业预测结果处于高度风险1区间,具体预测结果Ft为(0.9987,0.0399,-0.0039,-0.0466,0.0775)即 A(10000)。其中F1为A(-∞,-1.87),F2为 C(-1.72,2.05),F3为 A(-∞,-2.54)。
由因子分析可得,种植风险为云南蔗糖产业面临的首要风险,主要体现在种植成本(水田、旱地、水浇地)、入榨量、产糖量和自然灾害。由BP神经网络分析可得,2019/20年榨季云南蔗糖产业总体处于高度风险区间 A(-∞,-1.87),风险敞口较大,其因子F1处于高度风险1(-∞,-2.37),因子F2处于无风险区间(-1.72,2.05),因子F3处于高度风险1(-∞,-2.54),即实证研究结果表明,在 2019/20年榨季,云南省蔗糖产业将面临较大风险,风险来源为种植成本(水田、旱地和水浇地种植成本)和自然灾害风险,应注意加强控制成本和自然风险的预防。
云南蔗糖产业面临的风险最主要的来源为种植成本过高。甘蔗种植成本主要由人工成本、地租、化肥等费用组成,其中中耕管理成本和砍收成本等人工成本是降低甘蔗种植成本的重要制约因素,其费用占到了总成本的 50%以上,细碎化小规模的小农户经营方式生产成本高,无法面对激烈的市场竞争。因此,应大力发展机械化甘蔗生产,提高甘蔗规模化种植水平,降低人工成本的同时实现甘蔗生产和销售阶段的规模效益。然而,在 2019/20年榨季,云南机收率仅为 2.26%,相比广西省 2019/20年榨季“双高”基地 13.2%的机收率,云南蔗糖产业的机械化推进还需继续加强[8]。
云南蔗糖产业风险的另一个来源是甘蔗产量。根据历年云南糖业协会和云南糖网关于蔗糖产业的统计数据,云南省历年平均甘蔗种植面积在 30万hm2左右,为在有限的面积内提升甘蔗产量,应积极推进甘蔗良种培育。根据国家甘蔗品种第 6轮集成示范德宏点的试验结果,粤甘50号、云蔗11-3898、云瑞10-187、粤甘48号4个品种在甘蔗蔗茎产量上有较高产表现[9],应因地制宜地进行推广。此外,还应加强对甘蔗新品种的研究培育,开发高产高糖抗逆性抗虫害好的甘蔗新品种,从而保证甘蔗产量的稳步增加。
自然风险也是云南省蔗糖产业的发展的一个重要威胁。甘蔗生产面临着旱灾、病虫、洪涝和霜冻等自然灾害。针对云南省甘蔗种植主要面临的旱灾和病虫灾害,在研究培育新种同时,应强化外部的监测和治理。基础设施建设是促进农业活动发展的关键,包括蔗田灌溉、道路及坡地改造等内容,完善的基础设施建设能有效地应对甘蔗旱灾,达到抗旱目的。针对可能的病虫害,应注重监测,开展专业化防治服务,积极推广物理、生物防治措施指导。