基于聚类分析的新疆棉花生产风险区划研究*

2021-06-21 07:59王静王莉晶聂芳曈郭金梦段星汝刘云
棉花科学 2021年3期
关键词:区划损失率单产

王静,王莉晶,聂芳曈,郭金梦,段星汝,刘云

(塔里木大学信息工程学院,新疆 阿拉尔 843300)

棉花是关系国计民生的战略物资,安全稳定的棉花生产是确保国民经济持续健康发展的基础。新疆是我国第一大棉花生产区,棉花产业的发展对新疆农业发展起着重要的作用。由于新疆棉花存在着较高的产量风险和价格风险,棉花收入具有较大的波动性,因此,棉农对收入保险有迫切的需求[1]。自20世纪80年代以来,棉花保险一直是新疆重要的特色险种,目前棉花保费收入已占全部农作物保费收入的50%以上,参保面积已达90%。随着新疆农民合作社、家庭农场等新型经营主体不断发展,推行棉花收入保险对于棉花产业及新疆农村经济的稳定发展更具重要意义[2]。而保险费率厘定是否合理又与风险区划密切相关[3],风险区划是棉花收入保险费率厘定的前提和基础,保险产品根据棉花种植区域的自然和社会条件厘定费率。新疆是我国陆地面积第一大省级行政区,地域广阔,气候各异,不同地级区域的棉花生产由于气候不同,其风险水平也明显不同。因此,应根据不同地区的风险特征以及当地对收入风险的认知水平厘定差异化费率。只有在风险区划环节充分考虑不同风险因素,体现风险分区的科学合理性,才能科学厘定保费率,促进棉花保险市场的发展[2]。

近年来,已有许多学者在生产风险评估和风险区划方面进行了深入的研究,并取得了很多有意义的成果。陈国荣,等[3]以森林火灾为例,采用基于熵权的TOPSIS法对全国各省份进行风险区划研究,在95%置信度下厘定森林火灾险的区间费率。吴垠豪,等[4]和陈军,等[5]学者基于区域产量变化衡量自然风险对农业生产影响视角进行了农作物生产保险风险区划研究。袁祥州[6]以湖北省三个地级区域级水稻产量风险评估为案例,定量评价了地级区域水稻产量风险的低估程度。李文芳,等[7]与何青华[8]使用非参数信息扩散模型,选取不同指标对小麦生产风险进行了区划。此外,基于不同的研究对象众多学者运用不同的方法在风险区划方面做了大量的工作,得出了一系列重要的结论[9-14]。现行棉花生产风险的区划,受人为因素的影响较大,尚缺乏科学理论依据,也未能科学反映区域之间风险水平的差异。基于此,作者结合新疆棉花单产记录的丰富数据资料,通过构建新疆棉花收入风险区划指标体系对棉花收入风险进行等级区划,也为其他经济作物生产风险区划工作的开展提供理论参考和实践指导。

1 数据来源及分析

数据均来自历年《新疆统计年鉴》及新疆维吾尔自治区国民经济和社会发展统计公报。搜集并整理了新疆主要棉花生产区域(地区、自治州、市)1990~2019年的棉花种植面积、棉花总产量、农作物种植面积等的时间序列数据,用非参数扩散模型估计新疆13个区域的棉花风险损失。新疆13个区域1990~2019年棉花单产数据的描述性统计分析结果见表1。

表1 各地级区域棉花单产(kg/hm2)序列的基本统计量

2新疆棉花生产风险损失率的估计

影响棉花产量的综合风险因素有很多,主要包括社会风险与自然风险两方面的因素。因而选取新疆13个地级区域1990~2019年的棉花单产数据来计算其历年棉花的单产减产率,并利用非参数信息扩散模型计算出各地级区域棉花单产减产率超过某一阈值的概率值。

2.1 应用非参数信息扩散模型

影响农作物产量水平的因素很多,首先是生产力方面的因素,包括生产水平、基础设施、生产规模等,这些因素决定农作物单产的长期趋势性;其次是自然风险方面的因素,包括地形地貌、气温降水等,该因素决定农作物单产的随机波动性。因此,新疆各地级区域棉花单产的时间序列数据同时具有确定性趋势和随机波动性特征。鉴于ARIMA(p, d, q)模型可以较好地反映时间序列的确定性趋势和随机性特征。本文使用Eviews 8.0软件来选取最优的ARIMA(p, d, q)模型对棉花单产序列进行拟合,并将得到的新疆历年棉花单产的趋势值作为对应年份棉花单产的理论值,据此计算历年棉花单产减产率。其计算公式如下(1)。

(1)

设棉花产量损失率为l,且l∈[0,1],某地第t年的产量损失率的样本观测数据为xi(t=1,2,3,…,T)。设xi所包含的信息按正态分布规律扩散给损失率样本空间[0, 1]里的所有样本点l,则其信息扩散模型为(2)。

(2)

式中h是信息扩散系数。为简化计算过程,实际应用中一般将产量损失率l的样本空间[0,1]平均分成m份,0=l1

(3)

(4)

2.2 产量损失率及其概率估计

使用Eviews 8.0软件及相关统计方法检验可得,各区域棉花单产趋势模型见表2。

表2 各地级区域棉花单产趋势模型

运用非参数信息扩散模型对以上各地级区域棉花单产减产率的概率进行估计,将产量损失率l的样本空间[0,1]平均分成21份。0=l1

表3 各地级区域棉花风险损失率的概率分布

由表3可知,各地级区域棉花风险损失率大于30%的概率几乎为0,说明新疆在棉花生产方面有很大优势;但是在一定的风险损失程度下,各地级区域发生风险损失的可能性有较大差异,如和田、塔城和哈密等区域发生一定程度风险损失的概率较其他区域大。

3新疆棉花产量风险区划

3.1 主导指标的选择及其分析

棉花的生产离不开自然环境、社会经济、生产技术等条件,这些因素是棉花生产的主要风险因子。本文根据风险区划的特征以及聚类分析的要求,选择以下四个指标对新疆棉花生产进行风险区划,各区划指标的含义及类型如下。

X1为各地级区域棉花单产变异系数,是综合性指标,它反映了新疆各区域棉花生产的波动情况。该指标值越小,表明各地级区域棉花生产越稳定,生产风险越小。计算棉花单产的波动水平即变异系数。

X2为各地级区域棉花单产减产率超过某一阈值的概率,是自然风险指标。为了能较充分地反映各地级区域的自然风险状况,选取单产减产率超过10%和20%的概率作为其中的两个风险区划指标。

X3为各地级区域棉花生产的专业化指数,是棉花生产规模指标;专业化指数主要考察棉花的规模情况。通常规模面积越大,一旦发生自然灾害,受到损失的可能性也就越大。专业化指数计算公式为(5)。

(5)

式中SAIij表示棉花的专业化指数,CSij表示各地级区域棉花的播种面积,CSi表示各地级区域农作物的总播种面积,CSj表示新疆棉花播种面积,CS表示新疆农作物的总播种面积。当SAIij>1时,说明该地级区域棉花的生产规模超过了全疆平均水平,该地级区域棉花生产规模较大。当SAIij<1时说明该地级区域棉花生产规模低于全疆平均水平。

X4各地级区域棉花生产的效率指数,棉花生产效率指标。效率指标的高低反映了各地级区域农业生产资源的生产能力。其计算公式为(6)。

(6)

其中APij为i区域棉花单产;APj为全疆棉花平均单产。EAij>1表明与全疆平均水平相比,i区域棉花生产具有效率优势,其风险水平较低;反之则较高。

3.2 权重确定和模型构建

在根据风险指标进行风险区划的过程中,各指标的权重起着非常重要的作用。基于所构建的指标体系,采用因子分析法进行加权综合来进行棉花产量的风险评估,得出各公共因子得分,为聚类分析提供数据。

3.2.1 KMO和Bartlett检验

KMO检验是比较变量间简单相关系数和偏相关系数的方法。KMO统计量的取值在0和1之间。KMO值越接近于1,意味着原有变量越适合作因子分析。

Bartlett球形检验用于检验相关阵中各变量间的相关性是否为单位阵,即检验各个变量是否相互独立[15]。对数据进行KMO检验和Bartlett球形检验,检验结果见表4。

表4 KMO和Bartlett球形度检验

由表4可以看出,KMO检验量的度量值为0.455(>0.45),Bartlett球形检验的度量值为0.017(<0.05),故适合作因子分析。

3.2.2 确定公共因子的个数和命名

当满足累计贡献率大于70%的条件时,釆用方差最大正交旋转法对因子旋转后得到的载荷矩阵和方差贡献率(见表5)。

表5 旋转后的因子载荷矩阵和方差贡献率

因子1为产量致灾因子,包括单产变异系数、专业化指数和效率指数,这三个指标反映了单产的高低。因子2为产量综合自然风险因子,本文选用各地级区域的棉花单产减产率来近似代替综合自然风险损失率。它包括棉花单产减产率超过10%的概率和棉花单产减产率超过20%的概率。

运用统计分析软件SPSS 25.0,得出棉花产量风险各因子的得分系数矩阵,进一步计算得出各地级区域公共因子的得分。具体结果见表6。

表6 各地级区域棉花产量风险因子得分

4新疆棉花产量风险评估及区划

4.1 聚类分析

为了综合评价新疆棉花生产在各地级区域的风险大小,这里采用系统聚类法进行风险区划。使用统计分析软件SPSS 25.0对以上影响新疆13个地级区域棉花产量风险的分类指标进行聚类分析,将聚类结果确定为3类,聚类谱系图见图1。

图1 聚类谱系图

4.2风险评估

从图1可以看出,新疆棉花产量的风险区划具有一定的地域完整性,所划分的区域具有连片的特点。克拉玛依市处于高风险区域;中风险区域主要有乌鲁木齐市、昌吉回族自治州、博尔塔拉蒙古自治州、塔城地区、巴音郭楞蒙古自治州、克孜勒苏柯尔克孜自治州、喀什地区和和田地区;低风险地区主要包括吐鲁番地区、哈密地区、阿克苏地区和伊犁哈萨克自治州。将新疆棉花生产风险分为高、中和低三个区域。据此给出各地级区域棉花产量的风险等级分区见表7。

表7 新疆棉花各地级区域风险区划表

为了更加直观的对比各区域的风险状况,表8给出反映各区域风险程度的指标数据。

表8 各区域风险程度的指标数据

5结论

新疆总面积占中国陆地面积大约六分之一(166万km2),地域广阔,气候条件千差万别,农业技术装备参差不齐,不同地级区域的棉花生产由于气候不同,其收入风险水平也明显不同。本文以新疆地级区域为基本单位,利用因子分析和聚类分析的方法,对新疆棉花进行了保险风险区划研究,克服了因原始指标间存在相关性所造成的聚类偏差,区划结果较为客观准确。区划结果表明自然风险对棉花安全的影响在全疆呈现出南疆高、北疆低的区域分布及连片性特征,这与新疆各地级区域自然灾害的实际状况是一致的。研究结果能够为相关从业者进行生产布局、发展棉花保险、指导应对灾害工作提供参考依据,并且具有重要的现实意义。

实际上,在自然灾害的发生概率、强度及抵御自然灾害的能力方面,即使在同一地级区域范围内也差别很大,因此,下一步有必要考虑实施更小区域单位的风险区划,基本单位越小,越能体现各区域单位间的风险差异。

猜你喜欢
区划损失率单产
山西夏收全面完成 总产单产好于常年
黑龙江省和全国“十三五”期间三大作物单产变化分析
农业农村部印发《意见》提出到2025年农产品加工环节损失率降到5%以下
农大农企联手创山西小麦最高单产新纪录
油菜“不务正业”,单产3.4吨
社区治理如何密织服务网——成都安公社区划了“五条线”
对自然地理区划方法的认识与思考
棉花苗期雹灾损失定量分析
小麦赤霉病危害损失研究初报
龙泉驿区雷电灾害风险调查评估与区划