胡春月
多元统计方法在分析全国主要农产品中的应用
胡春月
(贵州财经大学贵州贵阳550025)
中国是一个农业大国,农业关系到国计民生,是国民经济的支柱产业,但是长期以来我国农业一直存在着地区发展不平衡的现象。在我国的不同地区,主要农产品发展存在着明显差异,需要对各地区的主要农产品发展做出恰当的评价。文章选取8个指标来分析我国主要农产品发展状况,分别为人均粮食产量、人均棉花产量、人均油料产量、人均糖料产量、人均水果产量、人均园林水果产量、人均瓜果类产量、人均蔬菜产量。利用主成分分析,将这8个变量降维,通过聚类分析,将特征相似的地区归类。基于上述分析,结合我国国情提出了一些建议。
主成分分析;聚类分析;主要农产品
农业是国民经济的基础,国家经济发展的程度,往往与农业有着紧密的联系。主要农产品产量是农业发展的重要组成部分,反映出一个地区乃至国家的农业发展水平,一个地区及国家的农业发展水平又影响着主要农产品的产量。
韩翊(2019)通过比较优势分析法,对内蒙古12种主要农产品的效率优势指数、规模优势指数、综合优势指数进行计算,选择出葵花籽、莜麦、甜菜、谷子、马铃薯、胡麻籽为内蒙古优势特色农产品[1];张曼琳等(2018)选取2001年—2015年新疆统计年鉴相关数据,在协整分析上建立自回归模型,利用新疆粮食和棉花产量数据对新疆农民纯收入进行实证分析,得出新疆粮食产量对农民纯收入提升有促进作用,棉花产量对农民纯收入提升有阻碍作用的结果[2]。
分析和研究我国各地区主要农产品产量的侧重点,对国家主要农产品投入具有重要意义,有助于了解我国农业的发展分布情况,降低相关政策在制定和实施中的盲目性,有助于完善欠发达地区的农业发展政策。本文采用的多元统计分析方法在现实问题的处理中应用非常广泛,如刘娜等(2014)将多元统计分析方法应用于重要质量控制中心研究[3],李晓芬等(2008)利用多元统计分析方法对辣椒品种的耐盐性进行了评价[4]。本文选用2018年《中国统计年鉴》中反映我国按人口平均的主要农产品产量的8个指标的数据来进行分析并建立模型,根据模型借助R软件进行逐步分析。
1.1.1 主成分分析方法
主成分分析方法的本质是“降维”,将高维数据有效地转化为低维数据来处理,揭示变量之间的内在联系,进而分析解决实际问题[5]。
1.1.2 主成分分析模型
1.2.1 聚类分析方法
把要研究的我国31个省(区、市)(不含港、澳、台)按照一定的标准分为若干类,本文采用的是按照变量对观测值进行聚类,样品间的靠近程度通常用距离来衡量。
1.2.2 聚类分析模型
全髋关节置换术联合阿仑膦酸钠片对股骨颈骨折的疗效及对骨密度水平的影响 ………………………… 刘克春等(9):1278
根据所收集的指标数据,借助R统计软件工具计算各成分的贡献率,结果如表1。
表1成分贡献率
12345678 贡献率/%40.86221.05712.63410.9797.3304.2842.8540.000 累积贡献率/%40.86261.92074.55385.53292.86297.146100.000100.000
由表1数据可知,前4个主成分反映了信息的85.532%,可以作为评价31个地区按人口平均的主要农产品产量的综合变量。这4个主成分的系数矩阵如表2。
表2系数矩阵
第一主成分 -0.333 -0.239-0.532-0.472-0.414-0.384 第二主成分0.555 0.600-0.253-0.119-0.3040.3390.214 第三主成分0.1840.665-0.254-0.499 -0.444 第四主成分0.5970.107 0.666 -0.193-0.380
根据表2,得到4个主成分函数分别如下:
第一主成分对应的系数主要为负,且各系数的差别不大,反映了一个地区的主要农产品产量的总体均衡情况;第二主成分对应的系数符号有正有负,反映了主食和辅食的类别差异;第三主成分把棉花和其他主要农产品区分开来,可以理解为经济作物因子;第四主成分把粮食和糖料与其他主要农产品区分开来,可以理解为主食产品中的两大类。我国31个地区各主成分得分情况如表3所示。
表3主成分得分情况
第一主成分第二主成分第三主成分第四主成分 第一主成分第二主成分第三主成分第四主成分 北京2.274-1.5520.723-0.113湖北-0.3101.251-0.768-0.565 天津1.968-1.2570.606-0.140湖南0.1460.601-0.367-0.449 河北-0.2490.074-0.325-0.543广东0.764-1.4070.030-0.003 山西0.604-1.3240.6540.219广西-3.584-2.412-2.9992.898 内蒙古0.3153.438-0.6061.573海南-2.639-1.193-0.213-0.665 辽宁0.233-0.1350.140-0.093重庆0.292-0.184-0.447-0.562 吉林1.6601.5980.7531.507四川0.4440.550-0.548-0.272 黑龙江1.8901.4971.3782.470贵州0.3300.315-0.875-0.809 上海2.201-1.4030.609-0.198云南0.120-1.036-0.5990.670 江苏0.1640.353-0.344-0.833西藏2.180-0.4330.2860.062 浙江0.817-0.9800.277-0.548陕西-2.228-1.2320.270-0.326 安徽0.9530.4790.2490.196甘肃-0.4940.322-0.032-0.424 福建0.539-1.3970.164-0.400青海1.9320.382-0.245-0.184 江西0.6030.0740.1840.050宁夏-1.8591.263-0.179-1.326 山东-1.5180.931-0.611-0.928新疆-5.9450.0743.6910.548 河南-1.6032.742-0.858-0.814
从第一主成分来看,新疆和广西的主要农产品平均产量总体较为均衡且较高,而北京和上海比较低;从第二主成分来看,内蒙古和河南的主要农产品平均产量在主食方面的产量比较高,而广西辅食方面的平均产量比较高;从第三主成分来看,新疆是棉花平均产量最高的省份;从第四主成分来看,广西在主食产品中的两大类即粮食和糖料的平均产量比较高。
本文采用欧氏聚类计算相似矩阵,并采用系统聚类方法中的最大距离法聚类,结果如图1所示。
图1 聚类分析图
取合并聚类为800,则31个地区可以分为4类,以下从聚类的结果分析各类地区按人口平均的主要农产品产量的特征。
第一类:广西单独为一类。从第一主成分主要农产品产量总体情况来看,其主成分预测值为负,且绝对值较大,这说明广西按人口平均的主要农产品产量总体比较高;第二主成分其预测值为负值,且绝对值较大,这说明广西主要生产辅食类农产品,且产量也较高;第三、第四主成分预测值绝对值较大,故将其单独分为一类是合理的。
第二类:黑龙江、内蒙古、吉林分为一类。从主成分来看,三个省份的主成分得分预测值的绝对值排名比较靠前;结合实际情况来看,三个省一直以来都是我国的农业大省,且都盛产小麦、玉米等主要农产品,尤其是黑龙江耕地多且黑土地肥沃,人口稀少,机械化水平较高。
第三类:安徽、山西、甘肃、辽宁、江西、云南、贵州、江苏、河北、湖北、重庆、湖南、四川、河南、山东、宁夏、新疆、海南、陕西分为一类。其中,山东、河南等省份虽然也是我国的农业大省,但是其人口众多,故其按人口平均的主要农产品产量也略有逊色。
第三类:广东、浙江、福建、北京、上海、西藏、天津、青海分为一类。其中广东、浙江、福建、北京、上海、天津是中国工商业比较发达的地区,城市建筑面积占比较大,其发展的优势不在农业方面。而西藏和青海地区土地较为贫瘠,适合一些水果的种植和畜牧业的发展。
按人口平均的主要农产品产量从总体上来说,广西的人均糖料产量发展特别突出,其他各方面也均衡发展,平均产量总体较高。其他土地肥沃,耕地面积宽广的地区,如黑龙江、内蒙古、吉林、河南、山东等地更是我国主要农产品发展的主力军。其中黑龙江的人均粮食产量在全国遥遥领先,新疆的人均棉花产量是其他省份的两百多倍,我国的人均糖料产量主要来源于广西。
综上所述,我国主要农产品发展的地区土地较为肥沃,耕地面积大,机械化和技术化水平较高,而工业、服务业发达的地区如北京、上海、天津因受地域的限制,主要农产品的产量较少。所以,在土地肥沃的平原地区,应当加快提高农业机械的创新水平,扎实推动规模化生产,保持农业产业持续发展;对于山地较多的地区,可以根据当地的气候变化特点,种植合适的农作物,进行试点示范,提高农作物的生产力。山地地区有待提高的主要农产品发展空间较大,应鼓励和支持培育农业合作组织,选拔有能力的专业人才来带动农业合作组织的发展。
[1]韩翊.内蒙古特色农产品产业化发展研究[D].太原:山西农业大学.2019.
[2]张曼琳,董璐璐.新疆主要农产品产量对农村居民纯收入的影响[J].新疆农垦科技,2018,41(11):50-52.
[3]刘娜,李军,李宝国.多元统计分析在中药质量控制中的应用和思考[J].中国中药杂志,2014,39(21):4268-4271.
[4]李晓芬,尚庆茂,张志刚,等.多元统计分析方法在辣椒品种耐盐性评价中的应用[J].园艺学报,2008(3):351-356.
[5]费宇.多元统计分析[M].北京:中国人民大学出版社,2014.
10.3969/j.issn.2095-1205.2022.06.39
F222.1
A
2095-1205(2022)06-119-04
胡春月(1994- ),女,汉族,贵州毕节人,硕士在读,研究方向为大数据分析。