基于主成分和聚类分析的影响巴西雨林的因素研究

2013-08-29 09:28王浩华
关键词:雨林种植业甘蔗

黄 浩,王浩华

(海南大学 信息科学技术学院,海南 海口 570228)

亚马逊热带雨林位于南美洲的亚马逊盆地,占地700 万km2.雨林横跨了8 个国家:巴西、哥伦比亚、秘鲁、委内瑞拉、厄瓜多尔、玻利维亚、圭亚那及苏里南,占据了世界雨林面积的一半,森林面积的20%,是全球最大及物种最多的热带雨林.但是,由于人类对雨林的过度砍伐造成了雨林的大面积破坏,导致了各种严重的影响,比如:物种灭绝、气候异常、水土流失和生态系统紊乱等恶性循环.而导致森林被破坏的原因又有很多,比如:非法砍伐、种植业、畜牧业、采矿业、工业污染和自然灾害等,其中,种植业、畜牧业和非法砍伐尤为严重.鉴此,本文就种植业和畜牧业进行了科学的分析,以找出具体的原因,旨在为巴西政府出台相关的政策提供一个可靠的科学依据.

1 数据收集与分析

1.1 数据的收集 巴西雨林占整个亚马逊雨林的60%,绝大部分分布于巴西的9 个地区,即Acre,Amazonas,Roraima,Maranhao,Tocantins,Amapa,Mato Grosso,Para 和Rondonia.因此,本文主要以这9 各地区为对象进行分析.由于本文主要是对养殖业和种植业进行分析,因此又以当地14 种比较重要的作物和牲畜作为研究对象,即咖啡、可可、水稻、甘蔗、豆类粮食、烟叶、木薯、玉米、大豆、牛、马、猪、山羊和绵羊.其数据来源于巴西地理和统计研究所(IBGE)[1],具体数据见表1.利用SPSS.18 进行相关系数矩阵分析、主成分分析和聚类分析.主成分分析主要是把多个变量作线性组合,变成少数几个综合变量,即主成分,以便反映原来多个变量大部分信息的一种统计方法.聚类分析就是将变量按照它们性质上的亲疏和相似程度进行分类的一种统计方法,它可以将多变量的数据进行有效的分类[4].

1.2 相关系数矩阵分析 通过SPSS.18 对数据进行相关系数矩阵分析,得到相关系数矩阵(见表2).从表2 可以看出,所有的作物和动物养殖对森林的破坏均有正相关性,其中豆类、甘蔗、可可、玉米、牛、马、绵羊、猪、大豆与砍伐面积的相关系数均大于或接近0.50,分别为0.72,0.54,0.76,0.53,0.85,0.86,0.70,0.57,0.49,而它们的显著性水平分别为0.015,0.068,0.008,0.069,0.002,0.002,0.019,0.053,0.089,均小于0.1,这表明在显著性水平为10%的情况下,呈现显著的正相关性,说明这些对森林的破坏比较显著.但是,其中的可可和猪比较特殊,可可是巧克力的主要原料,由于巴西的气候非常适合种

植,所以人们对可可树的种植每年都在增加,但是可可树不能种植太密,还必须有高大的树木为它遮阴,因此可可树的适当种植不但不会破坏森林,而且还会对森林有一定的保护.猪在当地的产量占到了14%(见图2),远不如牛的产量,虽然其相关系数到达了0.57(显著性水平为0.053),但是由于猪无需通过放牧的形式进行养殖,所以猪不会对森林造成直接的破坏.其他动植物均对森林有不同程度的直接破坏,其破坏程度与种植规模和养殖规模是正相关的.马和绵羊的相关系数很高,但是它们的产量分别只占到了2%和6%,因此马和绵羊并不是森林破坏的主要原因.从图1 中发现,当地甘蔗的产量占到了76%,最后分析得到,豆类,甘蔗,牛和大豆对森林的直接破坏尤为显著.在之后的分析当中,本文将去掉猪和可可,因为猪对森林砍伐并不造成直接影响,而适当地种植可可对森林反而起到一定的保护作用,所以,这两个变量不满足分析的要求.

表1 巴西各主要地区畜牧业和种植业的发展状况 103t

表2 相关系数矩阵

图1 巴西各种农作物产量比

图2 巴西各种牲畜的产量比

不仅如此,从表2 中还可以看到,许多变量之间的相关性也比较强,说明它们之间存在信息上的重叠,因此对其进行主成分分析.

1.3 主成分分析 主成分个数提取的原则为主成分对应的特征值大于1 的前m 个主成分.在某种程度上特征值可以被看成是表示主成分影响力度大小的指标,如果特征值小于1,说明该主成分的解释力度还不如直接引入一个原变量的平均解释力度大,因此用特征值大于1 作为纳入标准.SPSS 在进行主成分分析时,会自动进行标准化处理,最后得到总体方差解释表(见表3)和因子载荷阵(见表4).

表3 总体方差解释

从表3 可以看出,通过对各因子进行主成分分析(PCA)发现:4 个主成分因子(A1、A2、A3和A4)累计贡献率达到了95.691%(见表3),表明该4 个因子基本上包含了各地区森林砍伐受到的主要影响来源.将SPSS.18 给出的因子载荷阵(见表4)中的每一列除以相应的特征根的开方后,就得到主成分矩阵,见表5.

表4 因子载荷阵

表5 主成分矩阵

从表5 中的第一主成分因子(A1)可以看出,除了咖啡、木薯、山羊、烟叶的值很小之外,其他因素均对森林砍伐有比较大的影响,其中烟叶为负值,这可能是由于近年来当地气候的恶化而导致烟农对种植烟草的信心逐渐削弱,并且随着极端天气的增多,部分烟草遭到了破坏的缘故.而咖啡的值不大是因为需求量并没有其他作物或牲畜的大,所以对森林的砍伐并不是主要原因.水稻、甘蔗、豆类、玉米、大豆、牛、马和绵羊的值相差不大,说明它们对森林砍伐的影响也相对较高,因为这些作物和牲畜均需要大量的土地进行种植和放养,而且这些作物和牲畜在当地的需求量也很高,随着需求的上升,就需要更多的土地去种植和放养,这是导致森林被砍伐的重要因素,也就是说,粮食作物和食草牲畜对森林砍伐的影响是很显著的,其累计贡献率达到47.974%.第二主成分因子(A2)对水稻、豆类、木薯、山羊的影响较大,而对甘蔗、玉米、大豆、牛、马、绵羊有着负面的影响,其中4 种牲畜就有3 种受到负面影响,说明当牲畜的产量降低时,人们会增加作物的种植面积,以保证粮食充足.在第三主成分因子(A3)中,豆类、牛、马的值均为正值,说明第三主成分因子是与当地人们的生活习惯有关,因为当地人主要以牛、豆类粮食等为主食,在短期内人们是不会改变对这些食物的需求的.通过图2 也可以看出,巴西在2009 年所养殖的牛占到了75%,说明当地对牛肉的需求相当高,也反映了养牛业对森林的破坏程度非常高.

将表1 中的咖啡、水稻、甘蔗、豆类、烟叶、木薯、玉米、大豆、牛、马、山羊和绵羊分别设为变量X1,X2,X3,X4,X5,X6,X7,X8,X9,X10,X11,和X12,并与特征向量相乘就可以得到每一个主成分表达式[4].

第一主成分:

第二主成分:

第三主成分:

第四主成分:

在此,并没有将特征根与标准化的原始数据进行相乘,这是因为单位是统一的.为尽量保证信息的完整,再将得到的F,F1,F2,F3和F4的值分别再除以106,计算结果见表4.

根据以上模型求出综合值,然后根据F,F1,F2,F3和F4对样本进行排序(见表6)[5].

表6 主成分和综合主成分值及排序

1.4 聚类分析 利用SPSS.18 软件,采用“最短距离法”[5]对9 个地区进行原始数据聚类分析,结果见图3.从图3 中可以看出,可分为四大类:第一类由Mato Grosso 组成,说明这个地区的森林受到破坏的程度最高,受到的威胁也是最大的;第二类由Para 组成,表明这两个地区受到的威胁程度相对第一类地区来说要低一些;第三类由Rondonia,Tocantins 和Maranhao 组成;第四类由Amapa,Roraima,Amazonas 和Acre 组成,这些地区所受到的威胁是最低的,也反映出这些地区所受到的破坏也是最小的.聚类分析所得到的结果与主成分分析的结果相符合,即验证了主成分分析的正确性.

按照各类中第一主成分的平均得分排序(见表6),第一类的第一主成分平均得分是;第二类的第一主成分平均得分是;第三类的第一主成分平均得分是;第四类的第一主成分平均得分是.再按各类中样品的综合成分得分排序,最终排名为:Mato Grosso,Para,Rondonia,Maranhao,Tocantins,Acre,Amazonas,Roraima,Amapa.这也说明了这些地区的森林破坏或者森林所受到的威胁度依次降低.

运用同样的方法对12 种动植物进行聚类分析,得到结果如图4 所,从图4 中可以看出,可分为三大类:第一类由牛(Cow)组成,说明养牛业对森林的破坏最为严重,因为当地的食物以牛肉为主,对于巴西人来说这是不可缺少的食物,所以每年都在扩大牛的养殖,而养牛需要大量的场地,故对森林的砍伐也将加剧;第二类由大豆(Soy)和甘蔗(Sucrose)组成,表明在种植业中,大豆(Soy)和甘蔗(Sucrose)是对森林威胁最大的,其中随着乙醇工业、生化电池和生物塑料的发展,对甘蔗的需求量也越来越大,对森林的破坏也将加大;第三类由玉米(Corn)、木薯(Cassava)、咖啡(Coffee)、水稻(Rice)、豆类(Beans)、烟叶(Tobacco leaf)、马(Horse)、山羊(Goat)和绵羊(Sheep)组成,相对第一、二类来说,对森林的威胁度相对小了很多,这是因为这些作物和牲畜基本是自给自足或用于出口的,其需求量并没有前两类的大,因此发展并不会太迅速,这一类对于森林的破坏程度相近,均很小,故将其归为一类.

图3 各地区聚类分析树状图

图4 各动植物聚类分析树状图

1.5 结果分析 收集各地区的历年森林砍伐面积数据,并作图(见图5).

图5 巴西各州森林砍伐面积

从图5 中可以看出,Para 和Mato Grosso 地区的历年森林砍伐面积都比较高,由此说明这两个地区所受到的威胁程度和破坏程度是最高的,这与聚类分析的结果一致,也与表6 中的排序相同,这就验证了本文所运用的主成分分析和聚类分析法对农业的分析,从而间接反映了森林的砍伐严重程度,也就是说,通过分析各地区的种植业和畜牧业的状况,间接说明了森林被破坏的严重程度.种植业和畜牧业越发达,也就表明需要开垦的土地就越多,对森林的威胁程度就越高,被破坏的森林面积也将越大.在图5 中还可以看到,在2004 年达到最大值后就逐渐减少,这是因为巴西政府在2003 年创建了ITPM,采取了措施,并协调行动,减少了亚马逊地区的森林砍伐率.从2010 年的统计数据可看出,除了Para 之外,其他地区的森林砍伐都得到了非常有效的控制.

2 建 议

根据巴西各州的数据及主成分分析法和聚类分析法的分析结果,对巴西有效控制森林砍伐提出以下建议:

1)对森林威胁度高的地区,要加强管理,对这些地区的生产应进行合理的监管,应加强对该地区的实时监控和宣传教育,以防滥砍滥伐的情况发生.尤其是对于第一和第二类地区(Mato Grosso 和Para),必须要立刻采取相关措施.

2)森林威胁度较高的地区是由于扩大种植业和畜牧业而造成的,因此,必须对其进行统筹规划和控制生产,避免过度开垦而造成森林的破坏,尤其是第一、二类(Cow、Soy 和Sucrose),对其要进行合理的控制.

3)森林的砍伐还包括非法砍伐,由于丰厚的利润,少数人非法砍伐树木以换取金钱,对于这种情况,除了应加强对人们的宣传教育之外,还要制定相关的法律法规,加重对非法砍伐者的惩罚.

4)森林的大面积消失还源于每年的自然灾害,由于人类的破坏,生态系统已经变得非常脆弱,加之近几年的气候异常,自然灾害的频发加速了森林的破坏,比如每年的火灾都会吞噬大面积的森林.所以应加强卫星监测,并做好自然灾害发生时的协调工作,以保证损失达到最小.

5)在经济发展的层面上,要注意经济的波动对人们的影响,比如物价的上升会导致人们扩大种植业和畜牧业,以平衡物价的上升,并且物价的上升还会导致非法伐木的发生率升高.

总的来说就是:要制定严格、完善的法律,加大执法力度;加快建立保护区的进度;采用多种保护方法,协调建设与保护的矛盾;加大环境知识教育,加强物种保护的科学研究;谨慎对待转基因物种;严格控制外来物种和合理规划资源利用.

3 结束语

应用主成分分析法和聚类分析法可以有效降低各指标之间的信息重合,因此当指标较多、关系较复杂、无法进行层次划分时,运用主成分分析和聚类分析会更加有效.而且该方法可以利用计算软件,如SPSS、SAS 等进行数据处理,能更方便地实现分析和评价[4].采用此方法可以大大减少数据的处理,有效地分析森林受到破坏的主要原因,从而为巴西政府采取相关措施提供科学可靠的依据.在之后的工作中,还应继续关注巴西雨林的进展,并进行己所能及的研究.

巴西热带雨林是人类的财富,但人类的活动却导致了雨林前所未有的破坏,虽然破坏的因素很多,但只要找出主要原因,并着手解决和进行保护,相信热带雨林早晚会恢复它的生机.

[1]巴西地理和统计研究所[EB/OL].http:∥www.hi.stats.gov.cn/hnstjj/index.html,2012.

[2]张文彤,闫洁.SPSS 统计分析基础教程[M].北京:高等教育出版社,2002:23-40.

[3]于秀林,任雪松.多元统计分析[M].北京:中国统计出版社,2004:61-162.

[4]王旭,霍德利.主成分聚类分析法在煤矿安全评价中的应用[J].中国矿业,2009,18(2):86-104.

[5]林海明,刘乐强.主成分分析法在企业经济效益综合评价中的有效应用[J].数学的实践与认识,2005,35(4):65-68.

[6]刘绿叶,孙国铭,刘培廷,等.应用主成分法和聚类分析法分析吕四渔场近岸海水水质[J].海洋渔业,2006,28(3):217-221.

猜你喜欢
雨林种植业甘蔗
“十四五”全国种植业发展有了路线图
清明甘蔗“毒过蛇”
雨林里有一群霸
向雨林出发吧
雨林里有条沸腾河
雨林求生记
甘蔗的问题
爱咬甘蔗的百岁爷爷
种植业结构调整中存在的问题及对策
23个甘蔗品种对甘蔗黑穗病的抗性测定