令狐云龙+寇恩华
摘要:本文采用因子分析对重庆市不同区域的重金属浓度进行了分析,运用SPSS17.0统计软件对数据进行处理。最后得出工业区重金属污染最为严重。为我国的环境污染防治工作提供了理论基础。
关键词:土壤重金属;污染因子分析;SPSS17.0
中图分类号:S151.9+3 文献标志码:A 文章编号:1674-9324(2015)19-0113-02
近年来,随着城市经济的快速发展和城市人口的不断增加,人类活动对城市环境质量的影响日显突出。文献的作者以工业废水,废气和生活废水,废气为指标,运用SPSS因子分析得出全国各个城市的环境污染结果。文献的作者应用内梅罗综合指数法得到了土壤中同时含有多种重金属污染的评价方法,从而获得土壤整体污染程度。本文应用因子分析,不仅可得到重金属综合污染情况,还可得到每种重金属的污染情况。
为了更精确的掌握城市表层土壤重金属污染问题,本文根据城市功能不同把城市分为五个区,分别是:生活区、工业区、山区、主干道路区及公园绿地区。再根据每个区的砷、铬、镉、铜、汞、镍、铅、锌八种重金属的浓度指标,运用因子分析确定每个区的土壤重金属污染情况。线性综合指标往往是不能直接观测到的,但它更能反映事物的本质,因此因子分析广泛应用于环境科学方面。因子分析模型:xi=ai1f1+ai2f2+…+aimfm+εi(i=1,2,…,8),其中(i)x1,x2,…,x8为8种重金属的浓度经过标准化处理后的标准化变量。标准化处理可以消除量纲的影响,而且标准化变换不影响变量的相关系数。这里的xi都具有均值为0,方差为1的特征。(ii)f1;f2;…fm叫做公因子,它们是在各个表达式中都出现的因子。本文最后得出f1,f2两个公因子。(iii)εi称为特殊因子,是每个观察变量特有的,表示该变量中不能被公共因子解释的部分。相当于回归分析中的残差项,各个特殊因子之间以及特殊因子与公因子之间是相互独立的。(iv)aij称为因子载荷,它是第i个变量在第j个公因子上的负载,它的绝对值越大说明xi和fj相依程度越大,即公因子fj对xi的载荷量大。
上述是对因子分析模型的简单介绍,下面介绍因子分析的一般步骤:(i)原始数据标准化。标准化公式为xij=■,其中xij是第i个变量的第j个观测量,而xj和δj分别为该变量的均值和标准差。(ii)应用KMO和Bartlett验证是否可应用因子分析。(iii)计算标准化数据的相关系数矩阵,求出相关系数矩阵的特征值和特征向量。(iv)使用方差最大法进行正交变换。其目的是使因子载荷两级分化,而且旋转后的因子仍然正交。(v)确定因子个数,计算因子得分,进行统计分析。
现以重庆市为例,按功能不同,把城市分为生活区、工业区、山区、主干道区和公园绿地区。以每个区中土壤重金属元素的浓度为参考数据。这里取8种重金属浓度,分别是x1为砷(μg/g),x2铬(ug/g),x3镉(μg/g),x4铜(μg/g),x5汞(ug/g),x6镍(μg/g),x7铅(μg/g),x8锌(μg/g)。数据来源于中国统计年鉴。
1.建立指标体系和在SPSS中导入原始矩阵,并且利用分析——描述统计来将数据进行标准化。
2.考察收集到的原有变量之间的线性关系,判断是否适合采用因子分析提取因子。利用SPSS软件,借助变量的相关系数矩阵、卡方检验和KMO检验方法进行分析。其结果如表1、表2所示。
从相关系数矩阵可以看出,大部分的相关系数较高,这8个变量之间存在较强的相关性,说明这8个变量反映的信息有很大的重叠,能够从中提取公共因子,适合进行因子分析。从KMO和Bartlett的检验表可以得到,卡方检验统计量为905.711,相应的概率p接近0,说明相关系数矩阵与单位阵有显著差异。表明适合进行因子分析。
3.利用相关系数矩阵求出相应因子的特征值和累计贡献率。SPSS操作结果如表3。
从上表看出旋转前后总的累计贡献率没有发生变化,即总的信息量没有损失。另外,旋转之后,有2个因子已经提供了原资料90.147%的信息,满足因子选取的原则:m个因子的累积贡献率要大于或等于80%,特征根要大于1。这可以说明因子1和因子2是土壤重金属污染的最重要的污染源,对该城区重金属污染的贡献最大。
4.在根据旋转后的因子载荷矩阵。
从表4中可得出,因子f1在主要由铬、镉、铜、汞、铅、锌构成,主要是工业交通产物,因此称为工业与交通因子。因子f2由砷和镍构成,称为生活因子。
5.根据正交旋转后的因子得分,得出因子得分函数。
由表5,可以写出以下因子得分函数:
f1=-0.147x1+0.895x2+0.984x3+0.212x4-0.004x5+
0.965x6+0.860x7+0.969x8
f2=0.963x1-0.442x2+0.177x3+0.968x4-0.724x5+
0.168x6-0.285x7+0.203x8 现给出经过方差最大旋转方法旋转后的5个类区在2个因子上的得分。
根据上表可知,主干道区在主因子f1上得分较高,这是因为因子1中的重金属大部分来自于车辆尾气的排放和轮胎的摩擦。发展电动车和环保轮胎是减少土壤污染的可行办法。而生活区和公园绿地区在主因子f2上得分较高,是因为因子2的重金属主要产生于生活垃圾,工业产生非常少。提高居民的环境意识至关重要。工业区在因子1和因子2上的得分均较高,说明重金属在工业区的污染比较严重,政府应采取环境保护措施进行治理。endprint