孟千翔
摘 要:随着我国居民生活水平的提升,环境保护问题早已成为全民关注的热点。其中监测河流水质并分析其空间特征是我国目前水环境所关注的热点。本文根据北京市水务局于2018年2月发布的2017年四个季度北京市水质检测结果,通过因子分析法对数据进行降维处理,并对影响水质因子差异性的因素进行分析,根据分析结果对自来水净化处理相关部门提出合理的建议。
关键词:因子分析;自来水资源;综合评价
中图分类号:X824 文献标识码:A 文章编号:1671-2064(2019)04-0009-03
0 引言
北京地处水资源匮乏的海河流域,人均水资源占有量小于300立方米,仅为全国人均水资源占有量的八分之一。北京市地表水产量多年平均值为21.78亿立方米,但枯、丰水年的产水量差别十分巨大。由于近些年来城市人口的不断增加和经济的迅速发展,北京市水资源需求量已远超其自身的供给能力。为了维持城市水资源的供求平衡,只能以超采地下水、牺牲城市水环境为代价。这种状况导致北京市地下储水量逐年下降,同时出现了水质下降、矿物质含量增加、自来水硬度增大等现象,引发了一系列的环境问题[1]。
随着多年以来环保事业的不断发展,北京市自来水集团创立并逐渐完善了一套范围全面、方法多样的生活用水水质监控体系,公开接受卫生部门和全体公民的监督,以确保首都供水安全、水质可查[2]。常规的水质参数繁多,单一的水质参数评价方法不能准确描述水质情况[3]。為了更准确地对北京市不同地区和季度的自来水水质进行综合评价,本文基于相关历史数据,使用因子分析的方法进行统计分析,得到综合得分方程,并计算不同地区的水质得分,绘制折线统计图,进一步分析自来水水质的地域性差异,以此为依据对北京市水资源处理部门提出合理建议。
1 因子分析原理
在实际生活之中,一个问题通常存在多个监测指标,为了对问题进行综合评定,我们可以使用因子分析法对数据进行分析。在因子分析法中,我们对所有水质监测指标的检测数据提取公共因子,计算每一个因子的方差贡献率,并根据计算结果对各个因子的得分进行加权求和,得到综合得分函数。因子分析可以将相关性显著的变量分到同一主成分之中,而不同主成分中的变量之间不存在显著的相关性[4]。其根本目的是用少数因子去描述多指标变量之间的联系,“由表及里”,“去粗取精”,对复杂的实际问题进行降维处理,得到合理的得分方程,以便于我们对问题进行综合评定[5]。
因子分析法可以表示为矩阵的形式:X=AF+B,即:
是原始观测变量的公共因子,它们是相互独立的不可观测的理论变量。均值向量E(X)=0,协方差Cov(X)=∑,且协方差矩阵与相关矩阵相等。A(αij)是公共因子F(f1,f2,f3,…,fk)的系数,称为因子载荷矩阵。
称为因子载荷,数学上可以证明,αij是第i变量和第j因子的相关系数,反映了第i变量对第j因子的重要性,同时也表示原始观测变量xi对公共因子fj的依赖程度。
2 实例分析
2.1 数据查找
据可靠报道,自2013年1月15日起,北京市水务局每个季度都会对各地区自来水水质进行检测,并向民众公开监测结果[2]。我们从官方网站获取到2017年四个季度北京市十一个地区的自来水资源检测结果,并选取毒理指标中的变化范围较大的7个指标,详见表1。
从表1中的数据可知,2017年四个季度北京市各地区自来水水质均未超过水质常规指标限值,即符合国标要求。在对数据进行因子分析之前,需要先进行相关性检验。
2.2 相关性检验
利用SPSS软件中的降维分析功能,对表1中各个指标和变量进行相关性检验,包括KMO检验和Bartlett球形检验。其中KMO检验统计量可以用来比较多个变量之间的相关系数和偏相关系数,其值越接近0说明变量之间的相关性越强。当KMO检验值大于0.5时,各个变量之间显著无关,即相互独立,即满足因子分析的前提条件。Bartlett球形检验则用于检测变量指标的相关矩阵是否为单位矩阵,以确保各分量之间相互独立[4]。
检验结果详见表2,其中北京市自来水水质指标各因子之间的KMO值为0.502,Bartlett球形检验量的Sig<0.01,符合因子分析的前提条件。
2.3 因子分析
对表1中的数据进行因子分析,可以分别得到七个因子的方差贡献率,如表3所示。
由表3可知,前三个特征值对应的方差百分比积累已经达到了85%,所以这三个特征值所涵盖的主成分较全面地折射出原有各因子的情况,可以用来对北京市自来水资源质量进行分析。
对一个变量来说,载荷量绝对值较大的因子与该变量的相关性更高,也就更能代表这个变量。从表4中可以看出,第一主成分可代表溶解性总固体和总硬度这两个因子,第二主成分可代表氟化物因子,第三主成分可代表三氯甲烷因子,由表5成分得分系数矩阵可知,因子得分公式为:
F1=-0.039x1+0.220x2+0.035x3+0.251x4+0.204x5+ 0.272x6+0.249x7
F2=0.713x1-0.170x2-0.046x3+0.379x4-0.118x5+ 0.178x6-0.168x7
F3=-0.092x1-0.155x2+0.828x3+0.320x4+0.135x5- 0.004x6-0.162x7
采用方差贡献率作为计算综合得分的权重,三个旋转后公因子的方差贡献率依次为49.804%和18.983%和16.851%,故而各地区水质综合得分计算公式为:
zF=0.4980FAC11+0.1898FAC21+0.1685FAC31 (5)
利用式(6)计算各水样的综合得分。使用MATLAB数学软件根据计算结果绘制水质得分折线图。由于各项数据值越小表示水质越好,故综合得分越低水质越好。
在2017年,北京延庆、丰臺和昌平三个地区的自来水水质综合得分较小(基本小于-0.5);怀柔、门头沟和房山地区的水质得分较前三个地区略高,但基本上小于0;密云、通州和大兴地区的水质得分较高,均大于0,其中大兴地区的得分明显高于其他地区。这表明北京中部地区的水质明显好于其他地区。结合表3可知,这主要是由于中部地区的氯化物、硫酸盐、溶解性总固体和总硬度等水质监测指标较小;同时,各个地区水质得分存在较大差异,这表明自来水水质情况和地域因素有一定的关系。
通过上述分析并结合北京地区自来水资源水质均符合国家标准,但存在细微的地域差异,北部及中部地区水质各项指标较低,水质较好,自北向南自来水水质逐渐降低。但针对于某个地区而言,自来水水质随季节的变化并不明显。
结合北京市自来水供水特征可知,北京主要河流水系发源于西北,流经中部地区后流向东南部。河流下游水域的矿物质含量较高,因此东南部地区自来水的含盐量和硬度较大。
3 结论与建议
通过查找北京市供水系统相关资料可以作出合理推断,自北向南水资源质量的变化,主要原因是北京市内主要河流大多发源于西北地区,而河流沿线地区经济发展较快,导致生产生活污水的大量排放。水资源在流经北京市内的过程中,矿物质不断沉积,水质逐渐下降,导致河流下游的东南地区水质较差。
根据以上分析,建议城区相关部门加强工厂污水排放现象的管控,并针对东南地区严格执行自来水的净化工作,保证入境水资源南北质量一致,减小地区差异,提高北京市自来水的整体质量。
参考文献
[1] 佚名.北京水资源状况及用水结构分析[J].北京社会科学,2000(1):40-41.
[2] 张景华.北京:让自来水更“透明”[N].光明日报,2013(1).002.
[3] 王京萌,郭逍宇,赵文吉等.多元统计分析对再生水河流水质特征分析.环境工程学报,2013,7(11):4281-4289.
[4] 王志超,史海滨,李仙岳等.基于因子分析法的再生水水质随季节变化研究.北方农业学,2017,45(4):79-84.
[5] 李春昉,郭际,赵绍丰.多元统计分析之因子分析浅析[J].价值工程,2010(15):128-129.