用SPSS实现对太原市PM2.5区域变化特征和影响因素的分析

2015-03-10 08:10解蕾
太原城市职业技术学院学报 2015年4期
关键词:对话框太原市监测点

解蕾

(运城师范高等专科学校,山西运城044000)

用SPSS实现对太原市PM2.5区域变化特征和影响因素的分析

解蕾

(运城师范高等专科学校,山西运城044000)

SPSS是一个集数据整理和数据分析功能于一体的统计软件,与EXCEL比较,SPSS能够处理的数据量更大,数据分析和统计的功能更多,数据处理的结果更加精准。本文主要通过“用SPSS实现对太原市PM2.5区域变化特征和影响因素的分析”的具体实例,按照“统计需求——SPSS操作方法——结论分析”的模式,对实用统计功能的SPSS实现方法进行介绍,以便使读者能够有效在理解SPSS的各统计基本操作,掌握利用SPSS解决实际问题的方法和技能。

SPSS;PM2.5;区域变化特征;影响因素

一、分析PM2.5变化特征的意义

PM2.5是指大气中直径小于或等于2.5微米的颗粒物,也称为可入肺颗粒物,是空气污染的主要指标。PM2. 5粒子小,富含大量的有毒有害物质,且在大气中停留时间长,输送距离远,对人体的健康影响很大,也是雾霾天气形成的主要原因。PM2.5的来源及化学组成均非常复杂,除了有自然与人为的一次排放之外,还包括由大气中气态污染物的二次化学合成,所以研究PM2.5的变化特征和探索大气中各类气态污染物对PM2.5的二次合成贡献的大小,对于跟踪污染源,以及城市的环境治理具有重要的参考价值。

近年来有许多研究对PM2.5的时空变化特征进行了分析,但因为监测的数据量比较大,使用传统的人工统计分析的方法容易导致研究结果的偏差。本研究数据的来源是国家环境保护部每小时的实报数据,数据详细可靠,数据量也比较大,使用SPSS软件进行分析更加符合大量数据分析的需求。本文采用SPSS对太原市2014年3月份PM2.5的数据进行分析,从而得出PM2.5区域变化特征,并通过SPSS提供的相关性和回归分析研究其他大气污染物对PM2.5的影响。

二、数据文件的建立

1.数据信息

本研究主要是对太原市2014年3月份PM2.5及其他污染指标的统计分析。监测点设置在尖草坪、涧河、金胜、晋源、南寨、上兰、桃园、坞城、小店9处。本研究的数据来源于国家环保部网站,通过silverlight编写接口程序,通过服务器动态获取其网站所发布的太原市9个空气质量监测点位的日报和时报数据,数据变量包括监测时间、检测点位、SO2、NO2、O3、CO、PM10、PM2.5每小时的浓度平均值,共计8个指标。

2.SPSS操作方法

通过SPSS导入EXCEL数据表,单击数据窗口左下方的VariableView标签,进入变量定义视图窗口,将空气质量等级建立值标签,在DataView数据视图中,执行Data——SortCases命令,按照position进行升序排序。对于缺失和无效数据通过数据的选择功能直接删除。最终到的数据表如图1。

三、基本描述性统计分析

1.分析需求

利用描述统计过程对太原市2014年3月份各污染指标的一般统计量进行计算,主要包括观测量的数量、PM2.5最小值、PM2.5最大值、月均值和标准偏差。

2.SPSS操作方法

执行Analyze——DescriptiveStatistic——Descriptive命令,在弹出的Descriptives对话框中选择变量"PM2.5"到Variable[s]栏中,选择Savestandardizedvalueasvariables选项,单击OK按钮。

在结果输出窗口中,可得到如表1所示的执行结果:

表1

从表1中可以看到,3月份PM2.5的月均值为55.57ug/m3,最大值为269ug/m3,最小值为4ug/m3。

四、各监测区的空气质量等级对比

1.分析需求:利用列形式统计报表功能对2014年3月份太原市空气质量数据进行描述统计量计算,计算并对比各监测地区的污染比例。

图1

2.SPSS操作方法:现将变量quality的类型转换为Numeric数值型数据,然后执行Analyze——Reports——ReportSummariesinColumns命令,选择变量“quality”到DataColumns框中,单击Summary按钮,设置Value的值为2,选定单选按钮Percentageabove,单击Continue按钮。

从结果输出窗口中,可得到如表2所示的执行结果:

表2 空气质量等级

从表2空气质量等级列概述报告中可以看到,太原市各监测点空气质量等级>2(未达到优良)的比例,从报告结果中看到小店、涧河、坞城3个区域的污染最为严重,2014年3月份的空气质量等级数值,污染天气所占比例分别为62.5%、62.0%、57.7%。

五、各监测点的PM2.5浓度值差异对比

1.分析需求:对各个监测点的PM2.5数值进行差异比较。单因素方差分析方法用于测试某一个控制变量的不同水平是否给指标变量造成了显著差异和变动,而且单因素方差分析的控制变量只能有一个,所以适合本例。

2.SPSS操作方法:执行Analyze——CompareMeans——OneWayANOVA命令,打开OneWayANOVA对话框;从左侧变量列表中选择“PM2.5”到DependentList框,选择“position”到Factor框;单击PostHoc按钮,打开OneWayANOVA:PostHocMultipleComparisons对话框,选择LSD显著性检验法;单击OK按钮。

在结果输出窗口中,可得到如表2所示的执行结果:

表3 ANOVAPM2.5

从方差分析表(表3)中,我们能看到F检验值为61.618,相伴概率为0.000<0.05,所以拒绝零假设。也就是说,各个区域的PM2.5差异很显著。

图2监测均值折级图

从均值折线图(图2)中,也能够看到各个地区的PM2.5值的差异比较显著,其中南寨的PM2.5均值最高。

六、PM2.5影响因素的分析

1.分析需求:PM2.5的来源及化学组成均非常复杂,除了有自然与人为的一次排放之外,还包括由大气中气态污染物的二次化学合成,通过相关性分析,预测PM2.5与CO、NO2、O3、SO2之间是否存在线性关系。

2.SPSS操作方法:执行Analyze——Correlate——Bivariate命令;在弹出的“BivariateCorrelations”对话框中,选择变量PM2.5、CO、NO2、O3、SO2到“Variables”框;在“CorrelationCoefficient”栏中选择Pearson简单相关系数;在“TestofSignificance”栏中选择“Two-Tailed”选项;单击OK按钮。

从相关系数表中可以看出,PM2.5与CO的相关系数为0.829,不线性相关的概率为0.000,这说明PM2.5与CO之间有较显著的线性相关关系。PM2.5与NO2的相关系数为0.464,不线性相关的概率为0.000,线性相关很显著,但相关程度不高。PM2.5与O3的相关系数为-0.253,不线性相关的相伴概率为0.000,所以PM2.5与O3之间存在较显著的负相关关系,但相关程度很微弱。PM2.5与SO2的相关系数为0.307,不线性相关的相伴概率为0.000,所以表明PM2.5与SO2之间相关程度很微弱。

七、建立PM2.5与CO的回归模型

1.根据相关性分析的结果,用PM2.5与CO做线性回归得出回归模型。并对模型的优劣进行评价。

2.SPSS操作方法:执行Analyze——Regression——Linear命令;在弹出的“LinearRegression”对话框中选择变量“PM2.5”到“Dependent”框,选择变量“CO”到“Independent”框中;单击Statistics按钮,打开“Linear Regression:Statistics”对话框,选择“Estimates”和“Model fit”选项,单击“Continue”按钮返回主菜单;单击OK按钮提交系统执行。

模型拟合概述表显示,相关系数R=0.807,判定系数R2=0.688,修正的判定系数为0.688,这表明PM2.5与CO之间具有很强的线性相关关系。

从方差分析表中可以看到,F统计量的值为7480.242,F统计量的相伴概率Sig=0.000,回归效果非常显著。

从线性模拟系数表中可以看到,常数项为:16.279,自变量系数为:2.439。由此可得相应的模型为:PM2. 5=16.279+2.439CO。

经过分析得出以下结论:太原市各个监测区域之间PM2.5的质量浓度差异显著,其中小店、涧河、坞城3个监测点的污染比较严重。PM2.5与CO具有高度的线性相关,而且线性相关很显著,说明CO对PM2.5的大气二次合成贡献较大。通过回归分析,建立两者之间的回归模型为PM2.5=16.279+2.439CO。可以看出,用SPSS实现大数据量的数据分析,既容易操作,而且功能强大,大大提高了统计分析的效率,增加了分析结果的可靠性。

[1]和雅君.SPSS旅游统计使用教程[M].北京:旅游教育出版社,2010.

[2]何正国.北京地区PM10和PM2.5质量浓度的变化特征[J].环境科学研究,2004,17(1).

TP

A

1673-0046(2015)4-0182-03

猜你喜欢
对话框太原市监测点
保定市满城区人大常委会为优化营商环境固定监测点授牌
太原市为农村寄递物流补“短板”
天津南港LNG接收站沉降监测点位布设
抚河流域综合治理监测布局优化
太原市61个村要建污水处理设施严禁直排入河
太原市园林绿化植物选择及分析
太原市六家药茶企业获省级授权
全站仪极坐标法监测点稳定性分析方法研究
正常恢复虚拟机
Bootlace Worms’Secret etc.