李文青 史雨梅
摘 要:空气污染问题近年来备受社会关注,而造成空气污染的因素繁杂,各因素对空气污染造成的影响水平值得深究。因此,利用方差分析(ANOVA)方法,对滁州市的三个监测点收集到的数据进行处理,利用SPSS软件检验监测点、时间对监测数据是否存在显著性影响及其影响水平的分析,进一步探寻滁州市空气污染的主要来源。
关键词:方差分析;环境监测;空气质量
中图分类号:FX8 文献标志码:A 文章编号:1673-291X(2021)26-0044-03
一、研究准备
(一)研究背景
空气环境的好坏是影响环境质量的一大重要因素。它是由空气中的悬浮颗粒物浓度度量的,通过实时环境监测对当前的空气质量指数,可以了解到空气污染物主要由二氧化氮、臭氧、PM10和PM2.5组成,通过对各影响空气质量的因素(时间、监测点)进行分析和分解,从而可以对症下药减轻空气污染问题对我们生活造成的不便。
(二)方差分析的基本思想
方差分析(ANOVA),又名“变异数分析”、“F检验”,是指对于两个及两个以上样本,通过分析样本误差来检验总体均值是否存在显著性差异,也就是初步判断给出的一个或多个自变量对因变量是否独立。
组成复杂系统的各因素分为不可控的随机因素和为了研究施加的可影响结果的可控因素两类,各因素相互联系、相互制约,因此,在此条件下得到的实验数据往往呈现波动性。而方差分析的基本思想正是通过分析研究实验数据波动的规律,将各组实验数据在某影响因素下可能存在的系统性波动与随机波动做比,据此推断各总体均值之间有无显著差异,若存在显著差异,就说明这一因素对因变量影响显著。
(三)实时监测数据
通过查询获取安徽省生态环境厅的往年空气质量记录数据,我们从中选取了2019年8月至2020年2月中构成空气污染的主要部分,分别为氮气、臭氧、PM10以及PM2.5,利用EXCEL表格进行AVERAGE计算,得出各主要污染物月平均数值,如表1所示。
二、方法综述
在数理统计中,精密度通常使用标准差来表示。标准差亦称均方误差,用σ表示。但通常情况下测定平均值不等于实际值,因此测定值与平均值之差不等于测定值与真值之差。为要表示有限测定次数的精密度采用符号s代替σ,有限测定次数标准偏差的计算公式为:
其中,N-1在数理统计中说明在N次测定中只有N-1个可变的偏差,代表自由度。
方差分析就是分析构成总体的方差的各个成分,然后利用显著性检验来分析判断,得出结论。常用的方差分析有单因素方差分析和双因素方差分析。
(一)单因素方差分析
假定存在m(i=1,2,…,m)个监测点,第i个监测点存在ni个监测值,用Xi1,Xi2,…,Xin表示监测值,易得各监测点平均监测值:
方差分析的目的就是为了通过Q1,Q2的大小判断各监测点间是否存在显著性差异,若Q2显著性大于Q1,则说明各监测点存在显著差异。
Q1,Q2,Q的自由度分别为n-m,m-1,n-1,由此可以借助F检验判断各监测点是否存在显著差异:
用上式计算出来的F值与附表的值进行比较,通常分为4种情况:F>F99%,方法影响特别显著;F99%≥F>F99.5%,方法影响显著;F99.5%≥F>F99%,方法有一定影响;F90%≥F,看不出方法对结果有较大影响。
(二)双因素方差分析
双因素方差分析在实时环境监测中的应用主要为同时考虑时间与地区不同对空气质量的影响,两者之间不存在交互关系,由此可以得出时间因素和地区因素的平方和Q2、Q3,分别为:
三、实际应用
(一)时间因素
由于时间与地区两因素之间不存在交互关系,通过SPSS软件直接对表2中获取的实时监测数据进行双因素方差分析,得出在时间因素不同的情况下空气环境中NO2对应的显著性水平为近似于0,小于设定的值0.05,表明不同时间点的NO2数值具有显著差异。用此方法同样计算O3、PM10、PM2.5对应的显著水平,均为0,且同样,空气质量指数(AQI)在不同时间条件下亦存在显著差异。
(二)空间因素
进一步考虑不同站点因素对空气环境质量的作用。操作数据显示,由于监测站点不同,AQI、NO2、O3、PM10、PM2.5各F值对应的显著水平分别为0.130、0.201、0.130、0.421、0.165,均大于设定的0.05,表明滁州市老年大学、人大宾馆、市政府原办公楼三个站点环境空气质量不存在显著差异,三个地区均处于同一污染水平。
四、结论与改進
(一)结论
本文根据滁州市空气质量数据的特征构建了方差检验(ANOVA)模型,通过SPSS软件对时间与空间两个影响因素进行方差分析检验的运行结果可以清晰看出,地区不同对空气污染物及AQI数值几乎没有影响,因此滁州市内三个站点间的空气环境污染差距并不大。
而从选取的7个月数据得出的结果来看,在时间条件不同的情况下搜集到的空气环境数据有显著变化,因此可以得出季节与气候的变化能够对空气环境造成显著性影响。
方差分析能够得出影响滁州空气环境的主要因素为时间,而滁州市在地域上整体空气质量处于同一水平。同时能够从均值、方差中看出,在几大主要空气环境污染物中,臭氧是对空气质量造成最大伤害的物质。因此,方差分析能够检验时间、空间等因素是否对空气质量具有影响,及其影响是否显著。该方法可以广泛应用于环境质量评价中。
(二)改进建议
第一,在观测过程中,仅选择滁州市三个观测站进行数据收集,模型的可信度有待提高。
第二,在模型的设定上还可以考虑人均GDP以及所在地区的工业产业、交通、人口规模等因素,这样将大大提高模型的复杂度,可以进一步细化模型。
第三,本文只重点分析了的空气污染成分中的PM2.5、PM10和O3,其他空气污染的组成成分有待进一步分析。
第四,在使用的数据上,本文的数据从采集到整理还有一些缺失值(地区范围较小,可供收集渠道不足),有待进一步提高收集数据的连续性。
参考文献:
[1] 许榕,徐淑霞.方差分析在环境质量评价中的应用[J].江苏环境科技,2002,(4):19-20,22.
[2] 杨小勇.方差分析法浅析——单因素的方差分析[J].实验科学与技术,2013,11(1):41-43.
[3] 邹 .SPSS软件单因素方差分析的应用[J].价值工程,2016,35(34):219-222.
[责任编辑 张宇霞]
收稿日期:2021-01-27
基金项目:国家级大学生创新训练项目“基于实时环境监测数据的函数型统计方法研究”(201910377019)
作者简介:李文青(2000-),女,安徽铜陵人,学生,从事经济统计学研究;通讯作者:史雨梅(1990-),女,安徽安庆人,讲师,从事计计算研究。