丛琳+孙德山+邹存利+张蕾
摘 要 选取2016年北京市空气质量指数数据,简述了北京市空气的现状,并根据频率得出PM2.5已经成为北京市空气中的首要污染物的结论.通过计算PM2.5与AQI所监测的其余指标之间的相关程度,进行PM2.5与PM10,CO和NO2的多元回归分析,得到线性回归方程.同时对模型给予改进,建立基于2个主成分的、更为精准的多元回归模型.得出PM10是空气中PM2.5的最主要成因的结论,CO和NO2对PM2.5的影响也不容忽视的结论,对北京市雾霾天气预防提供参考意见.
关键词 PM2.5; AQI; 相关系数;多元回归分析;主成分分析
中图分类号 O213 文献标识码 A
Abstract We selected the Beijing air quality index data in 2006, clarified the current situation of Beijing air, and based on the frequency we got a conclusion that the PM2.5 has already become the primary pollutant.The calculated correlation between PM2.5 and AQIs remaining indicators, multiple regression analysis of PM2.5 and PM10, CO and NO2, we got the linear regression equation. By improving the model at the same time, a more accurate multivariate regression model based on two principal components was established. It can be concluded that PM10 is the main cause of PM2.5 in the air, and the effect of CO and NO2 on PM2.5 cannot be ignored, the suggestion was provided on the prevention of haze weather in Beijing.
Key words PM2.5; air quality index; correlation index; multivariate regression analysis;principal component analysis;principal component analysis
1 引 言
空气是地球上大气层中的气体混合,作为人类赖以生存的物质,空气的质量变化直接影响着人类的生活.空气质量是依据空气中污染物的浓度来反映空气受污染的程度的一项指标.现今,空气质量问题已经成为环境质量中的重点,空气质量每况愈下,随之而来的对空气问题进行分析以及提出相应的解决措施也成为了人类生存环境保护的重中之重.
我国从20世纪80年代开始了大气中颗粒物的研究工作.黄鹂鸣等[1]对大气颗粒物的污染在5个典型的城市功能区进行了分析,结果表明PM2.5与PM10的比例占到68%左右.宋宇等[2]对北京市1999年和2000年的空气污染物的消光系数以及粒径大小不同的颗粒物的质量浓度进行监测,得出能见度下降的首要原因是大气颗粒物的消光.魏玉香等[3]对南京市2007年度PM2.5进行了日变化、月季变化的特征分析,并利用同期气象资料分析气象与PM2.5的关系.美国国家环境保护局也曾对与PM2.5相关的健康效应予以定量的评价,其中由死亡引起的经济损失比重达到89%之高.
PM2.5是直径小于等于2.5微米的细颗粒物,它在空气中的含量浓度与空气污染程度有着密不可分的关系.尽管,这种细颗粒物是空气中很少的一个组成部分,但其粒径小、面积大、在大气中能长时间停留且能远距离输送等特点使其对空气环境质量以及人类身体健康有着重大影响.事实证明,PM2.5所能携带的有害物质多于PM10等其他污染物质,并且对人类呼吸系统有极强的穿透力,更易于被呼吸道黏膜所吸附,并永久留于体内.由于PM2.5等空气污染物导致的空气质量破坏正在蔓延,每年约有300万人死于肺部相关疾病.因此,随着全球大气的污染情况日益加重,作为首都的北京则更应该予以重视研究,以便为相关部门的针对性治理提供一定的参考信息与建议.
2 数据来源及北京空气质量基本状况
本文所采用的数据来源于中华人民共和国环境保护部的数据中心[4]和中国空气质量在线分析平台[5].其中2016年4月16日及2016年9月6日的数据有所缺失,采用平均值法进行插补处理.同时采用标准化的方法对数据进行处理,以减除量纲对分析的影响.
据历史天气状况纪录,2016年北京市平均轻度雾霾以上的天气达到55天,大多数出现在秋冬季节.2016年11月5日出现能见度不足200米的强浓雾霾,造成494架飞机航班取消,所导致的交通事故更是不计其数.同年12月19日~12月21日,北京市红色预警雾霾天气,对中小学生采取“停课不停学”措施.雾霾天气主要由城市工业化、机动车数量以及绿地覆盖程度和人口规模等因素影响.日常生活所产生的废气排放无疑成为了空气的一种负担.
从数据中得出,北京市2016年366天中优良天气所占比例为52.1%,重度及严重污染的比例达到10.7%.表明北京市总体空气质量不容乐观.具体数据如表1所示.根据所收录的2016年北京市每日空气首要污染物数據得知,北京市空气中首要污染物有NO2,O3-8,PM10,PM2.5,并对其出现频率进行统计分析.其中PM2.5出现156天,所占百分比为42.6%,远超其他污染物所占比例.详见表2.因此,PM2.5成为北京市空气中首要的污染物.endprint
3 AQI指数介绍
AQI是空气污染指数,是用不同级别来描述空气污染成都和质量情况.参与评价的指标主要有细微颗粒物(PM2.5)、可吸入颗粒物(PM10)、二氧化硫、一氧化碳、二氧化氮、臭氧六项.空气污染指数分为五个级别,取值范围在0至500之间,本文所采用的数据中每天空气污染程度就是由此指数评价得到的.当AQI达到300以上,则可判定当日空气状况属于严重污染,2016年北京市一共出现了9天严重污染情况,这对儿童、老人和病人的身体有着极大伤害.
4 PM2.5的相关系数计算
4.1 相关系数介绍
相关系数是一种反应变量之间相关关系密切程度的统计指标,是用以研究变量间线性相关程度的量.皮尔逊相关系数计算公式为:
相关系数r的取值在-1和+1之间,r值的正负表示变量间相关关系的正负,r的绝对值越大则说明两变量的相关性越强.皮尔逊相关系数是最常见的计算方法,但并不是唯一的.肯德尔秩相关系数定义了n个同类别的统计对象按照特定的属性进行排序,若二者属性的排名相同,则系数为1,这也表明两个属性是正相关的;反之,若排名相反则系数-1代表负相关;若排名完全独立则不相关.Kendall秩相关系数计算公式为:
斯皮尔曼等级相关系数对未知类型的数据类型使用积矩阵相关系数来描述相关性,它对原始数据是没有要求的,属于非参数统计方法.
4.2 相关系数计算
运用SPSS 20.0[6],采用上述3种相关系数计算方法进行指标间的相关性分析,得到结果如表3所示.
Pearson相关系数中,PM2.5与PM10的相关系数为0.894,与CO的相关系数为0.868,与NO2的相关系数为0.824,相对前两者来说其相关性有所减弱;而PM2.5与其余指标间的相关性相对较低.同时,Kendall相关系數与Spearman相关系数的结果大致相同.所以,与PM2.5相关性较强的分别为PM10、CO和NO2.
由北京市2016年全年空气质量数据,以及数据间的相关性分析,可以初步得出PM2.5与PM10、CO和NO2具有较强的相关关系.并且通过控制这些污染物的形成与排放,对PM2.5的形成也可以起到抑制作用.因此,需要研究分析指标间具体的变动趋势关系.
5 PM2.5与主要指标的多元回归分析
多元回归分析是用于处理一个因变量与多个自变量间数量关系的方法.运用EViews 8.0[7]对与PM2.5相关性比较强的3个指标PM10、CO和NO2,运用最小二乘法进行多元回归分析,得到结果如表4所示.
由于NO2的参数检验0.388 8远远大于0.05,说明此变量并不显著,所以做删除处理.同时参数C的检验也不显著.所以再将PM2.5对PM10和CO重新做二元回归分析,得到结果如表5所示.各个统计指标都是显著的,参数检验也均通过.
为了改进模型以更准确的描述监测指标之间的关系,采用主成分分析方法对除PM2.5以外的其余5个变量进行分析,然后建立主成分间的多元回归.运用R 3.4.0[8],得到主成分分析结果以及相应载荷矩阵如表6和表7所示.由此可以得到前2个主成分的贡献率达到83.4%,超过80%,这表明前两个主成分所包含的信息足够充分.
由于主成分分析操作中已经保证两个主成分间的独立性,因此对PM2.5与两个主成分做二元回归分析,得到回归结果如表8所示.
通过回归方程,可以表明PM2.5与两个主成分间关系.由此表明,当主成分E1保持不变时,主成分E2每变化一个单位会导致PM2.5变化1.758个单位;同时当主成分E2保持不变时,主成分E1每变化一个单位PM2.5会变化0.596个单位.同时也间接的反映出PM10含量变化对PM2.5的影响最大.
6 总结与建议
本文通过收集2016年北京市空气质量监测的各项指标,研究北京市雾霾形成的主要因素PM2.5的污染问题,整理了北京市2016年AQI及其具体监测指标的具体数值,对366天的具体情况进行了整理分析,得出PM2.5是北京市2016年首要污染物.进而对PM2.5和其他监测指标进行相关分析及多元回归分析,得到相应的回归方程.由于变量间相关性,采用主成分分析得到2个主成分,得到一个较为精准的统计模型.并得出结论:在除PM2.5外的五个监测指标中,PM10对PM2.5的影响程度最大,所以优先控制空气中尘土的含量可以达到控制PM2.5的目的,同时CO与NO2对PM2.5的影响也不容小觑.因此,要通过控制建筑工地扬尘工作尘土飞扬、加大城市绿化面积和汽车尾气排放及化工气体不完全燃烧的排放等从根源解决问题,以改善人们赖以生存的环境.
参考文献
[1] 黄鹂鸣,王格慧,王荟,等.南京市空气中颗粒物PM10、PM2.5污染水平[J].中国环境科学,2002.22(4):334-337.
[2] 宋宇,唐孝炎,方晨,等.北京市能见度下降去颗粒物污染的关系[J].环境科学学报,2003.23(4):468-471.
[3] 魏玉香,银燕,杨卫芬,等.南京地区PM2.5污染特征及其影响因素分析[J].环境科学与管理,2004.5(3):327-311.
[4] 中华人民共和国环境保护部.中华人民共和国环境保护部数据中心,[EB/OL].(2017-06-01)[2017-06-01].http://datacenter.mep.gov.cn/index.
[5] 真气网.中国空气质量在线监测分析平台[EB/OL]. https://www.aqistudy.cn.
[6] 薛薇.基于SPSS的数据分析[M].北京:中国人民大学出版社,2006.
[7] 张大维,刘博,刘琪.EVIEWS数据统计与分析教程[M].北京:清华大学出版社,2010.
[8] 肖枝洪,朱强,苏理云,等.多元数据分析及其R实现[M].北京:科学出版社,2013.endprint