金仁浩 曾国静 李盈新 武帅
(北京物资学院信息学院 北京 101149)
大气污染问题影响着人们的健康和出行,自2013年北京雾霾事件以来,大气污染问题成为人们普遍关注的话题。近几年来,经过政府和民众共同的努力,北京市空气质量得到了显著的提升,但北京市在“十四五”期间仍将坚持推进空气质量持续改善。目前研究北京市大气污染问题的文献比较丰富,主要集中在大气污染分布特征和影响因素两方面。
相关研究主要基于北京环保部门每日实时发布的北京35 个空气监测站点的SO2、NO2、PM10、PM2.5、O3、CO 和综合空气质量指数AQI 数据。董芬等对2006 年北京PM10 的分布展开分析,得出北京市空气质量呈现北好南差的分布,在秋冬季这种趋势更加明显[1]。李令军等对2013-2014 年北京PM10 和O3的分布进行分析,同样得出大气污染物在北京呈现出南高北低的分布特征[2]。王占山等对2013 年北京PM2.5 分布展开研究,得出该污染物分布呈现出冬春季较高、秋夏季较低、南部较高、北部较低的特点[3]。金仁浩等对2018 年北京市大气污染物的分布特征展开研究,得出污染物浓度在空间上呈现出北低南高的趋势,自然因素是造成该趋势的主要原因[4]。
涉及北京地区空气质量影响因素的研究相对比较丰富。譬如,李玉敏等利用回归模型对1999-2009 年北京空气质量影响因素进行分析,得出城市绿地覆盖率和人口规模对空气质量有显著影响[5]。肖稚颖等运用灰色关联法对空气质量影响因素进行分析,得出公共交通运输和生产能源消耗对空气质量有着较大的影响[6]。姚祎等运用回归模型对2016-2020 年北京春节期间的空气质量数据进行分析,得出气象因素对北京多种空气污染物浓度占据主导性影响,经济活动对NO2浓度有着显著正相关影响,但对PM10、PM2.5 和SO2浓度的影响并不显著[7]。弓辉等通过GIS 空间描述和统计相关分析研究京津冀地区雾霾形成的因子,得出AQI 受到污染物排放和气象因子的综合影响[8]。
相关文献中,一般是以AQI 或者PM2.5 作为反映空气质量的主要因素,由于北京民众对PM2.5 的敏感程度较高,故本文以PM2.5 作为目标变量。虽然对北京空气质量影响因素方面的研究较多,但现有研究仍存在一定的不足之处。譬如,研究的数据年份往往集中在2018 年之前;对AQI 或PM2.5 影响因素的研究往往会仅考虑其他几种污染物,或仅考虑气象因素,很少会同时考虑这两方面因素的综合影响。因此,为弥补这一不足,本文以2020 年3 月-2021 年2 月北京市空气质量和气象数据为基础,在描述分析PM2.5 变化规律的基础上,运用回归模型综合研究这两方面因素对PM2.5 的影响。本文的研究结果可为北京地区大气污染治理提供一定的参考,具有重要的实践价值。
虽然北京市共有35 个空气监测站,但环保部门也会发布每日北京污染等级及PM2.5、PM10、SO2、CO、O3、NO2这6 种污染物的总体平均浓度值。本文在选取北京市每日污染物指标的基础上,还收集了北京每日天气状况、风向、风力、温差、最高气温、最低气温这些气象指标。收集的数据时间跨度为365 天,即从2020年3 月1 日至2021 年2 月28 日。根据PM2.5 日均值,可将空气质量分为6 个级别:优,良,轻度污染,中度污染,重度污染,严重污染,这六个级别对应的数值区间分别为0-35,35-75,75-115,115-150,150-250,250 以上。
本文首先对北京市空气质量在时间上的变化规律进行分析,再研究其在不同气象状况下的分布特征,进而从整体上了解北京空气质量的变化特征。在对PM2.5 浓度值与气象因素和其他污染物浓度值进行相关性研究的基础上,运用多元回归模型综合研究其他污染物指标和气象指标对PM2.5 浓度的影响。
在统计模型中,回归模型是一种常见的用来研究目标变量与自变量影响关系的模型,该模型具有简单易懂、理论完善、解释性强、容易实现等优点,被广泛应用于各个领域。该模型对数据量的要求不是太高,符合本文研究目标。在回归建模时,本文采用逐步回归的方法实现对自变量的选取。
北京四季分明,夏季天气炎热,冬季寒冷干燥,春季和秋季气温变化幅度较大。北京四季一般可划分为春(3 月-5 月)、夏(6 月-8 月)、秋(9 月-11 月)、冬(12月-2 月)。颗粒污染物PM2.5 在四季上的变化差异如表1 所示。由表可知,春夏秋三季污染物浓度均值相差不大,但夏季均值和波动都最低,秋季均值和波动幅度都高于春季;冬季浓度均值明显偏高,且波动幅度最大。春夏秋季PM2.5 浓度均值对应的空气质量等级为优,冬季浓度均值对应的空气质量等级为良,因此总体而言近年来北京市空气质量相对较好。造成北京PM2.5 在季节上的变化规律,可能是因为北京地区春秋季早晚温差较大可达10℃左右,且时常出现的大风天气会导致空气中沙尘较多,这都会导致PM2.5 污染物较难稀释;而夏季温度较高,降水较频繁,一定程度的降雨可清除空气中的颗粒物,便于PM2.5 污染物的吸收和扩散;冬季寒冷干燥温度较低易刮大风,容易造成颗粒状悬浮物在空气中集聚,且冬季采暖也会加剧空气污染物的排放。
表1 PM2.5浓度变化的季节性差异(单位:ug/m3)
天气状况对空气质量存在着显著影响,当大气中的污染物相对稳定时,污染物被稀释和扩散的效果主要受气象因素的影响[9]。不同天气状况下,污染物PM2.5 的浓度均值如图1 所示,按浓度均值由大到小对天气状况进行了排序。雨夹雪和小雪天气污染物浓度均值较高,前者高达109;阴天和多云天气相比于小雨、中雨和雷阵雨天气污染物浓度偏高,但相差不是太大,这几个天气状况对应的空气质量等级都为良;浮沉和晴的污染物浓度均值较低,对应的空气质量等级都为优。另一方面,用空气质量等级和天气状况构建列联表,建立独立性卡方检验,得出p-value 值仅为0.007,进一步说明天气状况和污染物浓度存在显著的相关性。
图1 不同天气状况下北京市PM2.5浓度均值
风向对空气质量存在着显著影响,不同风向下,污染物PM2.5 的浓度均值如图2 所示。南风和东风对应的污染物浓度均值较高,数值大于45;东南风、东北风、北风对应的污染物浓度均值介于36-38 之间,与南风和东风数值对应的空气质量等级都为良;西南风、西风、西北风对应的污染物浓度均值较低,都达到了等级优,其中西北风所对应的浓度均值最低为19。另一方面,用空气质量等级和风向构建列联表,建立独立性卡方检验,得出p-value 值仅为0.008,进一步说明风向和污染物浓度存在显著的相关性。高浓度的污染物通常聚集在下风方向地区,北京冬季风向以西北风为主,对应风力往往较大,进而导致整体空气质量较好。另一方面,北京的工业生产基地主要位于南部和东北部区域,工业生产排放的污染物容易在南风和东风的作用下进入市区,导致市区PM2.5 的浓度偏高。
图2 不同风向下北京市PM2.5浓度均值
为了综合研究气象因素及其他污染物因素对PM2.5 浓度的影响,本章利用多元回归模型综合考虑这些因素的作用。由于回归模型的自变量需是数值型指标,因此回归分析仅涉及风力、温度差、最高气温、最低气温这4 个气象指标。各自变量指标与目标变量PM2.5 浓度的相关系数表如表2 所示。由表可知,在气象指标里,PM2.5 浓度仅与风力指标呈现显著的负相关,与其他气象指标相关性不显著。在其他污染物指标里,PM2.5 浓度与臭氧浓度呈现不显著的负相关,但与其他污染物指标都呈现出显著的正相关关系。
表2 各自变量与PM2.5浓度的相关系数
选取表2 中与PM2.5 浓度有显著相关关系的自变量建立多元线性回归方程,并通过逐步回归的方法剔除不显著自变量。逐步回归模型结果如表3 所示,仅有污染物指标显著,而风力指标未通过显著性检验,PM10、SO2、CO 对目标变量都有着显著的正影响,其中PM10 和CO 为高度显著。
表3 影响因素对PM2.5浓度的回归分析
表3 所得模型中,风力指标未通过逐步回归的显著性检验,但通常认为风力对空气质量存在显著的影响。以PM2.5 浓度为目标变量,以风力指标和PM10 两自变量建立模型时,风力指标未通过显著性检验,PM10 浓度显著。经计算得风力和PM10 之间呈现出异常显著的负相关性,说明风力和PM10 指标在回归模型中存在制约关系。剔除PM10 指标,重新建立多元线性回归模型,逐步回归结果如表4 所示。在新模型中,NO2和CO 对目标变量都有着高度显著的正影响,但风力对目标变量有着显著的负影响,与表3 模型共同的自变量仅为CO 指标。综合表3 和表4 模型结果,对PM2.5 浓度有显著相关关系的自变量为PM10、SO2、CO、风力、NO2。
表4 影响因素(剔除PM10指标)对PM2.5浓度的回归分析
本文对北京每日空气质量和气象数据进行描述和建模分析得出:北京市空气质量得到了明显的提升,四季PM2.5 浓度均值对应的空气质量等级都为良以上;天气状况、风向都对PM2.5 浓度有着显著的影响,其中雨夹雪和小雪天气污染物浓度较高,南风和东风对应的污染物浓度较高;PM10、SO2、NO2、CO 对PM2.5 浓度都有显著的正影响,但风力对PM2.5 浓度有显著的负影响。
因此为了降低PM2.5 浓度,政府部门要制定政策减少生产生活过程中PM10 污染物的排放;提高燃料的燃烧率,减少SO2和NO2的排放;要搞好北京南部和东北部工业生产基地环境规划,当处于上风向时,尤其要注意控制污染物的排放。