凌启东 张红伟 朱 瑾 王 建
1. 徐州工业职业技术学院信息与电气工程技术学院,江苏 徐州 221440 2. 徐州医科大学医学信息学院,江苏 徐州 221004
中国是全球雾霾污染高发区之一,全国很多城市都出现了雾霾污染的天气,严重影响了人们的生活和健康[1]。目前政府正积极采取各种措施来消除雾霾,降低其对环境的影响,为了寻找有效消除雾霾的方法,有必要分析出形成雾霾的主要因素,对雾霾进行更清晰的了解,从而使人们能够有针对性地进行防治。针对当前大气污染物较多、雾霾成因复杂的情况,基于Pearson 相关系数研究了雾霾的主要成分PM2.5 与当前主要的空气污染物的相关性,找到了与PM2.5 相关性最高的大气污染物,为下一步雾霾的治理研究提供了可靠的数据支撑。
影响雾霾的因素多种多样,PM2.5 是构成霾的主要成分,是雾霾天气的“始作俑者”,因此,可以将对雾霾的研究转换成对PM2.5 的研究。在雾霾成因研究现状中,PM2.5 形成的主要因素包括以下方面。
我国的主要能源物质是煤炭,煤炭燃烧时会有SO2、NOx、CO、VOCs、烟尘等物质产生[2]。其中,挥发性有机物(VOCs)还可以和SO2、NOx 等发生反应,形成会严重危害人们健康的二次有机气溶胶。
我国经济发展越来越快,几乎人人家中常备一辆小轿车,全国已登记注册或者正在使用的机动车的数目非常庞大。机动车尾气中的污染物有悬浮的固体颗粒物、CO、NOx 等。
工业是我国经济结构中至关重要的一员,然而也正是工业废气排放标准的宽松、环保设施的缺乏等,使得排放的废气严重超标,造成了环境的严重污染。工业废气中的污染物主要有:SO2、NOx、CO、烟尘、粉尘等。
有时候,恰当的气候条件也会导致雾霾天气的产生,雾霾从产生到消散的过程中每个环节都与气候条件有着密切的联系,例如,降雨量减少使污染物不易沉淀;平均风速降低使污染物不易搬运;温度升高加速污染颗粒物之间的相互作用等。因此,一旦出现前面所提到的各种气候,就会形成严重的大气污染。
中国人口数量持续上升,高楼大厦鳞次栉比,这些都会在一定程度上影响季风,阻碍污染物的扩散,日积月累,不断增加城市PM2.5 浓度。
但是PM2.5 与哪些具体的污染物有关仍然是当前研究的热点,考虑到氮氧化物在太阳照射和适宜的气候下可以生成臭氧(O3),再结合上面的五大因素,本文就PM2.5 与PM10、SO2、CO、NO2、O3、温度、湿度、风级之间的关系,利用二元简单相关进行了关联度分析,研究影响PM2.5 的主要因素,从而使人们能够有针对性地对PM2.5 进行治理。
不同指标的量纲(如面积、时间、长度、质量等)及量纲的单位(如平方米、秒、厘米、千克等)通常是不一样的,如果直接用这些原始数据进行计算,结果往往是不对的。为了防止产生这种影响,有必要事先对原始数据进行归一化处理,使得各指标之间的量级相同,方便比较。
为了数据处理时能够更加方便,对PM2.5 相关数据的处理使用的归一化方法—min-max 标准化,对原始数据进行线性变换,将其值映射到区间[0,1]内[3],如式(1)所示。
其中:x 是原始数据,xmin是原始样本数据中值最小的数据,xmax是原始样本数据中值最大的数据。
协方差能反映两个随机变量之间的相关关系,如式(2)所示。
其中:X=(x1,x2,……xn)T,Y=(y1,y2,…,yn)。
由于协方差值的大小受量纲影响较大,因此,不能简单地用协方差来度量大气污染物之间的相关程度,将协方差除以X 的标准差和Y 的标准差,从而剔除量纲的影响,引入了Pearson 相关系数,如式(3)所示。
Pearson 相关系数的绝对值始终是小于等于1 的。两个变量之间的|ρ|值越接近于1,则二者相关程度越高;|ρ|的值越接近于零,则二者的相关程度越低[4],|ρ|值与相关程度的关系如表1 所示。
表1 相关系数与相关程度对应表
选取2018 年徐州市大气质量数据为分析对象,根据式(3),计算出PM2.5 与各污染物指标的相关性系数如表2 所示,PM2.5 与PM10、CO 的相关程度最高,与SO2、NO2、O3的相关程度也较高,因此,在研究PM2.5 的相关治理时,可以重点研究PM10、CO、SO2、NO2、O3污染物的治理问题。温度、湿度、风级的相关程度很低,在研究时没有太大的研究价值。
表2 PM2.5 与各指标相关性汇总
为了验证Pearson 相关系数的有效性,绘制PM2.5 与PM10、PM2.5 与湿度的散点关系图,PM2.5 与PM10 的变化趋势如图1 所示,呈正相关关系显著,与Pearson 相关系数的计算结果一致;PM2.5 与湿度的变化趋势如图2 所示,呈现低度负相关关系,与Pearson相关系数的计算结果一致。
图1 PM2.5 与PM10 的相关性
图2 PM2.5 与湿度的相关性
PM2.5 是雾霾的主要成分,通过min-max 标准化实现了对原始数据的归一化处理,映射到区间[0,1]范围内,基于Pearson 相关系数分析了PM10、CO、S O2、N O2、O3、温度、湿度、风级之间的二元关系,研究发现与P M2.5 与P M10、C O、S O2、N O2、O3的相关程度较高,因此对PM2.5 的治理可以重点研究这些相关的污染物的变化,对雾霾污染的防治具有较大的意义。