周彤璞+陈国庆
摘要:针对成都市空气中的PM2.5,从影响AQI指标的六个因素的探究为切入点,构建了主成分分析模型和高斯烟羽扩散模型,运用MATLAB、Excel等软件对数据进行处理,探索了PM2.5的成因、演变等一般性规律,结合所得结果为当地政府提出了相关建议。
关键词:空气质量;主成分分析;高斯烟羽扩散模型
中图分类号:X51 文献标识码:A 文章编号:1674-9944(2017)2-0045-04
1 引言
PM2.5的出现给人类治理环境污染带来了巨大的挑战。四川作为全国著名的“天府之国”,由2014年的全国第八经济大省到2015年成为第六经济大省,体现出四川省近年经济发展迅速。成都作为其省会城市,更要在经济发展的同时,关注环境状况,坚持走可持续发展的道路。PM2.5无论对人体健康还是对生态环境都具有极其恶劣的影响。国务院于2012年同意新发布的《环境空气质量标准》增加了PM2.5监测标准[1], 全国科学技术名词审定委员会在2013年将PM2.5的中文名称命名为细颗粒物。PM2.5的主要来源是工厂废气、秸秆焚烧、汽车尾气排放等。人们在生活、学习、工作中都离不开这些活动,可以说人类是PM2.5的制造者。成都市的雾霾此消彼长,各种疾病“纷至沓来”。在雾霾污染的高压下,人们对PM2.5的关注程度越来越深入。张怡文(2015)[2]使用神经网络模型对PM2.5的浓度进行预测,该方法精度较高,但是对样本数据采集的要求过高,实际应用价值不高。马小铎(2015)[3]使用近几年采集到的数据,通过对这些数据的研究,找到了PM2.5污染物的各种理化影响因素之间的相关关系和扩散与消退的一般规律。因此,对PM2.5影响因素的研究,有助于更深刻地了解问题,同时能够提出更具建设性的治理建议。
2 主成分分析
2.1 基本思想
在统计学中,经常使用原始指标的线性组合所构成的综合指标来代替原有的指标,即:
Yi=li1X1+li2X2+…+lipXp,i=1,2,…,p
要求Yi尽可能地反映原有P个变量的信息。这里的“信息”用Yi方差来度量,即要求var(Yi)=lT∑l1达到最大,为此需要对系数向量加以限制即满足约束条件:
lt1l2=l211+l212+…+l11p=1
求l1使var(Y1)取最大值,由此l1所确定的随机变量Y1称为随机变量X1,X2,…,Xp的第一主成分。
如果第一主成分还不足以反映原变量的信息,则进一步求Y2,为了使Y1和Y2所反映原变量的信息不相重叠,要求Y1和Y2不相关,即Cov(Y1,Y2)=lT∑l2=0。于是,在约束条件lT2l2=1,lT∑l2=0下,求l2使得var(Y2)达到最大,由此l2所确定的随机变量Y2称为X1,X2,…,Xp的第二主成分。
一般地,求第i个主成分Yi,则要求其系数及主成分满足以下条件。
(1)系数向量是单位向量,即:
l2i1+l2i2+…+l2ip=1,i=1,2,…,p;
(2)不同的主成分不相关,没有重叠信息,即:
Cov(Yi,Yj)=0,(i≠j,i,j=1,2,…,p);
(3)各主成分的方差递减,重要性递减,即:
var(Y1)≥var(Y2)≥…≥var(YP)≥0;
Y1,Y2,…,Yp依次稱为第一主成分,第二主成分,…,第p个主成分。
2.2 计算步骤
(1)数据的无量纲化,由于所选取的变量具有不同的单位和不同的变异程度。不同的单位常使系数的实践解释发生困难。为了消除量纲影响和变量自身变异大小和数值大小的影响,故将数据标准化。
设有n个样本,p项指标的数据矩阵为:
X=x11x21…xn1
x12x22…xn2
x1px2p…xnp
令yij=xij/Sj,Sj=1n-1∑ni=1(xij-j)2,j=1n∑ni=1xij,i=1,2,…,n;j=1,2,…,p。
则Y=y11y21…y1p
y12y22…y2p
yn1yn2…ynp实现无量纲化。
(2)采用线性相关系数研究[4],构造矩阵Y的实对称矩阵,相关系数矩阵R。
R(X,Y)=∑ni=1(xi-)(yi-)∑ni=1(xi-)2∑ni=1(yi-)2,
其中R(X,Y)表示二者之间的线性关系系数,R(X,Y)越接近1表明X,Y越相关,
反之它的值越接近0,表示二者之间的相关性不明显。
根据2016年1~8月成都市空气质量历史数据,使用MATLAB软件分别计算出AQI基本监测指标中PM10,SO2、CO、NO2、O3与PM2.5的相关系数,得到的相关系数矩阵见表1。
(3)计算R的特征值与相应的特征向量,得到的结果如表2所示。
(4)根据特征值计算累计贡献率,确定主成分的个数,而特征向量就是主成分的系数向量,计算结果见表3。
一般按照前n个主成分的累计贡献率达到85%以上的原则,选择前3个主成分,它们的主成分公式分别为:
F1=-0.4745x1-0.472x2-0.3813x3-0.4432x4-0.4576x5+0.0302x6
F2=-0.0693x1-0.0195x2+0.3025x3-0.1986x4+0.0932x5+0.9248x6
F3=0.2325x1+0.1931x2-0.8691x3+0.1583x4+0.1521x5+0.3244x6。
2.3 结果的分析
在第一主成分的表达式中第一、二、五项指标的系数较大,这三项指标起着主要作用,我们可以把第一主成分看成是由PM2.5、PM10、NO2组成的反映成都市空气质量指数的综合指标。在第二主成分中,第六项指标系数最大,远超过其他指标的影响,可单独看成是O3的影响。在第三主成分中,第一、三、六指标的影响大,且第三、六指标的影响尤其大,可将其看成是反映SO2、O3的综合指标。
3 成都市PM2.5的一般性演变规律
3.1 大气稳态下的高斯烟羽扩散模型
从应用角度出发,目前国内外在实际操作中使用的大气扩散模型,多属描述中等密度云扩散的高斯模型[5]及其变形模型。国家制定的《制定地方大气污染物排放标准的技术方法)(GB/T13201—91)亦推荐该模型。
由正态分布假设,可以导出下风向任意一点C(x,y,z)处污染气体浓度的函数为:
C(x,y,z)=A(x)e-ay2e-by2
由概率论可以写出方差的表达式:
σ2y=∫+∞0y2cdy∫+∞0cdy, σ2z=∫+∞0z2cdz∫+∞0cdz(2)
由能量守恒得:
Q=∫+∞-∞∫+∞-∞cudydz
将(1)式带入(2)式积分得:
a=12σ2y,b=12σ2z
将(1)式和(4)式带入(3)式,积分可得:
A(x)=Q2πuσyσz
将(4)式(5)式带入(1)式可得:
C(x,y,z)=Q2πuσyσzexp[-12(y2σ2y+z2σ2z)]
其中C为任意点的污染物浓度,单位为g/cm3;Q为源强,即点释放速率,单位为g/s;u为风速,单位为m/s;σy,σz分别为水平扩散参数和垂直扩散参数且与大气稳定度和水平距离x有关,并随x的增大而增大。y,z分别为水平方向距离和垂直方向距离,单位为m;当y=0,z=0时,A(x)=C(x,0,0),即A(x)为x轴上的浓度,也是垂直于x轴截面上污染物的最大浓度点Cmax。当x→∞,σy及σz→∞,则C→0,表明污染物已在大气中得以完全扩散。
按照Pasquill的分类方法[6],随着气象条件稳定性的增加,大气稳定度可以分为A,B,C,D,E,F六类(表4)。
取成都市实时监测2016年4月14日的数据,温度在11~ 25℃之间,风向风力为南风微风,换成风速为3.4~5.5 m/s,可以认为D类大气稳定度,所以扩散系数的取值为σy=0.08x/(1+0.0001x)0.5,σz=0.06x/(1+0.0015x)0.5,设点源污染强度Q=2000 g/cm3。将参数代入方程(6),用MATLAB软件[7]绘出图1。
3.2 结果的分析
通过图1,可以看出,距离污染点源下风向一定距离处,污染扩散浓度近似呈现正态分布[8],在扩散中心处附近达到最大值,当横向距离达到一定值以后,扩散浓度降低到零。成都市的PM2.5检测数据均来自成都城区8个监测点,分别为灵岩山、君平街、大石西路、梁家巷、沙河铺、金泉两河、三瓦窑、十里店8个监测点,其中灵岩山为清洁对照点,位于都江堰。PM2.5扩散的同时也不断在衰减。
4 总结与建议
研究表明,PM2.5严重危害身体健康,而成都市大片地区的PM2.5的浓度高于标准限值。随着经济的发展,工业生产排放的废气和机动车辆排放的尾气增加迅速,导致大气中的悬浮物大量增加。空气中颗粒物浓度的增加,使雾霾频频出现。如今很多城市的污染物排放水平已处于临界点,对气象条件非常敏感,空气质量在扩散条件较好时能达标,一旦遭遇不利天气条件,空气质量和能见度就会迅速下滑。虽然我国许多城市都对PM2.5进行过一定的研究,但是数据来源均来自于较少监测点的间断性监测,监测的方法也是有所差异,导致不能对PM2.5的污染机制有着深刻性了解。在此,以中国政治经济发展中非常重要的大型城市成都为例,希望可以为其他相关或者后续的研究提供参考。同时,以上所用模型及研究方法对其他地区的空气污染状况的分析也具有一定的参考作用。
在此,提出以下建议:①外出戴上专门的口罩,由于普通口罩无法有效抵挡微小颗粒物进入鼻腔,因此想要抵挡PM2.5就需要佩戴专门的医用口罩。②出门尽量坐公交,随着私家车的不断增加,汽车的尾气排放量也呈指数型增长,多乘坐公交,可以为减少PM2.5做出贡献。③严禁焚烧秸秆,每逢秋收之后,秸秆焚烧现象比比皆是,然而每次的焚烧给环境带来了巨大的破坏,在秸秆不完全燃烧的情况下会产生很多属于PM2.5范疇的细颗粒物。为了避免让雾霾雪上加霜,当地政府要加强对焚烧秸秆的监管。
参考文献:
[1]中华人民共和国环境保护部.环境空气质量指数(AQI)技术规定[S].北京:中国环境科学出版社,2012.
[2]张怡文,胡静宜,王 冉.基于神经网络的PM2.5预测模型[J].江苏师范大学学报(自然科学版),2015,32(1):63~65.
[3]马小铎.影响PM2.5的理化因素及相关问题的模型研究[D].北京:北京交通大学,2015:15~28.
[4]郭红霞.相关系数及其应用[J].武警工程学院学报,2010,26(2):3~5.
[5]董 赫,翟 哲,李 夺.高斯烟雨扩散模型在空气中PM2.5实际问题的应用[J].黑龙江八一农垦大学学报,2014,26(3):69~73.
[6]李玉平.计算大气扩散系数的一组经验公式[J].北京理工大学学报,2009,29(10):914~917.
[7] 李柏年,吴礼斌.MATLAB数据分析法[M].北京:机械工业出版社,2012.
[8]尹 凤.大气污染物扩散的理论和实验研究[D].青岛:中国海洋大学,2006.
Research on Air Quality of Chengdu City Based on Gaussian Diffusion Model
Zhou Tongpu1, Chen Guoqing2
(1.School of Businiess and Management,Xihua University,Chengdu,Sichuan 610039, China;
2. School of Economics, Xihua University, Chengdu,Sichuan 610039, China)
Abstract: This paper, aiming at the PM2.5 problem in the air of Chengdu, constructed the principal component analysis model and Gaussian diffusion model from the six factors which affect the AQI index. The data were processed by MATLAB and Excel. It also explored the causes, evolution and other regular laws of PM2.5. Combined with the results, wehoped to make recommendations for the local government.
Key words: PM2.5;air quality;principal component analysis;Gaussian diffusion model; MATLAB