孙明明 程路明 张 杰
(郑州大学 水利与环境学院,河南 郑州450001)
在郑州市九个监测点中,市监测站离市中心近,人口密度大,污染严重,故选取市监测站作为研究对象。以2014年3月01日到5月31日共92天数据为例,每天0点到22点共12组偶数点的AQI六个指标值(数据来自国家环境保护部)。针对指标单位的不统一,首先对数据进行无量纲化和归一化。对于一个参考数据x0,比较数列的为xi,可用下列关系表示各比较曲线与参考曲线在各点的差[1]:
式中,ξi(k)是第k个时刻比较曲线xi与参考曲线x0的相对差值,这种形式的相对差值为xi对x0在k时刻的关联系数。ζ为分辨系数,ζ∈[0,1],取ζ=0.5。92组相关系数的分析如表1所示。
表1 关联系数分析表
由表中分析得到,O3与PM2.5的相关性最低,可认为O3与PM2.5低度相关,其余皆为中度相关。除O3外,其余指标相关度较高,因此剔除O3后,可以使用多元线性回归作为PM2.5分析模型,建立PM2.5关于SO2、NO2、CO、PM10的多元线性回归模型。
郑州市PM2.5数据是从2013年11月份开始,选取2013年10月29日到2014年5月31日217组郑州市每天的PM2.5、SO2、NO2、CO、PM10值作为数据,进行线性回归分析(数据来自国家环监总站)。拟合出PM2.5与其它4个指标的回归方程(置信水平取为:1-0.05)。
第一次进行拟合时,存在残差置信区间未经过0点的数据,视为异常点,剔除这些数据后再进行线性回归分析。以此反复,直到不再出现异常点为止,得到线性回归方程:
PM2.5=-26.330+0.6633PM10+25.0695CO-0.6103NO2-0.0603SO2
由图可知没有异常点,置信区间皆经过0点。计算回归方程的相关系数r2为0.957 2,接近于1,表示方程的回归程度较为显著。F为843.727 4,F>F1-α(k,n-k-1)=F1-0.05(4,151),其对应的概率为0,小于显著性水平α0.05,说明回归模型较为显著,模型成立[2]。
图1 线性回归残差分析图
取郑州市2014年6月1日到6月26日30天PM2.5数值作为模型反演数据,对比PM2.5模型计算数值和真值。由图中可以看出,回归模型能够很好地反映出真值的变化规律,但在某些点差距较大,为检验拟合效果,对30组模型计算值和真值的误差绝对值进行统计,得到表2。
表2 30组模型计算值和真值的误差绝对值统计
由表中得到:6月份作为检验对象的30天数据中,误差小于15的有22天,占全月的73.33%。因为AQI的危害等级划分中相邻等级之间数值相差50,而且每个等级的波动范围为50[3],所以回归模型计算结果能够满足空气质量等级划分的准确性。
图2 PM2.5真值与回归模型对比图
通过对郑州市2014年市监测站3月1号至5月31号AQI指标的相关性分析,得出与PM2.5相关性最高的是PM10,说明郑州市近一年内主要污染物是大颗粒物质。而在2013年至2014年郑州市先后进行了修建地铁、整修文化路等工程,所以为改善空气质量,减少施工污染是首要任务。
排除与PM2.5相关性低的O3后,对PM2.5进行了线性回归拟合,拟合结果能较好地反映PM2.5的变化规律,满足空气质量等级的划分要求,PM2.5多元回归模型可适用于空气质量等级的预测。该模型同时表明PM2.5的形成与AQI指标因素变化有关系,在研究PM2.5成因的问题时,可考虑PM2.5由AQI指标因素转化而来这个途径。
[1]杜栋,庞庆华,吴炎.现代综合评价方法与案例精选(第二版)[M].北京:清华大学出版社,2008.
[2]江世宏.MATLAB语言与数学实验[M].北京:科学出版社,2007.
[3]GB3095-2012.环境空气质量标准[S].中华人民共和国国家标准.