叶景山,周富杰,黎哲镇,温永仙
(福建农林大学 计算机与信息学院,福建 福州 350002)
改革开放以来,我国经济发展迅速,人民生活水平不断提高,对健康越来越重视。空气污染是影响人民健康的一个重要因素,它会引发多种疾病,甚至死亡,世界卫生组织(WHO)提供的数据表明,每年因空气污染造成的死亡数达700万[1-3]。因此我国对空气质量十分重视,为了更好地监测、管控空气质量,环保部在新发布的《环境空气质量标准》(GB 3095—2012)中增加了PM2.5、CO与O3指标,同时降低了PM10、SO2及NO2标准限值[4-5]。分析城市的空气质量指数,可为环保部门应对污染风险、增强环境保护手段提供参考依据,具有重要的理论意义与实践价值。
空气质量指数(air quality index,AQI)是定量描述空气质量状况的无量纲指数[6],它是将几种常规监测的空气污染物浓度按一定的标准综合成为单一的数值形式[7-8]。AQI具有比空气污染指数 (air pollution index,API)更加权威,更加全面地衡量空气质量状况等优势[9],因此,AQI被广泛用于空气质量的研究中。首先是空气质量的预测,能提前知道空气质量情况,就能更好地应对空气质量差的情况,更有利于人的健康。在AQI预测方面,有基于神经网络及其改进的方法[10-13],薛俭和徐艳利用O-U模型对北京、天津以及石家庄的AQI进行预测[14],刘洪通等基于Storm建立了AQI实时预测模型[15],杨丰玉等考虑了风力因素[16],王晓玲等考虑了气象因素对AQI进行预测[17]。其次针对空气质量时空分布的问题,刘华军和杜广杰结合了基尼系数测度、空间统计分析以及核密度方法对中国城市大气污染的空间格局与分布动态演进进行了研究[18]。姜磊等结合全域空间自相关、自然正交函数和空间描述性统计的方法来探索研究城市AQI的时空动态变化特征[9]。还有一些其他的相关研究,例如,高庆先等通过研究中美AQI的差异,提出AQI计算方法的一些问题[19]。谢珺怡研究了AQI对股市的影响[20],姜磊等对AQI的社会经济影响因素进行分析[21]。
本文对福建省空气质量情况进行研究,目前对福建省空气质量的研究比较少,曾艺芳等利用多元回归分析方法结合Arc GIS图分析了福州市的AQI时空分布特征及其影响因素[22]。杨春霖利用灰色聚类分析方法对闽侯县空气质量进行评价[23]。本研究拟采用函数型主成分分析方法提取主成分,结合Arc GIS图对福建省空气质量情况进行分析,同时利用函数型主成分分析得分图对福建省9个地级市的空气质量进行分类、分析。
福建省地处中国东南沿海,东经115°50′~120°43′,北纬23°33′~28°19′之间,与台湾岛隔海相望。福建土地总面积相对较小,约为1.21×105km2,排在全国23位。福建大部分属于亚热带季风气候,又处于沿海地区,所以雨热资源丰富且雨热同期,十分适宜植物生长。再加上地形并不平坦,多丘陵,素有“八山一水一分田”的说法,导致很多地方并不适宜耕种。福建的地形及气候条件适合林木的生长,第九次全国森林资源清查结果表明,福建省森林覆盖率连续四十年居全国第一,森林覆盖率达到66.8%[24]。森林覆盖率越高,在一定程度上意味着环境会越好,空气质量也就越好,因此福建省的空气质量相对较好。
数据取自于PM2.5历史数据网站(https://www.aqistudy.cn/historydata/),本研究中截取2018年福建省各市每日的AQI数据以及2015—2018年各市的月度AQI数据。宁德市的数据在2018年4月29日和2018年4月30日有缺失,采用2018年数据完整的363天的AQI平均值代替缺失值。
2.2.1 主成分分析
主成分分析也称主分量分析,是Hotelling在1993年提出来的[25]。主成分分析是将原有的多个指标简化成较少且具有代表性的综合性指标。假设有x1,x2,…,xp个变量,首先寻找一个线性组合f1。
并使其包含最多的变异性信息,也就是使得f1的方差达到最大,f1就是其第一主成分。随后,再寻找下一个线性组合f2。
在f1与f2互不相关条件下使得f2的方差达到最大,f2就是其第二主成分。依此类推,直至所有的变量信息被提取完毕。所以主成分分析就是用综合性指标代替原有的变量,即线性组合f1,f2,…,fk代替变量x1,x2,…,xp(k≤p),使其在包含绝大多数变量信息的条件下达到降维的目的。
提取的主成分个数与fi的贡献率有关,fi的贡献率是fi的方差与总方差的比值,第i个主成分fi的方差等于第i个特征值λi[25](所求出的特征值按照从大到小的顺序排列,第i个特征值代表该特征值在排序中第i位),所以主成分fi的方差贡献率可以用一个指标ωi来表示。
其中,第一主成分的贡献率最大,第二、第三主成分等的贡献率依次减少,而用于判断主成分提取个数的指标是前k个主成分的累计贡献率:
它是前k个主成分的贡献率之和,它表明前k个主成分综合原始变量xj(j=1,2,…,p)信息的能力,通常我们要求累计贡献率达到85%以上[26]。
2.2.2 函数型主成分模型
函数型数据分析[27](functional dataanalysis,FDA)最早是由Ramsay提出的,函数型数据是将数据以函数的形式表现出来[28],通常为光滑的曲线或连续的函数,其数据具有函数性。函数型主成分分析(functional principle components analysis,FPCA)是主成分分析的一种扩展[29-30],传统主成分分析的数据一般是向量形式,而FPCA的数据是连续的,是经典多元分析的曲线[31],是有限维度函数线性组合对无限维度的近似[32]。函数型主成分分析中离散的变量xj通过基函数平滑变为连续的函数x(s),此时,权重向量β变为权重函数β(s),所以
本研究利用R语言中傅里叶基函数对离散数据进行平滑,基函数个数K为65,用pca.fd函数计算函数型主成分,并画出相应的图进行分析。
原数据通过整理得到2018年福建各市每日AQI数据均值表(表1),2015—2018年福建各市每月AQI数据均值表(表2),2018年福建各市空气质量等级天数表(表3),并画出AQI的散点图(图1)。其中质量等级划分根据环保部于2012年发布的《环境空气质量指数(AQI)技术规定(试行)》里规定的质量等级标准进行划分[6](表4)。
表1 2018年福建省各市每日AQI数据均值表Tab.1 Daily average values of AQIof Fujian each city in 2018
表2 2015—2018年福建各市每月AQI数据均值表Tab.2 Monthly average value of AQI in Fujian each city from 2015 to 2018
表3 2018年福建各市空气质量等级天数表Tab.3 The number of days for air quality levels of Fujian each city in 2018
表4 AQI质量等级划分标准Tab.4 AQI quality level classification criteria
图1 福建省九个市在365天中每天AQI平均值的散点图Fig.1 Scatter plot of average daily AQI for nine cities in Fujian over 365 days
从图1的散点图可以看出,2018年福建省各市的AQI数据比较均匀,基本都在100以下,说明福建省空气质量总体很好,表3表明每个市都仅有少数几日有空气污染发生。而在第50 d(2月中旬)左右出现AQI数值异常偏高,该时间为2018年春节,AQI偏高可能是燃放烟花爆竹所致。
利用R语言进行函数型主成分分析,得到特征值及贡献率(表5),同时绘出特征值(图2),综合表5与图2,取前四个主成分pca1,pca2,pca3,pca4进行分析,累计总贡献率达到98.1%,包含原始变量绝大部分信息。
表5 函数型主成分特征值及贡献率Tab.5 Eigenvalue and contribution rate of functional principal components
图2 函数型主成分分析特征值Fig.2 Eigenvalues of functional principal component analysis
函数型主成分的结果给出了前四个主成分对均值函数的扰动图(图3),同时绘出主成分得分图(图4)。
图3 函数型主成分对均值函数的扰动图Fig.3 Perturbation diagram of the functional principal component to the mean function
从图3可以看出,第一主成分解释了58.5%的方差,其对均值函数的扰动与均值函数的趋势是相同的,说明第一主成分是能够影响污染物浓度的因素,是全年影响的,即非突发也非季节性,所以是工业废气,汽车尾气等污染源的排放导致AQI升高的重要因素。第二主成分解释了22.9%的方差,1月至3月中旬,5月下旬至8月下旬,11月中旬至12月末这些时间段促进AQI的升高(称为正效应),3月下旬至5月中旬,9月至11月上旬这些时间段使得AQI降低(称为负效应)。第二主成分的三个正效应时间段与福建农田休耕期一致,负效应时间段处于作物生长阶段,作物生长进行光合作用,净化空气,同时叶片等还能吸附一些固体颗粒物,减少了空气中污染物浓度。福建植被覆盖率大,影响效果较明显,所以第二主成分反映了作物对AQI的影响。第三主成分解释了11.6%的方差,其正效应出现在4月至7月,其它都以负效应为主。第三主成分效应比较集中,可能反映了一些人类活动的因素。例如,建设施工时会产生大量粉尘,完成清理后扬尘比原来少,因此后期出现负效应。第四主成分解释了5.1%的方差,其正效应主要是在1月至4月以及11月至12月,负效应主要出现在4月至9月,10月则基本持平,根据2018年的福建省气候公报可知,2018年秋季,主要是11月份,出现罕见的阴雨寡照天气,冬季容易出现连晴天气,春季多阴雨天气,2018年的雨季开始于5月1日,6月24日结束,同时6月至9月受多个台风影响,降水较多。邹琳等在研究南昌AQI时提到,降水会影响空气质量,降水量大时会降低AQI,而降水量小的时候会使空气中污染物浓度增大,从而增大AQI,同时连阴和连晴也会增大AQI。[33]这些正好与出现正负效应的时间及天气情况相吻合,所以第四主成分反映了降水对福建省AQI的影响。
图4 函数型主成分得分图Fig.4 Functional principal component score chart
利用ArcGIS软件对2018年福建省每日AQI均值数据,它是2018年福建省九个市365天的AQI数据平均值,即每个市2018年365天的AQI总和除以365(图5),2015—2018年福建省每月AQI均值数据,它是2015—2018年总共四年福建省每个月九个市的AQI数据平均值(图6),以及2018年福建各市的六种污染物的均值数据进行绘图(图7)。
图5反映的是2018年福建省AQI均值情况,从均值上看,2018年福建各市的AQI均值都在70以下,表明福建省总体空气质量良好。从区域上看,沿海城市总体空气质量差于非沿海城市,沿海城市经济发展更快,人口密度大,城市化程度高,汽车数量多,容易导致污染物浓度提升,使得AQI大于非沿海城市。具体来看,2018年南平、三明、龙岩及厦门的AQI均值不大于50,空气质量为优。其余市为良。图6显示的则是过去4年每月的AQI均值情况,其中厦门和福州的AQI均值大于2018年,通过计算得厦门和福州2015—2017的AQI均值分别为52和57,2018年为50和54,说明其2015—2017年的AQI均值大于2018年,表明2018年与前几年的综合情况相比,厦门和福州在改善空气质量方面有成效。
图5 2018年福建省各市的AQI均值空间分布图Fig.5 The spatial distribution of the average AQI for Fujian cities in 2018
图6 2015—2018年福建省各市每月AQI均值空间分布图Fig.6 Spatial distribution of monthly average AQI values in Fujian each city from 2015 to 2018
从图7可知六种污染物分布的具体情况,大体呈现出南北差异、沿海与非沿海的差异。从总体上来说,福建北部地区PM2.5、PM10和NO2的浓度相对福建南部较低些。SO2浓度呈现出非沿海地区高于沿海地区,而O3则正好相反,沿海地区O3浓度较高是因为沿海地区汽车数量较多,汽油挥发、尾气排放产生O3,导致其浓度高于非沿海地区。SO2主要来源是化石燃料的燃烧和硫化物矿石冶炼等,受重工业影响,非沿海地区SO2浓度高于沿海地区。CO浓度则是厦门、泉州和莆田一带较低,CO主要来源是原料燃烧和汽车尾气排放,而这一带需要通过原料燃烧的工业较少,所以CO浓度相对低些。具体来看,2018年漳州空气质量较差,除SO2外污染物浓度都较高,三明的SO2和CO浓度较高,南平空气质量较好,污染物浓度都较低。
图7 2018年福建省六种污染物的均值时空分布图Fig.7 Spatiotemporal distribution of the mean of six pollutants for Fujian each city in 2018
结合图4、图5和表2,对九个城市的空气质量进行分类。龙岩、三明、南平和厦门在同一个象限且AQI均值在同一区间,表明这四个城市的空气质量情况相似,归为一类。这四个城市空气质量以优为主,主要造成污染的是春节燃放烟花。宁德、泉州和莆田在同一个象限,归为第二类,特点是污染天数较多,空气质量为优和良的天数接近,漳州独在一个象限,却在泉州、莆田和宁德所在象限边缘附近,这是由于漳州污染天数与泉州、莆田和宁德相近,但漳州空气质量以良为主。福州独自在一个象限,与其他城市相比,福州空气质量天数都在中等的水平,所以福州自成一类。综上所述,如分成四类,则第一类为龙岩、三明、南平和厦门,第二类为宁德、泉州和莆田,第三类为福州,第四类为漳州。
随着科技发展,数据获取变得越来越容易,数据越来越密集,当数据无限稠密时会接近曲线,这时传统的离散数据分析方法变得不适用,函数型数据分析方法能解决这个问题,而主成分分析又有降维和简化指标的作用,所以用函数型主成分分析方法来研究空气质量指数特征是有意义的。通过函数型主成分分析方法对福建省AQI进行分析,提取的四个主成分是对AQI造成影响的四个因素,结合时空分布特征分析可知,AQI与经济发展程度、经济发展模式、人们生活习惯和气候条件等息息相关。经济发展程度越高,消耗资源越多,容易产生更多污染。经济发展模式则主要说明产业的不同,如重工业、轻工业以及农业、服务业等,会导致主要污染物类型的不同。人们生活习惯,例如出行,是选择公共交通、共享单车等较为环保的方式,还是自驾开车等。气候条件则是,降水,风力因素、温度、日照等等。福建省空气质量总体优良,但也存在一些差异,沿海地区的空气质量会略差于非沿海地区。
在上述分析中也发现了一些问题。首先是政策落实不是很到位,2018年春节福建省各市燃放了大量烟花爆竹,导致空气污染,龙岩和南平甚至重度污染。其次是汽车尾气以及工业废气排放很大程度上影响着空气质量,稻杆等作物剩余物的处理,人类建设活动导致的空气污染问题等。针对这些问题,提出一些建议。第一,必须继续坚持禁燃烟花爆竹的政策,并加强监督力度,一些重大活动必须得到特殊批准,可以适量燃放。第二,必须对工业废气严加管控,处理不达标的废气必须严禁排放,经济的发展不能以破坏环境为代价。同时相关部门应该督促有关企业进行技术革新,提高能源利用率。第三、建立相关的奖惩制度,违规了就应当按规定进行处罚,对做出较大贡献者也应该给予适当奖励。第四,提倡绿色出行,加强人民群众的环保意识,组织人员下基层宣传,学校学习教育等,只有每个人都有了这种意识,才会主动做到低碳、环保。总而言之,对于有些不可抗的自然因素,我们要学会预防,而人为的因素,则要努力从源头处理它,将它不好的影响降至最低限度。