宋晓辉,杜亮亮,李剑东,程晓丹,张 珺
(1.邯郸市气象局,河北 邯郸 056001;2.中国科学院大气物理研究所,北京 100029;3.河北省邯郸环境监测中心,河北 邯郸 056000)
随着城市规模扩大和工业化迅速发展,大气环境日益恶化,城市空气污染是当前全球大气环境和城市气候研究领域的热点和难点问题之一。我国长期积累的能源结构矛盾和粗放型经济增长方式使经济发展与自然环境的矛盾日益突出,城市空气质量问题已成为影响社会经济发展和居民生活的重要议题[1]。京津冀地区是我国北方最大的城市群和经济核心区,也是北方大气污染最严重的区域之一,京津冀空气质量指数的年均高值中心位于河北中南部,首要污染物浓度冬季高而夏季低,天津和石家庄空气质量最差的时段均为1和12月,京津冀供暖季污染物浓度明显高于其他季节[2-3]。因此,研究京津冀地区城市采暖期的环境污染特征是近年来我国大气污染研究及治理的热点。
城市空气质量与污染物排放、地形地貌和气象条件等诸多因素有关[4-9]。气象要素是制约空气污染物稀释、扩散、迁移和转化的重要因素[7]。研究表明,北方大城市空气污染与当地风向、降水、大气稳定度等气象条件关系密切[7];重污染天气过程多发生在静稳天气形势下,污染物主要来源为本地排放和外来输送[10-12],而城市空气污染加重、维持、消散的过程主要取决于本地空气污染源的排放规模以及影响空气污染物汇聚与扩散的气象条件[13-16];人为排放及不利气象条件的综合作用使得京津冀地区空气污染事件频发[17]。明确城市的空气污染特征及开展有效的空气质量预报已成为京津冀地区大气环境研究和社会经济发展的迫切需求。
当前的空气质量预报研究主要采用统计预报模式和数值预报方法,发达国家自20世纪60年代起先后建立了大气污染数值预报业务系统[18-20]。20世纪80年代起,国内直辖市和省会城市先后开展了空气污染预报方法研究,早期主要为污染潜势预报,选取表征大气扩散稀释能力的气象因子,通过组合加权计算潜势指数,对空气污染状况进行定性或半定量的判断[21-22];随着数值模式的发展和计算机性能的提高,利用数值模式进行空气质量预报的研究越来越多,学者们采用多元线性回归和神经网络等方法,通过建立污染物浓度与气象因子间的统计预报模型,实现了污染物浓度的定量预报[23-25]。人工神经网络是具有较强非线性映射能力、自学习能力和自组织能力的技术,可通过训练获得输入和输出之间的非线性关系并解决复杂问题,近年来已成为空气质量预测领域的重要研究技术[26-28]。
近年来,京津冀特大城市(特别是北京)的污染物局地排放已得到有力控制,城市空气质量也在稳步提升[17]。然而,邯郸等具有相当人口与经济规模的区域城市空气质量问题还很严重。邯郸地处太行山脉东麓和华北平原南部,主城区常住人口近360万,为京津冀Ⅰ型大城市。邯郸属温带大陆性季风气候区,常年盛行偏西风,太行山的阻挡和背风坡气流下沉作用使得沿保定—石家庄—邯郸一线的污染物不易扩散,形成大气高污染带[14-17]。2013年以来,邯郸虽然在转型发展、结构调整方面取得了一定成效,但空气质量水平一直位于全国重点城市环境空气质量综合指数排名后10位,大气污染治理形势依然严峻。目前,邯郸这类城市的区域大气环境数值预报服务尚在起步阶段,还无法满足业务与服务需求。因此,急需探究适用于此类城市环境污染的统计预报方法,这对于京津冀地区的空气污染特征、空气质量的预报及治理具有重要的现实意义。
该研究利用邯郸环境监测数据和同期气象观测数据,对该市采暖期环境污染(包括空气质量与环境气象条件)的时间演变特征进行分析;在此基础上,采用统计方法选取影响当地空气质量的关键气象因子,重点利用BP神经网络进行邯郸采暖期空气质量的预报研究。研究结果可为京津冀区域城市大气污染和空气质量预报研究提供有价值的科学参考。
研究所用气象资料由河北省气象信息中心提供,包括邯郸国家基本气象观测站2013—2017年的地面观测资料及同期的大气静稳指数与混合层高度等。空气质量资料由河北省邯郸环境监测中心提供,包括环保局、丛台公园、东污水处理厂和矿院4个监测站点2013—2017年的6种空气污染物数据,即SO2、NO2、PM10、PM2.5、CO(95)(CO日均值的第 95百分位数)和O3-8(90) (O3日最大8 h值的第90百分位数)的空气质量指数(AQI)和质量浓度(图1)。
图1 邯郸市气象及空气质量监测点位置示意
2013—2016年的资料用于分析气候特征,2017年的资料用于预报研究。该研究中邯郸采暖期定义为11月15日至次年3月15日。
首先采用相关性分析筛选空气质量的预报因子,再分别利用多元线性回归和BP神经网络2种统计方法建立基于气象要素的采暖期逐日污染物浓度的预报模型,进行空气质量预报;通过与同期污染物浓度观测值及线性回归模型预报结果的比较来检验BP神经网络对邯郸市空气质量的预报效果。
1.2.1预报因子的筛选
考虑到前期空气污染物的累积直接影响后期的空气污染程度,因此,选取前一日6种污染物质量浓度作为预报因子;初步选取直接或间接影响大气污染、有明确物理意义的气象因子(69个),包括邢台探空站的逆温、850和925 hPa高度、气温、露点、风速、混合层高度以及气象测站的气温、气压、湿度、风、能见度、露点和静稳指数等。在2013年1月—2017年3月的采暖期共收集邯郸市区各类污染物质量浓度有效资料478条。通过相关性分析可知,除O3-8(90)外,其他5种污染物质量浓度与前一日污染物质量浓度、静稳指数、逆温、相对湿度和露点温度等呈明显正相关,与气温、风速、能见度和混合层高度等呈负相关;O3-8(90)与其前一日质量浓度、温度、露点和混合层高度呈正相关,与其他5种污染物前一日质量浓度、静稳指数、气压和相对湿度等呈负相关;选择相关系数大的因子作为预报因子,同时考虑同一种污染物中各个因子是否类别相近,例如当08:00气温和日平均气温同时入选时,则只选择相关性最佳的因子,舍去其他同类别因子,而不同时刻的相关因子则不进行剔除。按照以上原则确定12~14个采暖期各类污染物质量浓度的预报因子。
1.2.2线性回归预报方法
利用SPSS软件的多元线性回归计算功能,按照经前述相关分析确定的各类污染物影响因子对预报值的影响程度,由大到小逐个引入回归方程,采用F检验,当候选变量中最大F值的P值≤0.05时,引入相关变量;在引入的变量中,最小F值的P值≥0.1时,则剔除该变量;最终无显著因子可以引入且无不显著变量需要剔除时,建立各类空气污染物质量浓度的线性回归预报模型。
1.2.3BP神经网络预报方法
大气环境受多重特征因子影响,且主要特征因子之间的关系非常复杂,有极为显著的非线性特征,BP 神经网络具有良好的非线性处理能力[29-30],是笔者重点采用的统计方法。研究利用MATLAB数学软件的神经网络计算建立6种污染物浓度的BP神经网络预报模型。首先对经过上述线性回归方法筛选出的各类污染物的最优样本进行数据归一化处理,选出训练样本和测试样本,利用训练样本建立BP神经网络模型;使用3层网络结构和S型神经元传递函数,通过选择不同训练函数和改变隐层节点数的方法,选取最优训练样本建立BP神经网络,并挑选出最优网络模型。其中,PM2.5的神经网络结构中输入层、隐含层节、输出层的节点数分别为7、10和1,PM10为7、10和1,SO2为8、10和1。
1.2.4预报结果的评估方法
通过平均绝对误差(EMA)、平均相对误差(EMR)和时间相关系数(r)对2种统计预报方法所得污染物浓度进行分析评估。计算公式分别为
(1)
(2)
(3)
2013—2016年邯郸主城区6种污染物AQI的时间变化特征见图2。由图2可见,PM10、SO2和PM2.5的AQI月变化趋势基本一致,均呈单谷型分布,1—5月逐渐下降,夏季为低谷,9月逐渐上升;O3-8(90)呈单峰型分布,1—5月逐渐上升,之后逐渐下降;NO2的月变化相对平缓,冬半年略高;CO(95)的月变化更为平稳。除O3-8(90)污染物之外,其他5类污染物AQI表现为冬半年高于夏半年。
从6种污染物AQI的四季变化(图2)可知,SO2冬季最高,春季次之,夏季最低;PM2.5和NO2冬季最高,秋季次之,夏季最低;PM10冬季最高,春季次之,夏季最低;CO(95)四季均较其他5种污染物略低,冬季略高;O3-8(90)夏季最高,春季次之,冬季最低。仅O3-8(90)的采暖期AQI均值低于年均值,其他5种污染物采暖期AQI均值都高于年均值。这表明采暖期是邯郸空气质量最差的时段,需要进一步结合当前的环境气象条件特征分析采暖期空气质量的影响因子。
很多研究已表明水平风速较小时空气流通能力差,不利于空气污染物水平扩散;低层相对湿度高有利于SO2的吸湿增长;逆温层抑制了空气垂直交换,造成水汽和气溶胶在近地面层聚集;静稳天气指数高说明环境气象条件不利于空气污染物扩散。对邯郸站2013—2016年间风、降水量、相对湿度和静稳天气指数等气象条件的分析可知,邯郸环境气象扩散条件夏半年优于冬半年,春季水平扩散能力最强,冬季(尤其是采暖期)最差。
表1为2013—2016年采暖期、非采暖期及全年的平均气温、降水量、相对湿度、风速和小风(日平均风速≤2.0 m·s-1)日数占比分布情况。邯郸采暖期平均气温为2.72 ℃,低于全年均值(15.04 ℃)和非采暖期均值(21.15 ℃);采暖期平均降水量为32.3 mm,仅占全年平均降水量的5.6%,明显低于非采暖期降水量(540.1 mm);采暖期平均相对湿度为57.67%,小于非采暖期(62.93%)和全年均值(61.17%);采暖期平均风速为1.97 m·s-1,与非采暖期(2.08 m·s-1)和全年均值(2.05 m·s-1)较为接近;在研究时段内,采暖期的小风日数总计为357 d,非采暖期为516 d,总计873 d,占比分别为73.6%、52.9%和59.8%。
表2为2013—2016年邯郸平均逆温和静稳天气指数。从第1层逆温(邢台高空站08:00探测资料)来看,采暖期第1层逆温的平均底高为380.6 m,低于非采暖期(469.0 m)和全年均值(434.7 m);平均顶高为624.7 m,较非采暖期(688.3 m)和全年均值(663.9 m)略低;平均逆温层厚度为244.1 m,高于非采暖期(217.0 m)和全年均值(227.9 m);采暖期第1层逆温的平均逆温差最大(4.1 ℃),平均逆温强度最强〔2.7 ℃·(100 m)-1〕;采暖期的平均静稳天气指数为10.8,高于非采暖期平均(9.0)和全年均值(9.6)。
图2 2013—2016年邯郸6种污染物空气质量指数(AQI)的月变化、季节变化、年均值及采暖期均值变化
表1 2013—2016年邯郸采暖期、非采暖期和全年环境气象条件的比较
邯郸采暖期气象条件的逐月变化见图3。月平均气温由低到高依次为1、12、2、11和3月;平均本站气压由低到高依次为3、11、2、12和1月;平均相对湿度由低到高依次为3、2、1、12和11月;平均风速1、11和12月均为1.9 m·s-1,2月略高,3月最大。从采暖期气象要素的日变化情况来看,平均气温自0时开始逐渐下降,7时最低,之后逐渐上升,15时达最高,后逐渐下降;平均相对湿度自0时缓慢上升,7时最高,之后下降,15时达最低,随后逐渐上升;平均风速0—8时维持在低值,之后上升,14—15时达峰值,随后逐渐下降。
表2 2013-2016年邯郸采暖期、非采暖期、全年平均逆温和静稳天气指数
图3 2013—2016年邯郸采暖期环境气象条件月变化和日变化
上述分析表明,邯郸采暖期降水少,温度低,湿度和风速小,而且小风出现频率明显高于非采暖期。采暖期局地逆温强,静稳天气指数高,为邯郸全年环境气象条件最差的时期。在采暖期内,1月环境气象条件最差,12月次之,且环境气象条件白天好于夜间,尤以5—7时最差。
邯郸采暖期的首要空气污染物为PM10、PM2.5和SO2[13]。基于2种统计预报方法获得2017年1月1日—3月15日这3种污染物质量浓度预报值与实测值的时间序列(图4)。
图4 2017年采暖期污染物质量浓度的逐日观测值与预报值对比
对2种方法的PM10预报值与观测值进行对比,3条曲线的变化趋势大体相同。1月1—10日和2月9—14日,2种方法的预报值波动滞后于观测值;1月1—8日BP模型预报值较实况值偏高,线性回归预报值则偏低;1月11—26日预报值的波动与观测值一致,其中1月9—16日BP模型的预报值略低于线性回归预报值,但均较接近观测值;1月18—27日BP模型预报值及波动更接近观测值;1月30日—2月14日2种方法的预报值波动滞后于观测值;2月15日—3月11日BP模型预报值的拟合效果优于线性回归。在67个有效数据中,43个BP模型预报值更接近实况,占比为64%;线性回归和BP模型预报值的平均绝对误差分别为64.69和51.96 μg·m-3,与观测时间序列的相关系数分别为0.78和0.87。
2种方法的PM2.5预报值与观测值对比,3条曲线的变化趋势虽基本相同,但BP模型预报值的波动更接近观测值,真实性好于线性预报模型。在67个有效数据中,41个BP模型预报值较线性预报值更接近实况,占比为61%;线性回归和BP模型预报值的平均绝对误差分别为45.05和37.81 μg·m-3,与观测时间序列的相关系数分别为0.81和0.89。
2种方法的SO2预报值与观测值对比,3条曲线的变化趋势基本相同,BP模型的预报值波动更接近观测值,真实性好于线性预报模型。在67个有效数据中,35个BP模型预报值与观测值的差值小于线性回归模型预报值与观测值的差值,占比为52%。线性回归和BP模型预报值的平均绝对误差分别为23.84和20.28 μg·m-3,与观测时间序列的相关系数分别为0.83和0.86。
表3为2种方法预报的6种污染物质量浓度的平均绝对误差、相对误差以及2种方法预报值与同期观测值的相关系数。6种污染物浓度线性回归预报值的平均相对误差为0.11~0.43。其中,NO2的平均相对误差最小,SO2次之,PM2.5平均相对误差最大,为0.43。线性回归预报值与实况值的相关系数为0.72~0.83。
BP神经网络模型预报的6种污染物质量浓度的平均相对误差为0.09~0.36;其中NO2的平均相对误差最小,PM10和SO2次之,O3-8(90)平均相对误差最大。BP神经网络模型预报值与实况值的相关系数为0.72~0.89。这说明BP神经网络对6种污染物浓度的预报误差均低于线性回归。2种方法预报值与实况值的相关系数相比,除O3-8(90)基本一致外,BP神经网络模型污染物浓度预报值与实况值的相关系数均高于线性回归模型,说明BP神经网络的预报效果优于线性回归模型。
BP神经网络对各类污染物质量浓度的预报误差明显低于线性回归模型。与线性回归模型相比,BP神经网络对于PM10预报值的平均绝对误差和相对误差分别减少19.8%和27.8%;PM2.5预报值的平均绝对误差和相对误差分别减少16.1%和25.6%;SO2预报值的平均绝对误差和相对误差分别减少14.9%和18.8%。
表3 BP神经网络和线性回归模型的预报误差及其与实况值的相关系数
以上分析表明,BP神经网络模型能够很好地描述污染物质量浓度与其影响因子之间的非线性关系,预报精度高于线性回归模型。在邯郸采暖期空气质量预报中,BP神经网络的预报效果较线性回归模型明显提高,应用于空气质量预报是可行且有效的。
该研究分析了邯郸环境污染特征(空气质量和环境气象条件),重点采用BP神经网络模型对邯郸采暖期6种空气污染物质量浓度进行了预报研究,并利用同期观测值及线性回归模型对预报结果进行了检验。
(1)邯郸空气污染物PM10、PM2.5、SO2、NO2和CO(95)的AQI均呈单谷型分布,冬季最高,夏季最低,AQI均值表现为冬半年高于夏半年,O3-8(90)的AQI变化趋势则相反;除O3-8(90)外,其他5种污染物的采暖期AQI均高于年均值,空气污染最重,首要污染物以PM2.5和PM10为主。
(2)邯郸采暖期降水少,温度低,湿度和风速小,而且小风出现频率明显高于非采暖期,局地逆温强,静稳天气指数高,为全年环境气象条件最差的时期。在邯郸采暖期内,1月环境气象条件最差,12月次之,且环境气象条件白天好于夜间,尤以5—7时最差。
(3)邯郸采暖期主要污染物质量浓度与前一日污染物浓度、静稳天气指数、逆温、相对湿度和露点温度等呈正相关,与气温、风速、能见度和混合层高度等呈负相关。BP神经网络对6种污染物的预报值与实况值的相关系数均高于线性回归模型,平均相对误差和平均绝对误差均较线性回归模型明显降低,且采暖期主要污染物PM10、PM2.5和 SO2的预报误差更低,预报效果明显优于线性回归模型。
由于数据来源的限制,该研究采用的邯郸空气质量资料时长较短,所以结论有一定的局限性。后续工作需要采用更长时间序列的空气质量和环境气象资料来优化统计预报模型,同时结合环境数值预报结果,进一步提高邯郸市的空气质量预报精度和时效。