我国城市环境空气质量预报主要模型及应用

2019-06-20 01:30宋鹏程张馨文杜云松

四川环境 2019年3期

宋鹏程,张馨文,黄强，龙平,杜云松

(1.绵阳市环境监测中心站，四川绵阳 621010；2.四川省环境监测总站，成都610091)

1 前言

城市环境空气质量预报能实现环境空气质量与重污染天气的提前预报，支撑政府制定防治策略，提醒公众提前防范，减少自身暴露，减轻污染。2013年国务院印发《大气污染防治行动计划》强调环保部门要加强与气象部门的合作，建立重污染天气监测预警体系[1]。到2014年，京津冀、长三角、珠三角区域要完成区域、省、市级重污染天气监测预警系统建设；其他省(区、市)、副省级市、省会城市于2015年底前完成。目前我国已形成国家-区域-省级-城市四级城市环境空气质量预报预警体系[2]，其中国家预报预警中心[3]主要负责国家层面的环境空气质量预报业务，并负责特别严重，影响范围大的跨区域、跨省市的大气污染过程预报，收集全国空气质量预报预警信息，构建全国环境空气质量预报信息网络。全国有京津冀及周边、长三角、珠三角、西北、西南、东北和华南七个区域预报预警中心[4]，负责区域内的环境空气质量总体协调及业务预报、数据共享与预报会商，参与重大活动环境空气质量保障，指导各省市精细化预报。省级预报中心主要负责辖区内的空气质量预警预报工作、省级业务预报预警工作、对地市级城市预报工作开展技术指导、组织开展重大活动环境空气质量保障等。城市级自行开展环境空气质量预报或者借助省级预报平台及技术支撑开展环境空气质量预警预报工作。

城市环境空气质量预报预警系统建设是一项复杂的系统工程，城市环境空气质量预报模型是实现空气质量准确预报和精准调控的核心工具。我国现行的城市环境空气质量预报模型包括统计预报和数值预报，国家-区域-省级-城市环境空气质量预警预报体系平台搭建时普遍选用多种统计预报和多数值预报模式，预报结果输出包括空气质量指数(AQI)、空气质量等级、六参数(SO2、NO2、CO、O3、PM2.5和PM10)质量浓度及首要污染物等，数值预报可同时输出气象要素(气温、气压、风速风向、边界层高度等)。

目前我国城市环境空气质量预报使用国外数值模型较多，平台搭建过程中对模型参数设置、污染源清单更新、气象参数模型和大气物理化学机理分析还存在缺陷，使得首要污染物、空气质量等级命中率等准确率较低，尤其是重污染天气。部分地区对预警启动时间、响应级别、污染影响范围、持续时间等关键问题判别略显不足，当城市环境空气质量预报模型预测可能出现重污染天气，并且达到相应预警级别时需要进行人工订正和部门联合会商，根据会商研判结果确定是否启动预警及响应级别。

2 统计预报

污染源排放、大气理化过程和气象条件是影响环境空气质量的主要因素[5]，统计预报通常忽略源排放量变化，视为常量，更多的是考虑天气形势或气象条件对空气质量变化的影响，借助历史的环境空气质量数据和同期气象观测资料(如温度、风速、风向、相对湿度等)通过统计学方法建立拟合方程或统计模型，外推得到未来空气质量预报结果。统计预报具有运算量少、硬件要求低、易于操作、简单实用等优点，常见的模型包括人工神经网络、多元线性回归、ARMA、动态统计等，优缺点见表1。

2.1 人工神经网络

神经网络算法一般用半经验的结果分析出污染物的变化趋势[12]。人工神经网络[13]通常由输入层、输出层和中间层(隐层)组成，上下层之间实现全连接，而每层神经元之间无连接，当样本提供给网络后，神经元的激活值从输入层经各中间层向输出层传播，在输出层的各神经元获得网络的输入模式，为逐层状态更新的前向传播。如果输出响应和期望输出模式有误差，不满足要求，则按照误差逆传播算法进行修正，当各训练模式均满足要求时学习结束。国家预报预警中心、西北、西南和华南区域预报预警中心、广西省、天津市和四川省等均采用神经网络统计模型，其中四川省采用基于神经网络法统计预报模型OPAQ[2](Operational Predication of Air Quality)，对辖区内绵阳市预报结果(2016年1月～2018年9月，表2)进行评估发现模型预报效果较好，由于模型具有动态偏差修正功能[14]能够对结果进行实时修正，预报与实况浓度变化趋势一致性较好，但在污染过程预报中存在明显的高值低估和低值高估现象，同时随着迭代次数的增多学习效率降低，进而收敛速度减缓，使得24h的首要污染物、空气质量等级准确率和空气质量等级命中率预报结果明显高于48h、72h和96h。

表2 2016年1月5日～2018年9月30日OPAQ模型预报结果Tab.2 Results of OPAQ forecast system from January 5,2016 to September 30,2018

备注：空气质量指数类别跨级预报(如“良至轻度污染”)与实测(如“良”)一致时，等级准确率为100%，空气质量等级的命中率为50%；非跨级预报与实测结果一致时等级准确率和等级命中率均为100%。

2.2 多元线性回归

多元线性回归具有方法简单、理论严谨等优点，使用较为广泛，其核心是关键参数的选择，由于地区差异，东南沿海、西南、西北和华北等地的气象关键参数差别较大，需结合本地特定的污染物浓度和气象参数之间的规律进行线性回归。一般采用逐步回归算法，对气象条件和非气象条件中所有参数按照对因变量Y(污染物预报浓度)影响的显著性程度大小进行回归，对因变量Y作用不显著的变量不引入方程，在引进新变量后不显著变量需剔除以保证最优方程，最优回归方程[15]:

Y=B0+B1X1+B2X2+B3X3+…+BnXn

其中Y为污染物预报浓度，B0为常数，X1、X2、X3、Xn为预报关键参数，B1、B2、B3、Bn为关键参数的系数。

西北、华南区域预报预警中心及沈阳市等均采用线性回归，其中沈阳市利用2013年1至2月空气质量数据进行逐步回归[16]方程建立，并选用2013年11月～2014年1月实测数据进行模型验证，由于建模样本量偏少使得空气质量等级(55.8%)和首要污染物(68.5%)较低，可结合前期预报评估结果，对输入参数、权重因子等进行优化，建立动态更新机制，提高预报准确率，减少人工订正。

2.3 小波多尺度分解改进的ARMA模型

小波分解改进的ARMA模型是选用Mallat算法[17]进行小波多尺度分解[18]，将信号逐层进行分解，每一层分解的结果将上层分解得到的低频信号再分解成低频和高频两部分，

Aj+1,k=∑mh0(m-2k)Aj,m

Dj+1,k=∑mh1(m-2k)Aj,m

式中：j为分解尺度；k、m为平移变量，为近似系数，是低频部分；Dj，k为细节系数，是高频部分；h0、h1分别是低通和高通滤波器。利用分解后的小波系数可以重构原来的序列，小波系数的重构见式：

3 数值预报

数值预报是以大气动力学理论为基础，在特定的气象场、源排放和初始边界条件下，基于大气物理化学过程(输送、扩散、转化和沉降等)建立大气污染浓度在空气中的输送扩散模型，借助模型来预测大气污染物浓度。目前国内普遍使用的模型包括NAQPMS、CMAQ、CAMx、WRF-Chem等，数值预测结果仍具有不确定性，主要取决于预报的偏差，偏差客观上均源于污染源清单、气象初始场、大气污染物监测初始场及大气化学反应机理的完整性和准确性[4]。

3.1 嵌套网格空气质量预报模型系统

嵌套网格空气质量预报模型系统(NAQPMS)是在充分借鉴数值预报模式优点的基础上由我国自主研发的三维欧拉化学传输模型，该模型由基础数据系统、中尺度天气预报系统、空气质量预报系统及预报结果分析系统等构成[19]，基本构架见图1，其中基础数据系统包括下垫面资料、污染源资料、气象资料和大气污染物实时监测资料四部分。NAQPMS系统突破了我国区域大气复合污染建模原理和预报关键技术，充分考虑了自然源对城市空气质量的影响，设计了东亚地区起沙机制模型，实现了基于全国城市空气质量监测网络的大气化学资料同化，也考虑了平流、扩散、化学反应过程(包括气相化学、液相化学、气溶胶化学和非均相反应)、干湿沉降等过程，同时耦合了污染源识别与追踪模块等[20-21]，实现了各类复合污染从全球、区域、城市群与城市复合污染(沙尘、酸沉降、颗粒物、臭氧、核泄漏、大气汞等)的全尺度嵌套耦合建模。另外该模型自行研发了气象-化学双向反馈技术、自适应变网络技术、气溶胶微观力学模拟技术和二次有机气溶胶模拟技术。为了提高预报准确度模型在参数设计方案时采用不确定分析方法评估模型参数的不确定性范围，进行扰动集合预报。模型对区域空气重污染过程预报的准确率接近100.0%，对区域重污染程度预报的准确率近80.0%，但对重污染天气仍会出现高值低估或低值高估的现象，静稳型污染会出现早报、晚报或漏报情况。模型已在国家预报预警中心、京津冀、长三角和珠三角区域预报预警中心、全国16个省(直辖市)、7个副省级城市等投入业务运行，包括中西部地区和欠发达城市如银川[22]、西安等，同时在北京奥运、上海世博、广州亚运、南京青奥、北京APEC、9.3阅兵和G20峰会等重大国际活动空气质量保障中采用。

图1 NAQPMS模型的主要构架[19]Fig.1 The main frame of NAQPMS

3.2 CMAQ

CMAQ(Community Multi-scale Air Quality)是美国环保署(EPA)在拉格朗日轨迹模型和欧拉网格模型后提出的第三代空气质量预报和评估系统[4]，该模型是在“一个大气”理论的指导下，以WRF或MM5等中尺度气象模式和SMOKE(Spare Matrix Operator Kerenl Emission)等源排放模型为依托，充分考虑了大气污染过程中水平传输、垂直传输、扩散过程、源排放、化学反应和去除过程等对污染物浓度的影响，将复杂空气污染状况进行综合处理。模型可模拟平流传输、湍流扩散、气相化学反应、气溶胶动力学、排放过程、沉降过程、云过程和液相过程，可用于评价大气中细颗粒物、对流层臭氧、气溶胶以及酸沉降污染水平[24]，部分学者研究发现模型存在缺陷，如CMAQ4.3版本有质量不守恒缺陷，模型对臭氧光解速率常数设置偏低及模拟结果存在系统性误差等[25]。西南区域预报预警中心和四川省均采用CMAQ单一数值模型，其中四川省模型设计36km、12km和4km三层嵌套网格，在参数设置时对下垫面资料、源排放等进行了本地化处理，对辖区内的绵阳市(见表3)预报结果评估发现首要污染物和空气质量等级准确率相对较高，但由于四川盆地相对湿度高、气候变化复杂，污染扩散条件差，混合边界层变化快，污染物容易累积，且易形成逆温现象和静稳天气，而此特殊现象WRF-CMAQ模型很难准确模拟，另外，模型源排放清单更新不及时，初始条件和物理化学参数设置的不确定性都影响预报准确率，同时该模型采用跨级统计，使得空气质量等级命中率较低，可结合评估结果通过精细化气象场预报、更新源排放清单及动态调整理化参数设置提升预报准确率。

表3 2016年1月1日～2018年9月30日CMAQ模型预报结果Tab.3 Results of CMAQfrom January 1,2016 to September 30,2018

3.3 CAMx

CAMx(comprehensive air quality model with extensions)模型同样是欧拉型化学传输模型，在“一个大气”理念的指导下考虑气-液-固多相化学机制，利用气象场模拟结果，通过SMOKE源排放模型对源排放清单进行处理，最后CAMx模型对污染物浓度进行模拟，与models3-CMAQ模型不同的是CAMx模型具有双向嵌套的网格结构，可以多重网格同时进行计算，在时间范围和空间范围内模拟的更精细。另外，CAMx模型除了具有models3-CMAQ模型的典型特征外，还包括多种分析工具[26]如臭氧来源解析技术(OSAT)、颗粒物来源追踪技术(PAST)[27]、网格烟羽模块(PiG)等。

CAMx模型计算原理[28]如下：

沈松等[29]利用CAMx 5.01模型对珠三角的臭氧污染进行模拟发现模型能够较好地模拟出2004年10月臭氧浓度的变化趋势和浓度水平，大多数站点模拟结果与实测值均吻合良好，与实测值的相关性系数(r)为0.7，标准化平均偏差(NMB)为8.8%，标准化平均误差(NME)为37.9%。

3.4 WRF-Chem

WRF-Chem(Weather Research and Forecasting model coupled with Chemistry)模型属于区域大气动力-化学耦合模型，选用Chem作为内嵌模块，充分考虑了水平输送、扩散和对流过程、干湿沉降、气相化学、气溶胶形成、辐射和光分解率等过程[30]。该模型的气象模式和化学传输模块使用相同的格点、时间步长、传输方案和物理方案，避免因差值等造成的误差，同时二者为同步计算，在时间和空间分辨率上完成耦合，实现真正的在线传输，从而完成对太阳辐射、大气动力和气溶胶化学等多过程的耦合和反馈[31]。WRF-Chem模型[32]对广州市PM2.5(2013年1月)的波动变化趋势预报较好，但对重污染天气日均值预报的准确性不理想，预报结果偏低。PM2.5日均值预报与实测的相关性系数(r)仅介于0.3～0.6之间，主要是重污染天气过程较为复杂，而此模型搭建较为粗糙，仅使用了可反映区域背景排放的源排放清单，模型中未使用局地排放源是主要原因，同时预报过程也未考虑城市冠层结构对大气流场以及污染物扩散的影响。另外，该研究仅使用22个数据样本进行评估，数据量偏小也影响相关性系数。刘琳等[33]选用WRF-Chem模型通过模拟实验定量估算河南、京津冀、山东、山西、安徽和江苏、湖北6个区域人为源排放对河南省2015年12月PM2.5和PM10浓度贡献率。研究发现河南省的颗粒物主要来源仍为本省排放，其次为区域污染输送，且PM2.5外来输送率比PM10要高，其中河南省冬季PM2.5和PM10的本省排放平均贡献率分别为54.8%、61.3%。京津冀、安徽和江苏、山东、山西及湖北等地区域污染输送对河南PM2.5平均贡献率分别为12.0%、11.7%、8.0%、7.4%、4.3%，对PM10平均贡献率分别为10.4%、10.0%、7.0%、6.9%、3.8%。

4 多模式集合预报

由于大气初始条件的不确定和数值模式中物理过程本身的不确定性，使得数值预报模式在计算和积分过程中容易出现偏差，集合预报模式基于复杂的三维环境空气质量数值预报模式，通过构建产生多个差异性预报样本，利用预报结果算术平均、多模式权重平均集合技术、加权集成和多元线性回归等方法产生最优确定性预报结果。空气质量多模式集合预报前期研究主要考虑大气初始条件的不确定或者预报物理过程的不确定，既考虑初值的不确定性、又考虑物理过程的不确定性成为新的发展方向[34]。针对初值不确定性的集合预报通过在初始场上施加扰动，而针对模式物理过程不确定性的集合预报则通过对数值模式的内部物理过程进行改动，多采用统一的区域设置、统一污染源排放清单、统一气象预报场减小模式性能差异[35]。国家预报预警中心、西北和华南区域预报预警中心均选用NAQPMS、CAMx、CMAQ和WRF-chem多数值模式预报，长三角区域预报预警中心(NAQPMS、CMAQ和WRF-chem模型)和珠三角区域预报预警中心(NAQPMS、CMAQ和CAMx模型)也采用多数值模式预报。上海市[36]根据自身城市特点、经济条件及环境空气质量发展状况采用多模型集合预报(模型包括NAQPMS、CMAQ4.4、CMAQ4.6、CAMx和WRF-Chem)。浙江省[37]也采用WRF-Chem、CMAQ、CMAx多模式集合预报，云南省[38]结合高原特殊地形、气象条件、区域能源结构选用国内应用成熟、业务化程度高、对高原山地城市或者复杂地形性能良好的NAQPMS、CMAQ、CMAx空气质量多模式集合预报系统。北京市[39]也是采用多模式集合预报(模型包括NAQPMS、models-3/CMAQ和CAMx)，选用MM5中尺度气象模式，源排放模型SMOKE处理模拟域内的大气污染物排放源清单。在奥运会期间预报结果评估发现在排放源接近实际的情况下，PM10日均值多模式算术平均值优于单模式预报结果，同时多模式集合预报的权重集成PM10预报结果优于算术平均预报结果。

5 发展及建议

我国幅员辽阔、地域差异大，气象条件变化复杂，同时重污染时空变化迅速、污染来源复杂难辨，各市州在开展环境空气质量预警预报能力建设时要在前期经验积累的基础上综合分析，结合城市或区域气象特点、本地源排放清单合理搭建空气质量预报模型，模型参数进行本地化设定。环境空气质量模型运行后要进行短期评估和长期评估，结合评估结果对模型进行适当调整、修正和更新。由于气象场和污染源清单等影响因子的不确定性使得各种预报模型结果都存在偏差[40]，预报员在进行环境空气质量预报时要以模型结果为基础，同时结合历史同期主要污染物浓度和重污染出现频次，充分考虑沙尘天气、秸秆焚烧、重大节假日活动[41]、区域性污染和大范围污染传输影响，同时结合周边、本地当前空气质量实况及大气环境扩散条件对预报结果进行客观人工订正[42]。当预判出现重大污染天气时及时开展部门联合会商，结合预报结果借助超级站、复合型大气污染综合诊断平台及卫星遥感监测等技术对污染过程及预警工作做到准确研判。

中西部地区、中小城市及欠发达城市等受经济条件限制采用单一数值模式预报较多，部分沿海城市及经济发达地区多选用多模式集合预报，单一数值模型预报不确定性较大，多模式集合预报采用统一的模式区域设置，使用统一高分辨率源排放清单及排放处理过程，由统一气象模式产生气象驱动，能降低气象和排放源处理不一致引起模式性差异[39,43]，多模式集合预报结果准确率明显高于单一数值预报，已成为发展的主流方向[44]。

目前我们城市空气质量预报采用“自下而上”的报送模式，国家-区域和省级环境空气质量预报中心都建有完善的预报体系，同时配备有专业的预报团队，地级市由于受到经济条件的限制环境空气质量预报体系构建不完善，更多的是借助省级或区域预报中心的模型，同时预报人员技术力量不足，专业知识储备薄弱[45]，更多的是凭借经验，很难做到精细化预报。国家应该加大对地级市环境空气质量预报的能力建设，同时加强指导和培训。