张兴山,王娟怀,叶培龙,桑文军,李猛,包永虎
(1.河北省邯郸市气象局 河北,邯郸 056001;2.广东省气候中心 广东,广州 510080;3.兰州中心气象台 甘肃,兰州 730020;4.中国民用航空飞行学院 四川,成都 618300)
近年来随着城市化进程的加快,城市建设规模逐渐扩大、交通工具保有量增加,致使恶劣天气影响而引发的交通事故显著增加。尤其在冬季,冰雪雨雾等天气过程常导致城市道路产生湿滑、能见度低等危险路况,易酿成重大交通事故[1],由此给交通运输造成了严重的影响[2-3],据调查,道路结冰是影响交通安全的首要恶劣气象条件[4]。例如,2001年12月7日下午,北京一场小雪,24 h累计降雪量只有1.8mm,但正值下班车流高峰期,加之地面温度很低,雪融化后在路面结冰,因而造成北京市交通堵塞达数小时,社会影响异常强烈[5]。类似于这样严重影响交通的天气时有发生,因此有必要针对城市开展冬季道路结冰的预报预警服务研究,为城市道路清扫和喷雾抑尘作业提供科学依据。
美国及欧洲等国家对道路结冰的监测和预报十分重视,较早形成了一些路面温度预报和结冰预报技术[6-9]。Sass[8]利用丹麦道路站的数据对道路温度和结冰预测进行数值模拟,建立了道路结冰预报方法,取得较好效果。Shao等[9]通过收集公路养护信息,建立的道路结冰预报模型能够准确及时的预测路面结冰时间,为许多国家冬季道路养护提供技术支持。目前我国也有不少专家致力于道路温度预报[10-11]及道路结冰预报预警方面的研究[12-15]。董天翔等[10]利用三种统计预报方法,开展了路面地温预警建模与预报实验,三种统计预报模型的路面地温预报准确率均超过75%。马筛艳等[11]应用逐步回归方法建立逐时路面温度预报模型,预报效果良好,具有较好的实用价值。路面温度特征及预报模型地面温度预报研究为逐小时道路结冰预报预警提供了预报基础。陈凯等[12]基于C4.5决策树算法,以历史最低气温、日降水量等气象要素为训练数据建立道路结冰预报预警模型,预报准确性高且实用性强,为东北地区冬季道路结冰预报提供参考。白永清等[13]利用Logistic回归方法建立了高速桥(路)面结冰风险等级预警模型,结冰频率随环境气温的降低表现为渐增期、快增期、缓增期三个阶段,以等级形式发布路面结冰风险预警产品。舒斯等[14]研究了高速路段的道路结冰概率随气温的变化规律,分析高速公路不同路段结冰的气温条件概率,通过分析发现不同路段结冰频率变化的起始拐点环境气温T拐点有所差异,大部分T拐点大于0℃,最大T拐点达2.0℃。以上研究主要以降雨或降雪天气为背景,利用统计研究并制作结冰风险等级预报预警产品,同时舒斯及李迅等[15]研究表明结冰次数同降水和气温之间关系密切。因此本文将以地温和气温同时作为影响路面结冰的因子进行研究。
随着工业化和城市化的飞速发展,大气污染尤其是城市大气污染日益严重,同时城市交通格局和机动车保有量也有了很大的变化,交通活动水平和扬尘排放也随之增加[16]。从统计数据来看,全国区域城市中,京津冀污染尤为严重[17],2018年,邯郸(河北)等城市赫然名列全国城市空气质量最差城市之列[18]。近些年,京津冀地区通过大气污染联防联控机制,空气质量大幅改善,但治理工作仍任重道远[19],其中,道路清扫和喷雾抑尘在大气污染防治中起到一定作用[20],但在冬季,却大大增加了城市路面结冰的概率,增加了发生交通事故的风险[21]。邯郸市地处河北省南部,境内道路网较为密集,大气污染防治任务十分严峻。目前,针对无降雨或降雪背景下,由道路清扫和喷雾抑尘导致的城市道路结冰预报预警研究较少,因此,本文主要针对道路结冰开展概率预报和确定性预报模型研究,为道路清扫和喷雾抑尘作业时间提供科学参考,同时能够对公众提供道路结冰预警服务,保证人民生命财产安全。
选取邯郸市赵苑气象观测站资料。赵苑气象观测站为国家一般气象站,位于邯郸市区的赵苑公园(36.62°N,114.47°E),下垫面为土壤。利用1961~2016年日最低气温、日最低0cm地温(后文均以气温、地温表示)以及日是否结冰数据对土壤下垫面环境背景结冰预报进行统计和建模。利用2017~2018年当年11月至次年3月小时气温、地温数据对模型进行检验。本文只针对大气污染防治及城市道路养护过程导致的道路结冰进行预报预警服务,因此选取资料时不考虑降雨雪天气过程。
利用1961~2016年日数据,以日为单位确定邯郸市结冰开始结束日期;以1℃为间隔统计结冰概率随气温或地温的一维分布特征,确定邯郸市气地温、气温的分布边界;以1×1℃为间隔统计得结冰概率随地温和气温的三维分布特征,进一步插值到0.1×0.1℃为更直观呈现结冰概率的分布形态,确定拟合函数类型;利用1×1℃的概率统计数据进行拟合,结合拟合输出参数确定拟合效果,得到结冰概率随气温和地温的预报公式。
SVM(支持向量机)是一种二分类模型,可以寻找一个超平面来对样本进行分割,分割的原则是间隔最大化,最终转化为一个凸二次规划问题来求解[24-26]。主要有线性可分和线性不可分两类,文中假定输出量(结冰概率)线性不可分,进行建模,主要思路是:将线性不可分的原数据向高维空间转化,使其变得线性可分。采用MATLAB中svmtrain函数,分别选取Linear、Rbf、Sigmoid核函数进行分类训练,选取最优参数,最后通过对比训练集、测试集AUC(曲线下面积)选取最优模型。
本文以土壤下垫面环境背景,研究结冰随气温和地温的关系,为不同下垫面结冰预报研究提供一定参考,以期得到精细化和普适性的结冰预报模型。
图1是以日最低气温、日最低地温、日结冰现象为数据基础建立的结冰预报模型流程图,左侧为以统计方法建立概率性预报模型流程,右侧为以SVM建立确定性预报模型流程,后文将以流程图所示详细介绍结冰预报模型研究过程。
对1961~2016年结冰气象资料进行统计分析,以结冰概率≥5%界定结冰开始和结束时间(如图2所示,黑色虚线所示)。11月初开始结冰概率≥5%,随后结冰概率以1.6%逐日增加,至12月底结冰概率达到100%,即每日达到结冰零界条件,2月初开始结冰概率以1.6%逐日减少,至4月初结冰概率≤5%。即邯郸市结冰开始于11月初,结束于次年4月初。
通过对邯郸市历史日结冰现象、气温、地温进行统计(如图3所示),发现临界完全结冰条件(概率大于95%)为气温≤-1℃或地温≤-5℃,单一要素临界完全结冰条件地温低于气温约4℃;地温与气温的差值随结冰概率的降低而逐渐减小;以≤5%概率认为事件不可能发生,气温≥3℃或地温≥1℃为结冰不发生的条件。即单要素条件下,完全结冰条件为地温≤-5℃或气温≤-1℃,结冰开始发生的条件为地温≤1℃或气温≤3℃。同时可以看出,结冰概率分别同气温、地温呈Logistic函数的分布形式,即Sigmoid函数,它的几何形状是一条S型曲线。
通过分析结冰现象与气温和地温的平面分布(如图4a所示),发现结冰现象存在一定的过渡区域。为确定此过渡区域结冰概率与气温、地温的关系,需找到气温、地温的分布边界;通过分析气温、地温的平面分布(如图4b所示),发现其呈显著线性关系,指定拟合函数类型为。对其进行线性拟合,确定函数系数(通过95%置信检验):a=1.067,b=-2.686,拟合曲线确定为;对应统计参数R-square(回归系数)为0.9177,RMSE(均方根误差)为2.0761。两统计参数表明该线性模型对数据有较好的拟合效果,说明气温与地温有很好的线性关系,但气温对地温的拟合确实存在较大的误差宽度,也就是说对于某一特定气温不具备单一的地温与之对应。但通过这种线性关系,可以确定邯郸市气温、地温的分布边界。
通过以上统计分析确定气温、地温的重点研究区域可以看出,红色曲线为日最低气温、日最低地温分布的上下边界,黑色方格内(-1℃<气温<3℃、-5℃<地温<1℃)为结冰现象和不结冰现象均出现的区域,进一步对此区域进行研究。
基于前文2.2的分析,文中对结冰概率在-1℃<气温<3℃、-5℃<地温<1℃的区域进行统计,统计数据为1℃×1℃,为更清晰直观地呈现结冰概率的分布形态,再次进行‘Spline’三次样条插值,得到结冰概率在-1℃<气温<3℃、-5℃<地温<1℃的区域内0.1℃×0.1℃的分布(如图5a所示)。从图中不难发现,结冰概率的三维分布呈Logistic函数分布。
Logistic函数y=f(x)一般表达式为:
其特点为输出映射在(0,1)之间,单调连续,输出范围正好对应结冰概率范围(0%,100%)。因此指定拟合函数类型为∶,拟合方法为非线性最小二乘法,最后结合拟合输出参数确定拟合效果。
基于确定的Logistic函数分布,利用1×1℃的概率统计数据进行Logistics函数[13、22、23]拟合,对结冰过渡区域概率分布进行S型曲线拟合(如图5b所示),确定函数系数(通过95%置信检验):a=141.4,b=1.407,c=1.487,d=0.5434,得到结冰概率;对应统计参数R-square为0.9731,RMSE为6.2387,两统计参数表明该模型对数据有很好的拟合效果,可以作为结冰概率预报的公式。
考虑到实际业务需求,文中进一步针对结冰的确定性预报模型进行研究,以便对业务工作者提供相应的参考。结冰和不结冰现象为结冰预报的两种结果,可以对历史数据进行二分类训练,从而得出确定性结冰预报产品。
通过反复对比训练,确定三类核函数对应最优参数c、g的值,如图6(a、b、c)所示,通过最优参数训练得到三类核函数对应的二分类模型,并绘制模型训练集、测试集的ROC(receiver operating characteristic)曲线。其中Linear核函数训练集AUC最大达0.982,其次是RBF核函数0.976,Sigmoid最低为0.958;测试集中Linear核函数AUC同样最大达0.996,其次是Sigmoid核函数AUC为0.984,RBF最低为0.982。因此我们选取Linear核函数训练的二分类模型为确定性结冰预报模型(如图7所示)。该模型所用数据量为4389个,红色、蓝色实心点分别代表实况结冰、不结冰现象,蓝色圆圈代表支持该向量机的数据,共830个。黑色实线为间隔最大的超平面,即该模型的分界线,分界线左侧为预测结冰区域,右侧为预测不结冰区域。
利用2017~2018年当年11月至次年3月实况数据,对两种结冰预报模型进行效果检验,实况数据为剔除雨雪天气过程的日最低气温、日最低地温、观测是否结冰天气现象。检验结果ROC曲线如图8所示,确定性预报AUC为0.966,概率性预报AUC为0.975,两类预报模型AUC均接近1,说明以上两种预报模型均具有较好的利用价值,概率性预报模型略优于确定性预报模型
邯郸市结冰始于当年11月初,12月底结冰概率达到100%,结束于次年4月初;临界完全结冰条件为气温≤-1℃或地温≤-5℃,单一要素临界完全结冰条件地温低于气温约4℃,气温≥3℃或地温≥1℃为结冰不发生的条件。
在实况检验中结冰概率预报和确定性预报的AUC均接近1,预测效果好,概率性预报略优于确定性预报。
本文以土壤下垫面温度、气温及结冰数据对结冰预报进行统计、建模,而在实际业务中需要提供基于不同下垫面的结冰预报。结合李蕊等[27]研究,水泥和土壤下垫面温度变化趋势非常一致,白天沥青比土壤和水泥可高2℃左右,而夜间三者温差不大,在0.3℃左右,沥青略低。因此,在不考虑其他影响因素的情况下,本文结冰预报模型均可适时应用不同下垫面的地温预报和气温预报作为输入参数对是否结冰进行预报,预报结果具有一定的参考价值。