彭科曼,刘 博,陈海凤,田 程
(1.贵州省贵阳市气象台,贵州 贵阳 550001;2.天津市气象台,天津 300074)
贵阳迁站后雾的气候特征及预报模型研究*
彭科曼1,刘 博2,陈海凤1,田 程1
(1.贵州省贵阳市气象台,贵州 贵阳 550001;2.天津市气象台,天津 300074)
该文利用贵阳基准站2000—2013年的地面观测资料,运用线性分析、相关分析等方法对贵阳2000年迁站后雾的气候特征进行分析,结果表明:贵阳的年雾日分布不均,总体呈增长趋势;雾的盛发期在冬季,占全年的36.81%;雾在06—08时生成的概率比较高;09时左右消散的概率最高,持续时间多在6 h以下。该文还采用了CIMISS数据库2000—2015年的逐日气象资料,运用决策树方法建立统计模型来对贵阳雾的预报进行初探,命中率达到76.19%,该预报结果能够基本满足预报需求,为预报员提供一定参考。
贵阳;雾;气象要素;决策树
雾是近地面层空气中悬浮着的大量水滴或冰晶微粒而使水平能见度小于1 km的天气现象,是一种常见的灾害性天气。雾对交通的危害很大,同时还会加剧近地层的空气污染,危害身体健康[1〗[2-6],如刘玉英等[2〗对吉林省雾的气候特征及变化成因进行了分析;贺皓等[3〗运用数值预报释用技术、统计学方法和诊断分析方法对陕西省的大雾进行了研究;罗喜平等[4〗利用贵州省84个观测站的观测资料以及9个地州市代表站的气温、地温和相对湿度资料较为全面的分析了贵州省雾的时间、空间分布特征(其中对贵阳市雾的分析研究截止到1999年),研究表明,雾的气候特征具有明显的地域性差异,因此研究本地雾的气候特征以及发生规律,具有很大的现实意义。由于贵阳基准站于2000年迁站,新旧两站的海拔高度相差较大,对雾的观测有较大差异。目前学者们对贵阳迁站后雾的特征研究较少,并且在2014年之后,能见度观测由人工观测改为了能见度仪自动观测,由于观测方式的差异,使得能见度观测结果存在一定的差异,因此本文主要研究贵阳2000—2013年雾的气候特征,并采用决策树方法建立统计模型来对贵阳雾的预报进行初探,以期对雾的预报提供参考。
2.1 资料
本文所使用的气象数据来自于贵阳基准站2000—2013年的地面观测资料以及CIMISS数据库2000—2015年的逐日气象资料,通过数据质量控制后处理为时间序列和气象要素完整的逐日气象数据。雾日的记录以观测资料为准,一天之中任一时次能见度小于1 km,均定义为一个雾日。
2.2 研究方法
2.2.1 本文主要采用了线性分析和相关分析等气候诊断方法来研究贵阳迁站后雾的气候特征。
2.2.2 决策树 本文采用决策树方法初步尝试了对贵阳雾日进行预报。
决策树是一种统计学分类算法,是以实例为基础的归纳学习算法,代表了对象的属性和值之间的映射关系,能够从一组无次序、无规则的元组中推理出决策树表示形式的分类规则[7]。可见,采用决策树方法进行雾日和非雾日的分类预报具有直观、便捷的特点,故本文选取决策树方法尝试对贵阳雾日进行预报。本研究采用C4.5算法来进行决策树分类[8],该方法能够选择具有最大增益率的属性作为分裂属性,对目标类进行最佳的分割。
3.1 雾的年际变化
图1 2000—2013年贵阳市雾日的年际变化Fig.1 The annual variation of foggy days in Guiyang from 2000 to 2013
经统计,2000—2013年贵阳的年平均雾日为41 d。从图1可以看出,贵阳的年雾日分布不均,总体呈增长趋势,2006年以前,增长得比较迅速,在2006年达到第一个峰值,为61 d,之后略有下降;又在2012年陡增,雾日达到最多,为81 d。雾日最少年为2001年,仅有17 d。
3.2 雾的季节变化
图2 贵阳市2000—2013年各季节雾日数占全年 雾日总数的比例Fig.2 The proportion of each season’s foggy days to the whole year in Guiyang from 2000 to 2013
从图2可以看出,四季中,贵阳冬季雾最多,占全年的36.81%,春季最少,为19.79%,夏季、秋季分别为20.83%、22.57%。
冬季冷空气频繁,贵阳多处于变性冷高压控制下,近地面大气层结较稳定,夜间辐射降温加剧,且多静风、微风,在低层水汽充足的情况下,易形成辐射雾[9],并且冬季云贵静止锋比较活跃,受静止锋的影响,贵阳地区常常有锋面雾出现。因此与春、夏、秋三个季节相比,冬季贵阳雾日明显偏多。
3.3 雾的月际变化
图3 贵阳市2000—2013年月平均雾日数Fig.3 Monthly average number of foggy days in Guiyang from 2000 to 2013
经统计,2000—2013年,贵阳月均雾日数为3.4 d。从图3可以看出,月均雾日数多于平均值的月份有:1—3月、6月、10—12月,其余各月的月均雾日数均低于平均值。贵阳雾的盛发期出现在1、2、12月,均在5 d以上,4月、9月雾日较少,分别为2.0 d、1.9 d。
3.4 雾的生消和持续时间
掌握雾的生消和持续时间的气候特征,对于规避雾天带来的危害具有重要的意义,因此本文对贵阳站2000—2013年雾的生成时间、消散时间和持续时间进行了统计,统计时规定,当生成时间处于两个整点之间时,按第一个整点来统计,当消散时间处于两个整点之间时,按第二个整点来统计[2],例如,当生成时间为09时20分,作为09时来统计,当消散时间为10时35分,作为11时来统计。从图4可以看出,雾在06—08时生成的概率比较高,合计出现概率为45.0%,其中06时是全天各时次中出现概率最高的,为16.9%;雾的消散时间主要出现在08—11时以及20时,合计出现概率为59.2%,其中09时是全天各时次中出现概率最高的,为20.9%。雾消散的最高概率出现的时段比生成的最高概率出现的时段要晚2~3 h。从雾的生消时间多处于早晨来看,贵阳站的雾多以辐射雾为主,夜间气温下降,空气湿度逐渐增加,早晨日出前气温最低,空气湿度最大,因此有利于形成雾,日出后,随着气温上升,空气湿度减小,雾逐渐消散。从雾的持续时间来看(表1),持续时间在6 h以内的,占总数的85.2%,其中持续时间在3 h以内的出现概率最高,为61.7%。从持续时间上也可看出,贵阳站出现的雾多属于辐射雾。
图4 贵阳市2000—2013年雾的生消时间概率的日变化Fig.4 The diurnal variation of the probability of the time of fog formation and dispersion in Guiyang from 2000 to 2013
持续时间(h)0~34~67~12>12概率(%)61723511929
决策树方法对于判别雾日及类似的分类气象预报具有直观、便捷的特点,适于对雾日和非雾日进行分类预报。故本文选取决策树方法尝试对贵阳雾日进行预报。
4.1 预报因子的筛选
选取不同的预报因子进入模型,对最终的预报准确率影响很大。由于各个气象要素之间存在共线性的作用,对预报效果会有一定影响,因此综合气象要素与雾日的相关性分析结果,结合已有数值模式可预报的气象要素,本文共筛选出3组预报因子对雾日和非雾日的分类判别进行预报模型的建立,通过对3个模型预报准确率的比较确定最优模型。
第1组预报因子按照相关性大小来进行筛选(表2),对2000—2015年逐日气象要素和每日08时的气象要素进行普查,从(温、压、湿、风、降水)各类气象要素中分别选取出与日最小水平能见度相关性最大的要素作为预报因子输入模型;第2组预报因子为日气象要素;第3组预报因子仅包括08时气象要素。
表2 各气象要素与日最小水平能见度的相关性大小Tab.2 The correlation between the meteorological factors and the minimum visibility
注:**在置信度(双测)为 0.01 时,相关性是显著的
筛选的预报因子如表3所示:
表3 预报因子筛选结果Tab.3 The results of selected predictors
4.2 划分训练集和验证集
本文选取贵阳站进行预报试验,气象数据来自于CIMISS数据库2000—2015年的逐日气象资料,以日最小能见度小于1 km确定为一个雾日。将确定好的雾日作为决策树分类的目标变量,1为有雾,0为无雾。通过对原始气象数据中缺省数据的处理及空值的剔除,最终获得5 738个样本(包括雾日和非雾日)。在预报模型的建立过程中发现,由于非雾日样本数远多于雾日样本数,模型确定分枝节点时,会更多的考虑非雾日的预报准确率,而忽视了雾日的预报准确率,因此对样本进行预处理,随机抽取(按时间序列均匀分布)非雾日样本的1/7,使其样本数与雾日样本数基本一致,最终确定进行预报模型建立和检验的非雾日样本数为713个,雾日样本数为722个。将所有样本按照时间序列排序,取其前90%时间序列(2000年—2014年4月)为训练集,并进行10%交叉测试,后10%(2014年5月—2015年12月)为验证集。
4.3 建立决策树模型
本文使用weka软件,采用c4.5算法建立决策树。步骤如下:
①数据预处理。
②通过训练集建立决策树模型并在运行过程中进行10%数据交叉验证,最终挑选拟合准确率最高的决策树来确定模型。
③保存决策树结果。
④进行验证集准确率测试。
将3组预报因子分别建立决策树模型,预报结果如表4所示。
表4 3组预报因子所建立的决策树模型预报结果对比Tab.4 The comparison of decision tree model forecast results set up by three sets of predictors
最终根据预报准确率和可行性(有些预报因子无模式直接预报结果),确定最优预报模型为第3组预报因子建立的预报模型(图5),即采用08时气象要素对雾日预报命中率最高,且漏报率和空报率都最低。采用该模型对验证集(2014年5月—2015年12月)的105个雾日进行预报,共命中80个雾日。
图5 最优决策树模型Fig.5 The optimal Decision Tree Model
该预报结果能够基本满足预报需求,但准确率仍有提升空间,今后会尝试添加新的预报因子来对雾进行预报,如EC细网格预报的850 hPa温度、10 m风速等,以期能达到更好的预报效果,为提高贵阳雾日预报的准确率提供参考。
①贵阳的年雾日分布不均,总体呈增长趋势;雾的盛发期出现在1月、2月和12月;4月、9月的雾日较少;四季中,贵阳冬季雾最多,占全年的36.81%。雾在06—08时生成的概率比较高;09时左右消散的概率最高,持续时间多在6h以下。
②本文运用决策树方法,结合相关分析方法通过多次比对预报因子进行决策树预报试验,选取了与雾日的预报相关性最高的一组预报因子,尝试对贵阳雾日进行预报,最终建立的预报模型预报命中率达到76.19%。该预报结果能够满足预报需求,为预报员提供一定参考。
[1〗 周斌斌.论雾与污染的关系[J〗.气象,1994,20(9):19-24.
[2〗 刘玉英,李宇凡,张婷,等.吉林省雾的气候特征及变化成因分析[J〗.地理科学,2015,35(8):1 060-1 066.
[3〗 贺皓,刘子臣,徐虹,等.陕西省高等级公路大雾的预报方法研究[J〗.陕西气象,2003(1):7-10.
[4〗 罗喜平,杨静,周成霞.贵州省雾的气候特征研究[J〗.北京大学学报(自然科学版),2008,44(5):765-772.
[5〗 高阳华,冉荣生.重庆市雾的区域分布及变化特征[J〗.贵州气象,1999(6):3-5.
[6〗 周涛,周成霞.贵州雾的时空分布特征[J〗.贵州气象,2005,29(s1):32-34.
[7〗 Tan Pang-Ning,Steinbach Michael,Kumar Vipin,数据挖掘导论[M〗:北京:人民邮电出版社,2006.
[8〗 林玲玲.基于C4.5算法的高血压分类规则提取的研究[D〗:太原理工大学,2012.
[9〗 童尧青,银燕,许遐祯.南京地区雾的气候特征[J〗.南京气象学院学报,2009,32(1):115-120.
Study on climatic characteristics and forecast model of fog inGuiyang after relocation
PENG Keman1, LIU Bo2, CHEN Haifeng1, TIAN Cheng1
(1.Guiyang Meteorological Observatory, Guiyang, 550001, China;2.Tianjin Meteorological Observatory, Tianjin 300074, China)
Based on the surface observation data of Guiyang station in 2000-2013, the study analyzed the climatic characteristics of fog in Guiyang after relocation using linear analysis and correlation analysis method. The results show that the annual distribution of foggy days in Guiyang is uneven, and the annual trend of foggy days is increasing. Foggy days are concentrated in winter, accounting for 36.81% of the whole year. Fog usually forms from 6:00 to 8:00 and disperses at 9:00, while the duration of fog is usually less than 6 hours. And a fog prediction model, whose accuracy reached 76.19%, was constructed by Decision Tree Method according to meteorological data from 2000 to 2015 of CIMISS. The forecast results can basically satisfy the forecast demand and provide reference for the forecaster.
Guiyang; fog; meteorological factors; decision tree method
2017-01-20
彭科曼(1991—),女,助工,主要从事天气预报工作,E-mail:493069676@qq.com。
贵阳市气象局气象科研基金项目(筑气科合201405号)。
1003-6598(2017)03-0051-05
P426.4
B