史海锋 王 芳 周恩伟 顾 媛 张 斌
(浙江省气象局,浙江 杭州 310008)
技术报告
浙江地区雷暴日插值方法及分布特性的研究*
史海锋 王 芳 周恩伟 顾 媛 张 斌
(浙江省气象局,浙江 杭州 310008)
常用的空间插值方法主要有反向距离加权法、样条函数法和克里金插值法等,本文对浙江区域内的68个气象站点的43 a平均雷暴日数据进行空间插值试验,通过对插值结果的交叉验证来比较分析得出了浙江区域范围内雷暴日插值的优选方法。最后利用优选方法的插值结果结合浙江地形条件对浙江地区雷暴日的分布特性进行了分析。
雷暴日;空间插值方法;交叉验证;浙江地区
为了获取准确的雷暴日数据,通常需要建立高密度的雷暴日人工观测站点。然而,由于地形条件、技术手段和经济水平等各方面的限制,很多地方的雷暴日数据获取比较困难。为了获取站点外区域的雷暴日数据,研究人员通常需要通过已知样点的数据来估算未知点的数据,即空间插值[1],进而获得全局空间范围内各个空间位置的雷暴日数据。但是在各种空间插值方法中,并没有适合任意插值对象的最佳插值方法。长期以来国内外学者对空间离散数据的空间插值方法进行了大量的研究,分析了各种插值方法的利弊,以及针对不同的插值对象,选择出最优的空间插值方法[2-7]。本文分别使用反向距离加权法、样条函数法和普通克里金法等3种空间插值方法对浙江区域内的68个气象站43 a的年平均雷暴日进行空间插值计算。最后利用交叉验证法对3种插值方法计算结果的精度进行分析,以期选出浙江区域范围内雷暴日插值的优选方法,从而对浙江地区的雷暴活动以及分布特性进行研究分析[8-10]。
本文所采用的数据来自浙江省气象局。该数据为浙江省全省68 个气象台站43 a(1971—2013年)的年平均雷暴日以及站点的经度、纬度和海拔高程等数据。
2.1 反向距离加权法(IDW)
IDW是空间插值几何方法的一种,基于地理学第一定律:相似相近原理,即两个物体离得越近,它们的值越相似;反之,离得越远则相似性越小。IDW以插值点与样本点间的距离为权重进行加权平均,离插值点越近的样本点赋予的权重越大。其一般公式为:
(1)
(2)
(3)
式(2)中di0为预测点S0与各已知样点Si之间的距离。样点在预测点值的计算过程中所占权重的大小受参数p的影响,即随着采样点与预测值之间距离的增加,采样点对预测点影响的权重按指数规律减少。在预测过程中,各样点值对预测点值作用的权重大小是成比例的,这些权重值的总和为1。
2.2 样条函数法(Spline)
Spline是在空间插值时准确地通过实测样点拟合出连续光滑的表面。样条插值法又分为张力样条函数插值法(Tension Spline)和规则样条函数插值法(Regularized Spline)。在ArcGIS 中默认情况下指数为0.1, 站点搜索范围为临近的12个站点。其计算公式为:
(4)
2.3 普通克里金法(Kriging)
克里金法是1951 年由南非地质学家Krige提出, 并因此而命名。在1962 年法国地理学家Matheron给出了Kriging的一般公式。其公式为:
普通克里金插值的权重系数由以下2个方程决定:
式中,h为步长,γ(h)是变量Z以h的半方差,n为被h分割试验数据的数目。
普通克里金法根据拟合半方差模型的不同可分为球型模型、环状模型、指数模型和高斯模型。
2.4 验证方法
为了较好的验证插值的效果,采用交叉验证法进行检验。所谓交叉验证法首先假定某一站点的雷暴日值未知,采用其他站点的观测值来进行估算,然后通过计算所有站点实际观测值与估算值的误差,以此来评判空间插值方法的精度。本文采用平均误差和均方根误差作为检验精度的依据,平均误差反映样本数据估值的总体误差或精度水平,均方根误差反映的是样本数据估值的精度高低。
3.1 实验结果分析
对浙江省68个气象站点的年平均雷暴日分布进行反距离加权法、样条函数法和克里金插值法等3种方法的空间插值试验,同时对于每种方法的站点搜索范围都取临近的12个站点。得到如图1插值结果。
(其中左图为IDW,中间为Spline,右图为Kriging)图1 3种插值方法得到雷暴日空间分布图
图1为68个站点全部参与插值的结果,从图中可以看出3种插值方式得到的结果总体变化趋势较为一致。其中Spline法和Kriging法连续性相对较好,IDW法连续性较差;Spline法和IDW法所生成的插值表面较为光滑,Kriging法则相对粗糙。
表1 绝对误差分析表 d
首先从3种插值方法得到的结果的绝对误差分析(见表1)结果表明普通克里金法的绝对精度较好。平均绝对误差最小为普通克里金法,为2.8 d;绝对均方根误差最小的为普通克里金法,为±3.5 d。
表2 相对误差分析表
其次为了进一步评判3种插值方法插值结果的可信程度,本文引入相对误差进行分析比较。从3种插值方法得到的结果的相对误差分析(见表2)结果表明普通克里金法的插值结果的可信程度较高。平均相对误差最小和相对均方根误差最小都为普通克里金法,分别为0.07和±0.09。
3.2 浙江雷暴特征分析
从图2可以看出:显然这样空间分布特征与地形关系密切,雷暴日分布和浙江地形空间互相关系数达0.61。雷暴分布总趋势西部多于东部,南部多于北部,内陆多于沿海,山区多于平原。最强的活动区域主要在西部及西南部山区,沿海以及平原地区雷暴活动相对较弱。按站点进行分析:40 d以下的站点有34个,主要集中在湖州、嘉兴和绍兴平原以及宁波、舟山、温州、台州等沿海一带;40 d以上的有34个,主要集中在衢州、丽水、金华以及杭州等丘陵山区一带。
图2 浙江地形与雷暴日关系
从图3看浙江省一年四季均有雷暴活动,从43 a的资料分析:1、2月和10、11、12月相对较少,3—5月以及9月较多,高发期在6—8月,总体上呈单峰分布,单通过年最多雷暴日曲线来看,春雷有时也相对较多。
图3 雷暴日月分布图
通过实验比较3种插值方法的年均雷暴日的插值结果,得出如下结论:1)每种插值方法的计算结果的总体分布趋势大体一致;2)从绝对误差的角度分析,绝对平均误差和绝对均方根误差Kriging都占优;3)从相对误差的角度分析,相对平均误差和相对均方根误差Kriging都占优,说明Kriging法的可靠性较高;4)Krigin法插值表面要较其他2种方法相对粗糙。受限于气象站点的布设,海上和海岛的雷暴数据欠缺也在一定程度上影响雷暴日插值的结果和精度,故上述结论将对浙江地区雷暴日空间插值研究提供一定的参考。
最后本文结合插值结果和浙江地形条件分析指出雷暴分布呈西部多于东部,南部多于北部,内陆多于沿海,山区多于平原的总趋势;全省一年四季均有雷暴活动,高发期在6—8月。在分析插值结果和地形条件的关系时,试图引入高程因素使得统计分析更具有参考意义,但利用回归分析来拟合模型的结果不是很理想,下一步笔者还将进一步研究。
[1] 王新洲,陶本藻,邱卫宁,等.高等测量平差[M].北京:测绘出版社,2006.
[2] 金君,彭思岭,刘启亮等.中国陆地区域气象要素空间插值方法比较研究[J].工程勘察,2010(11):48-51.
[3] 靳国栋,刘衍聪,牛文杰.距离加权反比插值法和克里金插值法的比较.长春工业大学学报[J].2003(3):53-57.
[4] 李军,游松财,黄敬峰.中国1961—2000年月平均气温空间插值方法与空间分布[J].生态环境,2006(1):109-114.
[5] 李军龙,张剑,张丛,等.气象要素空间插值方法的比较分析[J].草业科学,2006(8):6-11.
[6] 邓晓斌.基于ArcGIS两种空间插值方法的比较[J].地理空间信息,2008(6)85-87.
[7] 王志恒,朱衍达.内蒙古地区气温空间插值模拟方法研究[J].地理空间信息,2014,(04):1-3+6+8.
[8] 童杭伟,范国武,王海涛.浙江省雷电活动的特点及其与地形和气候的关系[J].电网技术,2008(11):99-100.
[9] 林建,曲晓波.中国雷电事件的时空分布特征[J].气象,ISTIC PKU,2008,34(11):22-30.
[10] 顾震潮.我国雷暴的气候特点[J].地理学报,1978(1):42-48.
2014-11-12
公益性行业(气象)科研专项(GYHY20110635),灾害天气国家重点实验室开放基金(2013LASW-B04)