周昊楠,华烨,秦榕
(1.新疆气象信息中心,新疆 乌鲁木齐 830002;2.新疆气象台,新疆 乌鲁木齐 830002)
新疆地区年平均风速数据非均一影响研究
周昊楠1,华烨2,秦榕1
(1.新疆气象信息中心,新疆 乌鲁木齐 830002;2.新疆气象台,新疆 乌鲁木齐 830002)
利用惩罚最大F检验(The Penized Maximal FTest,PMFT),对新疆地区105个国家级气象站点建站至2014年逐年平均风速资料进行了均一性检验,并通过订正得出新疆地区年平均风速均一化数据集合;通过对订正后数据与原始数据进行对比评估,讨论数据非均一性对新疆风速的影响,研究结论得出:(1)在95%的显著性水平下,检验出所有待检站点均出现非均一间断点,共计151个;(2)元数据中记录的人为影响因素,超过1/3对年平均风速序列产生了非均一影响,其中仪器换型对年平均风速序列影响最为显著,其次为环境变化;(3)仪器换型和站址迁移对年平均风速的非均一影响与台站风力大小成正比,其它人为因素对年平均风速的影响与台站风力大小成反比;(4)订正后,数据时间序列的均一性得到改善,数据序列明显的趋势拐点趋于缓和,下降趋势普遍增强,数据可用性进一步改善。
新疆;风速;均一性;PMFT检验;订正
几十年来,全球各类区域极端天气事件逐年增多,气候变化开始成为各国政府和媒体密切关注的问题,而全球气候变暖也已经成为公众热议的话题;多年来,国内外气候科研机构积极开展了大量的相关研究,丰富了人类对大自然变化规律的认识,讨论了人类对气候变化所产生的影响;然而对于气象科学研究来讲,均一的长序列气象资料是科学研究的基础,其能够真实可靠的反映单站或大区域范围的历史气候变化过程,对未来气候变化预测和极端天气分析能够提供有力的基础保障。所谓均一的气象观测数据,理论上应是数据变化只受到天气和气候因素的影响,不受到任何人为干预,其能够真实反映气候演变规律的观测数据;但从我国气象事业的发展历史来看,随着人民生活水平提高及社会经济发展,多数站点已经遭受站址迁移、仪器变动、观测手段变化、观测环境变化和观测时次等人为因素的影响,使气象历史观测资料不同程度产生了不连续的非均一现象,这往往对气候变化研究,尤其是区域性或者局地气候变化检测和预测结果带来明显的歪曲,严重制约了现代气候变化模式的预测和预报的准确性;所以数据序列的均一化研究,已逐渐成为科研数据应用工作中必不可少的环节。关于数据均一化研究工作,国外的专家和学者开始的比较早,几十年来,许多专家在气候资料序列均一化检验及订正方面做了大量的研究和报告[1-8],研究内容涉及不同气象要素,其中包括如气温、降水、气压及相对湿度等,取得了许多显著的研究成果,为气候研究和预报服务做出了巨大的贡献。近些年来国内气象数据均一化研究人员通过对全国气温、降水等的研究,同样取得了许多重要的成果,大力推进了国内气象数据均一化研究的水平[9-19]。在风资料的均一性研究方面,国内专家也已逐渐取得了一定进展,如,刘小宁和曹丽娟等[20-21]分别引入标准正态均一检验(The Standard Normal Homogeneity Test,SNHT)和惩罚最大F检验(The Penalized Maximal F Test,PMFT)方法对我国主要气象台站年平均风速气候资料进行了均一性检验并分析了造成非均一性的主要原因,何冬燕等[22]以两站为例对比分析了用直接检验方法和3种间接检验方法对年平均风速的检验效果。然而,作为主要的气候要素之一,风是受地形影响较大的气象要素,在不同区域或环境下对不同检验方法的适用性可能完全不同,尤其在新疆地区,由于地形复杂、站点稀疏且分布不均匀等因素,使得多数依赖于参考序列的检验方法并不太适用于新疆地区的均一性研究。并且,虽然曹丽娟等用PMFT检验方法对全国主要台站进行了均一性检验,得到了较好的研究结果,但研究内容对风要素的局地性特点考虑的相对较少,属于方法研究的初步实验,如果要将均一性研究理论转化为实际应用成果,需在此基础上开展进一步的针对性研究。因此,本文选择新疆地区105个国家级气象站点近50 a平均风速数据进行均一性检验与订正探索研究,以分析新疆特定环境下风资料的特点,寻求不同研究环境下检验及订正方法的适用性和可靠性。
1.1 资料来源
由于新疆地区105个国家级气象站点建站至1961年的年平均风速资料存在不同程度的数据缺测,所以本文统一选取105个台站1961—2014年的年平均风速数据作为检验数据序列,数据来源于新疆气象信息中心,并且各台站年平均风速数据均已通过较为严格的质量控制。
1.2 元数据
文章中所用的气象地面台站元数据信息来源于新疆气象信息中心信息档案科,其中包括台站仪器变更信息、台站站址迁移信息、系统升级、站址环境变化及仪器高度变化信息等,涵盖目前新疆地区最为完整和准确的气象台站历史沿革元数据。
1.3 检验方法
PMFT方法是目前较为常用且不依赖于参考序列的均一性检验方法,该方法能够有效避免非均一的参考序列带来的检验误差,通常可以用于对年、月和日3种时间序列的均一性检验。其检验过程通过引入经验性的惩罚因子,很大程度降低了检验的误报率,并且能用于检验包含一阶自回归误差数据序列的多个间断点;其检验方式为通过回归检验算法依次分段找出序列中最可能的跳变点,并计算出所有跳变点的统计量,将其由大到小排列,判断最小的跳变点是否显著,当不显著时,剔除掉该跳变点,重新评估剩余跳变点的显著性,重复该过程,最终保留统计显著的跳变点。检验过程如下:假设εt是均值为0、方差为σ2的变量。对于线性趋势为β的时间序列{Xt},要检验其在t=K时刻是否存在间断点,其原假设为:
那么假设:
式(2)中μ1≠μ2,如果Ha为真,则时间点t=k为间断点,△=|μ1-μ2|为均值偏移大小,可通过式(3)得出最有可能的间断点:
其中:
式(6)中μ0和β0是在μ1=μ2=μ条件下的估计值。该方法通过引入经验函数,使其分布服从:
以上为均一性检验方法的具体构建方式,其经验函数构建方法详见Wang[23]。
1.4 订正方法
本文采用差值订正方法对检验出来的存在非均一点的序列进行了订正,其中差值订正是利用最后一段序列的趋势(均一的序列)和需订正的趋势之间的残差平均值的差值作为订正量来进行订正。
2.1 数据预处理
本文首先要对105个国家级气象台站数据完整性进行检验,筛选出1961—2014年数据完整、无缺测的站点;其次对通过完整性检验的台站进行必要的正态检验(文中通过K-S单样本检验方法对所有待检站点进行正态检验,检验结果见表1),最终得到47个站点符合条件,待检站点分布图见图1。
虽然本文所用的PMFT方法通过引入经验性的惩罚函数,使检验的命中率大幅提高,有效降低的非均一点的误报率,但考虑到均一性检验算法本身的不确定性等原因,本文采用现有的元数据和数理统计相结合的方式对检验出来的非均一断点进行确认,通过检验命中率(人为因素在元数据中记载的年份与检验结果的吻合程度)来评估分析最终检验结果,这样能最大程度保证检验的准确度和合理性。
表1 台站历史数据序列预处理
图1 站点分布图
在进行检验对比前,首先对台站历史元数据详细分析筛选,找出47个符合检验条件的待检站点1961—2014年可能对年平均风速数据序列均一性产生影响的人为因素,共计404个,其中所有站点经历站址迁移29次,仪器换型108次,观测环境变化163次,观测时次变化40次,仪器高度变化及其他因素64次;本文仪器高度变化的选择阈值为高度变化超过5 cm的年份;其次通过对待检站点建站至2014年的年平均大风日数进行统计划分,将47个待检站点划分为大风较少站、大风较多站和大风频发站(表2)3组进行PMFT检验,通过对比分析不同风速环境下的检验结果,找出不同风速环境下影响年平均风速数据序列均一性的变化规律及影响程度。文章中对新疆气象站点分类条件设定为:年平均大风日数<10 d为大风较少站,年平均日数10~40 d的为大风较多站,≥40 d的为大风频发站。
表2 待检台站按照大风日数分类统计的人为变化情况个
2.2 PMFT检验分析
通过结合台站元数据反复检验得出,PMFT方法在95%的显著性水平下检验出47个待检站点均出现非均一间断点,共计151个,其中站点站址迁移共计12次,仪器换型57次,观测环境变化46次,观测时次变化10次,仪器高度变化及其他因素22次,无元数据支持的断点4个,在表2中所有元数据支持的检测点中,有36%的检测点在95%的显著性水平下被定义为显著断点,这说明通过运用该方法对待检序列进行检验得出,超过1/3的人为因素对新疆地区年平均风速序列产生了显著的非均一影响(表3)。
由图2可以看出,经PMFT方法检验得出,新疆地区造成年平均风速数据序列显著非均一断点个数最多的因素是仪器换型,其次为观测环境变化,两类因素造成的断点个数占断点总数的2/3;由此可以说明,新疆地区造成年平均风速序列产生非均一性间断点的主要因素为观测仪器换型和观测环境变化,这主要是由于随着气象事业发展,风速观测业务的改革和站点环境改造,以及随社会经济的发展,周边城市化建设水平提高等因素带来的影响;其中台站风要素观测仪器换型对新疆地区年平均风速资料序列的影响尤为显著。
表3 待检台站按照大风日数分类统计的PMFT检验结果个
表4 断点检测命中率/%
图2 按照大风日数分类统计的PMFT检验结果
从图3中得出,3类待检站点的检验结果中,仪器换型因素所造成的非均一断点的检验命中率均达40%以上,是所有人为影响因素中断点检测命中率最高的一类,其中大风频发站断点检测命中率最高,高达60%以上,大风较多站次之,大风较少站则相对较少,检测命中率与台站年平均大风日数呈正比,由此说明在新疆地区风力越大的台站,观测仪器换型对年平均风速序列造成的非均一影响越大;此外,台站站址迁移所造成断点的检验命中率差异较为明显,大风频发站和大风较多站的断点检验命中率均达到40%以上,大风较少台站则只有20%,由此可以得出对于新疆地区年平均风速数据序列,站址迁移造成的非均一性影响与站点风力成正比,这可能和风要素的局地差异特性有关,对于风力越大的地区,新旧站址造成的差异越明显,对风要素的变化趋势造成的影响越大;观测环境变化则3类站点的断点检验命中率基本一致,大风较少台站略高于其他两类站点,说明在新疆地区站点风力大小对观测环境变化的均一性检验结果影响无明显差异,但该因素对新疆地区年平均风速序列所造成的非均一断点数量较多,影响较为突出,经查元数据,对3类待检站造成非均一影响较为明显的环境变化因素基本为高大建筑修建及防风林种植等,所以可以认为无论站点是否处于风力较大地区,气象站点附近高大遮挡物及植树造林工程均可能对风要素数据的连续性产生显著影响;仪器高度变化影响的断点检验命中率与站点风力大小成反比,且断点个数所占比例同样较高,对新疆地区年平均风速的非均一影响程度显著;观测时次变化影响的断点检验命中率同样与站点风力大小成反比。图3中大风频发站的断点命中率为零,是因为其元数据中记录的人为影响因素较少,且相邻年份出现其他人为影响较为显著,掩盖了其对数据序列的影响。
图3 3类大风日数分类统计待检台站的PMFT方法间断点命中率
另外,PMFT方法检测出4个显著性较高的无元数据支持的断点,占断点总数的3%。由图4看出,阿瓦提站无元数据支持的间断点年份附近出现了显著的趋势变化,1989年附近出现了显著的趋势下降现象,而从2004年附近,数据序列开始出现明显跳变提升;伊宁县站1995年附近同样出现了趋势的显著提升,而淖毛湖站在1988年附近则有明显的下降趋势变化,因为在台站的元数据中没有相关的人为变动记载,所以在PMFT方法的检验结果中将4个断点划分为无元数据支持的虚断点。通过详细翻查历史记载资料及实地考察调研,查明阿瓦提站在20世纪80年代末期,在测站正北方建成较大面积的果园,且与气象站仅一墙之隔,紧挨墙内的是气象站高3.2m视宽角32°的成排平房,侧面还有一栋视宽角11.6°,高7.4 m的气象局办公楼,该楼距观测场65m。另外,该站四周虽然未出现高大建筑物,但四周绿树成荫(最高仰角10.3°),地面植被茂盛,多层围墙阻隔,这都大大增强了地表摩擦力,对所测实际风速带来一定影响,而2004年左右测站正西面距离观测场60m修建了两条村级公路,且路基较高,该站盛行北风,西面出现长距离连续遮挡物,极可能使风速产生狭管效应。伊宁县站盛行风向是西风,在测站176°~360°方向有密集丛林及重叠的低矮建筑物,且20世纪90年代中期树木已形成一定的规模,严重阻碍了气流的正常流通,极有可能对正西方向风速产生明显影响。而淖毛湖1985年在测站东南方(在气象站围墙附近)种植的小树,3 a后已具规模,而该站盛行西北风,且年平均大风日数达90 d左右,因此可以判断该环境变化已对大风盛行的淖毛湖站风要素产生了显著影响。以上环境变化影响在元数据中并无记载,因为在新疆地区20世纪80年代多数气象台站的元数据对环境变化的记录不够详细和完整。由此可以得出,PMFT方法能够准确的检测出台站元数据中没有记录的显著跳变点,一定程度弥补了一些台站元数据不完整的弊端,提高了在元数据不完整情况下,均一性检测结果的准确性。
图4 阿瓦提、伊宁县和淖毛湖站无元数据支持的显著间断点
通过以上检验结果分析得出,PMFT方法对新疆地区年平均风速都有较好的均一性检验效果,尤其对仪器换型、站址迁移和仪器高度变化因素的非均一检验效果显著,有较高的检验命中率,但该方法的检验结果中出现了虚断点。上文通过元数据分析和资料详查,找出了PMFT方法检验结果中虚断点的产生原因,是由于元数据记录不完整所造成,最终将其归类为观测环境变化造成的非均一断点。因此该方法适用于新疆地区年平均风速数据的均一性检验。
经过订正后发现,新疆地区47个国家级气象站点的年平均风速序列总体平均值小幅上升,其中大风较少台站平均上升0.36m·s-1,大风较多台站平均上升0.29m·s-1,大风频发台站平均上升0.06 m·s-1,订正量与台站风速大小成反比,但总体保持下降的趋势,大风较少台站平均增速由-0.15m·s-1/10 a变为-0.16 m·s-1/10 a,下降0.01 m·s-1/10 a,大风较多台站平均增速由-0.20 m·s-1/10 a变为-0.25 m·s-1/ 10 a,下降0.05 m·s-1/10 a,大风频发台站平均增速由-0.33m·s-1/10 a变为-0.45m·s-1/10 a,下降0.12 m·s-1/10 a,增速下降浮动与台站风速大小呈正比,整体变化趋势与全国年平均风速普遍下降的趋势保持一致,并且序列的均一性得到明显改善,历史序列变化趋势趋于合理。并且可以看出(以图5淖毛湖、皮山、吐鲁番、红柳河为例),所有台站历史数据序列明显的趋势拐点趋于缓和,使待检站点近50 a的连续数据均一性趋于真实气候变化,具有较好的参考价值。
本文选用新疆地区数据序列完整且符合检验条件的47个国家级气象台站1961—2014年的年平均风速资料,采用PMFT均一性检验方法与台站历史沿革元数据相结合的方式,检验分析了影响新疆地区近50 a年平均风速数据序列均一性的非自然因素,以及在不同大风日数环境下讨论了该方法在新疆地区应用的特点及规律,并对检验出的非均一断点进行了订正。主要得到以下结论:
图5 淖毛湖、皮山、吐鲁番、红柳河站订正后对比
(1)通过PMFT检验方法对新疆地区47个待检台站进行检验得出,所有待检站点在95%显著性水平下均检验出非均一断点,其中有元数据支持的断点147个,占所有断点的97%,无元数据支持的断点4个,占所有断点的3%;有元数据支持的间断点总数占人为因素总数的36%,说明该方法检验得出,新疆地区超过1/3的人为变化因素使年平均风速序列产生了显著的非均一断点。对该方法中出现的4个非元数据支持断点进行分析发现,其产生的原因均为站点历史观测环境变化造成,并且影响显著,而新疆地区台站沿革记录不完整使本文将其划分为虚断点。由此可以看出,PMFT方法能够准确的检测出台站元数据中没有记录的显著跳变点,一定程度弥补了一些台站元数据不完整的弊端,提高了在元数据不完整情况下,均一性检测结果的准确性。由此可见,该方法在新疆地区年平均风速的非均一检验命中率为100%。
(2)通过对47个待检台站检验结果统计分析得出,仪器换型对新疆地区气象站点年平均风速的影响最大,其造成断点个数所占断点总数的比例最高,其次为观测环境变化;对检验结果进行不同大风日数环境下断点命中率的统计分析发现,在PMFT检验结果中,仪器换型和站址迁移对年平均风速的影响与台站风力大小成正比;其它三种人为因素对年平均风速的影响与台站风力大小成反比。
(3)对47个待检站点的非均一断点进行差值订正后,数据时间序列的均一性得到了极大改善,明显的趋势拐点趋于缓和,其中所有台站的年平均风速平均值小幅度上升,下降趋势整体略微增强,但没有改变新疆地区年平均风速变化的总体趋势,与全国年平均风速总体下降的变化趋势保持一致;使订正后的历史序列变化趋势更加趋于合理,均一性趋于真实。
(4)本研究重点分析了影响新疆地区年平均风速均一性的主要因素,讨论了PMFT方法对新疆大风区域站点年平均风速检验的适用性,分析了该方法在实际应用当中的优越性。通过均一性订正,得到了新疆地区47个国家级气象站点近50 a均一性较好的年平均风速数据序列集合,对新疆地区气候预测、天气预报及发展风能绿色产业奠定了较好的基础。
(5)本文通过运用PMFT方法对47个国家级气象站点1961—2014年的年平均风速数据进行了均一性检验和订正,讨论了该方法在不同大风日数环境下本地应用的特点及规律,并找出了影响新疆地区年平均风速数据均一性的主要因素,为今后新疆地区其他气象要素均一性检验提供了说明样例。但由于均一性检验算法本身的不确定性等原因,本文同样是采用元数据和数理统计相结合的方式对检验出来的间断点进行确认,故在元数据不完整情况下,检验仍需谨慎;同时,本文最终得到的订正后序列,虽一定程度修订了元数据中所记录的人为因素对时间序列的非均一影响,具有良好的应用参考价值,但仍不可完全等同于真实气候变化规律,如果要最大程度降低非均一因素对气象历史数据的影响,仍然需要更加深入的探索研究。
[1]Craddock J M.Methods of comparing annual rainfall records for climatic purpose[J].Weather,1979,34:332-346.
[2]Reeves J,Chen J,Wang X L,et al.A review and comparison of changepoint detection techniques for climate data[J].Journal of Applied Meteorology and Climatology,2007,46:900-915.
[3]Costa A C,Soares A.Homogenization of climate data:review and new perpectives using geostatistics[J].Mathematical Geoscience,2009,41:291-305.
[4]Alexandersson H.A homogeneity test applied to precipitation data[J].Int JClimatol,1986,6:661-675.
[5]Karl T R,Williams C N.An approach to adjusting climatological time series for discontinuous in homogeneities[J].JClimate and Appl Meteorol,1987,26:1744-1763.
[6]Vincent L.A technique for the identification of inhomogeneities in Canadian temperature series[J].J Climate,1998,11:1094-1104.
[7]Wang X L.Penalized maximal t-test for detecting undocumented mean change in climate data series[J].J ApplMeteor Climatol,2007,46(7):916-937.
[8]Wang X L.Accounting for autocorrelation in detecting mean shifts in climate data series using the Penalized Maximal T or F Test[J].Journal of Applied Meteorology and Climatology,2008,47(9):2423-2444.
[9]李庆祥.气候资料均一性研究导论[M].北京:气象出版社,2011:68-89.
[10]翟盘茂.中国历史探空资料中的一些过失误差及偏差问题[J].气象学报,1997,55(5):563-572.
[11]黄嘉佑,李庆祥.一种诊断序列非均一性的新方法[J].高原气象,2007,26(1):62-66.
[12]梁小文,杨梅学,万国宁,等.青藏高原气温序列的均一性研究[J].冰川冻土,2015,37(2):275-285.
[13]刘小宁,张洪政,李庆祥.不同方法计算的气温平均值差异分析[J].应用气象学报,2005,16(3):345-356.
[14]李庆祥,刘小宁,张洪政,等.定点观测气候序列的均一性研究.[J].气象科技,2003,31(1):3-10.
[15]李庆祥,江志红,黄群,等.长江三角洲地区降水资科的均一性检验与订正试验[J].应用气象学报,2008,19(2):219-226.
[16]江志红,黄群,李庆祥.近50年中国降水序列均一性检验与订正研究[J].气候与环境研究,2008,13(1):67-74.
[17]吴利红,骆月珍,孙莉莉.浙江省近34年年平均风速序列均一性检验研究[J].气象科技,2008,36(5):661-665.
[18]周昊楠,王秋香,华烨.乌鲁木齐逐月气温资料均一性检验和订正[J].沙漠与绿洲气象,2012,6(1):27-30.
[19]辛渝,赵逸舟,毛炜峄,等.新疆太阳总辐射资料的均一性检验与气候学估算式的再探讨[J].高原气象,2011,30(4):878-889.
[20]刘小宁.我国40年年平均风速的均一性检验[J].应用气象学报,2000,11(1):27-34.
[21]曹丽娟,鞠晓慧,刘小宁.PMFT方法对我国年平均风速的均一性检验[J].气象,2010,36(10):52-56.
[22]何冬燕,田红,邓伟涛.多种方法在年平均风速均一性检验中的效果对比[J].大气科学学报,2012,35(3):342-349.
[23]Wang X L.Penalized maximal f-test for detecting undocumented mean-shifts without trend-change[J].J Atmo Oceanic Tech,2008,25(3):368-384.
The Effect of Non-uniform Annual Average Wind Speed Data in Xinjiang
ZHOU Haonan1,HUA Ye2,QIN Rong1
(1.Xinjiang Meteorological Information Center,Urumqi830002,China;2.Xinjiang Meteorological Observatory,Urumqi830002,China)
Using the Penalized Maximal F Test(PMFT),we analyzed the conduct homogeneity test of the annual average wind speed data from 105 meteorological stations from their establishment to 2014 in gale areas of Xinjiang.And obtained homogenized dataset of annual average wind speed in Xinjiang by the revised;and were compared to assess based on the revised data and the original data,discuss the effectof non-uniformity data on which the application of the wind energy resource in Xinjiang,The results obtained:(1)The total 151 sites are checked out appear non-uniform discontinuities at the 95%significance level;(2)More than a third of human factors recording in metadata,which have a non-uniform impact on the annual averagewind speed sequence,the impact of change of instrumentmodel ismost significant,followed by change of station environment;(3)The effect of instrument type change and site relocation on the annual average wind speed is proportional to wind resource size at the station,and the other factors all are inversely proportional to wind resource size;(4)After homogeneity correction,the homogeneity of the time series data have been greatly improved,the obvious trend turning point of data series tends to be subsiding,and downtrend generally increased,to further improve data availability.
Xinjiang;wind speed;homogeneity;PMFT;revised
P468.026
B
1002-0799(2016)05-0017-08
10.3969/j.issn.1002-0799.2016.05.003
2016-05-06;
2016-06-15
2012年公益性行业气象科研专项(GYHY201206013)资助。
周昊楠(1984-),男,工程师,研究方向为气候数据均一化分析。E-mail:zhnlovezx007@sina.com
周昊楠,华烨,秦榕.新疆地区年平均风速数据非均一影响研究[J].沙漠与绿洲气象,2016,10(5):17-24.