基于R语言的高原地区地闪频次和雷电流幅值特征分析

2020-03-03 05:06王秀英金欣黄志凤欧建芳罗少辉
河南科技 2020年34期
关键词:雷电气象灾害

王秀英 金欣 黄志凤 欧建芳 罗少辉

摘 要:為探究西宁地区地闪频次与雷电流幅值的关系,利用2013—2017年闪电定位监测数据,运用R语言研究该区域内地闪频次和雷电流幅值变化特征,通过可视化直观展示两者间的相关性,在相关性分析基础上,建立基于地闪频次的小时雷电流幅值回归模型。结果表明,2013—2017年西宁市辖区内小时地闪频次最大为98次,雷电流幅值最大值为138 kA;地闪频次极值点处,雷电流幅值为峰值或在峰值左右;累计时次内的地闪频次和雷电流幅值最大值呈显著正相关,相关系数达0.856([N]=29);基于地闪频次拟合的小时雷电流幅值回归模型能够解释观测值73%的方差,模型的模拟效果较好,可用于小时雷电流幅值的预测。但由于样本有限,需要在多资料融合的基础上研究闪电定位监测数据,才能使模型稳定性更强,更深入了解雷电流幅值变化的机制,从而为雷电灾害风险区划和雷电灾害调查提供技术指标,为气象防灾减灾提供决策依据。

关键词:雷电流幅值;地闪频次;统计分析;R语言

中图分类号:P468.02文献标识码:A文章编号:1003-5168(2020)34-0144-06

The Characteristic Analysis and R Realization of Ground Flicker Frequency

and Lightning Current Amplitude in Plateau Region

WANG Xiuying JIN Xin HUANG Zhifeng OU Jianfang LUO Shaohui

(Qinghai Meteorological Disaster Prevention Technology Center,Xining Qinghai 810000)

Abstract: In order to explore the relationship between lightning frequency and lightning current amplitude in Xining area, this paper used the lightning location monitoring data from 2013 to 2017, studied the variation characteristics of lightning frequency and lightning current amplitude in the region by using R language, and visually displayed the correlation between them. Based on the correlation analysis, the regression model of hourly lightning current amplitude based on ground flash frequency was established. The results show that the maximum hourly lightning frequency is 98 times and the maximum lightning current amplitude is 138 kA in Xining City from 2013 to 2017, and the lightning current amplitude is the peak value or around the peak value at the extreme point of ground flicker frequency. There was a significant positive correlation between the lightning flicker frequency and the maximum lightning current amplitude, and the correlation coefficient was 0.856 (n=29). The maximum regression model of lightning current amplitude fitting based on ground flicker frequency can explain the variance of observed value by 73%, and the simulation effect of the model is good, which can be used to predict the maximum value of lightning current amplitude. However, due to the limited samples, it is necessary to study and analyze the lightning location monitoring data on the basis of multi-data fusion, in order to make the model more stable and to understand the mechanism of lightning current amplitude change more deeply. It can provide technical index for lightning disaster risk regionalization and lightning disaster investigation, and provide decision basis for meteorological disaster prevention and mitigation.

小时地闪频次.次.             1.0000000              0.8563068

小時雷电流幅值.kA.           0.8563068              1.0000000

结果表明,小时地闪频次与不同地闪频次的小时雷电流幅值呈显著正相关,相关系数为0.856([N]=29)。

4.2 相关关系的显著性检验

利用R语言模块中的cor.test()函数对单个的Pearson相关系数进行检验。结果表明,小时地闪频次与不同地闪频次的小时雷电流幅值两者之间相关度不为0。相关关系显著性检验的R核心代码如下:

cor.test(data_1[,1],data_4[,2])

#运行结果

Pearson's product-moment correlation

data:  data_1[, 1] and data_1[, 2]

t = 8.6153, df = 27, p-value = 3.137e-09

alternative hypothesis: true correlation is not equal to 0

95 percent confidence interval:

0.7138306  0.9307155

sample estimates:

cor

0.8563068

4.3 回归分析

利用OLS(Ordinary Least Square,普通最小二乘法)回归法研究地闪频次和雷电流幅值之间的变化规律。线性回归模型侧重考察变量之间的变化规律,并通过线性回归方程来描述其关系,进而确定一个变量的变化对另一个变量的影响程度,为预测提供科学依据。在R语言中,拟合线性模型最基本的函数是lm()[22]。为了使结果更加直观,制作小时地闪频次与不同地闪频次的小时雷电流幅值的散点图,如图5所示。从图5可知,地闪频次和雷电流幅值呈线性关系,由此作回归分析研究。

回归分析的R核心代码如下:

data_2-read.delim("clipboard")

myfit<-lm(LD~LN,data=data_2)

summary(myfit)

#运行结果

Call:

lm(formula = LD ~ LN, data = data_2)

Residuals:

Min      1Q     Median      3Q     Max

-52.883   -7.541    -1.311    12.288   26.480

Coefficients:

Estimate  Std. Error  t value  Pr(>|t|)

(Intercept)   25.4612   4.3558    5.845   3.18e-06 ***

LN            0.9623    0.1117    8.615   3.14e-09 ***

Signif. codes:  0 ‘*** 0.001 ‘** 0.01 ‘* 0.05 ‘. 0.1 ‘ 1

Residual standard error: 16.98 on 27 degrees of freedom

Multiple R-squared:  0.7333, Adjusted R-squared:  0.7234

F-statistic: 74.22 on 1 and 27 DF,  p-value: 3.137e-09

由计算结果得到:

[β0=25.4612β1=0.9623sd(β0)=4.3558sd(β1)=0.1117]                            (1)

回归系数的[P]值均小于3.18×10-6,显著性差异明显,模型的方差解释率达到73.3%。F分布的[P]值为3.137×10-9,显著性差异明显,该模型通过了t检验和F检验,因此,回归方程为:

[LD=25.46+0.96×LN]                           (2)

其中,[LD]为小时雷电流幅值;[LN]为小时地闪频次。

5 结论和讨论

5.1 结论

本文基于R语言,将数理统计分析引入雷电信息化系统中,为雷电数据的深入分析、挖掘提供了便利。研究结果表明,2013—2017西宁市辖区闪电定位监测数据小时地闪频次最大为98次,小时雷电流幅值为138 kA。由地闪频次和雷电流分布图可知,地闪频次极值点处,雷电流幅值为峰值或在峰值左右。小时地闪频次与小时雷电流幅值散点矩阵图表明,累计时次内的地闪频次和雷电流幅值呈显著正相关,相关系数为0.856([N]=29),说明地闪频次和雷电流幅值具有较高相关性,地闪频次越高,雷电流幅值越大。基于地闪频次拟合的小时雷电流幅值回归模型能够解释观测值73%的方差,模型的模拟效果较好,可用于小时雷电流幅值的预测。

5.2 讨论

在利用雷电流强度和频次进行雷电流活动特征研究分析过程中,国内研究人员[23-27]大部分立足于雷电灾害的致灾因子、孕灾环境和承灾体系统,计算评估值,得出雷电灾害发生的潜势等级。本文利用R语言实现地闪频次和雷电流幅值的可视化,并通过模型建立,得出地闪频次和雷电流幅值间的线性关系。研究表明,地閃频次和雷电流幅值的回归模型差异性显著([P]<0.05),模型可以预测雷电流幅值的大小,找出可能造成雷击灾害的地闪频次数。然而,由于闪电数据样本有限,导致模型稳定性不强,因此,在多资料融合的基础上,闪电定位数据的特征有待进一步研究。另外,本研究统计分析结果出现离群点,在未来研究中,将针对异常雷电流幅值进行探索研究,以便更深入地理解雷电流幅值变化的机制,从而为雷电灾害风险区划和雷电灾害调查提供技术指标,为气象防灾减灾提供决策依据。

参考文献:

[1]张春松,杨晓玲,刘蓉,等.甘肃武威市雷暴天气时空分布特征[J].干旱气象,2015(4):659-665.

[2]王智刚,丁海芳.建(构)筑物雷电灾害区域影响评估方法与应用[M].北京:气象出版社,2014:14.

[3]刘维成,陶健红,邵爱梅,等.雷电监测预警预报技术简述[J].干旱气象,2014(3):446-453.

[4]林溪猛,卢辉林,黄月清,等.福建古雷石化基地雷电活动特征及对策分析[J].气象与环境科学,2016(4):109-114.

[5]高峰,杨金玲.基于闪电定位仪监测的雷暴特征分析[J].现代农业科技,2017(23):194-198.

[6]邓猛.山东地区雷暴分布特征及潜势预报研究[D].南京:南京信息工程大学,2013:10-11.

[7]张雅斌,高菊霞.高原东北侧灾害性雷暴的大气电场特征分析[C]//第26届中国气象学会年会论文集.陕西省防雷中心,2009:2068-2074.

[8]邹宗峰,朱艳科,夏云等.基于R语言的AHP分析程序设计[J].数理医药学杂志,2013(4):468-470.

[9]黎一盈,王恒俭,李宏超,等.大数据时代下高危污染源的预警研究[J].科技资讯,2016(4):468-470.

[10]杨霞,吴东伟.R语言在大数据处理中的应用[J].科技资讯,2013(23):19-20.

[11]杨帆,申贵成.基于R语言的网页抓取与数据收集[J].现代经济信息,2017(33):307-308.

[12]卡巴克弗.R语言实战[M].2版.王小宁,等译.北京:人民邮电出版社,2016:121.

[13]袁佳.R语言及ggplot2在环境空气监测数据可视化中的应用[J].中国高新技术企业,2015(16):89-91.

[14]王志良,曹蕾,李彬彬.R语言在降水极值统计分析中的应用[J].人民黄河,2012(5):22-24.

[15]肖颖为,葛铭.R语言在数据预处理中的开发应用[J].杭州电子科技大学学报,2012(6):165-168.

[16]赵义军,张小轩,商梦娇.多元回归分析在温度预测中的应用及R实现[J].佳木斯大学学报,2016(6):1020-1025.

[17]盛坤,杨丽娟,李晓航等.基于R语言的冬小麦品种稳定性分析[J].中国农学通报,2016(30):14-21.

[18]刘二刚,马建强.R语言在统计分析中的使用技巧[J].电脑知识与技术,2017(1):251-253,256.

[19]陈希.基于R语言数据挖掘的社交网络客户细分研究[D].北京:北京邮电大学,2011:34-40.

[20]陈毅恒,梁沛霖.R软件操作入门[M].北京:中国统计出版社,2006:76-78.

[21]叶文春.浅谈R语言在统计学中的应用[J].中共贵州省委党校学报,2008(4):123-125.

[22]薛毅,陈立萍.统计建模与R软件[M].北京:清华大学出版社,2007:32-33.

[23]王凤娇,任钟冬,韦良文,等.雷电灾害等级划分及发生潜势指标探讨[J].气象科技,2009(6):744-747.

[24]郭虎,熊亚军,扈海波.北京市雷电灾害灾情综合评估模式[J].灾害学,2008(1):14-17.

[25]李家启,秦健,李良福,等.雷电灾害评估及其等级划分[J].西南大学学报(自然科学版),2010(11):140-144.

[26]王敏,孔尚成,王秀英.青海东部地区雷电灾害易损性分析与区划[J].气象科技,2018(2):26-31.

[27]程萌,王秀丽.基于闪电定位数据的鲁西南地区雷电灾害易损度区划[J].气象与环境科学,2017(4):126-131.

猜你喜欢
雷电气象灾害
气象树
避雷妙招
笔记本雷电接口究竟有何用?
文章有象
灾害肆虐
2015年我国海洋灾害造成直接经济损失72.74亿元
雷电能治病吗?/自杀疑云