龚连蓉,徐 恬,周 婧
(安徽财经大学统计与应用数学学院,安徽 蚌埠 233030)
南极洲平均地表温度分析与预测的研究
龚连蓉,徐恬,周婧
(安徽财经大学统计与应用数学学院,安徽 蚌埠 233030)
目的针对南极洲平均地表温度这一核心问题,建立定义平均地表温度的数学框架,并分析时间和温度的关系。方法以南极洲温度为研究对象,通过美国航空航天局网站获取相关数据,随机选择4个站点的数据、利用区域优化平均法求出整个南极洲地区的平均地表温度、大气压力、相对湿度、地平面50 m高度风速、地平面10 m高度空气温度和地表辐射量。选择与平均地表温度相关性较大的影响因素建立线性回归模型,以南极洲的平均地表温度建立SARMA时间序列模型,通过使用SPSS,EVIEWS等软件,定义出平均地表温度,分析出时间与温度的变化关系。并与之前的温度进行对比,对温度变化趋势做出预测。结果南极洲平均地表温度定义为:平均地表温度=8.802-0.119×相对湿度+0.36×地平面50 m高度风速+1.199×地平面10 m高度空气温度-0.17×地表辐射量。南极洲平均地表温度与时间的关系可表示为:(1-B)(1-B3)xt=εt/(1+2.319B+2.078B2+0.709B3)。结论近年来温度逐渐上升,导致冰川融化,海平面上升甚至更多危害,呼吁大家减少温室气体的排放,共同维护美丽的地球家园。
平均地表温度;区域优化平均法;线性拟合;时间序列分析;EVIEWS
地表气温变化是气候变化研究的核心问题之一,对某一区域或全球范围而言,研究其平均气温变化十分重要[1]。地表温度是地面与大气界面热状况的显示器,是衡量气候变化的一个重要标志,是地表与大气相互作用过程中最重要的物理学参量之一,在全球环境变化、气候、气象、地震、农业等诸多相关学科研究中具有重要意义[2]。在先前的估计中,在土地平均定义有一些方法上的差异,为简单起见,只考虑南极洲。本文旨在建立一个定义和估计从气象站温度计数据的平均表面温度的数学框架,并描述南极的温度变化(详见2015年数学建模小美赛B题[1])。
1.1研究思路
任选南极洲的4个地区,利用区域优化平均法计算出南极洲的平均地表温度和大气压力、相对湿度、地平面50 m高度风速、地平面10 m高度空气温度及地表辐射量。分析各因素与平均地表温度之间的相关性,选择相关性比较大的因素与平均地表温度做拟合分析,得出的表达式就是平均地表温度的定义。思路流程图如图1所示。
图1 思路流程图1
1.2数据处理
1.2.1区域优化平均法
区域优化平均法是一种计算区域平均温度的方法[3]。选择目标区域内N个温度观测点,T(i,t)表示点i在t时刻的温度,w(i)表示点i的权值1≤i≤N,则实际区域平均温度为:
(1)
权值ω(i)满足约束条件:
ω(1)+ω(2)+…+ω(N)=1
(2)
利用(1)式计算区域平均温度之前,通过优化加权机制计算点i的权值ω(i),化加权机制以均方差最小化为基础。理想平均温度和实际平均温度的均方差为:
(3)
E2越小,表示实际平均温度和理想平均温度越接近。设E2不受时间影响,式(3)进一步展开为:
(4)
其中ρ(i,j)=〈T(i,t)T(j,t)〉,下面简称ρij,假定为准静态。权值ω(i)满足约束条件(2)式且使得(4)式均方差最小,权值ω(i)即为最优权值。拉格朗日乘子法计算最优权值,设拉格朗日乘子为-2A,乘子结合(2)式和(4)式得到新函数F如下:
F(ω(1),…,ω(N)=E2(ω(1),…,ω(N))-2A((ω(1)+ω(2)+…+ω(N)-1)
(5)
上式分别对ω(1),ω(1),…,ω(N),A求偏导数,且令偏导数等于0,得到ω(1),ω(1),…,ω(N),A为未知量的方程组,其矩阵形式如下:
(6)
现随机选取4个观测点,计算得出各地区的权重,如表1所示。
表1 各地区的权重
加权平均计算南极洲各因素数据如表2所示。
表2 南极洲各因素数据
1.2.2建立线性拟合模型
1)模型简介
研究在线性关系相关性条件下,2个或者2个以上自变量对1个因变量,为多元线性回归分析,表现这一数量关系的数学公式,称为多元线性回归模型[4]。
一般情况自变量与因变量之间存在着某种相关关系,相关关系之间的强弱程度用相关系数r表示:
相关系数的取值范围在[-1,1]之间,正负号仅表示方向,不表示大小。因变量可由相关性较大的自变量来表示:
y=β0+β1x1+β2x2+…+βkxk
其中β0称为回归常数,β1,β,…,βk称为回归系数,y称为被解释变量,是k个可以精确控制的一般变量,称为解释变量,也就是自变量。
对多元线性回归,也需要测定方程的拟合程度,检验方程的拟合效果是否优秀。测定多元线性回归的拟合度程度,与一元线性回归中的判定系数类似,使用多重判定系数,其中定义为:
式中,SSR为回归平方和,SSE为残差平方和,SST为总离差平方和[5]。
同一元线性回归相类似,0≤R2≤1,R2越接近1,回归平面拟合程度越高,反之,R2越接近0,拟合程度越低。
2)模型的建立与求解
结合表2,分析各因素与平均地表温度之间的相关性,选择相关性比较大的因素与平均地表温度做拟合分析,得出的表达式就是平均地表温度的定义。通过SPSS求得各因素之间的相关性大小如表3所示。
表3 相关性大小
由此可知平均地表温度与大气压力的相关性较小,与相对湿度、地平面50 m高度风速、地平面10 m高度空气温度、地表辐射量之间的相关性较大。对相关性较大的因素与平均地表温度进行拟合,得到结果:
Y=8.802-0.119X1+0.36X2+1.199X3-0.17X4
拟合度为0.99,表明几乎绝大多数的数据都可用这个模型来解释。
1.3结果及结果分析
由上述分析过程可以将平均地表温度定义为:
平均地表温度=8.802-0.119*相对湿度+0.36*地平面50 m高度风速+1.199*地平面10 m高度空气温度-0.17*地表辐射量。
相对湿度和地表辐射量与平均地表温度呈现负相关关系,地平面50 m高度风速和地平面10 m高度空气温度与平均地表温度呈现正相关关系。相对湿度和地表辐射量每增加一单位,平均地表温度减少0.119和0.17单位;地平面50 m高度风速和地平面10 m高度空气温度每增加1单位,平均地表温度分别增加0.36和1.199单位。由此可见,空气温度对平均地表温度的影响较大,其它因素也具有一定影响力。
2.1研究思路
利用区域优化平均法计算出南极洲近8年的平均地表温度。要求温度变化和时间的关系,建立时间序列分析模型。由于季节因素的影响,应建立SARMA模型。拟合出平均地表温度与时间的表达式,并对未来几年的平均地表温度进行预测。建模思路流程图表现为图2。
图2 思路流程图2
2.2数据处理
由于参考数据缺失较多,现随意选取4个数据较完整的地面站近8年的月度平均地表温度,利用区域优化平均法,计算出南极洲近8年的月度平均地表温度。如表4所示:
表4 南极洲近8年月度平均地表温度(℃)
2.3建立时间序列模型
2.3.1模型的简介
SARMA模型是一类常用的时间序列模型,其基本思想是:依据变量自身的变化规律,利用外推机制描述时间序列的变化。其使用前提是时间序列是为零均值的平稳随机过程。对于包含趋势性和季节性的非平稳序列,须经适当的逐期差分和季节差分消除影响后再对序列进行分析,建立SARMA(p,d,q)模型。SARMA模型的一般表现形式为:
φP(B)φP(BS)d(1-BS)Dyt=θq(B)θ(BS)μt
式中:yt为时间序列,μt为随机项,φP(B)为非季节部分AR(p)部分,φP(BS)为季节AR(p)部分,(1-B)d为d阶逐期差分,(1-BS)D为D阶逐期差分,θq(B)为非季节性MA(q)部分,θ(BS)为季节性MA(q)部分。
SARMA模型(auto-regressive and moving average model)是研究时间序列的重要方法,由自回归模型(简称AR模型)与滑动平均模型(简称MA模型)为基础“混合”构成。在市场研究中常用于长期追踪资料的研究,如Panel,用于研究消费行为模式变迁,在零售业具有季节变动特征的销售量、市场规模的预测等。
混合模型ARMA(auto-regressive moving-average)如果时间序列yt满足,则称时间序列为yt服从(p,q)阶的自回归滑动平均混合模型[6]。
将预测指标随时间推移而形成的数据序列看作是一个随机序列,这组随机变量所具有的依存关系体现着原始数据在时间上的延续性。一方面,影响因素的存在;另一方面,又有自身变动规律。假定影响因素为x1,x2,…,xk,由回归分析
Y=β0+β1x1+β2x2+…+βkxk+e
其中Y是预测对象的观测值,e为误差。作为预测对象Yt受到自身变化的影响,其规律可由下式体现,
Y=β0+β1xt-1+β2xt-2+…+βpxt-p+et
误差项在不同时期具有依存关系,由下式表示,
et=α0+α1et-1+α2et-2+…+αqet-q+μt
由此,获得ARMA模型表达式:
yt=φ1yt+φ2yt+…+φpyt+et-θ1et-1-θ2et-2-…-θqet-q
2.3.2模型的识别
从2008-2015年南极洲的月度温度变化来看,其波动具有明显的季节性和波动性(图3)。假如没有季节效应的影响,南极洲的平均地表温度始终在某个均值附近随机波动,季节效应的存在,会使气温在不同年份的相同月份呈现出相似的性质。因此可以考虑采用差分自回归移动平均法(SARMA)建立模型[7]。
2.3.3模型的建立
为了消除季节性的影响,对原序列做一阶12步差分,得到新的序列,时序图见图4。
图3南极洲近8年月平均地表温度时序图 图4差分后的时序图
对其进行ADF检验可知序列是平稳的。为确定SARMA(p,q),模型中的p,q,分析序列的自相关系数与偏自相关系数图,如图5。
分析图5可知:序列的自相关系数拖尾,偏自相关系数3阶截尾。因此可以建立AR(4)模型,拟合结果如图6所示。
图6 AR(4)模型拟合结果
模型的拟合优度为0.9813,拟合效果较好。最终得到温度变化与时间的关系式为:
图7 模型预测
2.3.4模型的预测
利用EVIEWS对2015年的温度进行预测:
分析图7可知,南极洲平均地表温度的波动比前些年的小,并且温度对比之前有一定的上升。说明在全球变暖的趋势下,南极洲温度也在上升当中。希望人们对此引起重视,遏制全球变暖刻不容缓。
2.4结果及结果分析
由上述分析得到温度随时间的变化关系可表示为:
并且对近几年的温度进行预测和对比可知,对比之前平均地表温度正在有波动地上升。而近些年由于温度上升所带来的冰川融化现象不在少数,将会引发更多水灾、旱灾、热浪和推动海平面升高。虽然冰川融化已经没有办法阻止,但只要人类减少造成气候暖化的温室气体的排放,就可以减缓冰川融化的速度。
结合区域优化法,线性回归和SARMA模型,得到了对平均地表温度的定义:平均地表温度=8.802-0.119×相对湿度+0.36×地平面50 m高度风速+1.199×地平面10 m高度空气温度-0.17×地表辐射量。温度随时间变化的关系可表示为:
并通过对比得出温度在逐渐上升的结论。
以上各模型在建模过程中通过相应的软件检验,具有一定合理性[8]。对于影响平均地表温度的因素,通过区域优化平均法选取大量的数据进行分析,运用软件进行计算使得结果更加准确。但仍然存在一些问题有待改进。平均地表温度的影响因素有很多,需要综合考虑。利用区域平均法以4个区域的数据代替整个南极洲的数据,处理方法过于粗糙,存在一定误差。这些都是值得深入研究的方向。
[1]杜予罡,唐国利,王元.近100年中国地表平均气温变化的误差分析[J].高原气象,2012,31(02):456-462.
[2]柳钦火,符铠华,高晴,等.基于时间序列分析的地表温度变化过程探讨[J].科学技术与工程,2005,5(19):1303-1304.
[3]王聪,黄宁,杨保.区域优化平均法的改进及其在计算平均温度中的应用[J].地理科学,2014,34(02):237-241.
[4]邓维斌,唐兴艳,胡大权,等.SPSS 19统计分析实用教程[M].北京:电子工业大学出版社,2013:3-102.
[5]庞皓.计量经济学[M].北京:科学出版社,2007:1-70.
[6]王燕.应用时间序列分析[M].北京:中国人民大学出版社,2005:20-98.
[7]杨桂元,黄己立.数学建模[M].合肥:中国科技大学出版社,2008:15-66.
[8]杨桂元,朱家明.数学建模竞赛优秀论文评析[M].合肥:中国科技大学出版社,2013:1-82.
[责任编辑:关金玉英文编辑:刘彦哲]
Analysis and Prediction of Average Surface Temperature on the Antarctic
GONG Lian-rong,XU Tian,ZHOU Jing
(School of Statistics and Applied Math,Anhui University of Finance and Economics,Bengbu,Anhui 233030,China)
ObjectiveRegarding the average surface temperature of the Antarctic as a core issue,a method was established to define the average surface temperature,and analyze the relationship between time and temperature.MethodsTaking Antarctic temperature as the research object,through the NASA website the relevant data were obtained.And by average region optimization the data of four sites were randomly selected and calculated,obtaining the average surface temperature,atmospheric pressure,relative humidity,wind speed with 50 m above horizon,air temperature at 10m above ground plane and surface radiation amount of the Antarctic.The influencing factors which were more associated with the average surface temperature were chosen to build a linear regression model.TheSARMAtime series model was established based on the mean surface temperature of the Antarctic.Then using EVIEWS,SPSS and other software,the average surface temperature was defined,and the relationship between the time and the temperature was analyzed.The trend of temperature change is predicted by comparing it with the temperature in the past.ResultsThe average surface temperature of the Antarctica is defined as:the average surface temperature=8.802-0.119*relative humidity+0.36* wind speed at 50m above ground plane+1.199* air temperature at 10m above ground plane-0.17*surface radiation ground plane 10m high.The average surface temperature and time can be expressed as:(1-B)(1-B3)xt=εt/(1+2.319B+2.078B2+0.709B3).ConclusionIn recent years, the temperature has gradually increased, leading to the melting of glaciers,sea level rise and more harm.So It is hoped that everyone has to reduce greenhouse gas emissions and jointly safeguard the beautiful earth home.
mean land surface temperature;regional optimization method;linear fitting;time series analysis;EVIEWS
龚连蓉(1995-),女,安徽安庆人,安徽财经大学在读学生,研究方向:数字建模。
P 423.3
A
10.3969/j.issn.1673-1492.2016.09.010