吴 静,张德罡,李纯斌
(1.甘肃农业大学 草业学院/草业生态系统教育部重点实验室/甘肃省草业工程实验室/中-美草地畜牧业可持续发展研究中心,甘肃 兰州 730070;2甘肃农业大学资源与环境学院,甘肃 兰州 730070)
地表是连续分布的曲面,但地面观测的数据是离散的,不能完全覆盖地表范围,目前尚没有很好的办法找到一个曲面来覆盖地表[1-4]。以地面观测的样本点数据为基础来模拟连续地表曲面,传统上多采用建立数字地面模型来实现,即在现有的站点基础上直接利用空间插值算法来进行插值。但存在站点较密集的地方插值效果好,精度高,而站点较少的地方则误差较大的缺点[5]。可以采用先进行站点加密,再进行空间插值的方法解决这一问题。辜智慧等[6]在锡林郭勒盟利用地统计学分析方法进行了站点的加密研究,认为增加站点是解决插值问题的手段之一。
中国西北地区气象站点总数量少,分布不均匀[7-10],因而直接利用站点数据进行空间插值效果较差。≥0 ℃年积温是重要的气象要素,是草原综合顺序分类中的重要指标[11-14],试验以西北地区的甘肃省为研究区,利用人工神经网络方法,对≥0 ℃年积温站点数据进行插值加密,以期改善西部地区由于气象站点数量少、分布不均匀带来的气象要素空间插值结果误差较大的问题。
研究采用甘肃省及陕西、宁夏、青海、新疆、内蒙古周边地区202个气象站点1960~2009年逐日气温资料(图1),各项数据来源于美国国家气候数据中心(National Climatic Data Center,NCDC)第7版数据集(http:∥www.ncdc.noaa.gov/)以及中国气象科学数据共享网(http:∥cdc.cma.gov.cn/satellite/)。
人工神经网络(Artificial Neural Network,ANN)不要求对事物机制有明确的了解,输出结果取决于系统输入和输入输出之间的权重,而权重的数值通过训练样本的学习获得[15]。这种方式对解决机理尚不明确的问题特别有效,非常适合用来解决区域插值问题[16,17],该方法在气象要素的插值方面已经有了一定的应用,被认为是一种可行的方法[18,19]。
人工神经网络具有三层或三层以上的多层神经网络。最基本的神经元网络是三层网络结构,即一个输入层、一个隐含层(中间层)和一个输出层。输入层的功能是向神经元网络计算机提供信号,通常把模拟的感觉输入到神经网络;隐含层是输入与输出层之间的层次,为神经元网络提供记忆和计算功能;输出层输出神经元网络的计算结果,也输出处理元素实现其功能(图2)。
图1 甘肃省及周边地区202个气象站点分布Fig.1 Distribution of 202 meteorological stations inside and around Gansu Province
图2 三层神经网络模型Fig.2 Common artificial neural network(ANN) model with three layers
图2中,椭圆代表神经元,也称节点。隐含层用于模拟输入数据的非线性模式,网络可以有多个隐蔽层,每层的节点数可以不同。
输入层用Pi表示(i为输入层的节点数);隐含层用hj=f(Sj)表示(j为隐含层的节点数);输出层用ok
=f(Sj)表示(k为输出层的节点数)。它们之间的关联是:
输入层Pi
(1)
(2)
输入层只是输入数据的接口而不对数据进行任何处理;隐含层和输出层的节点都包含处理单元,所作的处理包括一个加权求和及变换操作。wji和wkj代表权重;通常采用线性函数和对数函数或S型函数(Sigmoid函数)作为网络的激活函数,其表达式为:
(3)
人工神经网络的运行可分成2个阶段即网络学习(或训练)和网络的联想。
根据神经网络的拓扑结构和信息流的传递方式,人工神经网络可以分为前馈网、反馈网和混合网3种形式。BP(Back Propagation)网络是1986年由Rumelhart和McCelland为首的科学家小组提出,是按误差逆传播算法训练的多层前馈网络,是目前应用最广泛的神经网络模型之一。
(1)气象数据处理 根据≥0 ℃年积温的定义,从原始的每日气温气象数据中提取每年≥0 ℃的所有天数的加和,得到气象站点逐年≥0 ℃年积温数据。
(2)建立神经网络拟合≥0 ℃年积温 在Matlab平台上建立了含2个隐含层的BP神经网络(图3)。
图3 神经网络结构Fig.3 Structure of ANN
其中,输入层有3组数据,分别是经度、纬度和海拔;输出层一组数据,为拟合值。第1隐含层有10个神经元,第2隐含层有20个神经元。
处理步骤:数据的归一化处理用mapminmax函数将输入数据集和目标数据集分别作归一化处理(映射到[0,1]),以提高网络训练效率和去量纲。
数据分类:用dividevec函数打乱数据顺序,抽取正常训练用数据(train data),变量数据(validate data),以及测试数据(test data),可以使数据更加具备典型性和更优良的泛化能力。
建立神经网络:用newff函数建立BP神经网络,设置网络层数,每层的节点数,隐含层的传输函数等。
指定训练参数进行训练:设置最大训练次数,训练目标,学习率、训练算法等参数,进行网络训练。完成训练后,用sim函数调用训练结果,输入测试数据,进行测试。
数据反归一化处理:用mapminmax函数将结果进行反归一化处理。
利用神经网络分别对分区已有站点数据训练网络,经过多次训练试验和调整参数,得到网络输出值与实测值拟合效果好的网络;然后,用训练好的网络对加密的站点进行≥0 ℃年积温拟合。
3.2.1 分区与站点加密 为提高插值精度,根据甘肃省地形和气候特点,以六盘山和乌鞘岭为分界线,将研究区划分为东部,中部和西部,东部以陇东黄土高原为主,中部以陇中黄土高原为主,西部以河西走廊戈壁荒漠、沙漠为主。
通过神经网络,西区加密站点202个,中区加密站点102个,东区加密站点65个, 这样将用于插值的气象站点数量由202个增加为571个(图4)。加密方法为随机选点加密。
图4 站点加密处理前后对比Fig.4 Comparison between Pre-and post increasing density of stations
3.2.2 图表分析 用散点图和曲线拟合图从总体上来衡量网络输出值与实测值的吻合情况。以训练样点的实测值为横坐标,以神经网络输出值为纵坐标做出散点图。图4中散点的拟合直线越接近45°方向上的直线,则表明输出值越接近实测值,结果越理想。以训练点为横坐标,网络输出值和实测值为纵坐标,画出各点网络输出值与实测值的拟合曲线图5。两条曲线越相似,说明网络输出值与实测值越接近,结果越理想。
图5 ≥0 ℃年积温输出值与实测值的散点Fig.5 Scatter Diagram of ≥0 ℃ annual accumulated temperature between output value and measured value
图6 ≥0 ℃年积温输出值与实测值的曲线拟合Fig.6 Fitting Curve of ≥0 ℃ annual accumulated temperature between output value and measured value
注:绿色曲线代表实测值,蓝色曲线代表训练输出值
3.2.3 精度评价 用平均绝对误差(MAE)、平均相对误差(MRE)和均方根误差RMSE等指标对精度进行了评价。
(4)
(5)
(6)
式中:Zri为神经网络输出值,Zpi为实际测定值,n为样点数。
平均绝对误差将各次输出值与实测值的绝对误差取绝对值后再求平均值,平均相对误差等于绝对误差与实测值之比的平均值,通常用百分数表示。均方根误差等于输出值与实测值偏差的平方和观测次数n比值的平方根(表1)。
表1 神经网络拟合误差Table 1 Fitting error of ANN
通过分析,东部要明显好于中部和西部,而西部的精度最差,查看气象站点的分布可以看出,东部的气象站点分布密度明显高于其他区域,而西部的气象站点又为三者中最少。其中,相差最大的是MAE,东部要比西部低79.30 ℃。
将甘肃省划分为东、中、西3个区域,利用气象站点地面观测≥0 ℃年积温数据,建立人工神经网络,拟合得到571个地面点数据,并对3个区域结果精度进行了图表及指标分析。结果表明:东部的插值精度明显好于中部和西部,西部的插值精度最差,主要原因是气象站点数据过于稀疏。
参考文献:
[1] 李新,程国栋,卢玲.空间插值方法比较[J].地理科学进展,2000,15(3):260-265.
[2] 林忠辉,莫兴国,李宏轩,等.中国陆地区域气象要素的空间插值[J].地理学报,2002,57(1):47-56.
[3] 方书敏,钱正堂,李远平.甘肃省降水的空间内插方法比较[J].干旱区资源与环境,2005,19(3):47-50.
[4] 刘宇,陈泮勤,张稳.一种地面气温的空间插值方法及其误差分析[J].大气科学,2006,30(1):146-152.
[5] 张国平,晁瑗,许凤雯,等.站点密度对泥石流当日雨量和前期有效雨量计算的影响[J].地理研究,2011,30(7):1237-1243.
[6] 辜智慧,史培军,陈晋.气象观测站点稀疏地区的降水插值方法探讨[J].北京师范大学学报(自然科学版),2006,42(2):204-208.
[7] 赵军,杨梅,杨东辉.基于GIS的甘南高原积温资源空间插值分析[J].甘肃科技,2010,26(13):40-42.
[8] 郭婧, 柳小妮, 任正超.基于GIS模块的气象数据空间插值方法新改进——以甘肃省为例[J].草原与草坪,2011,31(4):41-45.
[9] 吴静,张德罡,李纯斌,等.基于3S技术的天祝县土地利用/土地覆盖变化研究[J].草原与草坪,2007,27(6):29-32.
[10] 王红霞,柳小妮,任正超,等.降水量的空间插值方法研究—以甘肃省为例[J].草原与草坪,2012,32(5):12-16.
[11] 李纯斌.草原综合顺序分类系统第二级亚类的定量化研究——以甘肃省为例[D].兰州:甘肃农业大学,2012.
[12] 郭婧,柳小妮,任正超.基于AMMRR插值法的草地综合顺序分类研究——以甘肃省为例[J].草业科学,2012,29(3):384-391.
[13] 吴静,李纯斌,张德罡,等.适用于3S技术的草原综合顺序分类法水热指标的改进[J].中国草地学报,2012(4):109-115.
[14] 吴静,李纯斌,胡自治,等.基于定量遥感的甘肃省草原综合顺序分类[J].农业工程学报,2013,29(1):126-133.
[15] 张婷婷.遥感技术概论[M].郑州:黄河水利出版社,2011.
[16] 李启权,王昌全,岳天祥,等.不同输入方式下RBF 神经网络对土壤性质空间插值的误差分[J].土壤学报,2008,45(2):360-365.
[17] 邵月红,张万昌,刘永和,等.BP神经网络在多普勒雷达降水量的估测中的应用[J].高原气象,2009,28(4):846-854.
[18] 金龙,覃志年,黄海洪,等.人工神经网络预报模型的过拟合研究[J].气象学报,2004,62(1):62-70.
[19] 黄子洋,李毅,高太长.一种基于神经网络的气象要素插值方法与分析[J].解放军理工大学学报(自然科学版),2008,9(4):404-408.