官莉,刘旸,张雪慧
(南京信息工程大学气象灾害省部共建教育部重点实验室,江苏南京 210044)
人工神经网络算法在红外高光谱资料反演大气温度廓线中的应用
官莉,刘旸,张雪慧
(南京信息工程大学气象灾害省部共建教育部重点实验室,江苏南京 210044)
基于红外高光谱大气探测器A I RS实况观测资料,尝试用人工神经网络算法来实现晴空时大气的温度垂直廓线反演,重点将该算法与目前已经发展比较成熟的特征向量统计反演算法进行比较。结果表明,两种算法在计算时间效率和反演精度上相当。鉴于人工神经网络算法的统计物理本质,误差反向传播BP神经网络可以求解非线性问题,在优化训练样本和继续调试网络种类和网络参数的基础上,有望能进一步提高反演精度。
红外;高光谱;人工神经网络;反演
官莉,刘旸,张雪慧.人工神经网络算法在红外高光谱资料反演大气温度廓线中的应用[J].大气科学学报,2010,33(3):341-346.
Guan Li,Liu Yang,ZhangXue-hui.Application of artificial neural network algorithm in retrieving atmospheric temperature profiles from hyperspectral infrared data[J].TransAtmos Sci,2010,33(3):341-346.
Abstract:The artificial neural network algorithm is presented in this paper to retrieve the temperature profiles under clear skies by usingA IRS(At mospheric InfraRed Sounder)actual observations.The study is focused on the comparison of artificial neural network retrieval algorithm with eigenvector regression algorithm which has already been well developed.The results show that these t wo algorithms cost nearly the same computing time with comparative precision in the realA I RS data retrieval process.Due to the statistic-physical nature of the artificial neural network algorithm,it is expected to i mprove the temperature retrieval precision on the basisof selecting network type andmodifying the network parameters sequentially. Key words:infrared;hyperspectral;artificial neural network;retrieval
为了观测并最终预报天气,气象学家需要用到全球范围的大气观测资料,如大气温度、气压、湿度、风、云等。卫星红外和可见光云图已能提供天气系统方面的信息,而大气的红外垂直探测资料则能提供水平和垂直方向分布的大气温度、湿度、云高、云量等参数。然而,由于卫星仪器观测到的并不是直接的大气温度、湿度等,而是大气辐射量,现在大气遥感的定量化水平仍然不能满足气候与环境变化研究、数值天气预报等应用的越来越高的要求[1]。为此,世界各国科学家一方面研究直接把卫星测量到的辐射量同化应用于数值天气预报模式,一方面增加星载仪器综合探测能力尤其是云天遥感探测能力、研究遥感反演新方法、不断提高遥感反演精度,以期能够达到数值模式直接应用大气温湿等参数的精度要求[2]。
大气红外探测器A IRS(Atmospheric InfraRed Sounder)与AMSU-A(先进的微波探测器)及HSB (水汽探测器)载在2002年5月4日发射的EOS (地球观测系统)Aqua卫星平台上,从650 cm-1(15 μm)到2 700cm-1(3.7μm)的光谱范围内有2 378个红外通道,高光谱分辨率平均为1 200(λ/Δ λ)[3]。A IRS跨轨迹横扫描宽度约为1 650km,星下点水平分辨率为13.5km,垂直分辨率为1km,能提供从地面到40km高度的大气信息,具有高测量精度和高光谱分辨率的特性,第一次在卫星上实现了真正意义上的对大气海洋环境的高光谱分辨率大气红外探测,为我们提供了一个可以监测全球温度、水汽、臭氧等分布及变化的全新的机会。
目前国内基于A IRS资料反演大气温度、湿度垂直廓线大多采用的是特征向量统计反演法,该方法本质是一种基于最小二乘法的统计回归算法[4-5]。人工神经网络算法可实现输入空间到输出空间的非线性映射,更接近大气温度、湿度反演的物理本质,是一种统计—物理算法。模拟分析研究[6]表明,人工神经网络算法在所有高度层上的反演精度都略优于特征向量统计反演算法。本文在此基础上尝试用人工神经网络算法来实现晴空时大气温度垂直廓线反演,并将上述两种反演算法的结果进行对比。
人工神经网络有多种网络模型,本文采用算法较成熟、应用较广泛的前向三层误差反向传播B P (Back Propagation)神经网络算法。B P网络可有效地用于复杂的非线性函数的逼近,一个3层的前馈网络能够实现任意精度的连续函数映射,包括一个输入层、一个隐含层和一个输出层[7]。B P模型由不同层次的结点组成(图1),X表示L个输入层变量,Y为M个隐层变量,Z为输出的N个变量。每一层的结点输出送到下一层结点,输出值由于连接权值不同而被放大或抑制。除了输入层外,每一结点的输出为前一层所有结点输出值的加权和。每一个结点的激励输出值由结点输入、激励函数及偏置量决定。
训练样本选用美国威斯康星大学开发的全球晴空反演训练样本,由TIGR3(TOVS Initial Guess Retrieval)、NOAA88和ECWM F等的全球有代表性的温、湿和臭氧等廓线组成,同时还补充了沙漠地区的无线电探空和臭氧探空值(所有廓线从1 100hPa到0.005hPa被内插到101个气压层),大约有12 000个样本。经过大量样本的训练和反复的网络模拟测试,考虑到A IRS2 378个通道上的亮温值有较大的相关性,对其作主成分分析,根据以往的研究经验,选取前30个特征向量进行重构作为神经网络的输入[8]。采用尺度化共轭梯度反向传播学习算法(即trainscg方法),隐含层节点数设置为63。在本文的研究中网络的输出层为101个气压层上的温度。
人工神经网络定型为如图2所示的样式:输入层、隐含层、输出层节点数分别为30、63和101, I W{1,1}为输入层到中间层的权值,LW{2,1}为中间层到输出层的权值,b{1}、b{2}分别为两层的偏置值。利用建立的人工神经网络模型,训练时样本库按窗区亮度温度和扫描角分类,训练出适合11类窗区亮度温度和6类扫描角的66套神经网络。
图2 用于训练的神经网络结构图Fig.2 Fram ew ork of the neural net w ork for training
反演时使用A IRS实际观测的L evel1B级辐射亮度温度资料(为经辐射定标和地理定位后的辐射率数据集),选取2002年9月6日覆盖中国部分地区的第181景(granule)为例,图3a为该景在窗区(900cm-1)观测的亮度温度,比较暖的亮温值意味着中低云或地表,亮温较低的冷云由蓝色(冷色调)来表示,而冷的亮温值代表高云。由于研究的算法是针对晴空状态下的大气温度垂直廓线反演,因此需要先进行云检测,A IRS云检测由落在每个A IRS视场中的精确空间匹配的1km MOD IS云检测产品客观确定,具体算法见参考文献[9]。图3b给出了该景中的晴空像素点,经过云检测后,该景有4 114个视场为晴空点(每景有135×90个观测视场)。
为检验反演算法的有效性,将上述人工神经网络算法反演的大气温度垂直廓线与特征向量统计反演方法[4-5]的反演结果进行比较,同时用A IRS业务数据集二级大气产品以及ECMW F欧洲中心数值模式客观分析场资料来进一步验证。A IRS的L evel 2标准反演产品是目前美国的业务反演产品,在每个AM SU视场基础上用晴空订正的辐射值来物理反演大气廓线,每个AM SU视场由3×3个A IRS视场组成(分辨率约为40.5km)[10]。而上述两种反演方法是基于A IRS单视场分辨率的,因此反演的参数场水平空间分辨率更高。ECMW F客观分析场每天有4次(世界时00、06、12、和18时),资料网格点为0.5个经、纬度(~55km),全球共720×361个格点,为便于比较,将格点资料水平、垂直内插到A IRS的资料点上(135条扫描线×90观测视场, 101气压层高度),在统计检验时将其客观分析场的温度廓线认为是真值。
图4与图5分别显示了该景区域内500hPa和850hPa高度的温度反演场。由图4可以看出,神经网络和特征向量方法反演的500hPa温度场南北温度分布与L evel2产品和ECMW F客观分析场走向是一致的,A IRS L evel2业务产品的图像明显降低了空间分辨率(3×3个A IRS视场组成了一个AMSU视场),不如两种反演算法给出的结果精细(单A IRS视场),单A IRS视野反演场不仅空间分辨率高而且反演结果分布较连续、均匀。总的看来, A IRS反演场与ECMW F客观分析场更接近些,神经网络方法反演的某些区域温度略偏低,在图像中部偏左有一条反演低温带,而该特征在其他图中没有出现,初步分析认为可能是由于分类反演时人工神经网络算法对这个A IRS扫描角度的训练样本数偏少,结果导致反演的温度有误差。由图5可知,整体上ECMW F850hPa温度客观分析场相对其他反演结果来说偏低,其他三种反演产品较接近,神经网络方法与特征向量统计方法反演结果更相似。
为更进一步验证人工神经网络方法与特征向量统计反演方法的有效性,将ECMW F客观分析场的温度廓线作为真值,统计了两种反演算法反演的温度垂直廓线的均方根误差,结果显示在图6中,该图给出了该景中4 114个晴空点反演的温度均方根误差的平均廓线。
图3 2002年9月6日第181景区域 a.窗区(900cm-1)通道观测亮度温度(单位:K);b.云检测的晴空像素点Fig.3 The region of granule181on6Septem ber2002 a.brightness temperature observed through a w indow (900cm-1)channel of A IRS(K);b.clear pixels
图4 2002年9月6日500hPa高度上温度场(单位:K) a.A IRS Level2业务大气温度廓线反演产品;b.晴像素点上ECMW F客观分析场;c.人工神经网络方法反演结果;d.特征向量统计法反演产品Fig.4 The temperature field at500hPa on6September2002derived from(a)A IRS Level2,(b)ECMW F objective analysis field,(c)artificial neural net work algorithm,and(d)eigenvector regression algorithm
图6 中实线和虚线分别代表人工神经网络法和特征向量统计反演法反演的温度廓线与ECMW F温度客观分析场相比的均方根误差。由图6可以看出,在大气低层(气压高于850hPa)和高层(气压小于1hPa)人工神经网络方法稍优于特征向量方法,温度反演精度最大可提高近1K,而在其他的高度上,特征向量统计法的反演结果与ECMW F的客观分析场更接近些。人工神经网络方法在某些高度层上对温度的反演有改进,但总体温度反演精度的提高不如模拟试验时明显。在850hPa高度上,人工神经网络算法均方根误差相对较小,而在500hPa高度上特征向量统计反演法略优,与图4和图5的直观分析结果一致。
就目前初步研究结果来看,尽管进行模拟分析时,人工神经网络算法在所有高度层上的反演精度都略优于特征向量统计反演算法[6],但应用实况A IRS观测资料试验时,神经网络方法没有明显改进反演精度。初步分析其原因可能是:
第一,特征向量统计回归方法在温度反演上已经是一套比较成熟的方法,在对流层中高层温度反演准确度已达1K。神经网络方法要在这些高度层上表现出改进,需要进一步研究。神经网络的建立过程有很多的可选性和不确定性,本文最后选择的这种神经网络建模方法可能并不是最佳的使神经网络泛化性能最佳的网络,神经网络的各参数设置还需要更多试验来确定。
第二,挑取主特征分量作为神经网络的输入,减少了辐射通道相关性的影响,简化了网络结构,节省了训练时间及反演时间,但也使得建立的网络模型成为一个输出多于输入的不稳定模型;目前选取前30个特征向量重构A IRS观测值,可以尝试增加到100个。
图5 2002年9月6日850hPa高度上温度场(单位:K) a.A IRS Level2业务大气温度廓线反演产品; b.晴像素点上ECMW F客观分析场;c.人工神经网络方法反演结果;d.特征向量统计法反演产品Fig.5 The sam e as Fig.4but at850hPa
图6 温度反演的均方根误差Fig.6 The root-m ean-square error of temperature retrievals
本文在模拟分析表明人工神经网络算法反演的大气温度廓线均方根误差要小于特征向量统计反演法的基础上,运用实况A IRS观测资料进行大气温度廓线反演实验,结果表明两种算法在计算时间效率和反演精度上相当。特征向量统计反演法目前发展已经比较成熟,针对红外高光谱观测值反演,初步尝试人工神经网络算法已获得与特征向量统计反演法相当的温度廓线反演精度。鉴于人工神经网络算法的统计物理本质,误差反向传播BP神经网络可以求解非线性问题,在优化训练样本和继续调试网络种类和网络参数的基础上,有望能进一步提高反演精度。
目前训练样本选取的是全球的大气无线电探空资料,而反演测试针对的是中国地区,人工神经网络方法有效性与所用的训练样本有很强的相关性。下一步,从全球训练样本中选取中国地区的样本,针对中国地区样本重新建立人工神经网络,有望能提高中国地区的温度廓线反演精度。
[1] 吕达仁,王普才,邱金桓,等.大气遥感与卫星气象学研究的进展与回顾[J].大气科学,2003,27(4):552-566.
[2] 邱金桓,陈洪滨,王普才,等.大气遥感研究展望[J].大气科学,2005,29(1):131-136.
[3] 官莉,Huang H L,王振会.红外高光谱资料反演有云时大气温湿廓线的模拟研究[J].遥感学报,2008,12(6):987-992.
[4] W eise E,Huang L H,L i J,et al.InternationalMOD IS and A IRS processing package:A IRS products and applications[J].J Appl Remote Sensing,2007,1,013519,doi:10.117/1.2766867.
[5] Guan L,Huang H L,L i J.A study on retrieving atmospheric profiles fromEOS/A IRS observations[J].Acta M eteor Sinica, 2005,19(1):112-119.
[6] 张雪慧,官莉,王振会,等.利用人工神经网络方法反演大气温度廓线[J].气象,2009,35(11):137-142.
[7] Yao Z G,Chen H B,L in L F.Retrieving atmospheric temperature profiles from AMSU-A data w ith neural networks[J].Adv A tmos Sci,2005,22(4):606-616.
[8] 官莉.利用A IRS卫星资料反演大气廓线1.特征向量统计反演法[J].南京气象学院学报,2006,29(6):756-761.
[9] 官莉,王振会.用空间匹配的MOD IS云产品客观确定A IRS云检测[J].气象科学,2007,27(5):516-521.
[10] Susskind J,Barnet C,B laisdell J.Retrieval of atmospheric and surface parameters from A IRS/AMSU/HSB data in the presence of clouds[J].IEEE Trans Geosci Remote Sens,2003,41(2): 390-409.
(责任编辑:张福颖)
Application of Artificial Neural Network Algorithm i n Retrieving At mospheric Temperature Profiles from Hyperspectral I nfrared Data
GUAN Li,L IU Yang,ZHANG Xue-hui
(KeyLaboratory ofMeteorologicalDisaster ofMinistry of Education,NU IST,Nanjing 210044,China)
P407.6;TP79
A
1674-7097(2010)03-0341-06
2009-11-05;改回日期:2009-12-02
国家自然科学基金资助项目(40605009)
官莉(1973—),女,新疆库尔勒人,博士,教授,研究方向为大气遥感科学与技术,liguan@nuist.edu.cn.