王春梅,顾行发,余 涛,周 翔,占玉林,韩乐然,谢秋霞
(1.中国科学院 遥感与数字地球研究所,北京 100094; 2.国家高分专项应用技术中心,北京 100094; 3.中国科学院大学,北京 100049)
土壤水分是水文模型、气候预测模型、干旱监测模型、作物估产模型的重要参量,也是全球气候变化和陆面数据同化研究的重要数据源[1];因此,准确监测土壤水分具有重要的学术意义和应用价值。传统的土壤水分监测方法虽然能够精确测量单点的土壤水分,但不能满足大尺度、动态监测土壤水分的要求。随着卫星遥感技术的发展与完善,基于卫星可见光-近红外及热红外数据、主动微波、被动微波的土壤水分监测方法相继研发,这使得大尺度、动态监测土壤水分成为可能。鉴于对土壤水分的强敏感性和高时间重复性,被动微波遥感数据已成为陆表土壤水分遥感产品的主要数据源,在全球土壤水分监测中具有广阔的应用前景[2-3]。国内外各知名研究机构都在发布自己的全球土壤水分遥感产品,如美国的AMSR-E和SMAP、欧洲太空局的SMOS MIRAS和我国的FY-3。
然而,目前遥感信息产品的真实性检验工作严重滞后,这使得区域尺度的遥感信息与地面测量尺度的地表观测信息脱节,进而制约了定量遥感产品在不同领域更好的推广与应用。随着业务化和工程化进程对定量遥感产品精度要求的不断提高,遥感数据信息产品的真实性检验变得极为重要。
研究表明,星载被动微波遥感的土壤水分反演效果并未达到预期精度(0.07 cm3·cm-3或0.04 cm3·cm-3),产品低精度与产品间不一致性的问题与“用户”的实用需求矛盾突出,极大限制了遥感产品的实用价值[4-7]。现有的土壤水分业务化反演算法都是针对均值地表发展起来的,在异质性地表上的土壤水分反演效果没有得到充分的真实性检验。然而,受遥感器件与成像原理的限制,被动微波卫星空间分辨率多为几十千米(如AMSR-E 数据为25 km,SMOS MIRAS 数据约为40 km,FY-3数据为25 km),低空间分辨率的特性决定了微波像元内部的异质性,即单一微波像元内存在多种地物或某种参数的多种取值,像元内的异质性给土壤水分产品的真实性检验带来了困难。
真实性检验是用来评价遥感数据产品、信息产品的真实性和准确性的,也就是常提到的“约定真值”。遥感数据的本质是采样,特性是其时空分布规律,因此构建出观测对象的参数场分布是对各类卫星获得的信息产品检验的依据[5-6,8]。最大化地接近真值,就要求在相同的时间地点,产品数值不仅一致,而且变化特征也要一致,并根据不同的物理量,具有相同的梯度、旋度与散度。
遥感数据信息产品真实性检验的核心问题是如何利用有限的地面直接或非直接测量数据,构建完整信息的观测参数时空场。其不仅能够代表卫星观测尺度值,而且能揭示空间异质性规律,确保对观测参数尺度信息的有效承载,为遥感数据信息产品提供验证数据。
观测参数时空场的构建涉及地面观测、同步观测、尺度转换等关键环节,可通过2个途径进行构建[8-10]。其一,在观测参数时空变异特征分析的基础上发展尺度上推策略,来利用地面实测点数据为遥感信息产品提供定标和验证服务,技术的本质可以理解为“点代面”;其二,利用多源信息融合技术,集成地面观测点、模型模拟、遥感数据所反映的和观测参量相关联的自然要素或相关指标所反映的观测参量的时空分布信息,为遥感验证提供信息量更丰富、精度更高的时空场地面真值,技术的本质为“多源信息融合”,这样也可以充分发挥海量遥感大数据的作用。
常用的被动微波土壤水分遥感产品真实性检验方法,主要有实测样本数据检验、影像数据交叉检验、模型模拟检验、影响因素检验和传统地统计检验。本文查阅了大量文献,列出了不同检验方法研究的主要情况,简要分析了5种方法的优缺点和实际应用。
影像数据交叉检验是基于航空数据或更高分辨率的卫星数据等价产品而进行的检验方法,这也是Modis陆表产品检验的重要手段[31-33]。航空数据虽然分辨率较高,但是价格比较昂贵,用于低分辨率尺度的土壤水分检验成本高昂。同时,由于过境时云的存在,同一区域很难连续获得高质量的影像,这极大地限制了地面同步观测的高分辨率卫星、航空数据的检验能力,不适宜用作低分辨率土壤水分产品的通用检验方法。
为了克服缺少土壤水分实测数据、气象站数据的缺陷,陆面过程模拟检验和联系相关变量检验方法越来越成为低分辨率遥感产品检验的主流方法。陆面过程模式是近30 a来以地球陆地表面物质、能量和水分的交换与运输为理论基础,以数字地形分析、GIS技术和数学方法为技术手段发展起来的陆表过程模式,已经成为近年来气象学、水文学研究的一个非常活跃的领域。模拟所采用的要素包括地形、植被、气象,以及其他环境因素。土壤水分是陆面过程的主要参量之一,可以利用陆面过程模型模拟土壤水分结果,制作土壤水分的高分辨率趋势面参考图,但模拟精度受模式结构和输入数据的影响比较明显[7-9,18-19,24,34-35]。
Crow等[19]于2012年提出,土壤水分的影响因素包括土壤质地、地形、植被、气象要素等。目前,国内外利用影响因素作为先验知识的土壤水分遥感产品检验研究有很多[19,36-39]。Tuttle等[40]于2014年利用降雨数据对AMSR-E土壤水分数据进行了检验;邱玉宝等[41]于2007年开展了AMSR-E被动微波土壤水分与降雨时空的相关性分析;Lakshmi等[42]于1997年利用归一化植被指数(NDVI)的变化对土壤水分反演误差进行检验;张涛等[43]于2012年通过理论模拟方法研究了土壤质地类型对土壤水分反演精度的影响。先验知识与土壤水分之间的关系非常复杂。既有的研究大多是基于单一参量或多参量的简单相关或回归统计,多限于对变化趋势性的定性检验,有关土壤水分与多源先验知识的综合性定量研究尤为缺乏[43]。
地统计检验是一种综合考虑先验知识和实测数据的思路方法。利用协同克里格、回归克里格、分层克里格、地理权重回归等,均能得到卫星观测尺度的土壤水分参考图,在先验知识与土壤水分相关性较强时,这些方法的检验精度均高于普通克里格方法;但这些方法在综合利用多源数据类型的先验知识信息方面仍显不足[44-48]:如协同克里格只能兼顾单个数值类型的环境因子,分层克里格只是将环境信息作为一个分层或分类依据等。
如表1所示,实测样本数据检验方法以样点的空间代表性为前提,但其方法本身仍存在着一些不足,如缺乏对先验知识的有效利用,导致检验真值精度降低,而且要求的地面监测网络数据集不易满足等。模型模拟检验和影响因素检验的理论依据都是土壤水分与先验知识的关系,但都忽略了样点的重要性。地统计检验(协同克里格、回归克里格、分层克里格等)是一种综合思路,综合考虑了样点和先验知识,但该方法在综合利用多源数据类型的先验知识信息方面仍显不足。
表1 不同检验方法的优缺点分析
如何更好地将地面测量和先验知识两种思想融合起来,如何高效兼顾样点空间相关性和多源类型先验知识的关系,提高观测参数时空场的构建精度非常重要。为此,需要深入开展土壤水分与多源先验知识集的综合性定量研究。
目前,有研究者尝试将贝叶斯最大熵理论(BME)应用到多源数据融合过程中,尤其是将和目标参量具有相关性的不确定性数据融入空间估计过程中,以发挥贝叶斯理论的优势;同时,在数据融合策略基础上,构建贝叶斯理论框架下的地面观测站点数据升尺度方法,有效利用海量多源遥感数据,以获取区域更高精度的目标参量空间分布信息,为遥感反演信息产品提供更可靠的验证数据。
1.2 实验病毒 柯萨奇病毒B组3型(Coxsackievirus B3,CVB3)由本院微生物病毒研究室提供,经Hela细胞活化,反复冻融3次后检测组织细胞感染率TCID50:10-3/mL。
Christakos于1990年提出了BME方法,并称其为现代地统计学;因此,BME检验方法属于现代地统计检验范畴,是在传统地统计检验方法上的改进[45,48-50]。在综合利用多源数据类型的先验知识信息方面,BME检验方法是一个极具创新的方法,具有比较突出的优势。
BME检验方法进行大尺度空间异质性研究能融合多方面具有不同精度与质量的数据,并将这些数据分为2方面:(1)专用数据(KS)。按照数据的精确与否分为硬数据和软数据两类,两类数据均定量表示被研究属性的含量,区别在于硬数据为确定性的值,而软数据的值具有模糊性质,形式为值域区间或概率分布,如对某个点位的田间观测近似数据、从土壤制图中获取的土壤质地分布等。相对于硬数据而言,软数据具有模糊性、获取容易、成本低等特点。(2)普遍知识/数据(KG)。用来描述空间随机域的整体特征的数据或知识,如一般自然规律、经验知识和基于硬数据任何阶的统计动差(如数学期望、协方差、方差等)。
基于这两方面数据,BME方法分为2个步骤:(1)使用KG,基于最大熵原理,计算研究区域内未测点变量分布的先验概率密度函数(以下简称pdf),而且当仅考虑硬数据统计误差时,所得结果与实地样本数据检验结果一样。(2)使用KS,基于贝叶斯条件概率,更新上一步获取的先验pdf,得到研究区域内未测点的后验pdf。根据最终得到的后验pdf,可以方便地制作卫星观测尺度的土壤水分数字参考地图,进而对遥感土壤水分产品进行检验。
在BME检验中,简单有效的软数据构造方式可大大提高检验评价的预测效果,然而土壤水分产品检验的相关研究中对于软数据的应用形式还比较有限。目前常用的软数据模型是环境相关法,下面详细介绍。
根据环境相关法的思想,土壤水分含量在不同环境的影响下可能会产生不同的空间分布特征。通过将土壤水分属性和辅助变量[包括数字高程模型(DEM)、土地利用现状图、Modis产品、FY-3号土壤水分产品]离散化,利用离散型的概率分布逼近土壤水分概率真实分布,从而达到预测的目的。
设待预测土壤水分Z的观测值范围为[Zmin,Zmax],根据精度要求将该值域范围等分为n个含量类别,则第k(1≤k≤n)组含量类别(记为Zk)可表示为[44]
(1)
据此,将建模样点上Z的含量大小划分为n个组。同时,与Z类似,可将辅助变量(记为E)的值域划分为m个值区间。根据辅助变量类型的不同,划分方法也有所不同。具体而言:如果E是连续型辅助变量(如地形因子和基于遥感影像的指数),则E的值域被等分为m个区间(E1,E2,…,Ei,…,Em);如果E是范畴型辅助变量(如土壤质地、土壤类型),则m为E的水平个数,而Ei则为E的某个具体水平(如土壤质地中的重壤)。
对于E的每一个区间Ei,依次判断建模样点上的E取值对其的归属性,结合Z含量的划分,可得到一个类似于直方图类型的Ei下Z取值的概率分布,用该取值概率分布R(Z,E)来表示Z和Ei的定量关系,用公式表示为
(2)
其中:l∈[1,m],Ci为所有建模样点上辅助变量E的取值属于Ei的个数,Count(l)i为第l间隔类内辅助变量E的取值属于Ei的所占个数。待预测土壤水分与辅助变量之间的完整定量关系可表示为
(3)
对于某一个特定的空间点位u,其上辅助变量E的取值是一个确定值。假设其值属于Ei,那么u上在辅助变量E影响下的土壤水分概率分布可记为P(Z,E)u:
P(Z,E)u=R(Z,Ei)u。
(4)
如果在该点位u上,存在着多种辅助变量取值,即E是多个辅助变量的集合:A,B,C,...∈E,则可按以上方法同时获取u上在多个辅助变量影响下的土壤水分概率分布。考虑到不同辅助变量与待预测土壤水分之间的相关性不同,引入它们之间的相关系数作为权重rE。对于连续型辅助变量,采用其与土壤水分的皮尔森相关系数作为权重;对于范畴型辅助变量,采用其与土壤水分的斯皮尔曼相关系数作为权重。为了能同时使用这些相关系数,权重需归一化(ωE=rE/∑rE,E=A,B,C,…)。最后,基于归一化的权重和辅助变量影响下的土壤水分概率,可得到任意点位上基于土壤环境相关法的土壤水分概率分布,该概率分布的期望值即为土壤环境相关法的预测值。
基于BME方法的应用研究已经成功地运用于土壤分类、城市热岛、气溶胶、土壤有机质等参数的空间估算研究[45,48-52]。另外,BME方法还被运用于流行病时空建模、生态与资源调查、气象气候研究等涉及自然资源与现象空间分布的多个领域。
在贝叶斯理论框架下开展土壤水分地面真值研究。根据环境相关法的思想,土壤水分含量在不同环境的影响下可能会产生不同的空间分布特征。通过将土壤水分属性和辅助变量离散化,利用离散型的概率分布逼近土壤水分概率真实分布,即可达到预测目的。Qin等[53]于2013年开展的研究正是这种策略的典型代表,通过贝叶斯线性拟合的方式将Modis表观热惯量数据作为辅助数据集成到升尺度过程中,成功地将稀疏站点的土壤水分观测数据升尺度到了微波遥感土壤水分产品(AMSRE-2 or SMOS)的像元尺度。由此可见,融合多源信息可以认为是一种强大的大数据分析转换策略。在土壤水分真实性检验应用中,可以凭借土壤水分和相关变量(如地表温度、植被指数、地形指数、气象数据等)之间的统计关系,尝试以先验变量数据集为辅助数据,利用BME方法融合土壤水分观测数据和先验变量数据集数据进行土壤水分的空间估计。
可以预见,BME贝叶斯最大熵方法提供了灵活的数据利用方式,使多种来源、多种类型的数据集有机会同时被用于卫星观测尺度的空间分析,能够综合各种先验信息与样本信息,是一种可靠的真实性检验方法[54]。
如何获取可以代表卫星观测尺度“真值”、并能表征空间异质性的土壤水分观测场,成为被动微波土壤水分产品真实性检验的关键问题。本文介绍了实测样本数据检验、影像数据交叉检验、模型模拟检验、影响因素检验和传统地统计检验。目前,有尝试将贝叶斯最大熵理论(BME)应用到多源数据融合过程中,并已在其他领域得到了广泛的应用。基于此,BME方法有望发展成为一种可靠的大尺度土壤水分真实性检验方法。
在今后的遥感产品真实性检验研究中,除了必须开展大规模、多样本的长时间序列、多空间维度的地面测量外,还要尽可能收集更多的先验数据集,建立综合数据库,使多种来源、多种类型的数据集有机会同时被用于不同观测尺度的时空分析,以便采用BME最大熵理论方法,生成具有“完整”信息的观测参数时空场参考真值,用于研究时空变化规律,评价信息一致的参考场地状态,并在此基础上,完成遥感信息产品的真实性检验。