高胜国+翁海腾+朱忠礼
摘要:贝叶斯最大熵方法(bayesian maximum entropy,简称BME)是现代时空地统计学的重要组成部分。该方法采用统计学中的贝叶斯理论和信息论中熵的概念来认识和处理时空变量,可以将所研究时空要素的软数据和硬数据系统合理地综合到对该要素的空间估计和分析制图过程中。本文首先结构化梳理贝叶斯最大熵方法的原理,对理论较深奥、公式较复杂的贝叶斯最大熵方法及该方法的特点加以概括,同时归纳与总结贝叶斯最大熵方法在地球科学领域内多个方向的应用研究进展,最后对该方法及其应用作总结与展望。经国内外学者多年的研究和实践,贝叶斯最大熵方法已被证明在地球科学领域有着更广阔的应用前景。
关键词:贝叶斯最大熵;地统计学;时空估计;软数据;硬数据
中图分类号: S127;S11+9 文献标志码: A 文章编号:1002-1302(2017)18-0011-06
收稿日期:2016-04-19
基金项目:国家自然科学基金(编号:91125002、41531174)。
作者简介:高胜国(1986—),男,山西忻州人,博士,讲师,研究方向为定量遥感、农业统计遥感。E-mail:cugbgaoshengguo@126.com。
通信作者:朱忠礼,博士,副教授,研究方向为遥感水文。E-mail:zhuzl@bnu.edu.cn。 贝叶斯最大熵(Bayesian maximum entropy,简称BME)方法是现代时空地统计学的重要组成部分。地表自然生态系统是一个组成要素多样、复杂的综合系统,加上自然环境历史演化变迁以及人类活动的影响,地表各要素在时空分布上呈现既有随机性又有结构性的特点,鉴于此,对地表时空要素的时空分布、变异性、相关性以及依赖性的定量描述和研究相当困难。传统的解决办法是将地理要素空间上划分为时空上较为均一的区域或层区,在一定程度上描述地表要素的空间分布以及变异情况。以变异函数和克里金估计为代表的传统地统计学的出现,将区域化变量理论引入到地表要素空间变异性研究中并加以丰富和完善,使之定量化,从而大大推动了地表要素空间变异这一研究进展。地统计学被证明是研究地表要素空间分布特征及其变异规律最有效的方法之一。传统地统计学主要处理空间变异,然而地表要素是时空动态的,它的许多属性在发生空间变化的同时也随着时间发生变异,在空间变异基础上引入时间变异的分析能更准确描述地表要素的变异特征;同时,地表要素的互相关联性使地表某种要素的观测数据对其他相关要素有一定的指示作用,这种相关要素观测提供的辅助信息同样是描述目标地表要素时空变异性的重要信息来源。贝叶斯最大熵方法采用了统计学中的贝叶斯理论和信息论中熵的概念来认识和处理时空变量,是现代时空地统计学的重要组成部分[1],它不同于传统的地统计学线性空间估计方法(普通克里金、协克里金、回归克里金等),属于以非线性理论为基础的时空估计范畴,对时空数据的分析以及不确定性数据(软数据)的使用成为其最大特点和优势,近20年來被逐渐应用到大气、土壤、环境、公共卫生等多个研究领域,近年来国内也有多位学者开始了对BME的相关研究。
1 贝叶斯最大熵
贝叶斯最大熵时空估计方法是1990年前后被提出的[2-4],并逐渐被广泛应用在地球科学领域。该方法涉及到认识论、时空随机场、概率统计等学科知识,与传统空间分析、制图方法相比,最大特点是可以将所研究要素的精确观测数据(硬数据)、不确定性数据(软数据)和其他来源的相关信息系统合理地综合到对该要素的空间估计和分析制图过程中。
从认识论的角度来说,综合的知识和信息越多,对想象或过程的认知就越真实、越准确。BME可以将广义知识(general knowledge,用G表示)和特定知识(specific knowledge,用S表示)同时综合到目标要素的空间分析过程中。广义知识可以是统计规律(统计矩)、相关定律、科学原理等。特定知识包括特定点位上的测量数据,如实测点数据、面数据、时间序列数据等。在贝叶斯理论框架下,广义知识属于先验信息,特定知识是所研究要素新的观测数据和信息来源,基于贝叶斯理论根据先验的概率密度函数(probability density function,简称pdf)估计地理空间要素的后验概率密度分布及后验概率。目前在BME应用的多数研究中,广义知识通常是一些统计矩,最常用的是均值、方差和协方差,特定知识包括软数据和硬数据。
BME方法在逻辑上可以分为3个相互关联的阶段:(1)先验阶段。通过信息期望(熵函数)的最大化,将从已有的统计知识中得到的先验概率考虑到空间估计中;(2)中间阶段。整理特定知识(硬数据和软数据)并且将其转化成一种便于融入后期数据分析中的数学表达形式(比如概率分布形式);(3)后验阶段。通过贝叶斯条件概率的形式表达待估计变量的后验概率,通过后验概率的最大化得到空间变量的估计。因此,BME方法在使自然现象的时空分析和制图过程满足信息量丰富的同时,又满足逻辑上的说服力更是合情合理,信息量丰富体现在先验阶段大量的先验知识,而逻辑上的说服力体现在后验阶段根据具体知识得到的后验概率[1]。
1.1 先验阶段
BME方法的此阶段是基于最大熵原理,在此阶段通常只使用广义知识(G)。
1.1.1 信息熵与概率 认知论中有这样的一个逻辑规则:如果某个命题越模糊越笼统,那么这个命题就包括了越多可能发生的事件,这个命题就有更大的可能性成立,然而关于命题的信息量却是少的;相反,如果越多可能发生的事件被排除了,也就是关于命题的信息量多了,而这个命题发生的可能性就小了[1]。也就是说一个信息量丰富的科学事件更不容易发生,因为它多了许多限制因素。在BME的先验阶段也作了这样的假设:广义知识所提供的信息量和地图真实形态出现的可能性之间是存在反比的关系,据此我们可以把包含在时空随机变量xmap的pdf 中的知识表达为信息量的形式。关于信息量和可能性之间有很多种表达方式,在BME中应用Shannon的信息量原则[5],根据给定的广义知识G,包含在xmap中的信息量表示为下式:endprint
infoG[xmap]=-lg lgfG(xmap)。
(1)
式(1)同时表示随机变量xmap的不确定性:概率越大,xmap的不确定性越小,同样由xmap的pdf 提供的信息量也越少。信息量的期望可以表示為下式:
infoG[xmap]=-∫d χmapfG(xmap)lgfG(xmap)lgfG(xmap)。
(2)
根据可使用的广义知识构建1个关于自然要素空间实现的概率模型。由广义知识提供并且引用到模型中的自然要素地图的信息量可以由式(2)来表达,此公式称为熵函数(entropy function)。BME名称缩写中的第3个字母“E”就是指这里的信息熵函数。
1.1.2 广义知识的数学表达 在自然科学中很多数据和理论都具有时空自相关特性和概率依赖性。所以将广义知识用数学的方式表达为相关自然变量的概率函数或是概率运算是非常有意义的。假设广义知识包含了一系列函数Gα(α=0,1,…,NC):
G ∶ hα(pmap)=Gα[xmap,pmap;fG]。
(3)
式(3)中:等号左边表示时空变量一系列的统计期望;等号右边是基于广义知识相关的时空随机变量xmap、时空坐标pmap和广义知识相对应的概率密度函数的表达式。hα可以通过很多种途径来构建。式(3)适用于各种类型的广义知识:各阶统计矩、经验关系、物理公式或是其他科学理论。在许多时空统计学中,物理知识、经验关系等可以转化为一系列的统计矩:
hα(pmap)=gα(xmap),α=0,1,…,Nc
gα(xmap)=∫d χmapgα(χmap)fG(χmap;pmap)。
(4)
式中:gα是χmap的一系列的已知函数。关于gα的选择有一些数学上和物理上的规则。一般g0=1,那么gα(xmap)=1是标准化系数。并且在gα(α>0)确定了之后,公式左边对应的统计期望hα必须直接从试验数据计算得到或从其他来源的广义知识(物理知识或经验图表)中推理得到。
目前应用最多的广义知识就是实测数据的统计矩,那么假设平均值为xi、方差为xi-xi、三阶矩为(xi-xi)3、协方差为(xi-xi)(xi′-xi′)在点pi,i=1,…,m,k处是已知的,则式(4)中对应的gα可以表达为1+(m+1)(m+6)/2种形式,具体可参考Christakos的方法[1]。
1.1.3 基于广义知识的联合概率密度函数的获取 BME方法的先验阶段主要目标是根据广义知识获取自然要素空间分布的先验概率密度函数,也就是在式(2)中的fG。这个基于广义知识得到的pdf将应用到下阶段的BME分析中。这里要计算先验概率密度分布函数需要借助拉格朗日乘数法[6]:
目标函数:
M=∫d χmapΦ[χ,fG(χ)];
(5)
限制条件:
hα=∫d χφα[χ,fG(χ)],α=0,1,…,Nc;
(6)
欧拉-拉格朗日方程:
ΦfG+∑Ncα=0μαφαfG=0。
(7)
在欧拉-拉格朗日方程中,μα是拉格朗日乘子,通过联立限制条件和拉格朗日方程可以得到μα以及fG,进而得到目标函数的最大值。
在BME分析中,Φ[χ,fG(χ)]=-fG(χ)lgfG(χ)lgfG(χ),φα[χ,fG(χ)]=gα(χ)fG(χ)。这样利用拉格朗日乘数法,以广义知识[式(4)]为限制条件,通过最大化infoG[xmap][式(2)]可以求得先验pdf fG(xmap)。根据Christakos的方法[1]可以知道先验概率的表达形式:
fG(xmap;pmap)=Z-1exp exp{γG[xmap;pmap]}。
(8)
这里γG[xmap;pmap]=∑Ncα=1μα(pmap)gα(xmap);lgZ=-μ0。
根据式(8),广义知识方程组[式(4)]可以写为下式:
hα(pmap)=∫d χmapgα(xmap)exp exp{μ0+γG[xmap;pmap]},α=0,1,…,Nc。
(9)
求解式(9)可以获取式(8)中的μα。
1.2 中间阶段
在现实世界中,对事物或现象的进一步认识和分析可以获取更多更确定的信息。BME分析中间阶段的主要工作是收集和整理所有可能的特定知识,并且把这些特定知识以一种定量的形式来表达,便于融合到BME分析的后阶段中。这里特定知识(S)包括硬数据和软数据,它们来源于实地观测或对历史数据的计算分析。
1.2.1 硬数据 硬数据是在试验中根据试验目的利用仪器观测到的数据,这些数据在BME分析中被认为是足够精确的,或者它们的误差小到可以忽略。假设在时空域中在mh个点进行观测,则产生的硬数据:
S ∶ χhard=(χ1,…,χhard)。
(10)
在BME的实际应用中,部分硬数据可以涉及2个方面的用途,一方面是在先验阶段通过对已有硬数据的分析可以得到一些广义知识(统计矩),另一方面是在后验阶段估计后验概率密度分布时用到[1]。
1.2.2 软数据 从认识学的角度来说,我们对某一事物的认识并不完全是靠一些确定的数据或是一些确定的事实,同样也包括一些不完全定量或定性的知识,比如专家的观点、经验、直觉,问卷调查以及有明显误差的观测数据等。这些知识对认识事物(制图或空间估计)是有用的,但知识本身却具有不确定性。在BME分析中可以把这些具有不确定性的数据以软数据的形式引入。假设在有特定数据的时空点χm中除去有硬数据的点,其他为软数据,则软数据可以表示为下式:endprint
S ∶ χsoft=(χmh+1,…,χm)。
(11)
为便于软数据参与BME分析,软数据同样需要用数学的形式表示,在贝叶斯最大熵中几种常用的概率形式表达的软数据如表1所示。
为軟数据发展专用的数学表达模型在BME应用中还是一个刚出现的研究主题。Lee研究的目标是改进软数据模型来更好地描述环境卫生领域相关数据的不确定性,并将此软数据集成到BME制图的过程中来提高实际应用过程中的制图精度[7]。在此研究中共涉及3种不确定性类型,包括测量误差,一级变量、二级变量的经验关系误差,以及观测尺度误差,针对每种误差所提出的软数据模型都进行模拟和实际案例研究的检验,研究结果表明,所发展的软数据模型可以很有效地利用到环境和公共卫生领域的研究中,进而可以结合多源数据得到所研究变量更丰富的时空分布信息。
1.3 后验阶段
在时空统计学的认知理论框架下,只剩下最后1个问题需要在后验阶段解决,那就是如何将先验阶段的广义知识[或fG(xmap)]和中间阶段的特定知识(S)综合考虑到制图或是空间估计过程中。即在后验阶段,新的概率密度函数是和知识总体相关的,相关公式:
probK[χk]=p′∈[0,1]。
(16)
式(16)表示在给定总体知识k=G∪S的情况下χk实现的概率是p′。有很多方法可以实现这个过程,在BME分析中应用贝叶斯全概率公式来实现:
probK[χk]=A-1probG[χmap(S)]。
(17)
式中:A=probG[χdata(S)],为标准化系数。
根据Christakos的方法[1],在先验阶段γG算子综合了广义知识,那么在后验阶段定义γS综合了先验阶段的γG算子和特定知识(S):
fK(χk)=A-1γS[γG,S,χmap,pk]。
(18)
式中:k=G∪S。
在所有的软数据形式里,区间形式的软数据最常用,而且在本研究中也采用了区间软数据,所以根据Christakos的研究[1],区间软数据形式的γG算子可以表示为下式:
γS[χmap,pk]=Z-1∫Idχsoftexpdχsoftexp{γG[xmap;pmap]}。
(19)
所以结合式(19),后验概率密度函数可以表示为下式:
fK(χk)=(AZ)-1∫Idχsoftexpdχsoftexp[∑Ncα=1μα(pmap)gα(xmap)]。
(20)
式中:I是考虑软数据区间的并集,比如χsoft=(x4,x5,x6),则I=I4∪I5∪I6。
得到后验概率密度分布,等于知道了所有可能的估计值,在BME分析中常用2种估计值模式,一种是BME Mode模式,这种模式下用后验概率密度函数fK(χk)取最大值时对应的点值作为最终估计值:
χkfK(χk)|χk=χ^k=0。
(21)
另一种模式是BME Mean,在这种估计模式下,估计点取值为
xk|K=∫fK(χk)χkdχk。
(22)
可以发现,这种估计模式是根据已有数据的非线性运算得到的,而且这种估计保证了均方根误差最小。
1.4 不确定性表达
地统计学的一个重要特点是在得到估计结论的同时可以对估计结论的不确定性有一个定量的描述。在一些自然变量的统计描述或估计的过程中,不确定性是一个不可回避的问题,同样在基于pdf进行估计的BME方法中,对估计结果作出相应的精度评价也显得尤为重要。
在BME估计方法中,任何一点的估计都是在分析后验pdf的基础上进行的,而估计的精度也同样依赖于后验pdf的形状。对BME Mode来说,不确定性就是对概率最大值周围待估变量值的离散程度的度量。在一般的pdf具有单极值的情况下,BME估计的精度可以通过求取每个估计点的标准方差(standard deviation)来评价:
σx(pk)=StDev[fK(χk)]。
(23)
式(23)反映空间估计精度,也可以表达为
σx(pk)={[X(pk)-χ^(pk)]2}1/2=[∫dχk(χk-χ^k)2fK(χk)]1/2。
(24)
此处χ^k=χ^k,mode=χ^k,mean,这里的期望是关于后验概率密度函数的期望,而不是算数平均值。根据数字模拟的结果表明,BME分析中的σx(pk)可以很出色地估计实际的空间估计精度[1]。在根据式(24)估计的不确定性基础上,可以定义相应的置信区间。例如,对于一个高斯(Gauss)分布的概率密度函数(pdf),在95%的置信水平下X(pk)处在区间χk±1.96σx(pk)内。
空间估计的精度(误差)也可以通过验证数据来估计,往往由于用于空间估计的样本数据本来就有限,并且获取每个样本数据需要付出很高的代价,在统计相关的分析中通常利用交叉验证(cross-validation)的方法来检验空间估计的精度。交叉验证即在多次空间估计中依次留出样本数据中的一个或多个数据不参与空间统计,然后利用每次不参与统计的样本点的观测值和估计值来获取空间估计精度的评价。
2 贝叶斯最大熵应用进展
贝叶斯最大熵在20世纪90年代初被提出之后,不断完善,在2000年前后开始应用在地球科学的多个领域中。由于该方法在时空分析过程中具有可有效地综合利用多源数据的能力,尤其是对不确定性数据(误差较大测量数据、专家知识、经验以及统计规律等)的有效利用,这种方法从最初的土壤学、公共卫生等领域被拓展应用到地球科学系统的多个领域,并和地统计学一样成为统计学中一个重要分支,近年来国内也开始有多位学者对BME进行研究。endprint
2.1 贝叶斯最大熵在土壤学中的应用
土壤学中的地表参数较多,空间分布变化强烈,仅用观测数据很难精确估测区域土壤变量。在20世纪80年代,有学者就将地统计学引入土壤学中进行地表参数的空间制图,并取得一定的成果。关于时空统计学的应用,Douaik等在 25 hm2 的区域进行土壤盐渍度的研究中,共获取区域中413个点的样本数据,其中20个点位通过传统的实验室分析土壤样本来确定盐渍度,精度较高并以此作为硬数据[8-9]。其他点通过传感器实地测量土壤电导率估计土壤盐渍度,由于数据误差较大,将其作为软数据,在空间分析的过程中使用了间隔软数据和概率软数据2种不同软数据的BME方法,同时采用20个硬数据和将软数据中间值作为硬数据的2种普通克里金方法。交叉验证的结果表明,BME的2种方法均可以精确地估计区域土壤盐渍度,利用软数据硬化的普通克里金方法来估计区域土壤盐渍度是失败的。Dimitri通过数据模拟的方法模拟了单变量的土壤黏土含量的空间估计和多变量的土壤质地(沙土、壤土、黏土)的空间估计,估计方法是BME和简单克里金方法,结果表明,引入软数据的BME方法要比只用硬数据的简单克里金方法的估计结果更精确,尤其在细节方面BME所反映的信息量更多,并且指出随着总数据中软数据的增多,所占比例增大,BME方法所得的空间估计的可信度更高,充分说明了引入软数据的必要性[10]。Gao等提出用融合卫星传感器(advanced spaceborne thermal emission and reflection radiometer,简称ASTER)数据反演的地表温度的BME方法对稀疏土壤水分观测站点进行空间估计研究[11]。在稀疏植被覆盖条件下,基于地表温度和土壤水分的反比关系,将土壤水分与地表温度建立线性回归关系,将地表温度辅助数据表达为服从t分布的土壤水分软数据,并融合到土壤水分空间估计中。结果表明,与传统普通克里金、协克里金、回归克里金方法相比,BME方法在空间估计中融入ASTER地表温度辅助数据后,所得到的土壤水分空间分布精度更高。
2.2 在大气污染研究中的应用
近年来环境问题,特别是大气污染问题越来越受到社会公众的关注。然而由于大气中气体的非平稳性、流动性,使精确估测大气污染物的空间分布变得尤为困难,而BME可以有效利用不同来源、不同精度的软数据,使空间制图成为可能。Christako等利用 BME 方法研究了北卡罗来纳州粒径在 10 μm 以下的可吸入颗粒物(particulate matter with particle size below 10 micron,简称PM10)的聚集状态,表明在站点观测数据基础上,引入软数据(专家经验)估计州内区域PM10的时空分布会明显提高估计精度,估计结果也更有意义,这也说明BME较其他空间估计方法在综合考虑多源数据(确定的和不确定的数据)方面的优势[12]。Christakos等根据美国加州范围内11年的站点PM10观测数据,采用时空统计学方法分析了加州范围内PM10的分布和变化特点[13]。结果表明,BME方法在研究PM10时空特征分析中非常有价值,并且得到较为精确的PM10空间分布信息。这也是在利用BME进行PM10空间分布研究中,首次尝试将所有站点观测数据当作软数据使用。同时,这为证明BME方法可以服务于实际污染物分布评价以及制图迈出了重要的一步。Yu等在美国卡罗莱纳地区分析不同时间尺度PM10和对流层臭氧时空分布对人类慢性疾病的影响研究中,采用2种基于BME的时间尺度上推策略估计区域PM10和臭氧的时空分布[14]。策略一是先聚合后BME,策略二是先BME后聚合。将结果与普通克里金法相比表明,加入软数据的BME可以有效地提高污染物时空估计的精度。交叉驗证的结果表明,在时间多尺度的污染物空间分布估计中,2种策略都可以得到较为合理的估计结果。Akita等提出移动窗贝叶斯最大熵(moving window Bayesian maximum entropy,简称MWBME)方法对2003年美国空气中细颗粒物(PM2.5)含量进行估计研究[15]。其中移动窗法考虑到PM2.5的空间非平稳性,BME方法可以解决在大气监测系统中数据的不确定性以及数据缺失问题。在预测结果中,空间分布有着明显的空间格局,MWBME法对大气中非平稳状态的污染物有着较好的估测效果。
Chistakos等研究了美国境内对流层臭氧含量分布,报道中主要采用时空统计方法(BME),以美国雨云号卫星(Nimbus satellite)大气污染测量仪的臭氧观测数据为硬数据,以大气对流层顶压力数据估计的臭氧数据为软数据,估计了大范围内对流层的臭氧分布,结果表明,由于该方法中引入了根据次级变量估计的软数据,在一定程度上消除了由硬数据的多点采样本身所带有的误差,因此BME方法得到了高分辨率下精度更高、信息量更丰富的臭氧分布数据,结果明显优于传统的其他统计插值方法[16]。Bogaert等对美国加州范围内对流层臭氧的时空分布作了相关研究,表明BME方法可以估计出更加科学合理、细节更加丰富的臭氧季节变化图,而且精度要明显高于美国国家环境保保局(U.S. Environmental Protection Agency,简称EPA)使用的方法[17]。Nazelle等在制定美国加州环境污染标准的研究中,利用 BME 方法综合利用多源对流层臭氧数据来估计臭氧的时空分布,将多尺度空气质量模拟平台(multiscale air quality simulation platform,简称MAQSIP)模拟数据(软数据)的精度考虑到估计的过程中,结果表明,与仅利用观测数据的传统统计学方法相比,此方法可以给出加州范围内更高精度的臭氧分布估计[18]。此外,Adam-Poupart等采用克里金方法、土地利用混合效应回归(land-use regression,简称LUR)法以及整合臭氧实测站点、LUR的贝叶斯最大熵(BME-LUR)方法对加拿大魁北克省的地表臭氧含量进行时空估计研究。最终发现,3种方法的预测结果的R2分别为0.414、0.466、0.653,BME-LUR法较克里金方法和LUR法在时空上能更好地估测大气污染物。同时还发现,BME-LUR模型是空间外推的较优方法[19]。endprint
2.3 在地面温度研究中的应用
地球是一个较为恒定的生态系统,任何一个系统参数发生较大的改变,都将影响生物的生存与发展,而地球的表面温度与人类的活动、生存有着重大的联系,故有必要监测地球表面温度的变化,这对人类的可持续发展有着重要决策作用。Lee等在研究凤凰城市热岛效应中发现,当存在较多缺失或不确定的数据时,利用BME方法可以精确地指示城市热岛效应[20]。同时将结果与空间简单克里金、时空简单克里金方法比较发现,BME方法均方根误差(root mean square error,简称RMSE)分别比上述2种方法提高35.28%、12.46%。同时改变软数据的使用数量时发现,软数据使用的数量越多,均方根误差越低。
综合多种数据源卫星产品是提高海洋表面温度(sea surface temperature,简称SST)精度与空间分辨率的方法之一。Li等在亚印太交汇区(joining area of Asia and Indian-Pacific oceans,简称AIPO)海域采用BME方法将中分辨率成像光谱仪(moderate-resolution imaging spectroradiometer,简称MODIS)/海洋表面温度(SST)和AMSR-E(advanced microwave scanning radiometer for EOS)/SST数据进行融合,在不同的分辨率下,提出1种将MODIS/SST和AMSR-E/SST结合在一起的误差模型。考虑到AMSR-E的空间分辨率较粗,空间数值存在一定的不确定性,通过误差模型将AMSR-E/SST处理后将其作为软数据,将MODIS/SST数据作为硬数据,最后通过BME方法产生8 d的平均值以及空间分辨率为4 km连续的海洋表面温度产品数据。结果表明,均方根误差为0.653 K,偏差为-0.146 K[21],这为后续海洋表面温度的研究提供了重要参考。
在上述基础条件下,Tang等采用不同的卫星传感器[MODIS、AVHRR(advanced very high resolution radiometer)、AMSR-E、TMI(the tropical rainfall measuring missions microwave imager)]的每日海洋表面温度数据,结合误差模型和时空协方差模型,利用BME方法将微波海洋表面温度数据与AVHRR 10年的海洋表面气象数据作为软数据,将红外海洋表面温度数据作为硬数据进行时空估计。最后得到空间分辨率为4 km、时间分辨率为24 h的海洋温度产品,并且将结果与实测数据对比,发现均方根误差为0.72 K,偏差为015 K[22]。
2.4 在其他方面的应用
在耗水量的研究中,Lee等利用水量分配数据、用户水费账单、土地利用类型和灌溉定额系数等数据研究了区域耗水量的分布,结果表明,现代统计学中的 BME 方法在制图过程中融合软数据有效合理的方法,与没有利用软数据的传统制图方法相比,此方法明显提高了制图的精度,这为进一步研究耗水量影响因子提供了有意义的数据[23]。
在灾害预测中,李明阳等以 2004—2008年紫金山国家森林公园风景林 96 个松材线虫病疫点定点观测数据为主要信息源,以与松材线虫危害程度相关的6个生态环境因子作为辅助信息源,采用BME方法对松材线虫危害程度进行了时空分析,结果表明,借助于地理信息系统(geographic information system,简称GIS)平台和 BME 方法及少量的定点观测数据,可以对松材线虫的危害程度进行时空预测,这为森林重大有害生物的入侵预防与控制工作提供了科学依据[24]。
在地下水位的研究中,Bogaert等在 BME 基础上提出了更一般化的基于贝叶斯数据融合的空间估计方法,并且考虑了融合过程中数据的冗余[25]。Fasbender等将BME方法应用到了比利时代勒河流域地下水位的估计过程中,在空间样本点数据(钻井)的基础上有效地融合了流域内河流网的数据,流域地下水位的估计精度有了很大的提高[26]。
在多源遥感产品融合的研究中,李爱华进行了基于BME方法的多源定量遥感产品融合研究,研究中尝试了稀疏站点叶面积指数(leaf area index,简称LAI)和陆地资源卫星专题制图仪(landsat thematic mapper,简称Landsat TM)反演的LAI融合,以及相同时空尺度的MODIS LAI 和 CYCLOPES LAI 产品的融合[27]。结果表明,得益于 BME 方法可以综合考虑不确定性数据进行成图,这种方法为改进遥感产品存在的时空不连续、精度不够及质量不稳定等问题提供了一种可行的解决方法。
3 总结与展望
作为现代时空统计学重要组成部分的BME方法,经过国内外研究者多年的开发和实践,已被证明是一个理论上较为成熟、能应用到实际研究中的优秀时空地统计学方法,这给地表要素时空变异性分析和制图研究注入了新的活力。
在BME方法中,基于信息量和地图真实形态出现的可能性之间存在1个反比关系的假设,利用Shannon信息量原则将广义知识表达为自然要素空间实现的1个概率模型,这样有效利用了统计规律(統计矩)、相关定律、科学原理、专家经验等知识;基于贝叶斯理论,将先验阶段的广义知识和以概率密度分布形式表达的软硬数据逻辑合理、公式推理明确地融合到一起,保证了目标要素在时空分析及制图过程中信息量的丰富。在提出BME概念之后仍被不断改进、完善与延伸。目前在土壤特性空间分布及制图、大气污染物(PM2.5,PM10)时空分布估测、表面温度的空间估计、公共卫生等领域已经有了较深入的应用。
与传统地统计学的空间估计方法相比,BME方法的特点或优势主要体现在以下几方面:BME法所得到的估计值是最优无偏估计值,如果软数据考虑在估计的过程中,BME法的估计过程是非线性的,而克里金估计值是线性估计过程中的最优估计,且只能利用硬数据;以区间或是概率密度形式表达的软数据或其他的物理规律可以很容易融合到 BME 时空估计过程中,传统克里金估计只是BME方法的一种特例;BME 估计过程中可以在每个估计点得到1个非高斯分布的概率密度分布(pdf),对pdf的形状不会有任何限制,据此容易计算得到多种估计指标(均值、方差、置信区间等)。而克里金估计只可以得到估计方差,BME法能估计得到每个待估计点连续的后验概率密度函数,根据应用目的可以容易计算得到相应的统计信息,因为在每个待估计点,后验概率密度函数只需要计算1次,这可以极大地减小BME法的计算量[10]。endprint
当然,贝叶斯最大熵方法本身也存在一定的局限性或者亟待解决的问题。比如应用此方法的前提需要有足够的先验知识,并且先验知识在先验阶段需要以一定的数学表达形式出现。另外,作为时空统计学方法,对空间维、时间维数据的尺度统筹显得尤为重要,但目前时空变异函数模型的发展还没有很好地解决此问题,时空变异函数模型的研究也成为目前该领域的研究热点。
随着遥感技术的发展,尤其是定量遥感对地表要素时空特征的不断探索[28-29],可以弥补地表传统点观测模式数据源的不足,为BME方法在地球科学领域的研究和推广提供更多时空软数据源,这使BME方法有更加充足的空间来发挥优势;另外,依托BME法可以综合利用相关的多源知识和信息的优势,可以基于BME法进行地表要素时空多源数据融合以及升降尺度的研究,并且已有相关研究取得初步进展[30]。随着国内外学者的不断探索,BME方法在未来地球科学领域会有更廣泛的应用前景。
参考文献:
[1]Christakos G. Modern spatiotemporal geostatistics[M]. New York:Oxford University Press,2000.
[2]Christakos G. A bayesian/maximum-entropy view to the spatial estimation problem[J]. Mathematical Geology,1990,22(7):763-777.
[3]Christakos G. Some applications of the bayesian,maximum-entropy concept in geostatistics[M]//Maximum entropy and Bayesian methods. Berlin:Springer Netherlands,1991:215-229.
[4]Christakos G. Random field models in earth sciences[M]. San Diego:Academic Press,1992.
[5]Shannon C E. A mathematical theory of communication[J]. Bell System Technical Journal,1948,27(3):379-423.
[6]Ewing G M. Calculus of variations with applications[M]. New York:W. W. Norton Company,1969,62-65.
[7]Lee S J. Models of soft data in geostatistics and their application in environmental and health mapping[D]. North Carolina:University of North Carolina at Chapel Hill,2005.
[8]Douaik A,van Meirvenne M,Tóth T,et al. Space-time mapping of soil salinity using probabilistic bayesian maximum entropy[J]. Stochastic Environmental Research and Risk Assessment,2004,18(4):219-227.
[9]Douaik A,van Meirvenne M,Tóth T. Soil salinity mapping using spatio-temporal kriging and bayesian maximum entropy with interval soft data[J]. Geoderma,2005,128(3):234-248.
[10]DOr D. Spatial prediction of soil properties,the bayesian maximum entropy approach[D]. Louvain-la-Neuve:Université Catholique De Louvain,2003.
[11]Gao S G,Zhu Z L,Liu S M,et al. Estimating the spatial distribution of soil moisture based on bayesian maximum entropy method with auxiliary data from remote sensing [J]. International Journal of Applied Earth Observation and Geoinformation,2014,32(10):54-66.
[12]Christakos G,Serre M L. BME analysis of spatiotemporal particulate matter distributions in North Carolina[J]. Atmospheric Environment,2000,34(20):3393-3406.
[13]Christakos G,Serre M L,Kovitz J L. BME representation of particulate matter distributions in the state of California on the basis of uncertain measurements[J]. Journal of Geophysical Research:Atmospheres,2001,106(D9):9717-9731.endprint
[14]Yu H L,Chen J C,Christakos G,et al. BME estimation of residential exposure to ambient PM10 and ozone at multiple time scales[J]. Environmental Health Perspectives,2009,117(4):537-544.
[15]Akita Y,Chen J C,Serre M L. The moving-window Bayesian maximum entropy framework:estimation of PM2.5 yearly average concentration across the contiguous United States[J]. Journal of Exposure Science and Environmental Epidemiology,2012,22(5):496-501.
[16]Christakos G,Kolovos A,Serre M L,et al. Total ozone mapping by integrating databases from remote sensing instruments and empirical models[J]. IEEE Transactions on Geoscience and Remote Sensing,2004,42(5):991-1008.
[17]Bogaert P,Christakos G,Jerrett M,et al. Spatiotemporal modelling of ozone distribution in the State of California[J]. Atmospheric Environment,2009,43(15):2471-2480.
[18]Nazelle A,Arunachalam S,Serre M L. Bayesian maximum entropy integration of ozone observations and model predictions:an application for attainment demonstration in North Carolina[J]. Environmental Science and Technology,2010,44(15):5707-5713.
[19]Adam-Poupart A,Brand A,Fournier M,et al. Spatiotemporal modeling of ozone levels in Quebec (Canada):a comparison of kriging,land-use regression (LUR),and combined bayesian maximum entropy-LUR approaches[J]. Environmental Health Perspectives,2014,122(9):970-976.
[20]Lee S J,Balling R,Gober P. Bayesian maximum entropy mapping and the soft data problem in urban climate research[J]. Annals of the Association of American Geographers,2008,98(2):309-322.
[21]Li A,Bo Y C,Zhu Y X,et al. Blending multi-resolution satellite sea surface temperature (SST) products using bayesian maximum entropy method[J]. Remote Sensing of Environment,2013,135:52-63.
[22]Tang S L,Yang X F,Dong D,et al. Merging daily sea surface temperature data from multiple satellites using a bayesian maximum entropy method[J]. Frontiers of Earth Science,2015,9(4):722-731.
[23]Lee S J,Wentz E A. Applying bayesian maximum entropy to extrapolating local-scale water consumption in Maricopa County,Arizona[J]. Water Resources Research,2008,44(1):1-13.
[24]李明阳,张晓利,刘 方,等. 基于贝叶斯最大熵模型的紫金山松材线虫危害程度时空分析[J]. 西北农林科技大学学报(自然科学版),2012,40(7):99-105.
[25]Bogaert P,Fasbender D. Bayesian data fusion in a spatial prediction context:a general formulation[J]. Stochastic Environmental Research and Risk Assessment,2007,21(6):695-709.
[26]Fasbender D,Peeters L,Bogaert P,et al. Bayesian data fusion applied to water table spatial mapping[J]. Water Resources Research,2008,44(12):1-9..
[27]李爱华. 基于贝叶斯最大熵方法的多源定量遥感产品融合研究[D]. 北京:北京师范大学,2011.
[28]弓永利. 基于微波遥感的裸露地表土壤盐分含量的反演[J].江苏农业科学,2015,43(11):442-444.
[29]汤 斌,王福民,周柳萍,等. 基于地级市的区域水稻遥感估产与空间化研究[J].江苏农业科学,2015,43(11):525-528.
[30]高胜国. 融合遥感信息的土壤水分空间估计及升尺度研究[D]. 北京:北京师范大学,2014.于姣妲,殷丹阳,李 莹,等. 生物炭对土壤磷素循环影响机制研究进展[J]. 江蘇农业科学,2017,45(18):17-21.endprint