基于最大熵理论的黑土地土壤风蚀主导因子概率密度函数

2015-03-29 09:08武欣慧刘铁军
安徽农业科学 2015年35期
关键词:风蚀概率密度函数信源

武欣慧, 刘铁军

(1.内蒙古农业大学,内蒙古呼和浩特 010050;2.水利部牧区水利科学研究所,内蒙古呼和浩特 010020;3.内蒙古大学,内蒙古呼和浩特 010025)



基于最大熵理论的黑土地土壤风蚀主导因子概率密度函数

武欣慧1, 刘铁军2,3

(1.内蒙古农业大学,内蒙古呼和浩特 010050;2.水利部牧区水利科学研究所,内蒙古呼和浩特 010020;3.内蒙古大学,内蒙古呼和浩特 010025)

土壤风蚀是一个复杂的过程,影响因素众多。严重的土壤风蚀会引起土壤质地变粗,结构变坏,土壤肥力下降,可持续生产能力降低,尤其东北黑土地耕作土壤疏松,抗蚀能力弱,水土流失日趋严重。众多因子对风蚀结果的影响是一个随机连续的概率事件,最终结果反映在风蚀量上。一次土壤风蚀可看作各变量随机组合作用于地表土的连续分布事件。为了将事件明了化,引入最大熵原理对风蚀变量寻找其熵概率密度函数,而目前运用最大熵原理来研究土壤风蚀的相关成果甚少。该方法对风蚀建模的筛选模型变量具有重要意义。

黑土地;风蚀;最大熵

土壤风蚀是一个复杂的过程,影响因素众多,如气温、空气湿度、风速、气压、地表土壤含水量、土壤质地、地表覆盖度、地表粗糙度等[1]。众多因子对风蚀结果的影响是一个随机连续的概率事件,最终结果反映在风蚀量上。严重的土壤风蚀会引起土壤质地变粗,结构变坏,土壤肥力下降,可持续生产能力降低[2]。我国北方旱作农田土壤风蚀问题严重,影响范围较大[3],尤其东北黑土地耕作土壤疏松、抗蚀能力弱[4]。由于降雨、风力和长期以来人口增加导致的过度垦殖等不合理开发利用,该区水土流失日趋严重[5]。一次土壤风蚀可看作各变量随机组合作用于地表土的连续分布事件。为了将事件明了化,引入最大熵原理,对风蚀变量寻找其熵概率密度函数,通过求解得出概率密度函数方程式,得知在风蚀发生过程中各因子的概率分布情况,进而辨别风蚀主要影响因子的影响时段,最终将风蚀系统过程的混沌状态清晰化、数值化。目前,运用最大熵原理来研究土壤风蚀的相关成果甚少[6]。该方法对风蚀建模的筛选模型变量具有重要意义。

1 信息熵原理及最大熵理论

1.1 信息熵的定义及基本性质

熵是由Clausius[7]于1865年首次提出的一个概念,主要用来衡量一个系统中分子运动的混乱程度。它是一个极其重要的物理量,但又以其抽象隐晦、难以理解而著称。熵作为一个状态函数,其含义非常丰富。在热力学中,它是不可用能的度量;在统计物理学中,它是系统微观态数目的度量。在不同场合,针对不同对象,熵可以作为系统的混乱性或无序度。1948年,信息科学的创始人贝尔实验室的美国电气工程师香农(Shannon C.E.)为研究信息的不确定性,依据热力学中熵的概念,把通信过程中信源信号的平均信息量称为熵,使熵概念的应用领域又获得史无前例的扩展。在信息科学中,熵是衡量系统不确定性程度的一个量度。信息论中的熵有时被称为“信息熵”或“香农熵”。信息熵的出现为现代信息论奠定科学理论基础[8]。

如果把一个离散信源表示为

(1)

随机变量X取值xi时的先验概率为pi,其中i=1,2,3,…,n。

p(X=xi∩X=xj)=0 (i≠j)

(2)

(3)

pi≥0

(4)

对于该信源只有部分知识,即信源具有随机不确定性,可用先验概率分布(p1,p2,…,pn)来描述。若有一函数(p1,p2,…,pn),则要求它满足以下条件:①对于固定的n来说,H是p1,p2,…,pn的连续函数;②如果所有pi相等,则H(1/n,1/n,…,1/n)是n的单调递增函数;③若将一试验分解成多个相继的试验,则原先的H值应为分解后多个试验的各个相应H值的加权和。

满足上述3个条件的测度H具有唯一形式,即

(5)

上述3个条件也是对要描述该样本窨不确定程度的要求,即信息熵的定义。其中,常数k取决于所选用的单位,通常取k=1。为了便于数学运算,常取自然数e为底,则式(5)可表示为:

(6)

式中,pi为信息源中第i种信号出现的概率;-lnpi为pi带来的信息量。

H(x)具有这样的意义,即在试验进行之前,它是试验结果不确定性的量度;在试验完成之后,它是从试验中所得到的信息的量度(信息量)。信息熵表征信源整体的统计特性,是总体的平均不确定性的量度。对于某一特定的信源,其信息熵只有一个。若统计特性不同,则其熵也不同。

对于连续信源,X的分布以概率密度函数p(x)来描述。仿照式(6)可以写出X具有连续分布情况下熵的表达式为:

(7)

1.2 最大熵原理

热力学统计物理中有熵增加原理,在信息论中也有对应的关于信息熵的著名定理——最大熵原理。按最大熵原理,笔者从全部相容的分布中挑选这样的分布。它是在某些约束条件(通常是给定的某些随机变量的平均值)下使信息熵达到极大值的分布。这是因为信息熵取得极大值时对应的一组概率分布出现的概率占绝对优势。从理论上可以证明这一点。

任何物质系统除了受或多或少的外部约束外,其内部总是具有一定的自由度。这种自由度导致系统内各元素处于不同的状态。而状态的多样性以及状态的丰富程度(混乱程度、复杂程度)的定量计量标尺就是熵。熵最大就是事物状态的丰富程度自动达到最大值。换句话说,事物总是在约束下争取(或呈现)最大的自由权。人们把这看作是自然界的根本原则。

Shannon解决了不确定性的度量问题,但这里还存在如何进行概率分配的问题。对于一个随机过程,概率密度事先是未知的且对于观测值的概率分配,可以有无限多组。Jaynes提出,当根据部分信息进行推理时,必须选择这样一组概率分配,它应具有最大的熵,并且服从一切已知的信息。这是能够做出的唯一的无偏分配;使用任何其他分配,就等于对原来所有信息做了随意假设。这一统计推理准则被称为最大熵原理[9]。

在数学上,最大熵原理可表示为:

(8)

(9)

(10)

pi≥0

(11)

式中,gj(x)为可观测的函数值;E[gj(x)]为相应的均值。

Tribus曾证明,正态分布、伽玛分布及指数分布等都是最大熵原理的特殊情况。对于连续变量x,该模型为:

(12)

约束条件为:

(13)

(14)

设拉格朗日函数为L,拉格朗日乘子为λ0,对于等式约束的极值问题式(12)~式(14),就有

(15)

得出

(16)

式(16)就是最大熵概率密度函数的解析形式,也就是上述优化问题的一个最优解。

一般的,拉格朗日乘子法的法则可叙述如下:欲求n元函数f(x1,x2,…,Xn)在m个(m>n)约束条件

(17)

下的条件极值,可用常数λ1,λ2,…,λm依次乘f,ψ1,ψ2,…,ψm,把结果加起来,得函数

F(x1,x2,…,xm)=f+λ1φ1+λ2φ2+…+λmφm

(18)

然后,列出F(x1,x2, …,xn)无约束条件时具有极值的必要条件。

(19)

这n个方程与m个方程联立解出n+m个x1,x2,…Xn,λ1,λ2,…,λm的值,而其中x1,x2,…,xn就是可能的极值点,称为驻点。其中,H(x)是分布函数f(x)的泛函数。而对于给定情况下的随机事件,若希望得到其特定意义的解析表达式,需确定参数λ0,λ1,λ2,…,λn。这属于一个多参数寻优问题。

2 基于最大熵的黑土地风蚀主要影响因子分布规律

选取2010~2012年在风沙运动频繁的春季测量的2 m高风速(x1)、气温(x2)和空气湿度(x3)3个风蚀主导因子。基于上述理论分析,利用Matlab编制相应的计算程序,得出主导因子分布规律的熵概率密度函数的表达式。在黑土地风蚀过程中,风速、气温、空气相对湿度的熵概率密度函数表达式为:

根据上述熵概率密度函数,将观测变量样本代入,得出风速、气温、空气相对湿度的熵概率密度函数分布规律拟合曲线(图1)。

3 结论

应用最大熵原理寻找风蚀主导因子的概率密度函数,得出概率密度曲线,可以直观地发现风蚀发生过程影响因子数值区间出现的概率情况,进一步对试验数据的有效性、风蚀时段进行辨别。通过对最大熵原理在风蚀影响因子统计分布模型中应用的研究,突出利用最大熵原理风蚀影响因子确定随机变量统计分布模型的优越性,同时为研究土壤的风蚀规律奠定基础。但是,利用最大熵原理得到的风蚀影响因子熵概率密度函数,受样本容量的影响较大,所以在利用该方法时,要事先采集尽量多的实测数据资料以提高精度。

[1] 吴正.风沙地貌与治沙工程学[M].北京:科学出版社,2003.

[2] 麻硕士,陈智.土壤风蚀测试与控制技术[M].北京:科学出版社,2010.

[3] 董治宝,董光荣,陈广庭.以北方旱作农田为重点开展我国的土壤风蚀研究[J].干旱区资源与环境,1996(2):31-37.

[4] 刘铁军,赵显波,赵爱国,等.东北黑土地土壤风蚀风洞模拟试验研究[J].水土保持学报,2013,27(2):67-70.

[5] 谢军.黑龙江省黑土区水土流失危害及治理途径[J].水土保持通报,1991(5):61-64.

[6] 邹春霞,申向东,李春娥.土壤风蚀影响因子分布规律研究的最大熵方法[J].农业环境科学学报,2007,26(6):2095-2098.

[7] 冯端,冯步云.熵[M].北京:科学出版社,1992.

[8] 姜丹.信息理论与编码[M].合肥:中国科学技术大学出版社,1992.

[9] 吴乃龙,袁素云.最大熵方法[M].长沙:湖南科学技术出版社,1991.

Probability Density Function about the Maximum Entropy Theory of Black Land Soil Wind Erosion Dominating Factor

WU Xin-hui1,LIU Tie-jun2,3

(1. Inner Mongolia Agricultural University, Hohhot, Inner Mongolia 010050; 2.Institute of Water Resources for Pastoral Area, Ministry of Water Resources, Huhhot, Inner Mongolia 010020; 3.Inner Mongolia University, Hohhot, Inner Mongolia 010025)

Soil wind erosion is a complex process,it is affected by many factors.Serious soil wind erosion can cause soil texture,structures deteriorate,soil fertility decline, sustainable production ability to reduce.Especially in the northeast tillage soil loosen, erosion resistance weak,soil and water loss is becoming more and more serious.The results of many factors on wind erosion is a random probability event,the final result reflects on the amount of wind erosion.A soil wind erosion can be combined as the random variables in overburden continuous distribution incident,in order to clear the incident,the introduction of the maximum entropy principle of wind erosion variables to find its entropy probability density function and using the maximum entropy principle to the relevant achievements of research is little on soil wind erosion.This method is of great importance in the screening model of variable wind erosion modeling.

Black soil; Wind erosion; Maximum entropy

国家自然科学家基金项目(51579157);内蒙古自然科学基金项目(2015MS0387);中国水科院科研专项项目(JSJBKY1556)。

武欣慧(1972- )女,内蒙古乌拉特前旗人,讲师,硕士,从事荒漠化防治与教学工作。

2015-11-09

S 157.1

A

0517-6611(2015)35-003-02

猜你喜欢
风蚀概率密度函数信源
黄土高原水蚀风蚀交错带迎风坡水蚀影响的风蚀特征
幂分布的有效估计*
基于极化码的分布式多信源信道联合编码
秦王川灌区种植春小麦与披碱草对耕地风蚀的影响差异
已知f(x)如何求F(x)
信源控制电路在功率容量测试系统中的应用
信源自动切换装置的设计及控制原理
基于概率密度函数的控制系统性能评价
非高斯随机分布系统自适应控制算法的研究
保护性耕作对农田土壤风蚀影响的室内风洞实验研究