基于Fisher判别准则的沉积环境判别与分类方法

2011-11-21 12:01董文娟朱远鑫万明刚
长江大学学报(自科版) 2011年13期
关键词:判别函数沉积环境沉积物

董文娟,朱远鑫,万明刚

(长江大学信息与数学学院,湖北 荆州 434023)

基于Fisher判别准则的沉积环境判别与分类方法

董文娟,朱远鑫,万明刚

(长江大学信息与数学学院,湖北 荆州 434023)

基于Fisher判别准则建立了沉积环境判别与分类的Fisher判别分析模型。模型选用粒度的平均粒径、标准偏差、偏差以及峰值等4个指标作为判别因子,利用方差分析的思想选择判别系数建立相应的判别函数,以该函数计算待判样品的Fisher判别函数值,以最大值对应的总体作为样品的归属。判别结果表明,所建立的沉积环境判别与分类的Fisher判别模型具有一定的实用价值。

粒度;沉积环境;分类;Fisher判别分析

沉积物粒度参数的变化受搬运介质、搬运方式、沉积环境和气候等因素控制,因此,沉积物粒度分析对揭示气候变化和环境的演变具有重要意义。粒度参数平均粒径、标准偏差、偏差、峰值是沉积物粒度4个重要参数。不同粒度组分的形成与搬运与沉积环境密切相关,处理、分析粒度数据可以进一步确定沉积环境,这对于现代沉积学的研究,乃至古代沉积物的沉积环境分析无疑都具有重要的理论和现实意义。

文献[1]给出了一种单样品粒度分布表征方法——粒度母体分解图;文献[2]通过测试分析发现沉积岩粒度中值分布、泥质含量、分选性等是影响油藏岩石渗透能力的重要因素,正态分布能较好地描述低渗透砂岩油藏中沉积物的粒度分布特征;文献[3]根据数理统计方法对粒度参数进行无偏估计,使之较以往参数估计更加符合无系统误差的评选标准,并利用这一方法对长乐东部海岸的风沙进行了系统的粒度参数分析;文献[4]对典型稳定湖相沉积物和典型风成黄土粒度参数进行定量化分析,然后利用多元判别分析的Fisher准则建立了湖相与风成沉积物2种沉积相的判别函数; 文献[5]以粒度参数为输入变量,设计了沉积环境判别与分类的神经网络模型。

下面,笔者将判别分析理论应用于沉积环境的综合评判中,建立沉积环境判别与分类的Fisher判别分析模型。

1 Fisher判别分析

1.1Fisher判别分析的基本思想

判别分析的基本思想,一般是将高维的数据点,利用投影映射到低维空间上,从而方便进行研究。Fisher判别准则是利用方差分析方法对k个总体G1,G2,…,Gk中抽取具有p个指标的样本数据构造判别函数:R(x)=c1x1+…+cpxp=cTx,其中系数c=(c1,…,cp)的确定原则是使得每个组内的离差最小,最后利用所得的判别函数对待测的样品进行判别。

1.2Fisher判别分析数学模型

设有k个总体G1,…,Gk,从中抽取样本数分别为n1,…,nk的样本,令n=n1+…+nk,其中每个样品具有p个指标。假设判别函数为:

R(x)=c1x1+…+cpxp=cTxc=(c1,…,cp)Tx=(x1,…,xp)T

(1)

不妨记:

A=cTμiB=cTsic

(2)

Fisher判别准则就是利用方差分析的思想来选取判别系数组成的向量c,使得:

(3)

达到最大,其中qi为正的加权系数,一般取(qi=ni-1);E,F分别为组间和组内离差平方和:

(4)

地基沉降的原因主要可以分成2方面:一方面是内部原因,即地基本身就存在不稳定性,例如,陕西地区的土壤类型是黄土,就会更加容易发生沉降;另一方面就是外部原因,在外部存在着过于强大的附加压力,超过了地基所能负荷的最大限度,从而使得地基发生变形,导致地基基础下沉。

Ec=λFc

(5)

由代数知识可知,该式非零的特征根的个数m不超过min(k-1,p);因为E为非负定,则非零特征根必为正根,有λ1≥λ2≥…≥λm>0。则可以构造m个判别函数:

Rl(x)=c(l)xl=1,…,m

(6)

1.3Fisher判别准则及检验

采取加权法和不加权法对待测样本x(x1,x2,…,xp)T进行归类。

不加权法:

(6)

加权法:

(7)

表1 3种沉积环境的粒度样本数据

(8)

2 实例分析

珠江口盆地某凹陷是晚新生代古珠江三角洲-滨岸沉积体系形成、发育及演化的主要场所。在对该凹陷某区域进行沉积微相划分时进行了大量的粒度试验,得到了一系列与沉积微相对应的粒度数据,取其中15个样本作为训练样本,建立Fisher判别函数。其具体样本数据见表1。

由表1可知,k=3,p=4,i=1,2,3,n=n1+n2+n3=15。

1)计算各判别变量的均值:

μ1=[2.2895,1.0884,0.2809,1.4689]μ2=[3.7933,1.9737,0.2680,1.1387]

μ3=[3.3747,1.5325,0.6657,1.8988]

2)计算各判别样本的方差:

3)计算组间和组内离差阵:

最后得到判别函数为:

R(x)=0.4296x1+0.5660x2+0.0519x3+0.227

利用上述判别函数对其余60个粒度参数进行判别分析,其判别结果见表2。

表2 60个样本的识别结果

由表2可知,所建立的沉积环境判别与分类的Fisher判别模型整体误判率为23.3%,具有一定的实用价值。

3 结 语

结合多元统计数学知识,以Fisher判别分析方法建立沉积环境综合评判的数学模型,为沉积环境的判别与分类提供了数量化与定量化的途径。值得指出的是在上述实例中除潮汐水道的判别率较高以外,其余2种沉积环境的判别率较低。出现整体判别率不高的原因主要在于基于Fisher准则的判别分析法是线性判别,产生的误差较大,适合两组间的判别。对于多组沉积环境的判别,可以尝试采取Bayesian判别分析法。

[1]曲政.沉积物粒度数据表征方法的研究[J].中国粉体技术, 2001,7(4):24-31.

[2]薛太清.低渗透砂岩油藏沉积物粒度分布特征研究[J].沉积学报, 2006, 24(3):414-418.

[3]杨锐,雷怀彦,刘建辉,等.沉积物粒度参数的无偏估计及其在长乐海岸的应用[J].海洋地质动态, 2007,23(10):33-36.

[4]张平,宋春晖,杨用彪,等.稳定湖相沉积物和风成黄土粒度判别函数的建立及其意义[J].沉积学报, 2008,26(3):501-507.

[5]方志江,曲政.基于粒度数据的沉积环境自动识别方法的研究[J].煤, 1999,3:60-63.

[6]高惠璇.应用多元统计分析[M].北京: 北京大学出版社, 2005.

[编辑] 洪云飞

10.3969/j.issn.1673-1409.2011.05.002

TE19

A

1673-1409(2011)05-0005-03

猜你喜欢
判别函数沉积环境沉积物
晚更新世以来南黄海陆架沉积物源分析
渤海油田某FPSO污水舱沉积物的分散处理
近三百年来长江口泥质区沉积环境变化及与低氧关系的初步分析
水体表层沉积物对磷的吸收及释放研究进展
微量元素在鹤岗盆地早白垩世沉积环境分析中的应用
Fisher判别法在个人信用风险评估中的应用
游乐设施事故与危险量化判别函数的构建
探究上市公司财务预警的数学模型
制造业上市公司财务预警研究
昭苏盆地含煤地层沉积环境及聚煤规律研究