董文娟,朱远鑫,万明刚
(长江大学信息与数学学院,湖北 荆州 434023)
基于Fisher判别准则的沉积环境判别与分类方法
董文娟,朱远鑫,万明刚
(长江大学信息与数学学院,湖北 荆州 434023)
基于Fisher判别准则建立了沉积环境判别与分类的Fisher判别分析模型。模型选用粒度的平均粒径、标准偏差、偏差以及峰值等4个指标作为判别因子,利用方差分析的思想选择判别系数建立相应的判别函数,以该函数计算待判样品的Fisher判别函数值,以最大值对应的总体作为样品的归属。判别结果表明,所建立的沉积环境判别与分类的Fisher判别模型具有一定的实用价值。
粒度;沉积环境;分类;Fisher判别分析
沉积物粒度参数的变化受搬运介质、搬运方式、沉积环境和气候等因素控制,因此,沉积物粒度分析对揭示气候变化和环境的演变具有重要意义。粒度参数平均粒径、标准偏差、偏差、峰值是沉积物粒度4个重要参数。不同粒度组分的形成与搬运与沉积环境密切相关,处理、分析粒度数据可以进一步确定沉积环境,这对于现代沉积学的研究,乃至古代沉积物的沉积环境分析无疑都具有重要的理论和现实意义。
文献[1]给出了一种单样品粒度分布表征方法——粒度母体分解图;文献[2]通过测试分析发现沉积岩粒度中值分布、泥质含量、分选性等是影响油藏岩石渗透能力的重要因素,正态分布能较好地描述低渗透砂岩油藏中沉积物的粒度分布特征;文献[3]根据数理统计方法对粒度参数进行无偏估计,使之较以往参数估计更加符合无系统误差的评选标准,并利用这一方法对长乐东部海岸的风沙进行了系统的粒度参数分析;文献[4]对典型稳定湖相沉积物和典型风成黄土粒度参数进行定量化分析,然后利用多元判别分析的Fisher准则建立了湖相与风成沉积物2种沉积相的判别函数; 文献[5]以粒度参数为输入变量,设计了沉积环境判别与分类的神经网络模型。
下面,笔者将判别分析理论应用于沉积环境的综合评判中,建立沉积环境判别与分类的Fisher判别分析模型。
1.1Fisher判别分析的基本思想
判别分析的基本思想,一般是将高维的数据点,利用投影映射到低维空间上,从而方便进行研究。Fisher判别准则是利用方差分析方法对k个总体G1,G2,…,Gk中抽取具有p个指标的样本数据构造判别函数:R(x)=c1x1+…+cpxp=cTx,其中系数c=(c1,…,cp)的确定原则是使得每个组内的离差最小,最后利用所得的判别函数对待测的样品进行判别。
1.2Fisher判别分析数学模型
设有k个总体G1,…,Gk,从中抽取样本数分别为n1,…,nk的样本,令n=n1+…+nk,其中每个样品具有p个指标。假设判别函数为:
R(x)=c1x1+…+cpxp=cTxc=(c1,…,cp)Tx=(x1,…,xp)T
(1)
不妨记:
A=cTμiB=cTsic
(2)
Fisher判别准则就是利用方差分析的思想来选取判别系数组成的向量c,使得:
(3)
达到最大,其中qi为正的加权系数,一般取(qi=ni-1);E,F分别为组间和组内离差平方和:
(4)
地基沉降的原因主要可以分成2方面:一方面是内部原因,即地基本身就存在不稳定性,例如,陕西地区的土壤类型是黄土,就会更加容易发生沉降;另一方面就是外部原因,在外部存在着过于强大的附加压力,超过了地基所能负荷的最大限度,从而使得地基发生变形,导致地基基础下沉。
Ec=λFc
(5)
由代数知识可知,该式非零的特征根的个数m不超过min(k-1,p);因为E为非负定,则非零特征根必为正根,有λ1≥λ2≥…≥λm>0。则可以构造m个判别函数:
Rl(x)=c(l)xl=1,…,m
(6)
1.3Fisher判别准则及检验
采取加权法和不加权法对待测样本x(x1,x2,…,xp)T进行归类。
不加权法:
(6)
加权法:
(7)
表1 3种沉积环境的粒度样本数据
(8)
珠江口盆地某凹陷是晚新生代古珠江三角洲-滨岸沉积体系形成、发育及演化的主要场所。在对该凹陷某区域进行沉积微相划分时进行了大量的粒度试验,得到了一系列与沉积微相对应的粒度数据,取其中15个样本作为训练样本,建立Fisher判别函数。其具体样本数据见表1。
由表1可知,k=3,p=4,i=1,2,3,n=n1+n2+n3=15。
1)计算各判别变量的均值:
μ1=[2.2895,1.0884,0.2809,1.4689]μ2=[3.7933,1.9737,0.2680,1.1387]
μ3=[3.3747,1.5325,0.6657,1.8988]
2)计算各判别样本的方差:
3)计算组间和组内离差阵:
最后得到判别函数为:
R(x)=0.4296x1+0.5660x2+0.0519x3+0.227
利用上述判别函数对其余60个粒度参数进行判别分析,其判别结果见表2。
表2 60个样本的识别结果
由表2可知,所建立的沉积环境判别与分类的Fisher判别模型整体误判率为23.3%,具有一定的实用价值。
结合多元统计数学知识,以Fisher判别分析方法建立沉积环境综合评判的数学模型,为沉积环境的判别与分类提供了数量化与定量化的途径。值得指出的是在上述实例中除潮汐水道的判别率较高以外,其余2种沉积环境的判别率较低。出现整体判别率不高的原因主要在于基于Fisher准则的判别分析法是线性判别,产生的误差较大,适合两组间的判别。对于多组沉积环境的判别,可以尝试采取Bayesian判别分析法。
[1]曲政.沉积物粒度数据表征方法的研究[J].中国粉体技术, 2001,7(4):24-31.
[2]薛太清.低渗透砂岩油藏沉积物粒度分布特征研究[J].沉积学报, 2006, 24(3):414-418.
[3]杨锐,雷怀彦,刘建辉,等.沉积物粒度参数的无偏估计及其在长乐海岸的应用[J].海洋地质动态, 2007,23(10):33-36.
[4]张平,宋春晖,杨用彪,等.稳定湖相沉积物和风成黄土粒度判别函数的建立及其意义[J].沉积学报, 2008,26(3):501-507.
[5]方志江,曲政.基于粒度数据的沉积环境自动识别方法的研究[J].煤, 1999,3:60-63.
[6]高惠璇.应用多元统计分析[M].北京: 北京大学出版社, 2005.
[编辑] 洪云飞
10.3969/j.issn.1673-1409.2011.05.002
TE19
A
1673-1409(2011)05-0005-03