毕武 袁小龙 段新力 黄显义 彭仲秋 李永华 向诗强 张恒(①新疆地矿局物化探大队昌吉831100②乌鲁木齐金维图文信息科技有限公司 乌鲁木齐830091)
用马氏距离方法提取化探综合异常
毕武袁小龙段新力黄显义彭仲秋李永华向诗强张恒
(①新疆地矿局物化探大队昌吉831100②乌鲁木齐金维图文信息科技有限公司乌鲁木齐830091)
摘要介绍了马氏距离方法原理以及马氏距离在地球化学综合异常提取中的应用,利用马氏距离方法在西昆仑甜水海地区1∶5万地球化学普查化探综合异常提取上做了一些尝试,取得了较满意的效果。
关键词马氏距离欧式距离化探综合异常
随着计算机硬件、软件技术水平的发展,物化探数据成图表现形式和方法越来越丰富,在化探数据处理方面,基本上已经可以全部用计算机软件实现,但在综合异常提取方面,还没有很理想的方法和手段。乌鲁木齐金维图文信息科技有限公司开发的“跨平台金维地学信息处理研究应用系统(GeoI⁃PAS)”利用马氏距离方法在化探综合异常提取上做了一些尝试,效果明显,可以作为化探项目人员在异常提取和解释上的参考。
马氏距离是由印度统计学家马哈拉诺比斯(P. C. Mahalanobis)提出的,表示数据的协方差距离。它是一种有效的计算两个未知样本集的相似度的方法。与欧式距离不同的是它考虑到各种特性之间的联系(例如:一条关于身高的信息会带来一条关于体重的信息,因为两者是有关联的)并且是尺度无关的(scale-invariant),即独立于测量尺度。对于一个均值为y,协方差矩阵为Σ的多变量向量,其马氏距离为:
马氏距离也可以定义为两个服从同一分布并且其协方差矩阵为Σ的随机变量与的差异程度:
如果协方差矩阵为单位矩阵,那么马氏距离就简化为欧式距离,如果协方差矩阵为对角阵,则其也可称为正规化的欧氏距离。
其中σi是xi的标准差。
我们熟悉的欧氏距离虽然很有用,但也有明显的缺点。它将样品的不同属性(即各指标或各变量)之间的差别等同看待,这一点有时不能满足实际要求。因此,有时需要采用不同的距离函数。
马氏距离的应用条件:
(1)马氏距离的计算是建立在总体样本的基础上的,这一点可以从上述协方差矩阵的解释中可以得出,也就是说,如果拿同样的两个样本,放入两个不同的总体中,最后计算得出的两个样本间的马氏距离通常是不相同的,除非这两个总体的协方差矩阵碰巧相同。
(2)在计算马氏距离过程中,要求总体样本数大于样本的维数,否则得到的总体样本协方差矩阵逆矩阵不存在,这种情况下,用欧式距离计算即可。
(3)还有一种情况,满足了条件总体样本数大于样本的维数,但是协方差矩阵的逆矩阵仍然不存在,比如3个样本点(3,4),(5,6)和(7,8),这种情况是因为这3个样本在其所处的二维空间平面内共线。这种情况下,也采用欧式距离计算。
(4)在实际应用中“总体样本数大于样本的维数”这个条件是很容易满足的,而所有样本点出现3)中所描述的情况是很少出现的,所以在绝大多数情况下,马氏距离是可以顺利计算的,但是马氏距离的计算是不稳定的,不稳定的来源是协方差矩阵,这也是马氏距离与欧式距离的最大差异之处。
马氏距离的优缺点:
优点:它不受量纲的影响,两点之间的马氏距离与原始数据的测量单位无关;由标准化数据和中心化数据(即原始数据与均值之差)计算出的二点之间的马氏距离相同。马氏距离还可以排除变量之间的相关性的干扰。缺点:它的缺点是夸大了变化微小的变量的作用。
如果用dij表示第i个样品和第j个样品之间的距离,那么对一切i,j和k,dij应该满足如下4个条件:
①当且仅当i=j时,dij=0;
②dij>0;
③dij=dji(对称性);
④dij≤dik+dkj(三角不等式)。
显然,欧氏距离满足以上四个条件。满足以上条件的函数有多种,本文用到的马氏距离也是其中的一种。
第i个样品与第j个样品的马氏距离dij,代入公式(1)得:
其中,T表示转置,xi和xj分别为第i个和第j个样品的m个指标所组成的向量,Σ为样本协方差矩阵。
本文以西昆仑甜水海地区1∶5万地球化学普查为例,图1为甜水海铅锌矿周围地质及各元素地球化学图,表1列出了甜水海地区元素背景特征值及异常下限。
因为地球化学条件与成矿的关系十分密切,一般情况下,浓集系数高,变异系数大、峰度值高者成矿条件好,而极大值高的元素则可能反映地表或浅部有矿化和含矿地质体分布。
普查区成矿地球化学条件最好的为Pb、Zn元素,这与区内分布有区域上的侏罗系龙山组和白垩系铁隆滩群铅、锌富集层位在普查区广泛出露有关,已有的多宝山铅锌矿和在异常检查中新发现的甜水海铅锌矿也是有力的佐证,其找矿前景巨大。为寻找铅锌多金属矿床的最佳找矿远景区,Pb、Zn元素异常区则可能成为找铅锌矿的靶区。
Cu、Ag元素的成矿地球化学条件也较好,是寻找中温热液型铜银矿的有利地段。
Cr、Ni、Co元素具一定的成矿地球化学条件,局部为寻找热液型多金属镍、钴矿的有利地段。经异常检查,暂未发现矿(化)点。
W、Sn、Bi、Mo元素成矿地球化学条件较差,这与普查区未出露分布有一定规模的中酸性及基性、超基性侵入岩和火山岩有关,其找矿前景不容乐观。
总体来看Pb、Zn、Ag、Cu、W、Sn、Bi、Sb、As、Hg等,普遍出现特高含量, W、Sn、Bi的背景含量不高,但仍出现特高含量。因此,该区元素含量极不均匀。Pb、Zn、Ag、Sb是主要找矿目标。
图1 各元素地球化学图
图2 综合异常与各元素异常图
图3 综合异常与马氏距离异常对比图
Pb、Zn元素的异常区分布在5 249高地一带,异常呈近似椭圆形,异常主要发育在侏罗系龙山组(J2l)和白垩系铁隆滩群(K2T)地层中。
该异常组合为Pb、As、Au、Zn、Ag、Cu、Sb、Co。主成矿元素Pb异常强度高,极大值为6 670×10-6,规模大,矿化强度高,浓度分带清晰,浓集中心突出,元素组合多,套合好。新发现的甜水海铅锌矿就位于该异常中,该矿床的规模初步估算已达中型,进一步的勘查工作正在进行中。
表1 元素背景特征值及异常下限
图2为该区的各单元素异常分类组合图,可以看到CuPbZn、AuAgAsSb两组的组合异常比较集中,与地质综合异常套合较好。WSnMoBi、CrNiCo两组的组合异常在该区异常较弱或者没有异常。
图3为该区经马氏距离处理得到的结果,全区综合异常合图、CuPbZn综合异常、AuAgAsSb综合异常,从图中可以看到这3个异常与地质综合异常套合较好;WSnMoBi综合异常、CrNiCo综合异常,在该区也有低综合异常反映。
用马氏距离提取的综合异常与我们实际勾绘的综合异常相比较,可以看出:
⑴与全部元素参与计算提取的综合异常较为接近。
⑵与主成矿元素组合提取的综合异常相似。
⑶对非主成矿元素组合的弱异常提取的综合异常有夸大的表现。
因此,我们在用马氏距离提取综合异常时,结合地质成矿条件和成因,可以分全部元素和几种元素组合分别提取处理,参考各单元素异常叠加图,略去其小异常对应的综合异常,在此基础上再绘制综合异常图,进行异常评价,可以提高化探综合异常提取的工作效率。由此可见,马氏距离对确定综合异常具有指导意义。
参考文献
[1]谢渝,舒林,司勇.新疆甜水海地区乔尔天山一带找矿潜力浅析.西部探矿工程,2011(11).
[2]杨万志,周军,庄道泽,等.新疆西昆仑_阿尔金成矿带区域地球化学勘查进展[J].西北地质, 2013.46(1):110-118.
[3]任燕,周军,冯长丽等.西昆仑岔路口-甜水海地区铅锌地球化学特征及找矿潜力.新疆地质2013(12).
[4]谢渝,赵同寿,李惠,等.新疆西昆仑甜水海地区1∶5万地球化学普查报告,2013,3.
[5]刘星毅.基于马氏距离和灰色分析的缺失值填充算法计算机应用.2009.29(9).
收稿:2014-07-14
DOI:10.16206/j.cnki.65-1136/tg.2015.02.019