基于RA GA的PPC模型在化探异常分析中的应用——以凤太矿集区为例

2011-10-19 05:08廖时理张利亚
地质找矿论丛 2011年1期
关键词:化探投影成矿

廖时理,张 均,张利亚,姚 涛

(中国地质大学(武汉)资源学院,武汉 430074)

0 引言

地球化学元素分布规律的研究是揭示元素矿化富集及空间变化规律的重要途径之一,传统的多元分析方法是建立在研究总体服从正态分布的基础上的,然而实际情况中的化探数据大多数并不满足正态假定这一前提,而且当数据的维数较高时,即使数据的样本点很多,散布在高维空间仍然会显得非常稀疏。这种情况下,传统的多元分析方法将会受到局限。投影寻踪聚类方法(PPC)的基本思想是把多维数据投影到低维(1~3维)的子空间上,寻找出能反映高维数据结构或特征的投影,从而能够更加直观地研究和分析高维数据[1]。最近几年来,投影寻踪方法在水利资源、农业、军事等许多领域都有了广泛应用,并取得了较好的效果,但是在地学领域,特别是金属矿产勘查领域的研究应用几乎还处于空白状态,仅少数人进行了一些探索性工作,如肖凡(2008)[2]首次将投影寻踪理论引入矿产勘查领域,并初步探讨了与分形理论结合的可能性。基于此,本文提出采用基于实码加速遗传算法(Real coding based Accelerating Genetic Algorithm,简称 RAGA)[3]的投影寻踪聚类(Projection pursuit cluster,简称PPC)[4]化探数据处理模型的新途径,并进行了实例研究。

1 投影寻踪聚类(PPC)化探数据处理模型

投影寻踪聚类技术的实质是一种降维处理技术,即通过投影寻踪技术将多维分析问题通过最优投影方向转化为一维问题,并利用投影特征值与投影方向向量值进行综合评价。其具体建模过程如下[1,5-9]:

(1)样本评价指标集的归一化处理。

(2)构造投影指标函数Q(a)。投影寻踪就是把p维数据{x(i,j)|j=1,2,…,p}综合成以a={a(1),a(2),a(3),…,a(n)}为投影方向的一维投影值z(i),

式中,x为单位长度向量,然后根据{z(i)|i=1,2,…,n}的一维散布图进行分类。综合投影指标值时,要求投影值{z(i)|i=1,2,…,n}具有如下散布特征:局部投影点尽可能密集,最好凝聚成若干个点团,而在整体上,投影点团之间尽可能散开。因此,投影指标函数可以表达成:

式中,Sz为投影z(i)的标准差,Dz为投影值z(i)的局部密度,即

式中,E(z)为序列{z(i)|i=1,2,…,n}的平均值;R为局部密度的窗口半径,它的选取既不能使它随着n的增大而增加太高,又要使包含在窗口内投影点的平均个数不太少,避免滑动偏差太大,R可以通过实验来决定;r(i,j)表示样本之间的距离,r(i,j)=|z(i)-z(j)|;u(t)为一单位阶跃函数,当t≥0时,其值为1,当t<0时,其函数值为0。

(3)优化投影指标函数。当各指标的样本集给定时,投影指标函数Q(a)只随投影方向a的变化而变化。由于高维空间上的点可以通过不同的投影方向映射到低维子空间上,而不同的投影方向则反映了不同的数据结构特征。其中使投影指标函数达到最大的投影方向即为我们所求的最佳投影方向,它能够最大可能地暴露高维数据的某类特征结构,因此,可以通过求解投影指标函数最大化问题来估计最佳投影方向,即最大化目标函数Max:

约束条件:

这是一个以{a(j)=1,2,…,p}为优化变量的复杂非线性优化问题,用传统的处理方法较难。因此,本方法应用模拟生物优胜劣汰与群体内部染色体信息交换体制的基于实数编码的加速遗传算法(RAGA)来解决高维全局寻优问题。由于文章篇幅在此不做详述,其具体过程参见文献[1]。

(4)分类(优序排列)。把步骤(3)求得的最佳投影方向a代入下式:

由此即可得个样本点的投影值z(i)。将z(i)和z(j)进行比较,二者越接近,表示样本i与j越倾向于分为同一类,若按z(i)值从大到小排序,则可以将样本从优到劣进行排序。

2 区域地质概况

凤太层控金-铅锌多金属成矿区位于秦岭泥盆系多金属成矿带中段。区域构造属于扬子古陆边缘秦岭微板块内北半部的构造断陷沉降带中的一级拉分盆地。

出露的地层主要为泥盆系,中上泥盆统(D2-3)约占总出露面积的85%;其次为石炭系、侏罗系及白垩系[10]。中上泥盆统(D2-3)以酒奠梁—王家院断裂和赵家庄—都督门断裂为界,可划分为3部分:南部泥盆系为一套碳酸盐岩、浅变质细碎屑岩;中部泥盆系为一套细碎屑岩-碳酸盐岩-细碎屑岩夹碳酸盐岩-细碎屑岩;北部泥盆系为一套浅变质的细碎屑岩,是该区的主要含矿层位[11]。其中,古道岭组(D2g)灰岩与星红铺组(D3x)千枚岩的接触面是区内铅锌矿的主要产出层位。

区内的基本构造格架为古岔河—殷家坝大型复式向斜,构造线方向为近 EW向,次级褶皱极为发育,褶皱形态紧闭至倒转,呈线状排列;该复式向斜西被区域性大断裂所截,东被华阳花岗岩侵吞[10]。断裂构造发育,南北两侧均受深大断裂控制;北为凤县—山阳断裂,南部为酒奠梁—狮子坝断裂(向东延伸并入江口—镇安—板岩镇 EW向断裂中)。此外,区内还广泛发育有一系列的次级断裂,主要有NWW向、NNE向、NW向和 NE向等4组[11]。

区内岩浆岩主要有分布在古岔河—殷家坝复向斜东端的狮子岭花岗闪长岩体(图1),出露面积约150 km2,还有若干中酸性小岩体。区内普遍发育花岗斑岩脉和闪长玢岩脉,尤其在河口—八方山—王家楞一带发育较多。岩体分布与区域主体构造线方向一致,明显受区域性深大断裂的控制[12]。此外,矿集区西侧深断裂带及其附近有小型基性-超基性岩体出露,东部北侧有苏家沟超基性岩体出露[10]。

3 处理结果与解释

本文所采用的数据为凤太矿集区东部1∶5万水系沉积物测量数据,每个样品共分析有16个元 素,对数据进行特异值处理后以x+2σ为异常下限,其统计特征如表1所示。

图1 陕西凤县太白地区地质略图(据八方山详查报告,有修改)Fig 1 Geological sketch map of Taibai and Fengxian in Shanxi Province

表1 凤太矿集区东部1︰5万水系沉积物测量主要元素特征统计表Table 1 Statistics of main elements analysis of river sediment samples collected at scale 1︰50000 in eastern Fengtai mineral cluster region

采用PPC模型的建模方法和过程对本批数据进行处理,为取得较理想的效果,在经过大量的试验后确定对凤太矿集区1∶5万水系沉积物化探数据采用的具体参数为,初始种群数400,优秀个体数N=20,密度窗宽R=0.1Sz,交叉率pm=0.8,变异率pc=0.85,加速次数为20次。处理结果如下:

投影方向:a=(0.08617,0.35821,0.02508,0.38521,0.35112,0.36367,0.21673,0.40255,0.16241,0.18104,0.35303,0.23035,0.04984,0.06231,0.08420,0.01975)

投影值:z=(0.25524,0.58012,0.19979,0.37939,0.30957,0.34071,0.25007,0.25514,0.51125,0.33387,0.51142,0.32357,0.28028,0.34686,0.29118,0.34246,0.27859,0.26065,0.29148,0.23728,0.27261,0.34194,0.28005……)

对投影值进行基本的统计分析,采用x+2σ作为异常下限,其特征信息如表2所示。

分别用传统的多元统计方法和 PPC模型投影值做异常图进行对比:

表2 PPC模型投影值 z特征统计表Table 2 Statistics of characteristizvalue of PPC model projection

图2 凤太矿集区Pb,Zn,Au综合异常图Fig.2 Pb,Zn,Au composite anomaly map of Fengtai area

图3 投影值异常图Fig.3 Projection value anomaly map

如图2和图3所示,结合研究区的成矿规律与控矿因素[12,14],常规方法所得到的异常中,Pb,Zn的异常范围较大,而且在针对本区成矿规律而言应该是无远景的地区亦出现了大片的异常;Au的异常区域则显得杂乱无章,与已知矿点的吻合性很差。无论是异常的形态规模还是分布,PPC模型的预测结果与实际的矿床(点)、分布的吻合度都要比综合异常图的结果好,比较而言,PPC模型的分析结果更加突出了一些与成矿有利部位的异常,减少了异常查证面积而没有丢失异常信息。

用基于RAGA的PPC模型对陕西凤太矿集区水系沉积物中16种元素进行分析,根据最佳投影向量a值将它们由大到小排序并作折线图(图4)。

根据折线图的变化趋势并结合实际情况,以0.3和0.1为分界点可将投影元素分为3类:Ⅰ类为As,Hg,Zn和 Pb;Ⅱ类为 Ti,Sb,Co,Mn,Bi,Cu,Au和Ni;Ⅲ类为 Mo,Ag,V和 Cr。Ⅰ类元素的值比较大,可能与本区为喷流沉积型的铅锌矿床有关,Pb,Zn为本区的主要成矿元素,在研究区内明显富集,显示投影方向值对主要成矿元素具有一定的突出作用。另外,研究区内As-Hg-Zn-Pb元素组合具有层控型铅锌矿床的特征[13],由折线图得到的Ⅰ类元素组合则恰好反映了这一特征。Ⅱ类元素包括本区的主要成矿元素Au,Cu及其他一些相伴生的元素,投影向量值在突出主要成矿元素的同时,显示这些伴生元素可能对找矿具有一定的指示作用。Ⅲ类元素的投影向量值较小,显示与矿化的关系不是太明显。

另外,将投影分类的结果与聚类分析的结果(图5)进行对比,两种方法所得到的元素分类结果差异不大,具有相似的元素组合,不同的是投影寻踪模型的结果对研究区的主要成矿元素具有一定的突出作用。

图4 最佳投影方向向量值分布图Fig.4 Distribution of the best projection direction vector

图5 凤太地区元素聚类分析图Fig.5 Diagram showing the element cluster analysis of Fengtai region

4 结论

将PPC模型的投影结果与常规的多元处理方法在异常的识别和元素组合方面进行初步对比,结果表明,该方法具有如下优势:

(1)该模型不仅能识别出异常强度较大的区域,而且能识别异常强度较小的区域,从而便于圈定异常区;并且在同样的条件下,相对于常规的多元统计方法,所得到的结果更稳定。

(2)应用该模型不仅能够将元素之间的相关性进行区分,还能够突出研究区的优势矿种,从而为确定进一步找矿的方向提供依据。

(3)该方法有着较为确定的取值标准,且不需要对数据进行预处理,减少了化探数据处理过程中的主观因素影响,使处理结果更加具有确定性和合理性。

当然,由于该模型才开始应用于金属矿产勘查领域,在实际运用过程中尚存在一些需要进一步探讨和完善的问题,如在交叉率、遗传率等参数的选择上怎样减小人为主观性的权重,如何更有效地构建应用于金属矿产领域的投影指标函数,如何对投影方向值所代表元素的地质意义进行更深入的探讨,如何将该模型与分形技术更好地结合等等。

[1] 付强,赵小勇.投影寻踪模型原理及其应用[M].北京:科学出版社,2006:21-49.

[2] 肖凡.基于 RAGA的PPC模型在个旧化探资料处理中的应用研究[D].武汉:中国地质大学,2008.

[3] 金菊良,杨晓华,丁晶.基于实数编码的加速遗传算法[J].四川大学学报(工程科学版),2000,32(4):1-5.

[4] Friedman J H,Turkey J W.A projection pursuit algorithm for exploratory data analysis[J].IEEE Trans.On Computer,1974,23(9):881-890.

[5] 王顺久.水资源开发利用综合研究[D].成都:四川大学,2003.

[6] 罗玮,肖健华.基于核的投影寻踪方法及其在模式分类中的应用[J].五邑大学学报,2003,17(3):6-8.

[7] 李竞生,姚磊华.含水层参数识别方法[M].北京:地震出版社,2003:66-67.

[8] 张欣莉,丁晶,王顺久.投影寻踪在岩溶水水质分类中的应用[J].工程勘察,2001(5):26-27.

[9] 金菊良,张欣莉,丁晶.评估洪水灾情等级的投影寻踪模型[J].系统工程理论与实践,2002(2):140-144.

[10] 王满祥.陕西省凤县八方山多金属矿床中段地质勘探总结报告[R].西安:西北有色金属地质勘查局,1989:1-170.

[11] 向婷婷,李春兰,刘雁.凤太矿集区金铅锌矿地球化学特征及找矿方向[J].物探与化探,2004,28(3):245.

[12] 于晓琴.陕西凤太矿集区金、多金属矿产分布特征及成矿作用浅析[J].陕西地质,1997,25(1):13-16.

[13] 王瑞廷,王涛,高章鉴,等.凤-太多金属矿集区主要金属矿床成矿系列与找矿方向[J].西北地质,2007,40(2):80.

[14] 隗合明.秦岭凤太矿田层控铅锌矿床的控矿条件及勘查标志[J].陕西地质,1990,8(1):69-75.

猜你喜欢
化探投影成矿
桂西沉积型铝土矿床成矿规律及成矿模式
解变分不等式的一种二次投影算法
新疆寨北山铜矿成矿新认识及找矿预测
柴达木盆地北缘锂多金属矿成矿条件及找矿潜力
西藏热昌金矿地质及物探化探特征
基于最大相关熵的簇稀疏仿射投影算法
找投影
找投影
《物探化探计算技术》2016年1~6期总要目
电感耦合等离子体质谱直接测定化探样品中微量银