李彦伟,罗先熔,黄学强,刘秀娟,邱 伟
(1.广西地质工程中心重点实验室,广西 桂林541004;2.桂林理工大学隐伏矿床预测研究所,广西 桂林541004;3.青海省地质调查院,西宁810012)
因子分析是研究从变量群中提取共性因子的统计技术,最早由英国心理学家C.E.斯皮尔曼提出[1]。因子分析可在许多变量中找出隐藏的具有代表性的因子,将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。它能够从大量的观测资料中,在关系复杂的情况下,寻找影响他们的共同因素与特殊因子,并以原始数据间的相关关系为基础,通过数学方法解释许多彼此间错综复杂的关系,它往往能指示某种地质上的共生组合和成因联系。地质工作中需要大量的数据进行解释,找出其影响它们的共同因素,并以此作为进一步工作的依据,因此,因子分析成为地质领域中应用广泛的一种方法[2]。本文以青海尕大阪铜多金属矿区为例,运用因子分析进行找矿研究。
青海尕大阪铜多金属矿区地处秦祁昆晚加里东造山系祁连造山带北祁连造山亚带,成矿区带属北祁连成矿带走廊南山铜多金属成矿亚带。北祁连造山带呈NWW向,工作区内主要被白垩系紫红色砾岩砂砾岩所覆盖,在东南部有较大面积的第四系冰水堆积砂土砾石层,在西北部有部分第四系冲洪积砂土砾石层(图1)。
在工作区内用地电化学方法采集了180个样品,分析后得到热释汞(Hg)、Con(土壤离子电导率),Cu,Zn,As,Ag,Cd,Sb,Au,Pb,Bi等10余种元素和物理参数的数据。
本文采用SPSS19软件进行数据处理与分析。数据分析之前先进行数据的标准化处理,因为主成分分析在通过相关系数矩阵R(协方差矩阵∑)求主成分时,往往优先顾及方差σ2j较大的变量,即受变量的计量尺度影响较大,有时会得出很不合理的结果。为了客观地说明主成分和因子的内涵,必须将原始变量数据标准化,以消除计量单位和数量级的影响。
图1 尕大阪工作区地质图Fig.1 Geological map of Gardaban area
本文采用Z-score进行数据标准化,公式为:
经过变换后的数据,均值为0,方差为1。
为定量地说明问题,应用SPSS中的聚类方法,先将数据根据元素间的相关性将元素分为3类(图2):第1类为Cu,Zn,Cd,Au,Ag,Pb,是硫化矿床的主要元素;第2类为Con,As,Bi,Sb;第3类为热释汞。从中不难看出,第1类为主要的成矿元素;第2类中的As,Bi,Sb在格尔的施密特分类中为亲铜元素,推测与低温热液相关,Con(土壤离子电导率)是一个表示矿化的重要物理指标;第3类中的Hg则。
聚类分形定性地描述了元素的相关性,为进一步定量说明元素组合问题和矿床成因问题,对SPSS中标准化处理后的数据进行因子分析,结果见表1。
在做因子分析前要对数据进行检验,Kaiser(1974)认为KMO值小于0.6时较不宜进行因子分析。经过检验,KMO值为0.788,适合于因子分析。
图2 SPSS分层聚类图Fig.2 SPSS hierarchical clustering diagram
表1 相关系数矩阵Table 1 The correlation matrix
从表1可以看到,热释汞跟其他元素的相关性都不是很好,甚至出现了负相关。相关系数矩阵从定量方面肯定了上述的分层聚类得到的元素组合结果。
本文采用Promax旋转的因子分析,截取了3个因子,其矩阵如表2所示。
表2 斜交因子模型矩阵Table 2 Oblique factor matix
第一主因子(F1)为 Cu,Zn,As,Ag,Cd,Sb,Au,Pb组合,是主要的成矿因子。各个F1因子上的载荷都很大,应该代表着铜多金属矿床的主要成矿阶段。F1因子可以被称作主成矿因子。
第二主因子(F2)主要由Con,As,Sb,Bi构成,而Con,As,Sb和Bi对于成矿都具有指示作用,都可以作为成矿的指示元素。因此,F2因子可以称作示矿因子。
第三主因子(F3)为热释汞。Hg是远程指示元素,是组成矿头晕的元素,但与其他元素的相关性不是很好,推测是由于断裂的存在和覆盖层较厚所致。
同时可以看到,Cu,Zn,Ag在第一主因子和第二主因子上都有一定的载荷,说明这3种元素所经历的成矿过程比较漫长和复杂。
根据矩阵结果计算出因子得分,然后在GIS系统中,通过用IDW法进行空间插值得到其趋势图(图3)。
从图3可以看出,主成矿因子得分呈NW-SE向的大致趋势(深蓝色、粉红色区域)。其趋势方向与图1中已知矿体的延伸方向大体一致。推测该趋势的形成或由矿脉延伸至工作区内而致。因此,该区域代表着在工作区内最有利的硫化物矿床成矿部位,尤其在工作区NW向的粉红色部位,成矿位置更为有利。
用IDW法空间插值后得到示矿因子得分图(图4)。图4中示矿因子的峰值(红色区域)出现在工作区中部及中部偏上位置。该趋势与得到的成矿因子趋势大体一致,印证了该区域的找矿前景。
图3 成矿因子得分图Fig.3 Diagram showing score of the ore-forming factors
图4 示矿因子得分图Fig.4 Diagram showing scores of ore-indicating factors
因子分析可以将繁杂的地球化学数据简化,从中得到有用的信息;可以找出主要的因子,如成矿因子及非成矿因子,乃至指示元素因子。本文利用因子分析在青海尕大阪矿区成功地找到了该矿区的指示元素。但在因子分析的过程中要注意以下问题:
(1)进行因子分析前,要对分析数据进行检验,检验其是否适合因子分析。检验方法主要有2种,即KMO检验和Bartlett球形检验。一般认为,在KMO检验中,得分大于0.6即可视为适合因子分析。
(2)进行因子分析时,要注意联系地质情况,才能恰当地给各因子定名。
[1]罗先熔,文美兰,欧阳菲,等.勘查地球化学[M].北京:冶金工业出版社,2007.
[2]吴喜之.统计学:从数据到结论[M].北京:中国统计出版社,2006.
[3]郝黎仁,樊元,郝哲欧,等.SPSS实用统计分析[M].北京:中国水利水电出版社,2002.
[4]任云生,刘连登,陈国华.铜陵地区伴生金矿中金的叠加成矿[J].黄金地质,2006,11(27):14-18.
[5]饶东平,曹新志,徐伯骏,等.新疆金窝子矿田岩矿石微量元素因子分析[J].有色金属:矿山部分,2010,62(3):14-18.
[6]姚玉增,巩恩普,梁俊红,等.R型因子分析在处理混杂原生晕样品中的应用:以河北丰宁银矿为例[J].地质与勘探,2005,41(2):51-55.
[7]徐振邦,娄元仁.数学地质基础[M].北京:地质出版社,1994.
[8]董庆吉,陈建平,唐宇.R型因子分析在矿床成矿预测中的应用:以山东黄埠岭金矿为例[J].地质与勘探,2008,44(4):64-68.
[9]吴锡生.化探数据处理方法[M].北京:地质出版社,1992.
[10]刘晓玲,陈建平.R型因子分析在青海省治多杂多地区成矿预测中的应用[J].物探化探计算技术,2010,32(3):332-337.
[11]刘建军,聂俊兵.采用因子分析法计算下庄铀矿田航放初始铀含量[J].铀矿地质,2009,25(6):361-365.
[12]肖克炎.地球化学变量的因子分析选择法[J].物探化探计算技术,1993,15(1):39-43.
[13]张海,何明友,刘应平,等.地质因子分析在寻找成矿地球化学信息及构造推断方面的应用[J].矿物学报,2009,29(增1):579-580.
[14]刘英俊,曹励明.元素地球化学导论[M].北京:地质出版社,1987.