水系沉积物化探元素组合的空间分布及其控制因素分析
——k- means 聚类分析法的应用

2021-05-25 10:04熊前进柴小婷
科学技术创新 2021年11期
关键词:塔格化探矿床

熊前进 柴小婷 万 翔 陈 曦

(1、湖北省地质调查院,湖北 武汉430000 2、中国地质大学(武汉)地质调查研究院,湖北 武汉430000 3、武汉轻工大学,湖北 武汉430000)

水系沉积物地球化学勘查数据不仅在地质背景分析、找矿勘探研究中起着非常重要的作用,而且也能够用于揭示特定地质-地理环境下地表物质演化的过程和机制,因此对地球化学勘查数据处理方法的研究也是勘查地球化学界的研究重点。传统的化探数据处理方法常基于数理统计的原理,不利于反映多元素之间的组合规律以及多元素的空间分布规律。[1-2]

k-means 聚类分析是一种“数据驱动”对样品进行分类的方法,是将数据集按照数据的相似性进行重新组合而成为多个类的过程,属于非监督分类方法。[3]通过对一批研究对象,在其分类情况未知的情况下,按照某种相似性指标或分类准则,自动进行类别的划分,分类结果要求分类综合优化指标达到最大,即类间差异较大而类内离差较小。k-means 聚类分析当类内密集而类间差别大时,分类效果好且分类速度快,[4-6]所划分出的不同类别各有不同的元素组合特征,这些组合特征及其空间分布特征能够反映其成因信息。

传统化探数据处理主要基于数理统计的原理研究单个元素的特征分布,圈定出单元素异常,进而根据元素异常的叠加圈定出组合异常,不利于分析元素的共生组合规律。本文尝试利用K-means 聚类方法对研究区内3620 个水系沉积物化探数据进行聚类,通过研究所划分出的不同类别元素组合特征及空间分布特征,旨在反映其成因信息。

1 地质背景

东天山康古尔塔格——阿其克库都克一带位于塔里木板块与准格尔板块碰撞对接缝合带处,出露的地层有第三、四系,干墩组,白山包组,梧桐窝子组,石炭系企鹅山群、大南湖组等。康古尔塔格深大断裂、阿其库克都可断裂横跨期间。康古尔塔格断裂北侧出露的地层以石炭系企鹅山群、泥盆系大南湖组为主,南侧出露地层则以石炭系梧桐窝子组及干墩组为主。沿康古尔塔格两侧,次级构造非常发育,主要为走向北东东、倾向北北西的压扭性断裂,是该区主要的控岩及控矿构造。[7]

该区岩浆活动强烈,岩石类型齐全,从正常系列的基性到酸性岩均有出露,以华力西期的斜长花岗岩-花岗闪长岩-二长花岗岩系列以及闪长玢岩、斜长花岗岩为主,多以岩株、岩枝或者岩脉状产出,而闪长玢岩及斜长花岗岩尾区内主要容矿岩石[8]。区内各类矿产丰富,矿床成因类型复杂,迄今已经发现的矿种有铜、铜镍、铜银、金、铜金、铁和锰等,如延东-土屋斑岩型铜矿床、元宝山金铜矿床、马头滩金矿床、红岭铜镍矿床、百灵山铁矿床、西凤山金矿床等(图1)。

2 K-means 聚类

2.1 数据预处理

研究区地球化学资料来源是新疆地质矿产勘查局提供的1:20 万地球化学水系沉积物测量数据,包括Ag、As、Au、Bi、Co、Cr、Cu、Hg、Mn、Mo、Ni、P、Pb、Sb、Sn、U、V、W、Zn、Fe2O3等20 种元素,共3620 个数据,数据类型为网格化原始数据(由于研究区水系不发达,采样点间距基本是2km×2km),储存方式为Access格式。

为了保证研究区所有样品信息的完整性,本文选用异值点替换方法处理特异值。具体操作为:低于检出限的数据取检出限的1/2;高于检出最高极限的数据取检出限的125%。为消除各个变量的单位(量纲)互不相同,对数据进行规格化,规格化的计算公式为:

其中Xij为第j 个样品第i 个变量的观测值,X*ij为规格化后的值。

2.2 K-means 聚类分析

研究区(地理坐标为东经90°30′-93°00′,北纬41°40′-42°20′)属于干旱荒漠区,区内共有网格状分布的3620 个化探样品。分析过程为:(1)采用不同的k 值(即预设类别数),用kmeans 方法对样品进行分类;(2)对每种方案,考查分类结果(各类样品的空间分布)并与区域地质矿产图进行对比。如果所得各类别样品点分别相对集中,并与区域地质特征(地层岩石建造和区域构造)较明显表现出分布的一致性,就认为该分类方案是比较优化的方案,能够提供地球化学演化的信息。经多方案试验,发现k=4(所有样品分为4 类)是较优方案,记下各样品点的类编号,利用MAPGIS 中的投影变换,以经度为x 轴,纬度为y轴,类编号为属性,进行投影变换,生成点文件。再利用MAPGIS中的图形处理的输入编辑,插入投影变换后生成的点文件,得到如下分类结果图。(图2)

图1 东天山康古尔塔格——阿其克库都克一带地质图

图2 东天山(康古尔塔格- 阿其克库都克一带)1:20 万水系沉积物分类图

结合研究区的地质构造、地层、矿(床)点等信息,从图2 可以看出,在所分出的4 个类别中,第1 类样品数较多(占37.3%),元素组合较为复杂,以Cu、Ni、Co、Mn、V、Cr、Fe、Zn 为主,空间分布于康哥尔塔格断裂带的南、北部,而中部分布较少,主要覆盖研究内主要铜矿床(点)、铁矿床(点)等,认为该类可能主要反映研究区铜-铁矿化信息,或者是包含背景和噪声在内的一个综合类别。

第2 类样品点数量少,元素组合特征以Au、Ag 为主,空间分布主要集中在研究区中部和西北部,范围覆盖了马头滩、孔雀山、元宝山南、马头山北、大东沟、咸水滩等大部分金矿床(点),说明该类样品的分布可代表金矿化异常区,该类元素组合可能为金矿化探找矿的指示元素组合。

第3 类样品点数量较多,主要元素组合为Pb、Mo、W、Bi,空间分布于研究区的东、西部,而中间分布少,本类样品在西部的分布范围与二叠纪地层建造以及石炭纪-二叠纪花岗岩类侵入体比较一致,指示了这些地质建造对该类元素组合的控制作用,并指示这些元素在表生变化中可能迁移距离很小;在东部主要分布于第三纪和第四纪沉积盆地中,说明在研究区东部可能因地形不同,这些元素表生迁移较远。

第4 类样品点沿近东西向康古尔塔格断裂带分布,并限于该断裂以南, 主要元素组合为Hg、Sb、Sn、U,指示该断裂构造对这些元素分布的控制,同时指示康古尔塔格断裂两侧地质情况的显著差异,与前人关于该断裂带为古生代碰撞带的认识一致[9-11]。

3 因子分析

为进一步挖掘样品分类所反映的信息,以3620 个1:20 万地球化学水系沉积物测量数据为基础数据,对20 种元素做正交旋转因子分析。适用性检验结果KMO 检测值为0.726(大于0.7),Bartlett 的球形度检验sig 值为0(小于0.05),说明因子分析可以应用于本样品数据。采用最大方差正交旋转法进行因子旋转,分成5 类时的旋转平方和的累计方差与初始特征值的累计方差相等,累计方差达67.675%。因此,本文按特征值>1 的标准,选取5 个主因子,结果如表1(因子旋转次数为10 次),如图1。

图3 第一主因子(F1)得分估值图

表1 正交旋转因子载荷矩阵

第一主因子(F1)代表Cu、Ni、Co、Mn、V、Cr、Fe、Zn、P 组合,该因子方差贡献率占31.283%,为主要成矿因子。其中,Cu、Cr、Co、Ni 元素组合主要反映了该区与侵入岩有关的铜、镍矿产,代表性矿床有黄山、黄山东铜镍矿。Cu、Ni、Co、V、Fe 特征元素组合,主要反映了与中基性火山岩有关的铁矿、铁铜矿,代表性矿床有雅满苏铁矿和黑尖山铜铁矿。第二主因子代表(F2)代表Ag、As 组合,主要反映了与该地区金、银矿化有关的元素组合。第三主因子代表(F3)代表Bi、Mo、Pb、W 组合,主要反映该地区与热液活动有关的铅锌多金属矿产元素组合。第四主因子(F4)和第五主因子(F5)的Sn、Hg、Sb、Au、U 组合,主要反映该区域构造断裂带(韧性剪切带)、中酸性火山岩等地质背景特征有关的各类蚀变岩型或热液型金矿。利用最小二乘法意义下的回归分析法,得到主因子得分估值图,可以看出,第一主因子的因子得分高值分布区域(见图3),与第一类样品点的分布区域高度吻合,可以推断第一类的元素组合特征基本与第一主因子相同。其它主因子估值得分图也与对应的元素分类结果图分布特征基本吻合。

4 结论

本文利用k-means 法对东天山地区1:20 万地球化学水系沉积物测量数据进行聚类,当分类数k=4 时,与已发现的矿床分布和因子分析结果的一致性较高。以上初步分析表明,结合地质背景和地理因素,k-means 可用于水系沉积物地球化学元素组合的空间分布规律研究。下一步工作拟在更详细考虑该区地质、矿化和地形因素的基础上,研究荒漠化地区不同元素表生变化的规律性及其控制因素,为研究区域地球化学演化规律提供有用信息,同时也为改进化探找矿效果提供帮助。

猜你喜欢
塔格化探矿床
安徽省滁州市琅琊山铜矿床成矿模式研究
西藏甲玛矿床中高硫化脉的发现与意义
Micro Tug1 小小塔格
青海益克郭勒地区化探异常特征及斑岩型钼矿床找矿潜力分析
趋势面法确定西藏青龙地区银铜铅锌化探异常及应用效果评价
化探异常找矿效果在地质找矿过程中的应用
乱扔东西的塔格叔叔
安徽省宿松县小岗饰面用大理岩矿床特征
通心木
通心木