王刚
辽宁省化工地质勘查院有限责任公司,辽宁 锦州 121007
辽宁东部地区是我国重要的金矿成矿区,发育于元古代辽河群大石桥组和盖县组中的金矿分布十分广泛。凤城市白云金矿是辽河群金矿中最为典型的金矿床之一,自20世纪80年代开始地质勘查工作,已圈定矿石量(333)为1842359t,金属量为2348kg,已成为辽宁省最主要的金矿矿产地之一。
1956年人工智能概念被提出,机器学习是人工智能的核心,而SVM是机器学习领域中的一个重要研究方向[1],它是机器学习中的一项新技术,借助于最优化方法解决机器学习问题的新工具。SVM最初于20世纪90年代由Vapnik提出,在1992年的计算学习理论会议上被介绍进入机器学习领域,之后受到了广泛的关注。近年来在其理论研究和算法实现方面都取得了突破性进展,开始成为克服“维数灾难”和“过学习”等传统困难的有力手段,在20世纪90年代中后期得到了全面深入的发展,现已成为机器学习领域的标准工具,它集成了最大间隔超平面、Mercer核、凸二次规划、稀疏解和松驰变量等多项技术。SVM的理论体系涵盖对象极为广泛,包括对偶表示、特征空间、学习理论、优化理论和算法等,如今SVM的应用十分普遍,主要包括文本分类、图像分类、生物序列分析和生物数据挖掘、手写字符识别等[2]。
本文将SVM理论应用到白云金矿地球化学行为的成矿过程预测中,根据预测结果,指导研究区富矿潜力评价。
研究区大地构造位置属于辽东晚元古代-古生代坳陷带(III-5-7);矿区内出露地层为古元古代辽河群上部层位,即辽河群大石桥组三段和盖县组;区内构造运动形式复杂,韧脆性变形强烈,褶皱构造规模大小不等,多呈紧闭背向斜或倒转、翻卷背向型形式出现。区域变质作用使大石桥组碳酸盐类岩石变质形成大理岩(图1)。
图1 研究区地质图Fig.1 Geological map of the study area
白云金矿的金矿体呈似层状、脉状及扁豆体状赋存于呈东西向展布的硅钾蚀变岩带或层间破碎带中,矿体具分支复合,尖灭再现、平行脉形式产出。矿体总体走向近东西,倾向南,倾角30°~45°,向南西侧伏,侧伏角30°~70°。白云金矿的矿石类型主要有蚀变岩型和石英脉型两类,蚀变岩型矿石主要矿石矿物为褐铁矿、银金矿,脉石矿物为石英、正长石等;矿石的金属矿物(主要为黄铁矿)呈团块状、细脉-网脉状、稠密浸染状或稀疏浸染状分布于脉石矿物中;矿石结构主要有它形粒状、自形-半自形粒状、乳滴状、球粒状、胶状等;构造主要有团块状、浸染状、细脉-细网脉状、条带-条纹状、斑点状和角砾状等。石英脉型矿石矿物主要为石英,石英裂隙中穿插大量浸染状黄铁矿和自然金等;金矿物赋存状态主要以包裹金、间隙金、裂隙金形式分布,可分成不规则粒状、细脉状、树枝状等。
在白云金矿11号矿体的岩心样品中采集13个金矿样品,进行组合样品分析,分析结果见表1。野外采集的新鲜岩心样品由辽宁省化工地质矿山第三实验室分析测试,所有的样品使用鄂式碎石机破碎至-10目,而后使用碳化钨环磨至-150目。样品采用四酸分解,测试仪器是Perkin-Elmer电感耦合等离子仪,进行金、银、铜、铅、锌元素质量分数的测定,测定限均为0.02。
表1 样品分析数据一览表Table 1 List of sample analysis data
SVM的基础是寻找在线性可分条件下的最优分离超平面,以便最大限度地扩大边界(平面和最近点之间的距离),该解决方案有几个重要的统计特性,使其成为有效解决问题的方式方法。最优解的主要统计特性之一是其性能不依赖于分离发生的空间的维数[3],通过这种方式,可以在非常高维的空间中工作,例如由核引起的空间,而无需过度拟合。
首 先 给 定 一 个 样 本 集S={(xi·yi);i=1,...,n,x∈Rd,y∈(+1,-1)},其中,x∈Rd是输入指标,为样本原始数据;y∈(+1,-1)是输出指标,为数据所属的类别;d为维数;i=1,...,n为n个样本点组成的集合,称为训练集。
若超平面方程w·x+b=0达到了最优分类平面的标准(即在分类间隔最大的情况下将样本正确地分开),则求解最优分类平面的问题可以转换为下述目标函数和约束条件:yi(w·xi)+b≥1,i=1,...,n;min1/2‖w‖2。其中:w为权重向量;b为偏置向量。
在许多情况下,一些样本往往不能被正确地分类,为了确保分类的准确性,这里引入了松弛因子ξi≥0,i=1,2,...,n,并引入惩罚因子C,为了寻找最优解,则优化问题可以表示为:
可通过选择适当的惩罚因子,构造并求解对变量w和b的最优化问题[4]。
考虑对偶问题,通过求拉格朗日理论数的极值点得到原始问题的最优解。拉格朗日理论的最初目地是刻画没有不等式约束的最优化问题的解,这个理论的主要概念是拉格朗日乘子和拉格朗日函数。由于直接处理不等式约束是困难的,转变为对偶问题通常比原问题更容易处理。通过引用Lagrange乘子算法,将上述原始问题转化为对偶形式[5]:
式中a为拉格朗日乘子,f(a)为最终需要计算出的决策函数,可通过调节C和a实现算法复杂度与分类精度的平衡[6]。
在以上计算过程中,内积(xi·xj)是二维的,当内积(xi·xj)是多维时,整个计算过程会增加很多计算量。我们引进函数K(xi,xj)=(xi·xj),就可以将求解最优化问题转变为:
这样我们通过选取适当的C和核函数K(xi,xj),得到最优解ai=(a1,...,an)T,进而求得w和b值,最终计算出决策函数的值。
在非线性条件下的分类问题,SVM的基本思想是通过核函数实现从低维向高维的映射,然后在高维特征空间中使用SVM进行线性分类,具体是通过核函数来实现的。常用的核函数K(xi,xj)有径向基核函数(RBF)、多项式核函数及Sigmoid核函数等[7]。对于核函数的选择,样本数据在进行回归估计时都有相应效果最好的核,但在缺少先验知识过程时,多项式核函数无法进行前期的正交化过程,而且该样本数据不满足Sigmoid核函数的半正定条件。RBF主要是通过分析训练样本距原点距离的实值函数[8],故本文选择RBF作为SVM分析的核函数。
根据正定核的等价定义,RBF主要是通过分析训练样本距原点距离的实值函数,数据表达式为:
式中:r为间隔,也是唯一的参数;σ为置信范围[9-10]。
将样本数据以样本集的形式,通过Matlab软件应用SVM算法进行数值模拟,以银、铜、铅、锌元素质量分数作为输入值(自变量),以金元素质量分数(因变量)作为输出值进行拟合实验(图2),探索它们之间的近似解析函数关系和曲线方程,步骤如下:
图2 偏差曲线拟合图Fig.2 Fitting diagram of deviation curve
(1)将预测样本数据转变为样本集的形式,以银、铜、铅、锌元素质量分数作为输入值(自变量x),以金元素质量分数(因变量y)作为输出值。
(2)将样本集代入公式(1),对样本集进行线性、非线性判别。对于C的选取,结合经验,C通常选取为1×104或1×106,也可以更大,经过多次尝试,选取C=1×104,拟合效果更精确。经判别,样本集整体呈非线性关系。
(3)将样本集代入公式(2)、(3),结合C的选取值,当r=1时,拟合效果最佳。由非线性原样本集转变为线性样本集。
(4)将经过核函数转变为线性的样本集代入公式(4),确定决策函数f(a)。
(5)通过已确定的f(a),并以银、铜、铅、锌元素质量分数经SVM计算出金的预测值作为计算值,与原值(金元素质量分数)进行拟合分析(表2)。
表2 数据偏差表Table 2 Data deviation table
由图2可以看出拟合曲线拟合效果很好,整体呈上凹状态。经由表2中13个样品的方差值可以看出,白云金矿11号矿体金元素的计算值与原值方差最大值小于2×10-6,基于银、铜、铅、锌元素质量分数,运用SVM算法计算出的金元素计算值与原值十分接近,说明在金矿研究区内运用银、铜、铅、锌元素质量分数的多少可以推测出金元素的质量分数,指导进一步金矿的找矿工作。
辽河群地层中已勘探出多种矿床,主要包括金、银、铅、锌和砷矿等,其中大石桥组中勘探出金、银、铅、锌矿;盖县组中主要勘探出金矿,也是白云金矿中金元素的主要赋集层,金矿体多为硅化蚀变岩和石英脉形态出露;研究区内断裂的走向多呈近东西向,也控制着金矿体的伸展方向。刘国平等通过石英40Ar/39Ar定年方法,认为白云金矿床为印支期成矿(40Ar/39Ar坪年龄为196~209Ma),石英40Ar/39Ar年龄略小于白云矿区脉岩的侵位年龄,可能与后期的“氩丢失”事件有关[11]。
结合SVM白云金矿地球化学行为预测的分析结果,银、铜、铅、锌元素与金元素在成矿过程中存在着相辅相成的关系,并作为共伴生元素与金矿同时形成。说明金矿形成于单一稳定的环境,后期的构造、变质作用仅改变了矿体的形态;进一步说明白云金矿的形成源于后期构造作用下的岩浆活动[12],金来源于热液岩浆,富矿岩浆热液侵入大石桥组和盖县组中,成因类型为岩浆热液型,在热液蚀变和变质作用下最终呈蚀变岩型和石英脉型金矿发育于大石桥组和盖县组中。
金元素的沉积主要发生在浸染的黄铁矿和其它矿物质中,这些矿物中金元素的丰度取决于矿物的结晶程度、表面形态和颗粒大小,一般来说,金的粒度小、表面粗糙、主矿物结晶性差有利于金的品位达到更高。此外,金的沉淀也受到硫化物表面还原和吸附反应的影响[13],可以想象,矿物在高温下会快速生长,导致结晶性差,颗粒小,表面粗糙,不规则,这种情况下矿物的表面积较大,有利于金的吸附,这就解释了为什么在高温下形成的矿物中往往含金量高。
在岩浆作用下金呈惰性,在各类岩浆岩中金基本上呈分散状态。金的富集成矿主要源于洋壳俯冲作用和构造运动,含矿岩浆侵入上地壳后,由于温度、压力的降低冷凝成矿。在岩浆作用中,相当部分的金元素活化转移至岩浆热液中富集起来,特别是岩浆分异的后期,金的富集程度最高,而后沿着有利的构造适宜部位沉淀成矿。主要分为以下几个阶段:
(1)在洋壳俯冲作用下,含矿热液沿构造裂隙进行充填交代,首先沉淀出早期黄铁矿、镜铁矿、磁铁矿等较高温矿物,同时交代围岩形成绿泥石化、绢云母化、硅化等围岩蚀变。在这阶段也有少量黄铁矿开始沉淀,主要形成围岩的黄铁矿化。
(2)由于含矿岩浆温度的下降,黄铁矿大量沉淀,同时石英继续沉淀,绿泥石化、绢云母化、硅化、黄铁矿化等围岩蚀变作用进一步增强。在这阶段开始有少量自然金的沉淀,主要在黄铁矿中呈包裹物产出。
(3)随着温度的进一步降低,早期形成的矿石和蚀变围岩受构造作用出现破碎和裂隙,矿液继续充填和交代,形成大量方铅矿、闪锌矿、黄铜矿等多金属硫化物的沉淀,同时伴随大量自然金的沉淀,石英和黄铁矿继续沉淀,这一阶段是金矿化成岩的主要时期。表现为金矿多与褐铁矿、方铅矿、闪锌矿、黄铜矿、自然银、黄铁矿和石英等呈共伴生状态产出,验证了SVM白云金矿地球化学行为预测模型中银、铜、铅、锌和金元素具有高度的拟合性。
(4)温度降低到200℃以下时,大部分矿物已沉淀出来,富含碳酸根和钙离子的残余溶液沿着构造作用造成的一些裂隙或孔洞在矿脉或围岩中渗透充填,沉淀出方解石等碳酸盐矿物,并有少量石英晶出。
(5)矿体因构造作用抬升至地表[14],原生矿物遭受氧化分解,形成孔雀石、蓝铜矿、褐铁矿、铜蓝等一系列的表生矿物。
上述金矿成矿规律的5个阶段是结合白云金矿的野外地质特征以及基于SVM白云金矿地球化学行为预测的分析结果(金与银、铜、铅锌元素来源一致或密切相关)总结而得。不是每个相似成因环境下形成的金矿床都经历了以上阶段,由于每个地区的岩浆成分、构造发育条件、围岩变化情况等不同存在一定的差别。
根据SVM白云金矿地球化学行为预测的分析结果,金矿的母岩为岩浆岩,岩浆岩和富含金的矿体的分布状态主要受构造发育影响。在岩浆侵入过程中,处于更高温度、压力及更低粘稠度的富矿岩浆主要发育于构造活动的位置或周边。
白云金矿金的来源为岩浆岩,其中发育多个金矿矿体。由此可见源岩是一个富含金元素的母岩岩体,在构造和围岩蚀变发育的地区,根据银、铜、铅、锌元素分布特征,可推测出构造部位、较近周边和深部存在金矿体的可能性。研究区大面积出露大石桥组和盖县组,未见大规模侵入岩,富金岩石在岩浆侵入过程中受到温度、压力的快速变化,在中地壳和下地壳中存在小规模金矿体的可能性则较小,不乏大规模金矿体的存在。进而可以说明在已发现的金矿床较深部具有良好的富矿潜力,这也是我们进一步找矿工作的重点。
(1)通过对白云金矿中金元素质量分数SVM白云金矿地球化学行为预测的分析结果,确定了银、铜、铅、锌元素在金成矿过程中起到了不可或缺的作用。根据预测模型的分析结果,基于银、铜、铅、锌元素质量分数经SVM计算出金的计算值与原值拟合效果很好,方差小于2×10-6,说明金矿在成矿过程中处于稳定状态,进而说明白云金矿的成矿过程是单一稳定的,并未受到后期变质作用的改造。结合前人的研究成果,说明白云金矿的成因类型为岩浆热液型。利用银、铜、铅、锌元素来做为突破口寻找金矿体的存在有望成为新的找矿突破口。
(2)根据基于SVM白云金矿地球化学行为预测的分析结果,结合白云金矿野外地质特征,进行了白云金矿成矿规律的综合研究,推测在已发现金矿床的较深部具有良好的富矿潜力,为下一步找矿工作提供了相关依据。