张明明,王成宝,秦宇帆,李思洋
(1.合肥工业大学 资源与环境工程学院,安徽 合肥 230009; 2.合肥工业大学 矿床成因与勘查技术研究中心,安徽 合肥 230009;3.合肥工业大学 安徽省矿产资源与矿山环境工程技术研究中心,安徽 合肥 230009; 4.合肥工业大学 空间信息集成与综合分析平台,安徽 合肥 230009)
火成岩或称“岩浆岩”,与沉积岩和变质岩并称三大岩石类型,一般由岩浆或熔岩经冷却和凝固而形成,岩浆一般来自地球地幔或地壳中现存岩石的部分熔融。火成岩广泛存在于各类型的地质环境中,例如地盾、地台、造山带、盆地、大型火成岩区、伸展地壳和大洋地壳等。火成岩的地球化学特征受到岩浆源区的矿物成分、部分熔融时的温度、压力以及挥发组分等物质制约[1]。
大数据思维的特点主要是:对全部数据进行分析,而非只研究随机抽样数据;放弃追求过度精确,而重视数据的复杂度[2]。多元、多维、多源、异构、时空性、相关性、随机性、模糊性、时空不均匀性和过程的非线性是地质大数据的特点[3]。通过露头地质观测、勘查工程、地球物理探测、地球化学探测等方式收集到的地质科学大数据,涉及地球从内到外的各个圈层,涉及地球的物质组成及其变化[4]。
本文研究火成岩主量组分的全球分布异常和岩浆活动之间的关联关系,从大数据的角度对侵入岩玄武岩的伴生模式进行直观展示,对火成岩的主量组分及其地球动力学背景研究具有一定意义。
针对火成岩,目前全球已经积累了海量的岩石地球化学和同位素年龄等数据,并且根据这些数据的构造背景、原岩类型建立了多个相关数据库,影响力较大且可靠性较高的岩石地球化学数据库有以下5个:
海底岩石学数据库(Petrological Database of the Ocean Floor,PetDB)、海洋和大陆岩石地球化学(Geochemistry of Rocks of the Oceans and Continents,GEOROC)数据库、日本深海样品库GANSEKI、变质岩石数据库MetPetDB及北美火山岩和侵入岩数据库(North American Volcanic and Intrusive Rock Database,NAVDAT)。
地质学领域需要建立和规范管理各专业子领域的数据资源,对于地质、矿产、化探等专业的数据整合、数据共享及相互关联的贯通性研究很有必要。如何利用目前国际范围内已有的地球化学大数据资源做进一步的集成与分析,以提取出具有更高价值的地质信息,需要大数据理念的指导和大数据技术的应用。本研究对PetDB、GEOROC、NAVDAT 3个数据库分别进行以关键属性为标准的筛选,得到基础数据集。
PetDB是对全球海底岩石、矿物及包裹体的元素化学数据、同位素数据及矿物学数据进行整合的数据库,数据来源于公共地质活动记录中出现的数据,包括期刊文章、专著、大洋钻探计划(Ocean Drilling Program,ODP)简报、硕士和博士论文等。PetDB将海底火成岩和变质岩的地球化学和岩石学数据进行归档、管理,可在线访问,目的是最大限度地利用这些数据解决最广泛的科学问题[5]。
GEOROC由德国Max Planck化学研究所的Sarbas研究小组负责建设和维护,实时更新数据,开源且提供给科研工作者多种查询方式。其中包含已公开发表的化学同位素数据,以及岩石、矿物熔融、流体和包裹体的泛用型元数据。目前,GEOROC已覆盖了岛弧、海洋岛屿及大型火成岩省的火成岩,如海山、海洋及大陆泛滥玄武岩等主流构造环境的岩石采样记录,综合收集汇总了不同地质背景的分析资料,包括板内洋岛火山岩以及汇聚板块边缘和大火山成岩的火山岩数据。到2012年,该数据库共含有数据条目599 450条,其中全岩数据298 700条,矿物数据277 370条[6]。GEOROC可为岩石地球化学研究提供全方位的大数据支持[7]。
NAVDAT首次将过去30 a产生的大量高质量的火成岩数据集成到北美西部火成岩活动的时空组合模型中,可提供北美西部中生代和较年轻火成岩的年龄、地球化学及同位素数据查询服务,支持对火成岩活动、构造和矿石沉积之间的联系研究,以及全大陆岩浆活动演变模式的研究[8]。
本文对上述3个大型岩石地球化学数据库进行融合,得到融合数据集,对这些含有地质意义的数据进行地质学分析,并与地理信息科学相结合,突破了样本数据数量上的局限,采用全数据或者接近全数据的模式进行研究,可有效弥补目前大多数岩石地球化学数据库在部分区域地质数据精度低的不足[9]。
PetDB、GEOROC、NAVDAT这3个地球化学数据库中的数据组织方式存在细微差别,本文进行数据集融合的方式如下:
(1) 对于数据类型和字段名完全相同的数据表,直接将数据拼接在一起。
(2) 对于表中字段名相同而数据类型(或数据表示方式)不同的字段,将内容统一成同一种格式后再进行拼接;若字段名不一样,则修改属性名之后再进行操作。
由此,将多个内容相同或相近的数据表进行合并,以便于在数据表中查询数据,将数据整合后就可以进行数据筛选。
对火山喷溢而出的熔岩的组分分析结果中,硅酸盐是岩浆的主要成分。其中w(SiO2)在10%~30%之间;Al2O3、Fe2O3、FeO、MgO、CaO、Na2O等的质量分数为20%~60%。因此,火成岩组分按其质量分数高低可以划分为:
(1) 基本组分,如SiO2、Na2O、K2O、Al2O3、MgO、FeO、CaO。
(2) 次要组分,如TiO、P2O5及其他微量组分[10]。
在岩浆成分中占大比例的是基本组分和次要组分,2种组分的种类和质量分数在很大程度上决定了岩浆的结构和性质[11]。
当地壳或地幔岩石发生部分熔融时,由于由SiO2、Na2O、K2O、Al2O3等组分组成的长英质矿物要求的熔融温度较低,它们在岩石部分熔融过程中总是最先被熔出,经部分熔融产生的岩浆在冷凝后再结晶形成的岩石总是比原岩的酸性程度高;同时,由于MgO、FeO、CaO等氧化物含量较高的矿物所要求的熔融温度较高,在岩石发生部分熔融时这些矿物较难被熔出,而经历过熔融作用后残留的岩石总是比原岩的基性程度高。
本文筛选PetDB、GEOROC、NAVDAT 3个数据库中地理位置属性和基本组分属性完整的数据,共获取火山岩数据226 756项。再分别筛选出经纬度属性完整的安山岩、玄武岩数据集,安山岩和玄武岩数据分别为18 994、47 431项。而对于本文关注的属性缺失的数据项,则通过辅助属性取均值的方式获取;若辅助属性也缺失,则删除该数据项。
本文关注的有效属性与辅助属性见表1所列。
表1 参与数据筛选的有效和辅助属性
安山岩是造山带中最普通的一种火山岩,由斜长石和少量石英组成,w(SiO2)为57%~62%;玄武岩由基性岩浆喷发凝结而成,主要成分是硅铝酸钠或硅铝酸钙,w(SiO2)大约为45%~52%,w(Fe2O3)、w(MgO)也较高。在全体数据集的岩石类型可视化分析中,本文筛选出的火山岩数据点分布均匀,以其中数据量占比分别居首位和第2位的安山岩和玄武岩为研究对象,对这2类岩石进行可视化分析,结果表明,安山岩与玄武岩以一种伴生的形式分布,玄武岩富集的地区也会出现不同程度的安山岩富集,如图1所示。
在火山岩的常用分类中,安山岩属于火山岩大类中的中性岩的一种,而玄武岩属于基性岩。安山岩和玄武岩虽然在化学成分上分类不属于同一类岩石,但其构成组分具有亲缘性,安山岩是由伴生的玄武岩岩浆分离结晶形成的[12]。
图1 安山岩与玄武岩全球空间分布
为进一步探究经度变化和组分含量变化之间的相关关系,在相隔30°的纬度区间内,作出横穿全球的剖面。邻域分析方法可通过函数对单元值及其邻域单元值进行处理和统计分析,然后将该值输出到相应单元位置。在邻域分析中,估值范围内的有效岩石样品数可达到最大数量,实现样本域内的局部最大无偏估计,使得样本的实际值具有最小的可能误差[13]。搜索距离是邻域分析中最重要的参数之一,根据投图工具所支持的输入类型,邻域分析工具可分为2类,即基于要素的工具和基于栅格的工具,后者具有累积遍历源与目标之间每个像元的距离成本的特点,因此本文采用后者,即ArcMap 10.2软件中的“栅格工具集”。
本文以南半球和北半球的15°、45°纬度线作为目标要素线,即所谓“剖面线”,创建了在这4条纬度线南北方向上,要素距离为15°纬度范围内的栅格范围。以剖面线为基准,扩展单位为15个纬度单位,全部数据点地理投影如图2所示。
图2 投图数据剖面分析
对投影后的数据点产生的属性字段进行数值合并,利用新产生的属性字段和元素含量字段生成平滑线图。各组分在不同纬度范围内的剖面线数据显示,主量组分SiO2的质量分数集中在个别经度范围上,如图3所示。图3中,横轴经度负值表示西经,正值表示东经。
由图3可知,在120°W~140°W、0°S~30°E、140°E~160°E这3段经度范围内都出现了明显的质量分数增高的现象,特别是在以45°N为剖面线的剖面中。Na2O、K2O、Al2O33个主量组分
图3 各纬度剖面SiO2质量百分数分布
在该剖面上的投图结果也出现了与SiO2类似的情形。主量组分含量的多少,可以在一定程度上直接影响火成岩中矿物成分的变化,尤其是Na2O和SiO2,可通过这2种组分的含量以及SiO2含量的高低划分碱性岩、次碱性岩之间的界限。此外,不同细分类型的火成岩形成于不同的构造环境,主量组分的质量分数数据可用于研究板块构造运动。
纬度剖面上的主量组分投图结果中,在不同经度段上的数值异常,表现出和各大地质板块交界处、活火山聚集处的位置相契合的现象。本文对比了w(SiO2)峰值出现的位置与板块边界的位置,以验证w(SiO2)峰值作为岩浆剧烈活动标志的可行性。
由图3可知,在45°N150°E、15°N15°W、15°N155°W、15°S30°E 4处地理位置上,w(SiO2)都出现了峰值,可分别与以下板块边界地点形成对应:位于45°N150°E的菲律宾板块、太平洋板块、北美洲-欧亚板块三者交界处,15°S30°E处的东非大裂谷,15°S120°E处的澳洲板块和欧亚板块交界处,以及15°S75°W处的南美洲板块和纳兹卡板块交界处等,如图4所示(板块分界线据文献[14])。
图4 w(SiO2)峰值位置与板块交界对应地点分布情形
岩石圈由若干板块组成,这是在固体地球的表层物质被撕裂为多个体量巨大的岩块的产物,它们受下方地幔对流的影响,漂浮在地幔的软流层之上,在不同方向上缓慢地运动,在板块的交界处岩石圈比较破碎,地下岩浆容易在此喷发形成火山[15]。由于岩浆的运动带动了与之相接触的岩石圈的运动,岩浆不断运动的同时带动着岩石圈,岩浆中的各种元素随着岩石圈的变动朝着板块的边界处汇集,在跨度为数百万年的长时间地质作用下,在板块的边界处就汇集大量岩浆组分。投图结果与构成岩浆的主要组分在板块交界处和大裂谷处质量分数发生显著性增高的现象相符合。
本文从3个大的岩石地球化学数据库PetDB、GEOROC、NAVDAT中聚合出所需属性完整的数据集,依据地质时代属性、岩浆的基本组分,筛选出可靠性较高的数据集并进行空间分布规律分析,得到以下结论:
(1) 安山岩与玄武岩以一种伴生的形式分布,玄武岩富集的地区也会出现不同程度的安山岩富集,结合板块边界的分布情况进行分析可知,富集现象主要集中在纳兹卡板块与南美洲板块交界沿线、南亚岛链等地。
(2) 火成岩的主量组分SiO2质量分数出现峰值的位置集中在以45°N为主的剖面,所有主量组分在该剖面上的质量分数值都达到甚至超过了30%;而在120°W~140°W、0°E~30°E、140°E~150°E这3段经度范围上,出现了组分富集现象。组分富集的具体位置可对应以南美洲板块和纳兹卡板块交界沿线为代表的多处板块交界,这些地区曾发生过剧烈岩浆活动。
地球化学大数据分析的意义不仅在于综合利用庞大的地球化学数据和各种地球化学数据类型,更在于对尽可能多的采样点数据进行处理,减小人为因素影响,实现大数据思想和传统地学的有机结合。本文进一步验证了地质全数据研究方式在地球化学数据空间分布研究中的可实践性,对于其在地质学众多分支领域中的应用研究具有借鉴意义。