国内外岩浆岩数据库现状与应用前景

2020-01-06 05:03张颖慧焦守涛范润龙王杨刚张建军
高校地质学报 2020年1期
关键词:岩浆岩同位素数据库

张颖慧,王 涛,*,焦守涛,郭 磊,范润龙,王杨刚,张建军

1.自然资源部深地动力学重点实验室,中国地质科学院地质研究所,北京100037;2.北京离子探针中心,北京100037;3.中国地质调查局发展研究中心,北京100037

数据是现代科学最重要的研究资源和成果。随着计算机技术和网络技术的发展,数据存储、处理、统计分析和共享能力日益增强,“大数据”时代已经到来(Lynch,2008)。大数据引发的第二次数据革命改变了传统的科学研究范式,成为继实验归纳、模型推演和仿真模拟之后的第四种科研范式——数据密集型科学(Hey et al.,2009),大数据驱动下的科学研究与知识发现正逐渐成为当今科学领域的新态势(Ahmed,2017;翟明国等,2018;张旗和周永章,2018;周永章等,2018)。与此同时,地球科学也在经历向地球系统科学转变的重大转型。在这样的时代背景下,由国际地质科学联合会(IUGS)组织领导,中国科学家倡议发起的“深时数字地球”(Deep-time Digital Earth,DDE)国际大科学计划应运而生。DDE计划聚焦于过去数十亿年的地球演化历史,以整合全球已有海量数据、共享全球地学知识为使命,力求建立地球系统科学的新理论体系,重建不同历史时期的地球演化,构建全球地质构造与工程地质条件,识别全球资源与能源矿产的宏观分布规律,更加准确地预测地球与人类的未来。

岩浆岩来源于地球深部,能够提供很多地幔和地壳的信息,对地学研究非常重要,承担深时数字深部地球特别是深部过程研究的重任。地质学者可以从岩浆岩的地点、岩石种类、矿物和化学组成、温度压力等推断出地球深部物质组成、深部地质过程、地质构造环境和动力学背景等。岩浆岩分布范围广(占地壳岩石超过三分之二),样品众多,分析、定年相对方便和精确,易于数据累积。近几十年来,日益提高的分析测试水平和不断深入的研究程度,使得岩石数据的数量和质量急剧提高。如何高效地存储、管理、共享这些分布在不同文献、报告、研究机构和专门的数据库中的重要数据,用大数据和人工智能方法加以充分挖掘和利用,是国内外地学工作者共同关心的问题。

本文将介绍国内外已有的岩浆岩相关数据库及其运行情况,为未来DDE计划整合全球海量岩浆岩数据、建设相关数据平台提供经验和基础。同时,列举近年来开展的以岩浆岩大数据驱动的科学研究典型实例,结合DDE的相关任务,探索和展望如何利用岩浆岩大数据进一步解决四维地球深部圈层物质构成、交换与动力学这一关键科学问题。

1 已有岩浆岩相关数据库及运行概况

随着地质学科的不断发展,发表和积累的岩石特别是岩浆岩基础数据(岩石地球化学、年代学、同位素数据等)越来越多。国内外多个国家机构都高度重视这些基础数据,各自建立了国家级或全球规模专业数据库。例如,美国的EarthChem(岩石学、地球化学、年代学)及其先后纳入的PetDB、NAVDAT等几个专业岩石数据库,德国Mainz的Max Planck化学研究所Bärbel Sarbas博士研究小组建立和维护后也连入EarthChem的GEOROC岩石地球化学数据库,加拿大萨省大学Bruce Etlinton开发和维护运营的DateView国际地质年代学和同位素数据库和StratDB岩石地层、构造域和矿床数据库,澳大利亚的EarthBYTE(年代学、地球化学、古地磁、同位素、矿产)综合地学数据库,以及各国地质调查机构的综合数据库,如美国地质调查局的全国岩石地球化学和地质年代学数据库,加拿大自然资源部的GeoGratis(地质图、岩石地球化学、年代学),英国地质调查局的OpenGeoscience(地质图、地球物理、矿产、古生物、岩石薄片照片等)等。

中国对岩浆岩数据库的重视和研究起步并不晚,中科院、中国地质科学院等研究机构和学者也建立(过)一些岩浆岩相关的数据库,但与其他学科例如比较出色仍在不断更新和完善的地层古生物数据库(GBDB)相比,中国的岩浆岩数据库在建立后疏于更新和维护,已难以提供基本的服务,现存的数据库(集)大都比较零散缺乏系统性。

现将介绍如下几个有代表性的岩浆岩相关数据库及其运行情况。

1.1 EarthChem

EarthChem (GeochemicalDatabasesforthe Earth,www.earthchem.org)运行一套数据系统,帮助地球科学家访问、共享和使用地球化学、岩石学和地质年代学数据,旨在建立固体地球的地球化学数据综合管理和信息系统,加强不同数据库间的协作,减少重复工作,共享数据管理经验和管理工具(Walker et al.,2005)。EarthChem成立于2005年,2010年与MGDS(Marine Geoscience Data System,海洋地学数据系统)合作共建IEDA(Integrated Earth Data Applications)综合地球数据应用工程(图1),并得到美国自然科学基金会(NSF)的资助,目前运行于哥伦比亚大学的拉蒙特—多尔蒂地球观测中心。EarthChem系统可确保能够开放和持久的访问有质量控制的数据,并为数据挖掘和数据分析提供高级功能,从而服务于数据生命周期中的各种不同目的。

(1)数据发布和保存

EarthChem Library是地球化学数据集(分析数据,实验数据,综合数据库)和与地球化学领域相关的其他数字资源的开放存取库。ECL为数据保存和访问提供了一整套服务,包括使用数字对象标识符(DOI)进行长期归档和数据注册。

图1 EarthChem和其他相关数据库的组织关系图(摘自余星,2014)Fig.1 Relationship of EarthChem and other relevant databases

Geochron是一个用于管理地质年代学和热年代学研究数据的应用程序。研究人员应首先向Geochron提交地质年代学数据,然后即可在EarthChem Labrary中一键无缝发布数据。目前已有1601件样品的地质年代学数据通过Geochron提交入数据库。

(2)数据挖掘与分析

EarthChem包含的数据库主要有PetDB(海底岩石学数据库)、SedDB(全球海洋和陆地沉积物地球化学数据库)、VentDB(海底热液地球化学数据库),并纳入了NAVDAT(北美火山岩和侵入岩数据库)等。除此之外,EarthChem Portal是地球化学数据的一站式服务,使用户能够同时搜索加入联盟的各个不同来源不同数据体系的数据库中的完整数据,包括PetDB,SedDB,NAVDAT,MetPetDB变质岩石学数据库,USGS美国地质调查局全国地球化学数据库,GEOROC海洋和大陆岩石地球化学数据库,以及DARWIN(Data and Sample Research System for Whole Cruise Information in JAMSTEC,日本海洋研发机构的数据和样品检索系统,合并了GANSEKI,Geochemistry and Archives of ocean floor rocks on Networks for Solid Earth Knowledge Integration,海底岩石地球化学资料网络存档,包括实体样品、对应的分析数据、手标本照片、少量显微薄片照片,旨在实现固体地球知识整合)。EarthChem Portal目前可覆盖的各个数据库样品总量有1054728件,化学值30059718条,具有丰富的搜索,可视化和输出格式选项,可与LEPR数据库和MELTS软件互操作。

(3)样品识别和元数据保存

SESAR是地球样品注册系统,是用于编目和保留样品元数据的样品元数据注册表。SESAR提供各种人工和机器接口与软件工具,用于注册样品元数据,获取样品的唯一标识符(国际地学样品号IGSN),以及搜索样品元数据目录。

EarthChem数据管理者确保研究人员提供的数据或从已发表的文献中提取的数据在分析数据质量(方法,精确度,标准测量),样品描述(岩石类型,结构,年龄,矿物组成,蚀变),样品出处(地理空间坐标,位置地名,构造背景),取样过程(技术,日期,巡航)等方面都得到正确记录。这些数据监管程序确保该系统依然是科研和教育的可靠资源。

EarthChem是目前最为常用和活跃的岩浆岩数据库和数据检索工具之一,成立最初是通过建立统一的网络平台将PetDB、GEOROC和NAVDAT三个主要的数据库连接起来。2005年,在美国国家自然科学基金支撑下,EarthChem开始建立自己的数据管理系统,将部分其他数据库的数据统一存放于自己的数据库中(图1),同时,开始研究数据的可视化及数据分析工具。目前,EarthChem的主要功能包括:数据查询、下载、位置Google Earth导出、在线地图显示,并可对查询结果提供在线的TAS图解和Harker图解可视化分析工具。

1.2 PetDB

PetDB(earthchem.org/petdb)是 the Petrological Database of the Ocean Floor(海底岩石学数据库)的简称,是对全球海底岩石、矿物和包裹体等的元素化学数据、同位素数据和矿物学数据的综合(Lehnert et al.,2000)。样品主要来源于产生于洋中脊,也包括弧后盆地、年轻海山、古老洋壳、地幔捕虏体以及越来越多的陆相火山岩等的海底岩浆岩和少量变质岩,可提供这些样品的主量元素氧化物含量、微量元素丰度、同位素、年龄和矿物模式含量等共计254个参数的数据,并且这些数据都有相应的元数据支持,提供与数据对应的样品、地理位置、岩石结构、分析测试方法、航次站位和参考文献等信息(Lehnert et al.,2000)。数据来源于学术期刊论文、专著、IODP(包括DSDP和ODP)出版物和学位论文等。

PetDB数据库系统于2000年开始投入使用,至今仍保持不断更新:最新更新日期为2020年1月16日,采样站位31958点,样品112735件,全岩数据点1467558条,矿物数据2026500条,火山玻璃数据791652条,熔融包裹体数据279744条,全部独立数据4566014条,参考文献2942条,最早的来源文献为1937年有关印度洋卡尔斯伯格洋脊玄武岩的地球化学数据报道。PetDB拥有强大的数据查询能力,可以支持各种参数、各种条件的独立查询或组合查询,一步一步聚焦到用户需要的样品或数据。常用的查询条件包括经纬度、地理名称、构造环境、样品特征、航次信息、数据可用性、数据库版本、样品编号等。按经纬度查询,可以手动输入选区的经纬坐标,同时可以在地图上拉水平展布的任意多边形框选择查询。按地理名称查询,根据样品所处的位置名称或地理要素类型来设置查询条件,地理名称可以来自不同尺度和地貌单元,如国家、群岛、大洋或海的名称,洋岛、洋盆、大洋高原、海山(链)、扩张中心、火山和裂谷的名称等,可以同时设定多个地名进行综合查询。按所处的构造环境和样品特征分类查询,如在各个克拉通、断裂带、活动带、造山带、蛇绿岩、大火成岩省、火山弧、弧后盆地等的内部或组合查询。如按样品的岩性分类查询,区分超基性、基性、中性、酸性岩浆岩,火山岩和侵入岩,以及岩脉、捕虏体等不同岩性的数据。此外,还可以查询具有指定数据项的数据条目,按航次信息查询,按数据提供者或来源文献信息查询,按样品编号查询,甚至按数据库版本进行查询,查找特定更新阶段内新增的数据,方便在原有的基础上只追加更新的数据,而无需重新下载所有数据。PetDB拥有详细的数据质量控制信息,明确各个数据的分析测试方法,引入了IGSN国际地学样品统一编号,由SESAR统一管理,可通过EarchChem Portal实现与其他数据库的交互查询。

PetDB提供了最全面的海底岩石信息,包括岩石类型、矿物组成、化学成分、同位素特征、岩石分布、年龄信息等等。基于这些数据,全球尺度或区域尺度的岩石地球化学研究成为可能,区域对比、综合研究更加方便。目前已有数百篇的高质量学术论文引用了PetDB,并且还在不断增加(余星,2014)。

1.3 NAVDAT

NAVDAT(NorthAmericanVolcanicandIntrusive Rock Database,www.navdat.org)北美火山和侵入岩石数据库,始于2002年,指导委员会包括堪萨斯大学的J.Douglas Walker,北卡来罗纳大学的Allen F.Glazner,科罗拉多大学的G.Lang Farmer,华盛顿卡内基研究所的Richard W.Carlson,以及墨西哥国立自治大学的Luca Ferrari,管理员是堪萨斯大学的Jason Ash。数据主要来自北美西部中生代以来岩浆岩的年龄、地球化学和同位素数据,该地区长期以来一直是探索岩浆活动、大地构造和成矿之间联系的天然实验室,但所用的一些临时数据库项目结束后就废弃了。因此,NAVDAT旨在为北美西部岩浆岩现有的和新的年龄和地球化学数据提供永久性的公开的数据库。包括样品64985件,地球化学值1103584条,文献1874条。该数据库最新的数据截止于2011年,并于2014年停止维护,所有数据并入EarthChem。但目前原网站的全部功能均可使用,也可以通过EarthChem Portal访问全部数据,其数据仍在被最新的研究所引用。

NAVDAT允许在整个大陆范围内查看岩浆活动的复杂时空分布,并且开发了许多新的可视化工具,包括时空动画和时间动画地球化学图。强大的地图界面允许用户快速在卫星图像上投图样品位置,超链接形式的地球化学投图允许用户快速研究岩浆岩成分的时空分布。同时还开发了一些可在岩石学界广泛推广的工具,包括能够存档元数据(例如分析技术和标准数据)的分析数据输入模板,以及用于轻松可视化样品位置的Google Maps和Google Earth接口。

1.4 GEOROC

GEOROC(Geochemistry of Rocks of the Oceans and Continents, georoc.mpch-mainz.gwdg.de/georoc/)海洋和大陆岩石地球化学数据库是由德国Mainz的Max Planck化学研究所的Bärbel Sarbas博士研究小组负责建设和维护的。最近更新2019年9月1日,包括样品544190件,文献18050篇,分析数据1585790条,单个的数据值22951050个。

GEOROC早期以板内洋岛火山岩以及汇聚板块边缘和大火成岩省的火山岩数据为主,后来扩展到收集发表的各种岩浆岩数据(如火山岩、侵入岩、地幔包体),包括主量、微量元素,放射性和非放射性同位素,全岩、玻璃、矿物和包裹体的年龄分析数据等。元数据包括经纬度、岩石分类和岩性、蚀变程度、分析方法、实验室和参考文献等。支持多种查询检索:按作者文献、地质环境、按地理坐标(经纬度)、按化学元素(包括主量、微量、稀土元素和放射性同位素)含量、按岩石类型查询等多种查询方式。还提供专题预编译数据,即预先按各种不同专题对数据进行整编为csv文件,可供直接下载方便使用。目前GEOROC已接入EarthChem数据体系,可通过EarthChem Portal访问查询全部数据。

1.5 DateView

DataView(thera2.usask.ca:8085)是加拿大萨省大学Bruce Eglinton教授建立和维护的国际地质年代学和同位素数据库,拥有分布在七大洲的超过106,000条记录。同时还有StratDB岩石地层、构造域和矿床数据库,基于IGCP509项目的基础,建立全球地层单元信息和各构造域的变质变形数据库,并与DataView地质年代学数据库相连。该数据库目前为IGCP648项目提供数据库支持。

DateView是一个基于web的数据库,使用标准的开源关系数据库管理系统(Firebird)开发,接口使用Delphi编程语言和Intraweb组件开发。表结构旨在确保参照完整性,即确保印刷错误最小化。图2以半概念的方式说明了数据库的结构。DataView便于用户依据不同的分类比较地质年代学和同位素信息,例如:构造省和地体,不同的地球化学分类,大地构造属性如前构造、同构造、后构造,识别出的边界等。此外用户还可以将上传的数据仅对特定的用户组可见,这样未发表的数据就可以和公开的数据一起安全地存储。该数据库网站具有非常好的查询功能,用户可以按照国家、地质单元、岩性、地质解释(如结晶年龄、变质年龄、冷却年龄、碎屑组成等),年龄区间、同位素体系、分析物质、参考文献和其他用户获取的分类查询数据库。查询结果可以下载和在线分析生成图表,例如可以按不同解释分类和数据分组绘制误差条形图、概率密度图、地图分布、锆石谐和图,同位素比值—年龄图等。同时,网站提供了一些用DataView数据库下载的数据根据其位置和属性制作的动画,在各个大洲地图上随着时间推移显示出岩浆、变质和冷却事件的发生位置。这些动画旨在展示数据库中的数据以便检查数据,同时也有助于可视化不同类型的活动随时间发生的位置。

1.6 各国地质调查机构的岩浆岩相关数据库

图2 DataView数据库结构设计概念图(sil.usask.ca/DV_overview.htm)Fig.2 Schematic design of DataView database(sil.usask.ca/DV_overview.htm)

除了学术机构、研究组和个人建立的以收集公开发表数据为主的专业数据库外,各国地质调查机构在开展地质调查工作的过程中也积攒了大量的岩浆岩相关数据,并且致力于为公众提供公开共享服务,纷纷在各自的综合性数据服务中建立和发布了岩浆岩相关的数据库。以美国地质调查局USGS为例,在包含和继承了其前身:提取于PLUTO数据库的美国岩浆岩地球化学数据库(Geochemistry of igneous rocks in the US extracted from the PLUTO database)的基础上,提供了全国岩石地球化学数据库(National Geochemical Database:Rock),目前共有414304条样品记录,其中岩浆岩地球化学数据约占一半,样品大部分来自美国境内,但也有一少部分遍布全球的样品数据,此外还有全国地质年代学数据库(National Geochronological Database),共有18548条美国境内的样品记录。数据库支持在线地图显示查看所有样品点和分析数据,也可以在Google Earth和GIS软件平台中显示这些数据,数据查询支持简单的按地理区域和岩性关键词查询,也可以下载全部数据为ArcGIS Shapefile格式、DBF数据库格式和文本表格格式到本地。USGS岩石地球化学数据库现也可以通过EarthChem Portal查询和获取全部数据。各国地质调查机构保有大量的岩石地球化学相关数据,例如USGS数据占EarthChem Portal全部可访问数据的三到四成,但通常都只局限在本国及邻区范围内,很多国家的数据还分散在各个省级地质调查局,此外,因其作为公益性服务的一部分,数据库的结构功能和服务设置上专业性和系统性有所欠缺,很多只提供静态的数据集下载,缺乏互联的接口。

1.7 中国岩浆岩相关数据库

中国在20世纪80、90年代就开始开展岩浆岩数据库的建立和国际对接工作(尚如相等,1989;徐伟昌等,1991;陆松年等,1997;尚如相,1999),也出现(过)研究机构和学者建立的一些岩浆岩数据库(王晓蕊,2008;张聪等,2012;钱莉莉等,2015),如中国地质科学院的中国及全球火成岩数据库和中国同位素地质年代基础数据,中科院数据云上的一些岩浆岩地球化学和年代学数据集,地质云上的相关数据库等。

中国及全球火成岩数据库可以在线按照不同的查询条件查询数据,同时该数据库提供了从电子地图上直接查询不同地区的火山岩数据的功能,但该数据库近年来疏于更新和维护,已难以保证提供稳定的在线服务。在中科院数据云上进行相关搜索可以获得中科院广州地球化学研究所建立的地球化学研究数据库、稀土元素地球化学数据库、微量元素地球化学数据库、常量元素地球化学数据库、稳定同位素数据库等一系列专门的地球化学数据库,以及中科院青藏高原研究所建立的如青藏高原局部地区年代学和同位素数据库等,但这些数据库多基于研究项目的需要而建立,较为分散,且为静态的数据集,缺乏系统的集成、持续的更新维护和交互接口。

综上所述,尽管科学家们在岩浆岩数据库建设方面的多年尝试已取得一些重要进展,PetDB和GEOROC一直保持不断更新并形成了较为完善的功能,被科学家广泛使用,各国地质调查机构的数据库也为开展局部研究提供了更为丰富的数据,此外还有了如EarthChem Portal这样覆盖多个优秀数据库的查询工具,但相比海量的且不断产生的分散在研究机构和个人手中的数据孤岛仍只是冰山一角,距离理想中能服务大数据和人工智能时代岩浆岩研究的数据平台仍有很多不足,具体表现为:(1)多是研究组、大学或研究机构建立,缺乏学术组织推荐;(2)更新慢,多个数据库已不再更新,或近期少有更新;(3)专业性强,系统性不够;(4)共享和开放不够;(5)集成和挖掘不够,缺少互联、整合的研究平台。因此,在“深时数字地球”大科学计划的推动下,将在已有工作基础上努力合理解决这些问题,推动专业的岩浆岩数据库进一步发展,建立开放、共享、统一的大数据平台,整合各学科基础数据开展全球协作,为运用大数据分析和人工智能解决关键科学问题,提供坚实的基础。

2 基于岩浆岩大数据的科学研究实例

传统的岩浆岩相关研究当然也离不开数据的支持,但究其研究方法仍依赖以演绎法和归纳法这些以因果关系为基础靠人脑主导的推理来实施的传统方法,是理论驱动模式。而数据驱动模式采用的大数据方法,是新提出来的第三种科学研究的方法,它依靠数据,研究相关关系,在很大程度上改变了人们对世界的认知和理解,许多传统的认识、方法、观点被挑战和颠覆,同时更多新的问题被展示和提出。在岩浆岩领域,数据驱动的研究探索既有揭示深部物质结构与地壳生长,超大陆的聚散、循环及动力学机制,岩浆演化与深部动力学对板块构造的制约等宏大的综合性地球科学问题,也有岩浆岩的自然分布、岩石命名分类和大地构造环境识别这样的学科基础问题研究,下面选择一些研究实例作以介绍。

2.1 岩浆岩大数据揭示超大陆聚散、循环和动力学机制

巨量岩浆发育有着深刻的地球动力学背景。因此,对巨量岩浆发育的重大事件,其时空演化和岩浆成因相关数据的系统总结研究,可以揭示全球尺度、造山带尺度和区域尺度的构造动力学特征和过程。例如,国际火山学与地球内部化学协会(International Association of Volcanology and Chemistry of the Earth’s Interior,简称IAVCEI)成立了大火成岩省委员会,提供不断更新的全球各个时期大火成岩省的清单信息和地理位置图(Ernst and Youbi,2017)下载(www.largeigneousprovinces.org/downloads)。大火成岩省数据的积累及其系统研究,揭示了地幔柱的发育时间和大地构造背景,为了解板块重大裂解、伸展事件提供了基础(Li and Zhong,2009)。全球岩浆岩特别是造山带花岗岩的年代学数据统计揭示,这些重大岩浆事件与超大陆汇聚相一致(如Condie et al.,2017)。近年来,依据岩浆岩及其他有关学科大数据分析,提出了超大陆循环的新认识,即全球超大陆与超级地幔柱每隔~600±100 Ma循环一次(Evans et al.,2016)。这方面的研究正成为新的热点,IGCP648正在开展超大陆旋回和全球地球动力学方面的研究。Li等(2019)最新的研究发现,在全球地幔柱活动和全球海平面变化与超大陆旋回有相似的周期性的同时,全球锆石Hf同位素特征和海水Sr同位素比值的变化呈现出另一类循环趋势,其周期大约是典型超大陆周期长度的两倍,这种1000~1500 Ma的周期趋势也出现在全球尺度的铅锌矿床、造山带和被动边缘年龄分布的数据中,压倒和调节了较弱的600~700 Ma的周期(图3)。同时,基于对过去2000 Ma全球古地理重建的最新进展,提出“外向”和“内向”两种超大陆聚合方式:外向型如Pangea的聚合,前一个超大陆Rodinia由内而外形成新的超大陆Pangea,在此过程中围绕Rodinia的超级大洋被俯冲消减,形成沿着板块构造边缘的火山和地震“火环”(ring of fire),大陆进一步分离直到它们再次在地球“另一侧”相互碰撞,原超级大洋所处的地壳被吞噬并形成了一个新的超级大洋和超大陆;内向型如Rodinia的聚合,前一个环Nuna超级大洋在新超大陆周期中幸存,新超大陆Rodinia是通过上一个超大陆Nuna裂解期间形成的内部海洋的俯冲消减而聚合的,裂解形成的新洋壳又被大陆地壳收回形成超大陆,被视为不完全的分裂。Li等(2019)认为,超大陆的聚散似乎是通过外向和内向两个过程交替进行的。更有趣的是,这两个交替的过程不仅决定了超级大洋是否存活,而且还决定了超级大洋周边的俯冲带“火环”能否存活。如果这个“火环”与超级大洋一起存活,那么地幔结构保持与上一次超大陆相似的模式,如果没有保存,那么地幔结构就会完全重组。研究人员推测,超大陆聚合的这种交替进行模式(以及超级大洋和“火环”的存活或再生),导致地球周期的存在,其长度大约是~600 Ma超大陆周期的两倍,同时也影响了一些地球内部资源的形成。

图3 地球超级循环的记录Fig.3 Records of Earth’s supercycles

利用岩浆岩矿物学和地球化学大数据分析,还可以进一步揭示超大陆聚合特征。例如,Liu等(2017)分析了来自rruff.info/ima的108857条矿物学数据,和通过EarthChem Portal获取的PetDB、NAVDAT、GEOROC、USGS数据库中已知年龄岩浆岩样品的代表性元素如Zr、Nb、Y、Co、Ni的全岩含量数据(包括129161条Zr,105045条Nb,121373条 Y,77835条Co和 82611条Ni)。通过统计学处理呈现和研究发现与Rodinia聚合(~1.3~0.9 Ga)相关的矿物学和地球化学与其他超大陆有着显著的不同(图4):Rodinia超大陆聚合的过程中形成了较多的含Nb、Y矿物和锆石,相应地岩浆岩富集Zr、Nb和Y。相比之下,含有许多其他元素(例如Ni、Co、Au、Se和铂族元素)的矿物含量明显较少,而岩浆岩中的Ni和Co并没有亏损。前者指示了中元古代显著的非弧岩浆作用,后者则与火山弧和造山带的侵蚀增强有关。基性岩和酸性岩的地球化学构造判别图解均显示,Rodinia超大陆聚合中岩浆岩板内地球化学特征占主导地位,而在Nuna和Gondwana中相对表现出更强的弧碰撞地球化学特征。因此认为Rodinia是加厚地壳向外侧双向俯冲汇聚拼贴。

图4 Nuna(蓝色x),Rodinia(红色圆)和Gondwana(灰色-)聚合期间基性(a)和长英质(b)岩石的构造判别图解(每个超大陆的平均值表示为星形,Liu et al.,2017)Fig.4 Tectonic discrimination diagrams for mafic(a)and felsic(b)rocks formed during assemblies of Nuna(blue,x),Rodinia(red filled circle),and Gondwana(gray,-)based on concentrations of immobile trace elements(Average values for each supercontinent are plotted as filled stars,Liu et al.,2017)

基于锆石年代学大数据可以为重建古地理和地球动力学机制提供依据。例如,Dean和Bruce(2018)将Laurentia古大陆西缘和北缘发表的碎屑锆石数据,结合GIS地图的沉积环境信息、古地理建模和岩浆、变质年代学,以更好地了解该区的地壳演化。利用从36份出版物中汇编的超过33000个碎屑锆石U-Th-Pb分析和3000个Lu-Hf分析,从DataView数据库中获取的69000多个岩浆、变质和冷却年龄,以及北美各种全岩样品的初始Nd同位素组成。结合7个地质调查机构的GIS地图中多边形信息的沉积环境,利用古板块重建模型和Gplates或Paleogis软件进行数据挖掘和古地理呈现。该项数据可视化研究展示了使用结构化数据系统处理和汇编大量的地球科学数据的诸多优点,为未来利用多变量和机器学习技术来实现更多的定量评估打下基础。

2.2 岩浆岩大数据揭示板块俯冲样式转变

在漫长的地质历史时期中,地球的板块俯冲样式随着地幔温度的降低发生过重要的转变。在地球的早期,其构造样式以滞留盖型(Stagnant-lid)垂向构造体制为主,此时的板块俯冲作用多呈短暂的、间歇性的俯冲(Episodic subduction)样式。后来,随着地幔温度的逐渐降低,板块俯冲的样式才转变成了现在所看到的持续性的俯冲(Continuous subduction),表现为大洋板块沿汇聚型板块边界持续性地循环至地幔中。Liu等(2019)采用统计学手段处理了通过EarthChem Portal获取的GEOROC、NAVDAT、USGS几个数据库的全球约55000件基性岩浆岩样品的地球化学数据,以全新的方法和视角对这一问题展开了深入研究(图5)。因为板块俯冲会将冷的大洋板块俯冲循环至热的地幔中,那么如果板块俯冲样式在地质历史时期的某一时刻从间歇性俯冲转变为持续性俯冲,其中一个重要结果就是会加速地幔的降温。Liu等(2019)的研究发现,21亿年前地球上开始出现大量碱性玄武岩,而碱性玄武岩的大量出现恰恰是地幔温度快速降低的结果。因此提出,持续性的板块俯冲体制开始于21亿年前。

2.3 同位素数据揭示深部物质结构与地壳生长

图5 Diff(HFSE)随时间的变化指示碱性玄武岩在地质历史中的演化(Liu et al.,2019)Fig.5 EvolutionofalkalibasalticmagmatismthroughoutEarth’s history indicated by Diff(HFSE)(Liu et al.,2019)

科学研究大数据在追求数据绝对数量的同时,有时候更强调数据的重要性。岩浆岩同位素数据尽管远远少于一般的常量元素数据,但是,同位素数据在揭示深部物质来源方面无可取代的意义显示了其数据库的珍贵性与重要性。随着同位素数据的积累,可以开展区域同位素填图,揭示区域性的深部物质组成特征及时空变化,从而为解决地壳生长、大地构造单元划分、深部动力学过程及区域成矿制约等重大科学问题提供新的思路和手段。例如,在中亚造山带通过花岗岩Nd同位素填图,揭示了深部物质组成特征,构建三维物质组成架构,并探索四维岩石圈架构的演化,从而解决地壳生长重大科学问题(王涛和侯增谦,2018)。在青藏高原碰撞带通过Hf同位素填图,揭示了岩石圈物质组成的三维结构和时空演变,为提升区域成矿规律认识提供深部物质制约证据,有助于成矿潜力的定量—半定量评级及区域成矿预测(侯增谦和王涛,2018)。

同位素填图可以用于研究不同类型(增生、碰撞、复合等)造山带深部物质组成特征及其异同(Mole et al.,2013;Hou et al.,2015;Yang et al.,2017;Deng et al.,2018)。同位素填图初步揭示,增生造山带如中亚造山带深部发育很多年轻地壳。例如,阿尔泰Nd同位素填图显示近一半是新生(<1.0 Ga)地壳,大兴安岭及邻区花岗岩类Nd同位素填图显示即新生地壳在60%以上。而对于复合造山带,如秦岭和东昆仑复合造山带Nd-Hf同位素填图确定的年轻地壳(<1.0 Ga)均<10%~20%,而大别碰撞造山带花岗岩Nd同位素显示造山带主要为古老物质。所以,同位素填图可以定量—半定量给出不同类型造山带深部物质组成特征(如年轻地壳与古老地壳比例)的描述。在此基础上,以中亚造山带南部巨量显生宙花岗岩同位素填图为例,通过花岗岩体的同位素信息提取该区深部地壳的组成信息,建立同位素省;据此,圈定深部新、老地壳物质分布范围,依据两者的时空变化,探讨地壳深部新老物质组成结构;依据它们的面积比例估算年轻地壳相对大小及陆壳生长量,从而得出中亚造山带南部年轻地壳(<1.0 Ga)分布面积>50%,大大高于其它显生宙造山带,为估算地壳生长量提供了一个可行思路和有效手段(王涛和侯增谦,2018)。

Mole等(2013)对澳大利亚Yilgarn克拉通的同位素填图显示(图6),其东部Goldfield克拉通由古老(TDM2值为3.0~2.7 Ga,Nd值为-0.2~+3.6)和年轻(模式年龄2.9~2.8 Ga)的块体混合构成,揭示了新生幔源组分向古老地壳的添加和混入在空间上是不均匀的,但添加量最大地带处于超级地体偏西侧,呈近NS向展布,与高MgO科马提岩带空间位置相吻合。Yilgarn克拉通西部由更老的地壳构成,其 TDM2值为 3.3~3.0 Ga,Nd值为-4.0~1.0。具有不同同位素组成的两个超级地体之间的边界与Ida超壳断裂空间位置相吻合,代表了不同的下地壳边界。表明Yilgarn克拉通由两个具有不同地壳组成和发育历史的“次克拉通”构成,其拼合边界位于Ida超壳断裂附近。此外,同位素填图还示踪出在Younami地体东部地区(Machison Domain)一个可能的NE-SW向裂谷,沿其发生新生地幔组分注入。这种不均匀的克拉通架构控制了矿产的分布。

2.4 岩浆岩的自然分布、岩石命名分类和大地构造环境识别

2.4.1 岩浆岩的自然分布和岩石分类命名

图6 澳大利亚Yilgarn克拉通花岗岩Sm-Nd同位素填图(揭示地壳深部物质组成、构造边界及其对成矿制约;Mole et al.,2013)Fig.6 Sm-Nd isotopic mapping of the granitoids from the Yilgarn craton in Australia(showing compositions in deep crast,tectonic aboundary and its constraints on the metallogenic belt;Mole et al.,2013)

岩浆岩分类是岩石学最基本的问题,是岩石学研究的出发点,岩石学的基础。目前在学术界广泛使用的TAS分类命名方案是IUGS在40年前确定的,已成为学术界的共识,为火山岩分类命名的重要方法。对于火山岩,由于矿物颗粒细小,很难识别,许多是玻璃质的,镜下很难确定其成分,需要借助岩石化学分析来加以判断,于是相应的推出了火山岩的TAS分类方案,随后在火山岩分类的基础上又提出了侵入岩的TAS分类。上述分类已经得到各国科学家的信赖,成为学术界一致的认识(Cox et al.,1979;Carmichael et al.,1982;都城秋穗和久城育夫,1984;Wilson,1989;Rollison,1993;邓晋福等,2015)。

最近,张旗等(2019)、葛粲等(2019)和焦守涛等(2019)正在利用数据库的全球数据和大数据方法探讨岩浆岩的自然组合和自然分布问题(图7a),对TAS分类进行了初步研究,文中讨论了TAS分类的初衷、分类的原则及存在的问题,推出了新的TAS分类方案(图7b)。早先的TAS图有15个岩区,新方案将其归并为10个岩区,即正常系列的4个岩区:玄武岩、安山岩、英安岩和流纹岩,建议去掉安山玄武岩和苦橄质玄武岩两个岩区;粗玄岩系列3个岩区:粗玄岩、粗安岩、粗面岩;碱性岩系列3个岩区:碧玄岩、响岩、碱流岩。不同系列之间的界线依数据在TAS图上的自然分布予以划分,正常系列与粗玄岩系列的界线在中酸性岩部分大体上与早先的TAS图的界线吻合,仅玄武岩部分不同于早先的方案。粗玄岩与碱性岩系列的界线则相反,在基性岩部分二者大体与早先的TAS图的界线相当,不同在酸性岩部分,按照数据的分布,很大一块T区划归了碱性岩系列。

图7 全球火山岩三个系列数据的分布和新的火山岩TAS分类图解(张旗等,2019)Fig.7 Distribution of three series of global volcanic rocks and new volcanic rock TAS classification diagram

2.4.2 岩浆岩构造环境判别

岩浆岩的基本理论主要是20世纪20~60年代在全球基性岩研究的成果上建立起来的(Bowen,1928)。在20世纪60~80年代,由于海洋地质学取得的进展及深海钻探项目的实施,特别是板块构造理论的建立和不断完善,使岩浆岩岩石学,尤其是玄武岩理论得到了飞速的发展。基性岩是岩浆岩岩石学中研究得最详细的岩石类型,积累的数据最多,质量最好,为玄武岩构造环境的判别方法和标准奠定了理论基础,继而又推动了岩石大地构造及地球动力学研究的进展。以Pearce为首的一批学者(Pearce and Cann,1973;Glassley,1974; Pearce,1975,1976; Pearce et al.,1977;Pearce and Norry,1979; Wood,1980; Shervais,1982;Mullen,1983;Pearce et al.,1984;Harris et al.,1986; Meschede,1986; Pearce and Peate,1995; Workmana and Hart,2005; Galoyan et al.,2007)致力于玄武岩构造判别图的构建,为板块构造和大陆造山带研究开辟了新的途径,极大地丰富了玄武岩的研究内容,并将玄武岩构造环境研究推向高峰。

但是,到了21世纪初,经过长期的理论与实践的检验,早先的判别图由于数据质量及数量、研究区域、研究思路以及研究手段和分析技术的限制,明显不适应数据大量积累带来的变化,存在一些局限和缺陷。许多学者开始尝试建立新的效果更好的判别图(Vermeesch,2006;Li et al.,2015;王金荣等,2016,2017;杨婧等,2016a,b;第鹏飞等,2017,2018;陈万峰等,2017;刘欣雨等,2017;Jiao et al.,2018)。随着地质大数据的发展,利用GEOROC和PetDB数据库,采用全数据模式,开展全球全体MORB、IAB、OIB数据挖掘的尝试性研究,使得探讨元素之间的相关关系成为可能。张旗和周永章(2017)和Zhang等(2019)得出的玄武岩判别图明显优于早先的判别图(图8),且适用性更加广泛,不排斥蚀变和混染、混合的样品。刘欣雨等(2017)构造了安山岩的构造环境判别图。袁方林等(2019)研究了全球三大构造背景的苦橄岩,提出了苦橄岩构造环境判别图,开创了判别图研究新的一页,之前学术界没有一个公认的苦橄岩构造环境判别图(Wilson,1989;Pearce et al.,2003)。焦守涛等(2018)、章宝月等(2019)采用机器学习方法对全球辉长岩进行研究,发现辉长岩也可以识别构造环境,大大扩展了判别图研究的领域。

3 展望

EarthChem、GEOROC等数据库已经清晰地勾勒出了岩石地球化学的“大数据”趋势,未来,在“深时数字地球”国际大科学计划的引领和推动下,它们将会进一步融合,形成从陆地到海洋、从地表到地下各岩类全覆盖的全球岩石地球化学“大数据”平台,离“数字地球”、“玻璃地球”的目标将更进一步。不同学科和行业的数据积累也都朝着“大数据”方向发展,并且在时间和空间体系内相互关联,至此地球系统科学的框架将逐渐明朗(余星,2014)。在此基础上,以大数据计算机分析和人工智能为手段,总结发现新的规律,进行海量数据的深度挖掘和二次开发,结合国内外研究前沿和研究进展,揭示新的规律和现象,特别是探索未知的地质过程规律和原理,以期解决地球系统科学的重大问题。结合岩浆岩研究的热点难点问题和上述岩浆岩数据驱动的代表性研究探索,未来“深时数字地球”大科学计划岩浆岩领域的关键科学问题拟聚焦于四维地球(深部)圈层物质构成、交换与动力学,重点攻关地球(深部)物质演变规律。具体的研究方向可参考以下几个方面。

3.1 地壳的起源与生长演化规律

大陆地壳的生长与否可以通过研究花岗岩的物质来源方式探讨是否具有新生地幔物质输入地壳、输入多少、过程等进行判断。在区域乃至全球尺度上,应用花岗岩同位素大数据,反演地幔物质输入地壳的多少以及改造地壳的程度,进而综合分析研究大陆地壳的形成和演化过程。通过花岗岩岩性和地球化学大数据的综合研究,可以推算出幔源岩浆的比例,进而对大陆地壳生长情况提供制约。进一步通过花岗岩的形成时间和成因机制的研究,研究大陆地壳的增生和稳定过程。通过大数据分析,探索地球四十多亿年以来,地壳生长演化规律,地壳物质的演变规律。

3.2 地球深部物质组成三维架构与演变

图8 新玄武岩构造环境判别图(Zhang et al.,2019)Fig.8 Discrimination diagrams for tectonic settings of basalts(Zhang et al.,2019)

通过岩浆岩探针与同位素物源示踪进行深部物质探测,是深部探测的重要途径。来自深部、穿越圈层的岩浆岩携带有从地幔到地壳不同圈层深部物质信息,深入、系统研究不同圈层和深度层次起源的岩浆岩及其岩石在区域上的展布,可以揭示地幔-地壳源区物质的性质、相互作用及其演化,重塑壳幔三维甚至四维物质结构。对于整个地球系统尺度、造山带尺度及区域尺度的深部物质结构与演变问题,则需要分析海量深部信息数据的时空变化规律。在大数据和人工智能的驱动下,研究全岩元素Sr、Nd、Pb及锆石Hf、O等各种同位素,以及Mg、Fe、Ti、Zn等新兴同位素示踪结果的关联性及其影响因素,辅以大数据时空化即填图的手段,探索深部物质性质、时空分布、三维架构、岩石圈热-化学组分及其演变过程。

岩石圈尺度的深部地质过程控制着大型成矿系统的形成发育和空间分布。应用岩浆岩数据库进行成矿相关的大数据研究,在区域尺度上,揭示造山带大陆生长架构与成矿系统发育机制;在矿区尺度上,探索不同成矿系统与岩石学指示标志的相关性,例如岩浆岩Eu/Eu*、(Ce/Nd)/Y等参数变化。基于大数据探讨哪些矿床受哪些条件的控制,各条件对这些矿床的控制程度如何?哪些区域与哪些已知矿床相似,相似程度如何?从大数据的角度重新认识全球大陆格架及矿产分布规律,由此开创出一条矿床学研究的新路径,应用大数据和人工智能方法定量、精确地研究矿床与控矿因素的关系,大幅提高成矿预测的准确程度(王怀涛等,2018;罗建民和张旗,2019)。

3.3 岩浆演化、超大陆聚散及深部动力学

通过岩石大数据分析,如巨型岩浆岩带的年代学、物质组成特征等方面的大数据综合研究,并与大地构造研究更紧密结合,可以为探索大陆地壳深部结构、生长演化、汇聚与裂解、地壳增厚减薄等地球动力学方面提供新的岩石学证据。例如,应用岩浆岩大数据随时间的切片,通过岩性、地球化学、同位素特征随时间的变化,反映大陆聚合过程,从而恢复不同时期的古地理面貌。另外,通过岩浆岩数据集成分析,揭示巨量岩浆时空演化和穿越圈层的物质交换作用,进一步分析超大陆聚散规律,特别是超大陆循环的规律,深入探索地球深部动力学过程。

3.4 岩浆岩分类与构造环境

早在20世纪60、70年代,最初的岩浆岩数据库建立很大程度上是由于岩石分类命名的需要,并且在当时岩浆岩特别是火山岩的分类命名中发挥了重要作用(李兆鼎,1984;尚如相,1999)。随后,岩浆岩判别图是板块构造兴起后一个重要的科学发现,依据大洋中脊、岛弧、洋岛三类构造背景明显不同的玄武岩的源区组成,从岩浆岩理论的深度出发,结合典型地区的研究实例,提出了许多玄武岩构造环境判别图(Pearce and Cann,1973; Glassley,1974; Pearce,1975,1976,1982,1983,2003;Pearce et al.,1977;Pearce and Norry,1979)。然而,随着数据量的累积和研究的深入,传统的岩石分类命名方案和判别图理论方法由于数据质量及数量、研究区域、研究思路以及研究手段和分析技术的限制,存在一些局限和缺陷。近年来,大数据的到来辅以人工智能方法,可方便挖掘多种元素,元素之间的关系(如比值等)乃至矿物的成分等大量的变量与成因环境的相关关系,许多新的分类方案和构造环境判别图被提出(Vermeesch,2006;Li et al.,2015;王金荣等,2016,2017;杨婧等,2016a,b;第鹏飞等,2017,2018;陈万峰等,2017;刘欣雨等,2017;张旗和周永章,2017;Jiao et al.,2018)。研究发现不同构造环境的样品,包括初始岩浆以及经过演化的岩浆及其堆晶岩、矿物,均不同程度保留了原构造环境的基因信息(焦守涛等,2018;韩帅等,2018;杜雪亮等,2018;李玉琼等,2018),查明上述环境不同的基因信息,即可判别不同的构造环境。通过地质大数据的研究是有意义的,但是,对岩浆岩分类和判别图的理论、方法,仍需进行深入的研究。未来,在“深时数字地球”大科学计划的推动下,更多的数据积累和更深入的分析挖掘将会展示出令人期待的结果。同时,对这些结果揭示出的新问题开展深入研究,也将推进岩浆岩理论研究的进步,促进岩石大地构造学、岩石地球化学及板块构造理论的发展。

此外,随着研究的不断开展,岩浆岩大数据驱动的人工智能研究更让人期待的是,一定还会揭示出许多之前从没有见过提到过的新问题,其中有些是早先的研究没有涉及的、值得进一步探索的科学问题。

4 结论

通过调研发现目前岩浆岩方面已存在PetDB、GEOROC、DataView、美国地质调查局岩石地球化学数据库等一批优秀的岩浆岩相关数据库;同时,像EarthChem这样理念架构完整先进的综合数据管理平台在此基础上发展起来,开发出了EarthChem Portal这样跨多个主流数据库的在线查询和简单可视化分析工具,正在推动岩浆岩相关的科学研究。

依托这些岩浆岩数据库,许多学者开展了数据驱动的针对关键科学问题的研究探索,如:大数据揭示超大陆聚散、循环和动力学机制,岩浆岩大数据揭示板块俯冲样式转变,同位素数据揭示深部物质结构与地壳生长,大数据和人工智能探索岩浆岩的自然分布、岩石命名分类和大地构造环境识别等。

随着大数据和人工智能时代的飞速发展,岩浆岩相关数据库面临新的挑战,亟须在现有基础上进一步发展、融合,建立开放、共享、统一的大数据平台,整合各学科基础数据开展全球协作,这也是“深时数字地球”计划提出的背景和目标。未来,在海量数据和全球协作平台的支持下,以大数据计算机分析和人工智能为手段,进行深度挖掘和二次开发,结合国内外研究前沿和进展,揭示新的规律和现象,特别是探索未知的地质过程规律和原理,以期解决地球系统科学的重大问题。在岩浆岩领域,我们建议聚焦于四维地球(深部)圈层物质构成、交换与动力学,重点攻关地球(深部)物质演变规律。研究方向包括地壳的起源与生长演化规律,地球深部物质组成三维架构与演变,岩浆演化、超大陆聚散及深部动力学,岩浆岩分类与构造环境等。

致谢:感谢DDE专辑特邀主编樊隽轩教授和史宇坤副教授对本文的支持和建议。感谢两位匿名审稿人的仔细修改和建设性意见。

猜你喜欢
岩浆岩同位素数据库
八采区岩浆岩研究分析
《同位素》变更为双月刊暨创刊30周年征文通知
印尼南苏拉威西省桑加卢比铜多金属矿地质成矿条件分析
永胜煤矿综合机械化回采天然焦探讨
数据库
数据库
数据库
数据库
毛登矿区锡铜矿成因分析
《同位素》(季刊)2015年征订通知