王涛 童英 丁毅 郭磊 黄河1, 范润龙 王朝阳 张颖慧 曹光跃 张建军
21世纪是大数据的时代(Lynch, 2008),大数据引发的第二次科学革命改变了传统的科学研究范式,“数据+模型”驱动下的科学研究新范式与知识发现正逐渐成为当今科学领域新的发展趋势(Ahmed, 2017;翟明国等,2018;Wangetal., 2021)。同时,地球科学也在经历向地球系统科学转变的重大转型,需要不同学科以数据为纽带的深入融合。在此背景下,中国科学家率先提出“深时数字地球”(Deep-time Digital Earth,简称DDE) 国际大科学计划,并由十几个国际组织与机构共同发起和参与,经国际地球科学联合会(IUGS)执委会投票通过,正式成为IUGS第一项认可的国际大科学计划,并已于2019年2月在北京正式启动。DDE将聚焦于地球过去数十亿年的深时演化历史,通过整合百年人类工业革命所积累的海量地学数据,在大数据驱动下重建地球生命、地理、物质和气候的演化,识别全球矿产资源与能源的宏观分布规律,更有效地防止和控制可能突发的灾害对人类所造成的损害。这一计划将面向全球数百万研究人员和科技专业用户,为其提供一个跨越学科领域和国界的虚拟科研环境,使其能够存储、共享和复用科研数据(Wangetal., 2021)。
地球科学基础学科数据库的建设是该大科学计划的核心内容和重要支柱。岩石(岩浆岩)是研究地球物质,特别是深部物质的基础学科。岩浆岩来源于地球深部,提供了深部物质与动力学信息,承担着深时数字“深部”地球研究的重任(Deep-time Digital Deep Earth, DDDE)。DDE-岩石(岩浆岩)工作组,即DDE-OnePetrology是首批启动(2019年)的6个DDE学科工作组之一,负责构建岩浆岩数据库,并探索构建科学研究平台和服务应用体系,搭建全球岩石学与其他学科专家合作交流的平台,开展相关科学研究,推动地球科学(岩浆岩)在大数据时代的创新发展,探索古板块格局重建、大陆聚散过程,地壳生长、地球深部物质组成与演化等重大地球科学问题。目前初步构建了数据库结构框架,入库了一批数据并公开上线,尝试开展应用研究。
本文将以岩浆岩知识体系为基础,以数据(数)+编图(图)+研究(文)三位一体的建库思路,简要介绍数据库的基本结构、功能及初步应用情况,展望未来的应用前景。该研究工作在推动数据驱动的岩浆岩研究方面将起到促进作用。期待更多地质学科工作者关注、参与、使用该数据库,并提出修改完善建议。
随着地质学科特别是测试技术的不断发展,岩石(岩浆岩)测试数据(相关的岩石学、地球化学、年代学、同位素等数据等)呈爆发式增长。国内外多个国家机构都高度重视这些基础数据,各自建立了国家级或全球规模的数据库,包括一些专业的岩石数据库(张颖慧等,2020)。例如,美国的EarthChem数据库(岩石学、地球化学、年代学),其先后纳入了PetDB、NAVDAT等专业岩石数据库;德国Mainz大学的Max Planck化学研究所建立的GEOROC岩石地球化学数据库;加拿大自然资源部建立的GeoGratis数据库(地质图、岩石地球化学、年代学、文章);英国地质调查局建立的OpenGeoscience数据库(地质图、地球物理、矿产、古生物、岩石薄片照片等);澳大利亚建立的Earth BYTE数据库(年代学、地球化学、古地磁、同位素、矿产等)。部分科学家也建立了一些地区性的数据库,并取得了很好的研究成果(Chapman and Kapp, 2017;Vlasceanuetal., 2021)。国内中国科学院、中国地质科学院等研究机构和学者也建立(过)一些岩浆岩相关的数据库,但目前除不断更新和完善的地质生物多样性数据库(GBDB)之外,其他一些学科的数据库都已基本停止更新和运行。
目前,国际上与岩石学、地球化学有关的、运行最好的是EarthChem和GEOROC数据库,下面对其进行简单介绍。
EarthChem(Geochemical Databases for the Earth,www.earthchem.org)数据库是目前最常用和最活跃的岩浆岩数据库和数据检索源。其成立最初是通过建立统一的网络平台将PetDB、GEOROC和NAVDAT三个主要的数据库连接起来。2005年,EarthChem数据库开始建立自己的数据管理系统,将部分其他数据库的数据统一存放于自己的数据库中;同时,开始研究数据的可视化及数据分析工具。目前,EarthChem数据库的主要功能包括:数据查询、下载、位置Google Earth导出、在线地图显示,并可对查询结果提供在线的TAS图解和Harker图解可视化分析工具。
EarthChem数据库运行一套数据系统,帮助地球科学家访问、共享和使用地球化学、岩石学和地质年代学数据,建立了固体地球的地球化学数据综合管理和信息系统,加强不同数据库间的协作,共享数据管理经验和管理工具(Walkeretal., 2005)。EarthChem数据库系统可确保提供开放和持久的数据,并为数据挖掘和数据分析提供高级功能,从而服务于不同的科学研究,产生了很好的效果,很多高质量文章都引用了该数据库的数据。
GEOROC(Geochemistry of Rocks of the Oceans and Continents)数据库是大陆和海洋岩石地球化学数据库,由德国Max Planck化学研究所的Bärbel Sarbas博士研究小组负责建设和维护。GEOROC包括板内洋岛火山岩以及汇聚板块边缘和大火成岩省的火山岩数据, 2023年6月1日更新后数据库共包括样品 640100件,文献 21370 篇,分析数据2402280条,单个的数据值35116090个。GEOROC可支持按作者文献、地质环境、地理坐标(经纬度)、化学元素(包括主量、微量、稀土元素和放射性同位素)含量、岩石类型等多种查询方式。GEOROC的特色服务在于预先按各种不同专题对数据进行了整编,形成csv文件,可供直接下载,方便使用。目前,GEOROC已经链接到EarthChem数据库中。
除上述2个数据库之外,国内外还有一些其他有关的数据库。例如,美国地质调查局(USGS)数据库中含有岩浆岩地球化学数据库(包括National Geochemical Database: Rock),其目前共有414304条样品记录,其中岩浆岩地球化学数据约占1/2。中国在二十世纪八、九十年代就开始了岩浆岩数据库建设(尚如相等,1989;徐伟昌等,1991;陆松年等,1997;尚如相,1999),也出现过研究机构和学者建立的一些岩浆岩数据库(王晓蕊,2008;张聪等,2012;钱莉莉等,2015),例如,中国地质科学院初步构建了中国及全球火成岩数据库和中国同位素地质年代基础数据、中国地质调查局“地质云”上的相关数据库和中国科学院数据云上的一些岩浆岩地球化学和年代学数据集(包括中国科学院广州地球化学研究所、青藏高原研究所等)等。但这些数据库较分散,且为静态的数据集,缺乏系统的集成、持续的更新维护和交互接口,难以保证提供稳定的在线服务。有关数据库的详细情况见张颖慧等(2020)。近年来,中国科学院也开始设立了公益学术平台。该平台首期集成了中国科学院的科技成果资源、科技出版资源和学术交流资源,目前通过平台可检索的科技文献资料约1.7亿篇。
从国内外岩石地球化学相关数据库的现状来看,目前还存在一些主要问题:(1)多个数据库已不再更新,或近期少有更新,几乎为停止状态;(2)专业性不强,系统性不够,不少同位素数据仅仅是原始数据的汇总,信息不全,没有依据有关信息给出真正实用的参数;(3)共享和开放不够;(4)缺少数据互联、整合的平台(多用户协同的数字化科研平台);(5)缺乏研究平台,特别是缺少数据库+数字编图+综合研究一体化的科研平台,难以开展数据挖掘和深入集成分析。
因此,在“深时数字地球”国际大科学计划的推动下,建立开放、共享、统一的岩浆岩数据库及研究平台,整合各学科基础数据开展全球协作,运用大数据分析和人工智能解决关键科学问题,极为必要。
目前,DDE-岩浆岩数据库初步构建了数据库框架,入库了一批数据。
构建数据库首先需要数据,高质量的数据是构建数据库的基石。DDE-岩浆岩数据库,数据主要来源有4种:(1)公开发表的文献;(2)本项目组研究团队获得的测试数据;(3)实验室测试共享数据;(4)一些国际组织(如大洋钻探计划)提供的数据和已有数据库的数据,特别是“长尾”数据。此外,还设置有志愿者贡献数据平台,贡献者可以提供数据。
2.1.1 文献数据
公开发表的文献数据是目前DDE-岩浆岩数据库的主要数据来源,其数据质量有保证,便于核查。数据获取方式主要是人工与AI相结合。首先,利用所在单位购买的出版商数据库及DDE平台上的Deep Scholar收集岩浆岩文献及其相关信息。然后,采用Deep Shovel和自主开发的Pdf表格数据提取软件,从文献表格和文字中获取数据,并应用DDE信息化团队和本团队开发的软件工具,进行数据及表格融合处理。借用信息化技术,搜集、整理、补全、校对和入库有关数据。
本数据库关键的数据都提供相应的经纬度,但大量的年代学、地球化学数据并没有经纬度信息,需要到文章中去查找,或者从图件中读取。目前采用的是项目组开发的地质图经纬度自动读取软件,且已经集成到Knowledgefusion中,正在进行标注,通过机器学习后可以自动获取经纬度。后期将利用DDE平台地理信息相互校正,也期望原始文献作者能提供精确的信息。
未来,对一些非结构化数据,将采用Human-AI Collaboration 框架,并实现在线支持。基于“人在回路”思想,利用已有文献和上海交通大学建立的文献库,采用自然语言处理(NLP)与计算机视觉技术,依据知识体系和知识图谱,自动识别、抽提多模态地球科学文档中与岩浆知识节点相关的图片、表格和描述文字,并对提取后信息结构化数据进行补齐。
2.1.2 团队实测数据
岩浆岩数据库项目组参与团队包括国内有关高校和研究机构的众多专家和研究团队。该团队长期从事岩浆岩方面的研究,有长期的积累和持续不断的新研究,产出了很多新的数据,除部分已发表数据外,存量数据及时入库,成为主要的新数据来源。此外,还有一些国外合作团队,他们的新数据也会及时入库。
2.1.3 实验室测试数据
在送样人员自愿的前提下,实验室测试数据将动态自动入库,实现了将实验室产生的测试数据和样品背景信息快速、准确地更新到特定数据库的功能,从源头保证了实验测试数据的完整性和权威性,避免了后续研究人员耗费大量时间精力搜集数据的工作;同时也提高了实验测试数据的利用率,加快了岩浆岩数据库的更新工作。
2.1.4 有关零散数据(库)
经过调研,发现网络上存在很多散落在各个领域和角落的数据。一类数据是存储于一些数据库中,而这些数据库已经长期未更新,也鲜为人知和使用;另一类是一些个人网站上储存的数据,这些数据长期被人忽视,未能发挥作用,成为“长尾”数据。
本数据库借用DDE Geoscience DataExpo,开展全球数据巡航,明确了一些长尾数据。这些数据经过整理入库,并注明了数据来源,以便更多人引用与标注。
此外,大洋钻探国际组织向DDE提供了IODP的原始文本等资料。本次花费大量人力,阅读报告等文献和钻探测试数据材料,摘录出岩浆岩方面的数据,并通过重新标定位置,给每个航次和钻孔赋予了经纬度信息。目前,从这些材料中,补充完善了航次、钻探中的1000条数据。
2.1.5 志愿者贡献数据
本数据库设置有志愿者贡献数据的途径。有2种途径贡献数据:一是,志愿者在设置的数据“收发室”,录入数据。数据管理人员进行核验后,合格数据录入相应的数据库。数据库收发室将自动标注数据来源和贡献者信息,记录贡献的数据量,并给予积分,数据库将给予不同类型的奖励(包括物质奖励);二是,使用者将自己的数据,入库到研究平台,形成个性化专题库;同时调用数据库有关数据,在平台上分析处理。其结果包括从数据库调用的数据都可以申请下载;同时,在使用者授权公开、共享这些数据时,数据将进入总库,以此实现数据库数据量滚雪球式的增长。用户越多,数据越多。
目前,初步构建的DDE-岩浆岩数据库数据类型主要包括:(1)岩浆岩岩石(样品)基本属性,包括类型、产状、构造、空间信息(经纬度、地理位置)、地质背景等;(2)测试数据,例如锆石U-Pb年代学、元素地球化学、全岩Rb-Sr-Sm-Nd-Pb-Hf-Li同位素、非传统同位素、矿物Hf-O-U-Th-He、低温热年代学等。数据量约30万多条,涉及全球重要造山带、克拉通以及部分海洋(大洋钻探样品岩浆岩数据)等。今后,还将不断补充完善数据类型和数据量。
此外,为了发挥各地区、各领域专家的作用和优势,依据已有的工作基础,已设立了22个专题数据库。包括两大类:一类是地域性的,如阿巴拉契亚、阿拉伯地盾、中亚(北疆)、特提斯(青藏高原)、华北克拉通、华南等;另一类是学科领域性,如非传统同位素、火山岩(中国)、蛇绿岩、碱性岩、岩浆岩锆石微量、岩浆捕获锆石、实验模拟、岩浆岩低温热年代学、大洋(钻探)岩浆岩、实验测试、锆石微量元素、同位素、岩浆有关关键金属矿产。
本数据库建设基于岩浆岩知识体系,以样品为核心,应用“数-图-文”三位一体的科研理念,采用“云+端”的模式进行构建。
(1)建立岩浆岩知识体系。知识体系可以理解为有上下逻辑(归属)关系的岩浆岩地质科学大词典。建立的岩浆岩知识体系由2600多个节点(岩浆岩词汇)构成,涵盖了绝大多数岩浆岩术语,特别是岩石类型的术语。岩石类型的分类采用了国际地球科学联合会推荐的分类系统,并参考了最新的教科书,补充了新的术语。
(2)基于知识体系及其岩石分类,以样品为核心,设计数据库结构。岩浆岩大量的数据基本都是岩石学(样品)描述和样品的测试数据。因此,数据库建设以样品为核心,便于以此为依据查询数据,应用数据。
(3)构建数字化编图平台和科学研究平台。DDE-岩浆岩数据库的建设目标,除为使用者提供数据服务外,最重要的目的是进行科学研究。因此,本数据库构建了研究平台,并突出岩浆岩时空演化的研究特点,构建了数字化编图平台,形成“数-图-文”三位一体的数据库与研究平台,即增加基于数据的数字化编图和数据分析研究的平台。这是本数据库的特点,也是有别于目前的GEOROC、EarthChem等数据库之处。
图1 岩浆岩数据库主页页面(https://petrology.deep-time.org/)Fig.1 Web of the DDE-OnePetrology database(https://petrology.deep-time.org/)
数据库网站(https://petrology.deep-time.org/)也充分体现了“数-图-文”三位一体的特色和设计思路(图1)。除数据库一般的基本要素外(如介绍、数据、图件和出版物等栏目),在主页左侧栏,展示主要数据类型,包括主库及22个专题数据库。在右侧栏,提供各类岩浆岩图件,包括数字化的亚洲岩浆岩图、全球岩浆岩图等一系列图件。在下方,提供各类软件,包括桌面研究平台系统。中间展示的是数据点及基于时代的岩浆岩分布图。此外,还提供二次开发接口,面向国内外涉及岩浆岩的数据库,实现和各类已有数据库的相互调用,进行跨库检索和数据共享,实现岩浆岩数据的增长、融合与应用。
数据库利用“云+端”的混合云模式搭建,充分利用“开源软件+自研”构建了具有自主知识产权的岩浆岩数据库系统(DDE-OnePetrology)。以样品为核心,设置了172多个字段,给出其关联属性(图2)。本数据库结构构建创新之处是,采用“Arangodb+PostGIS+DSpace”技术构建,科研人员可依据需求,自行设计数据结构,即增加栏目,不影响已有结构与数据,从而降低学科专家建库的门槛。利用桌面端软件,学科专家可以通过自主编辑知识树来自行建库,并自动具备以知识树为核心的数据与知识一体化管理、模板生成、入库查重、投图与编图研究等功能,而不用自己编制代码,可以极大地提高学科专家建库的效率,只需要关注本学科研究即可。
本数据库构建采用“Arangodb+PostGIS+DSpace”技术,存储全部过程中的结构化和非结构化数据;采用FastAPI开发服务端API,通过Nginx搭建服务集群提供云端访问服务;通过JS、PyQT等技术构建Web端和桌面端科研工作平台。其中,利用DSpace技术构建的机构知识库子系统用来存储和管理科技文献和科研成果;Arangodb用来存储非结构化数据,通过知识树编辑提供一站式建库功能,实现知识与数据的一体化存储与访问;PostGIS用来存储提取的空间数据。三者有机结合,实现每一条数据的可查询、可追溯和可视化功能。此外,发挥云平台高可扩展性、高可用性和资源分发等特点,消除人员、硬件、软件的重复配置,增加传统数据库的存储能力,借鉴实时GIS时空数据模型,实现对岩浆岩时空大数据模型的动态管理。
数据库技术架构主要包括四部分(1云+3端):(1)后台服务(云端):知识体系、数据与知识一体化管理、WebGIS服务等。通过微服务实现服务聚合与管理,为岩浆岩数据库提供图件发布、数据查询、专业投图等功能的后台服务。(2)网站(Web端):对外宣传展示门户网站,网址为https://petrology.deep-time.org. 用来提供数据访问和科研工具软件(数据投图、分析等)Web访问入口。(3)科研工作平台(桌面端):C/S端桌面程序,可用于数据处理、高性能计算和科学研究。首次操作,可通过主页进行下载,后续可在程序内自动更新。基于本地的特点,其内容比Web端功能更加丰富。(4)移动端App(移动端):基于位置服务的“库-图-文”三位一体化推送,便于野外开展研究。目前正在DDE统一规划下建设中。
在岩浆岩数据库的基础上,利用大数据技术,依据研究目的,提取关键属性;依据相关制(编)图规范,编制基于属性驱动的数字化图件,开展属性分类的数字化编图与综合研究。该平台目前有2个功能。
图2 DDE岩浆岩数据库总体架构Fig.2 Structure of the DDE-OnePetrology database
3.3.1 服务功能
提供了不同比例尺造山带、全球及地区的系列岩浆岩图(图1)。这些图件包括全球岩浆岩图、亚洲岩浆岩图、中国侵入岩图、亚洲中生代岩浆岩图、中亚造山带岩浆岩图、青藏高原岩浆岩图等重要造山带的岩浆岩图(见数据库网站)。与深部物质探测及动力学研究相结合,还初步提供了重要造山带Nd、Hf等多元同位素图,可揭示深部物质和地壳生长。与大陆聚合研究结合还编制提供了深时岩浆岩图,即恢复到古构造、古地理的岩浆岩图,如三叠纪、侏罗纪、白垩纪亚洲深时岩浆岩图3个案例。
特别是提供了数字化的亚洲岩浆岩图,方便使用者选取工作区后,自动获取该区域的数字化岩浆岩图,并以此为基础,根据自己的研究进行二次编辑修改。同时,本数据库将提供与该区图件相对应的已有数据资源,使用者可以依据数据编制新的岩浆岩图,并对数据进行分析。鼓励使用者将自己的数据和数据库提供的数据,统一放在平台上进行分析、作图等研究,并将自己的数据有偿提供或贡献给数据库。数据库将给予一定的奖励。
3.3.2 编图功能
该功能是以本库数据为基础的岩浆岩成图分析技术,将实现智能化(半自动化-自动化)编图,即以岩浆岩数据、板块数据和岩浆岩演化和岩浆岩知识为基础,充分利用高精度年代学数据,采用岩浆岩数据综合处理和制图表达专业模型为基础的编图、分析技术,通过数据、知识模型和推理分析,将实现样品采样点年龄数据、岩浆岩岩体(图元)数据的自动化、智能化编译、处理、分析、表达和编图应用。
图3 中亚和阿巴拉契亚两大增生造山带岩浆岩地球化学特征对比数据来源见DDE-岩浆岩数据库;(a、b)分别为中亚造山带、阿巴拉契亚造山带岩浆岩TAS图解;(c、d)分别为中亚造山带、阿巴拉契亚造山带A/NK-A/CNK图Fig.3 Comparison of geochemistry of magmatic rocks from the Central Asia and Appalachian orogenic beltsThe data from the databases in the DDE-OnePetrology; (a, b) TAS diagrams of magmatic rocks in the Central Asian and the Appalachian orogenic belts, respectively; (c, d) A/NK vs. A/CNK diagrams of magmatic rocks in the Central Asian and the Appalachian orogenic belts, respectively
具体已经或将实现以下功能:(1)特定区域的编图功能,使用者确定区域,平台自动给出该地区的数字化岩浆岩图(包括图例、比例尺等基本要素)和相应的所有关联数据信息(如年代学、地球化学、同位素地球化学等)。使用者可以再编辑,形成自己的基础性研究图件;(2)岩浆岩图件的自动更新功能,依据一定范围的新数据,自动-半自动更新岩浆岩图,如依据年龄更新岩浆岩的时代(图元颜色依据更新的时代自动更替),据自动生成颜色、花纹等图示,以及图名、图例、比例尺等基本元素;(3)编制深时岩浆岩图,给出一定的区域和岩浆岩图,依据提供的大陆拼合模式,回溯到原始时代,绘制出深时岩浆岩图;(4)岩浆岩图的智能融合,对不同来源、不同比例尺的多类岩浆岩图经智能化分析、拼接、合并、综合后,形成成新的岩浆岩图件;(5)岩浆岩专题图的全息表达,基于岩浆岩空间数据库等,自动地按照岩浆岩的多个属性或组合进行全维度的信息表达,用颜色、花纹、明暗、结构等表达各类属性等图面信息,如岩浆岩(体)为颜色单元的Nd同位素图。
研究平台初步集成了GeoPyTool(Yuetal.,2019)的部分投图功能等,且正在进一步集成和开发新的投图功能,可作为专业研究人员进行大数据综合分析可视化图解的有效工具。对于数据统计分析平台,可以依据需求,从数据库提取数据或参数,直接分析成图,给出不同参数之间的关系(图3)。
使用者从数据库选取区域或数据类型后,点击各种类型的岩浆岩数据分析图解,如岩石分类图、SiO2-K2O图、TAS图解、Pearce图解、年龄-同位素参数(如Nd、tDM等)等,即可得到有关图解;也可以依据研究目的,检索出相关数据,选择相应的参数并成图。优点是,可以对巨量数据快速给出各类参数及其相互关系图,对在海量数据中寻找可能的数据及其参数的相关性具有极高的工作效率和准确性,为开展大数据研究,寻找可能存在的科学现象和规律提供了技术支撑。而且,大量数据可以分组(如按年龄分组、或按地区)投点成图,寻找可能存在的时空演化规律。另外,对于数据空间分布等值线及分布密度分析与作图,可以选定一个空间范围,给出数据和参数,如Nd同位素的模式年龄(tDM),也可以给出其等值线图。
如图3所示,笔者分析对比了中亚和阿巴拉契亚造山带。这两个造山带通常作为古生代典型的增生造山带的代表。但是,这两大增生造山带有什么异同?特别是在增生造山最终的结果即物质组成及其架构方面是否相同或相似?这是人们关注的问题。显然,这些重大问题的回答,需要统揽、观察这两个整个造山带,需要大量的数据。
图4 中亚和阿巴拉契亚两大增生造山带Nd同位素特征对比(数据来源见DDE-岩浆岩数据库)Fig.4 Comparison of Nd isotope geochemistry of magmatic rocks from the Central Asia and the Appalachian orogenic belts(The data from the databases in the DDE-OnePetrology)
图5 阿巴拉契亚造山带志留纪-泥盆纪主造山阶段岩浆岩地球化学“顺时针”演变轨迹揭示同俯冲增生到后增生的构造环境演变Fig.5 The “clockwise” geochemical evolution trajectory of the magmatic rocks in the main Silurian-Devonian orogeny of in the Appalachian orogen, revealing the tectonic environment evolution from syn-subduction accretion to post-accretion
笔者初步应用该数据库数据初步分析对比了中亚增生造山带、阿巴拉契亚造山带岩浆岩年龄、地球化学和同位素特征,从数千个数据分析可以看出,中亚造山带岩浆岩类型多样,准铝质和过铝质各占1/2;阿巴拉契亚造山带岩浆岩主体为花岗闪长岩、二长花岗岩和碱长花岗岩,多数为过铝质。在同位素组成方面,两大造山带差异更明显(图4):中亚造山带具有高的εNd(t)值和年轻的二阶段模式年龄(tDM2),具有显著的年轻地壳组成特点;而阿巴拉契亚造山带相对具有较低的εNd(t)值和较老的模式年龄(tDM2)。这很好地说明尽管这两大造山带都作为典型的增生造山带,但是,中亚造山带具更多有年轻地壳,显示了更强的增生造山特点,是最典型的增生造山,可以作为增生造山带的端元;而阿巴拉契亚造山带更多显示有古老陆块特点,显示了众多古老微陆块的拼贴作用,可以作为一般的增生造山带。本文通过同位素填图,定量确定了年轻地壳比例,给出了定量确定和划分造山带类型的指标和图件,还提出了从物质角度定量刻画和分类造山带,即物质造山带概念(Wangetal., 2023c,详见下文)。
另外,该数据库还有分组投图分析功能。例如,针对阿巴拉契亚志留纪-泥盆纪主造山阶段的岩浆岩,将地球化学数据按年龄分三个图,分析显示,在Peace图解上显示了“顺时针”演变的趋势(图5)。这种统计出来的岩浆成分的演变可以揭示构造环境及其演变(王涛等,2017),即揭示了从同造山(俯冲增生)到后增生碰撞的构造环境。
图6 纽芬兰岛阿巴拉契亚造山带阿克利巨型花岗岩基地球化学填图及剖面(底图据王朝阳等,2022)Fig.6 Chemical mapping and section of the Akeley granitic plutons of the Newfoundland Appalachian orogenic belt (after Wang et al., 2022)
重要的是,本数据库初步具有数据的空间分析功能,即用数据绘制某些元素或参数的等值线图如地球化学元素填图。例如,阿巴拉契亚阿克利巨型花岗岩基的SiO2、K/Rb、F、Rb/Sr地球化学填图(王朝阳等,2022),显示岩基从东、西缘向矿化发生的南缘演化程度越来越高。LILE (Rb)、REE (Y)、HFSEs (Nb、Th、U)和挥发性元素显示了自北向南的演化趋势,例如Rb/Sr比值越大(>20),显示W-Sn-Mo成矿越好(图6)。这些为揭示成矿规律,开展成矿预测提供了依据。同理,该方法用于区域同位素填图,可以和上述研究实例一样,揭示区域深部物质组织架构及其时空演变。
应用岩浆岩数据库及其大量数据分析,已经在揭示超大陆聚散、循环和动力学机制(Evansetal., 2016;Condieetal., 2017;Lietal., 2019;Huangetal., 2022)、板块俯冲样式转变(Liuetal., 2019))、地壳生长(Meert, 2005; Dhuimeetal., 2018; Wangetal., 2023b, c)、岩浆岩的分布、命名分类和大地构造环境识别(周永章等,2018;张旗等,2019)等方面取得了重要进展和成果(详见张颖慧等,2020)。
本文依据数据库和数字化编图,采用“库-图-文”三位一体的研究范式,通过岩浆岩时空演化和物源分析,在揭示陆块聚合、大地构造体制时空范围、地壳生长、深部物质架构及造山带物质类型等方面也初步取得了一些研究进展。
现有板块理论很好地解释了具有规则边界的大洋闭合、2个不同板块的碰撞。但是,同一个板块下的不规则的大洋如何关闭?现代大洋中很多山弯构造的命运如何?这些问题还未得到很好的解释。我们利用新获得的和收集的2660个岩浆岩锆石U-Pb年龄,通过数字化编图(图7),在中亚造山系东部鉴别出“紧闭褶皱”的多条岩浆岩带,并发现它们向缝合带方向变年轻,很好地揭示了蒙古-鄂霍茨克洋从早期后撤式俯冲,到晚期剪刀状闭合,并最终形成蒙古-鄂霍茨克山弯构造的整个过程。据此,提出了该大洋闭合的机制和模型,即西伯利亚克拉通旋转和大洋后撤俯冲联合作用,大洋北侧安第斯型大陆边缘向南后撤旋转,南侧东西方向的洋内弧向北后撤旋转(Wangetal., 2022b)。Cawood(2022)对此评价到:“其大数据分析在破解造山带和地球发育历史方面越来越显示出重要性”,“这项研究为未来的研究开辟了新的道路”。
图7 中亚造山系花岗岩等岩浆岩锆石年龄分布(据Wang et al., 2022b)插图中的红色、绿色点均为锆石年龄点Fig.7 Distribution of zircon ages of the magmatic rocks (granitoids) of the Central Asian orogenic system (after Wang et al., 2022b)All red and green plots are zircon ages insert map
在上述基础上,笔者编制了基于ArcGIS的属性驱动数字化亚洲岩浆岩图,揭示了亚洲重要造山带岩浆时空演化规律,根据岩浆带的时空迁移,系统厘定了古老大洋的闭合和陆块拼合过程,以及多种构造体系的时空分布范围和叠合过程,提出了亚洲大陆5个阶段的聚合过程(Wangetal., 2023a)。此外,还揭示亚洲大陆的聚集和/或生长是主要通过2种基本方式,一是增生造山,二是碰撞造山。前者以中亚造山系为代表,以含年轻物源花岗岩类为特征,发育山弯构造;后者以中央造山系和青藏高原为代表,以再造物源过铝质花岗岩为特征。前者的年轻地壳生长在亚洲大陆的聚集过程中发挥了重要作用。
大陆地壳生长是地球科学最重要的科学问题之一。国际主流观点认为,陆壳主要形成于前寒武纪。显生宙是否有巨量陆壳生长一直存有疑问。依据全岩Nd同位素和锆石Hf同位素数据库的建立,本文第一作者在中亚造山带开展了全造山带尺度的Nd+Hf同位素联合示踪填图研究(Wangetal., 2009, 2023b),圈定新生地壳空间范围,确定中亚为全球最大的、最年轻的显生宙陆壳省,年轻地壳约占50%以上,量化地壳生长量,首创定量估算地壳生长量方法,确证中亚存在地壳巨量生长,澄清了中亚造山带是否存在巨量地壳生长的质疑(Kröneretal., 2014, 2017)。通过全球8个典型造山带的同位素填图的佐证(详见下文),科学地证明了显生宙板块体制下仍可以发生并保存巨量陆壳生长。
图8 中亚造山系岩浆岩Nd+Hf联合同位素填图揭示中亚造山系深部物质组成三维架构及四维演变(据Wang et al., 2023b)Fig.8 Nd+Hf isotope joint mapping of magmatic rocks of the Central Asian Orogenic Belt reveal the three-dimensional lithospheric architecture and its four-dimensional evolution (after Wang et al., 2023b)
这种大陆的新生地壳的形成与保存,显示了典型增生造山带的组成特点。我们还进一步通过长英质岩石同位素示踪填图确定下地壳的物质分布架构,依据基性岩的同位素示踪填图确定了上地幔的物质架构,进而刻画了岩石圈三维物质架构(3D),并分时间切片,确定同造山期的物质架构与后造山的物质架构,从而进一步厘定了岩石圈物质架构的演变(4D;图8)。在此基础上,本文第一作者依据大量矿产数据的分析,确定了每个同位素省(地壳省)的各类矿产的分布数量的密度,定量确定了各类矿产在不同的地壳类型分布的特征和量,并提出受控于年轻地壳、再造地壳和混合过渡地壳3种深部物质制约的成矿类型(图9;Wangetal., 2023b)。
此外,地球深部物质探测一直是深部探测的软肋,主要是缺乏有效的技术方法。笔者等应用岩石“探针”和同位素示踪填图,研究深部物质架构(侯增谦和王涛,2018;王涛和侯增谦,2018;王涛等,2022;Wangetal., 2023b)。即依据大量数据如同位素示踪数据,采用“岩石探针+同位素填图”为关键核心的技术,可以示踪岩石圈深部物质架构,即不同属性物质的时空分布。这为深部物质探测提供了新思路和方法,成为深部物质探测发展新方向。
造山带是认识地球形成演化的关键,是地壳生长的重要场所。长期以来,对造山带主要从结构构造和几何学、运动学等角度进行分类研究(如增生、碰撞端元类型),但常有争议。在上述同位素填图基础上,我们从造山带“物质演化”的角度,开展全球造山带对比研究(如IGCP662等项目),从地壳生长量刻画造山带物质演变的新视角,通过全球8个造山带同位素填图与研究(图10、图11),获得以下认识:(1)提出“物质造山带”新概念,发现不同造山带具有不同的新生物质占比(从>70%到<10%),创新性地提出了造山带物质分类:年轻地壳比例>30%的造山带对应增生造山带,<30%的对应碰撞造山带,进而定量刻画了造山带从增生到碰撞物质演化。(2)依据地壳生长量变化,追索不同类型造山带在威尔逊旋回中的演化轨迹。该研究开辟了从深部物质角度研究造山带新途径,特别是建立了刻画造山带物质演化的定量化指标,推动了造山带研究向定量化发展,为开展地壳深部物质探测提供了新思路和研究实例(Wangetal., 2023c)。
图9 中亚造山系岩浆岩Nd+Hf联合同位素填图揭示深部物质组织架构及其成矿制约(据Wang et al., 2023b)Fig.9 Nd+Hf isotope joint mapping of magmatic rocks of the Central Asian Orogenic Belt reveal the lithospheric architecture and its controls on mineralization(after Wang et al., 2023b)
图10 全球典型的8个造山带的Nd同位素数据(εNd(t))等值线图显示其空间变化、同位素省及年轻地壳的分布范围与面积(据Wang et al., 2023c)(a)阿尔泰构造拼合体(中亚造山带);(b)北美科迪勒拉;(c)纽芬兰-阿巴拉契亚;(d)拉克兰;(e)特提斯西藏;(f)加里东;(g)海西;(h)秦岭-大别. 数字地形图来自https://services.arcgisonline.comFig.10 εNd(t) contour maps of the typical eight orogens in the world, showing spatial variations of εNd(t) values, distribution of Nd isotopic provinces and the distribution and areas of juvenile crustal domains (after Wang et al., 2023c)(a) Central Asian Orogenic Belt; (b) North American Cordillera; (c) Newfoundland Appalachians; (d) Lachlan; (e) Tethyan Tibet; (f) Caledonides; (g) Variscides; (h) Qinling-Dabie orogens. The digit topographic map comes from https://services.arcgisonline.com
图11 造山带物质组成架构定量分类及其特征图红色符号是依据通过大量Nd同位素数据的填图(定量确定的新生地壳量和比例)确定的全球8个典型造山带; 扇区代表了从高度原始(100%新生或年轻地壳)到高度演化的连续过渡(新生地壳~0%)成分; 对数坐标的同心圆表示造山带的年龄范围即造山带的形成时间Fig.11 Classification and characteristics of orogens in terms of their compositional architecture (areal percent of juvenile compositions) and ages of orogensThe red symbols show the eight typical orogenic belts of the world identified by mapping (quantitatively determined amount and proportion of new crust) of a large number of Nd isotope data. Sectors represent a continuous transition from highly primitive (juvenile crust 100%) to highly evolved (juvenile crust ~0%) compositions. Concentric semi-circles with logarithmic coordinates denote the age range of the orogens
综上所述,与目前国际最好的、应用最广的数据库如GEOROC、EarthChem数据库相比,本数据库具有以下优势:(1)设计理念突出了“数-图-文”三位一体,并以岩浆岩知识体系为基础,既有一般的数据库服务功能,还拥有编图和研究平台,更有利于开展数据驱动的科学研究,更好地体现了DDE“共享全球地学知识,创新地学研究范式”的目标和愿景;(2)组织了建库、编图和研究一体化团队,开展了22个专题数据建设,使更多的一线专家参与数据库建设,数据类型更加多样化和专业化,弥补了现有数据库的不足;在某些地域和领域(如中亚、非传统同位素等)形成优势,更好地突显了专业研究的数据库特点;(3)核心数据如同位素数据更加齐全、专业和可用,即对数据都尽可能补充了年龄、经纬度等时空信息(开发了相应的技术软件和方法,从图上获取、补充经纬度数据),特别是给出了计算参数(如εNd(t)值、tDM2等),使用者可以直接在数据库中分析成图(而EarthChem等数据库中的50%以上的Nd同位素没有这些参数和年龄,难以直接使用),从而更有利于开展岩浆岩及其揭示的地球深部物质的时空演化;(4)创建了学科专家可以依据新的发展和需求及时调整数据库结构的技术与功能,不必从头再来,而且,科研人员可以自行设计完善,无需编码;(5)有强大的DDE平台支持支撑,包括数据获取技术等支撑及多种学科一体化的融合发展,构成了DDE的“超级航空母舰”,可与国际已有数据库互联互通,形成联盟,并有望发展为以DDE为核心的数据联盟。
因此,虽然目前岩浆岩数据库的构建仅是初步的,数据量与国际最好的数据库还有差距。但是,由于具有上述优势,本数据库将有望建成国内外最新、最强、最全的岩浆岩数据库,并打造国际化、有特色的、高水平的岩浆岩研究平台,吸引国际更多同行借助平台开展科学研究,共享全球岩浆岩演化数据,推动岩浆岩等地球科学研究变革。为此,下一步将加强以下方面的工作。
(1)实现数据爆发式、持续增长。需要及时入库最新出版的国内外已发表的数据;同时,突出专题数据库建设,特别是一些备受关注的重要造山带、重大岩浆岩省等地域性专题数据库和学科性的专题数据库,如传统同位素、非传统同位素、岩浆矿物数据库等。增加、完善数据的使用功能,吸引更多团队和科学家使用和贡献数据。另外,很多地质调查报告拥有众多新的测试数据。本数据库将努力挖掘这些长期被遗忘的“长尾数据”,使得本数据库在数据覆盖范围和领域方面具有优势。
(2)进一步研发智能编图系统,开展多属性系列数据编图,特别是编制深时岩浆岩图。首次编著以新的数据库为基础的数字化全球岩浆岩图,进一步完善数字化亚洲岩浆岩图,编制不同比例尺配套的系列洲际到区域的岩浆岩图,为使用者提供更多的图件服务,为科学研究提供基础图件。
(3)加强数据库平台建设。在DDE支撑下,开发有关软件技术,实现从野外研究、样品采集、数字化编图、成果推送到数据分析成图、科学推理分析一体化的科研活动都能在平台上实现,打造国际一流的岩浆岩研究平台。在此基础上,加强与其他已有数据库的交流和学习,完善数据标准和接口;力争2~3年内,与GEOROC、EarthChem等数据库实现互联互通,构建岩浆岩数据库联盟。
(4)在“库-图-文”三位一体方面产出高水平研究成果。包括应用大数据、智能化编图等技术,进一步揭示全球岩浆岩时空演化规律,揭示中国岩浆成矿时空演化规律及其成矿制约,探索提出新的地壳生长模式,构建完善地球深部物质探测技术方法体系,开展地球深部物质组成架构与演变的研究,为探索研究深时数字地球做出贡献。
此外,本数据库特别是研究平台将及时应用机器学习、人工智能等最新发展的技术接入本数据库的数字化编图平台和科学研究平台,特别是DDE推出和发布的GeoGPT的接入。
以岩浆岩知识体系为基础,初步构建了岩浆岩数据库。其结构包括:(1)后台服务(云端);(2)网站(Web端);(3)科研工作平台(桌面端);(4)移动端(App)。数据来源包括:公开发表的文献、研究团队测试数据、实验室测试数据、有关数据库的互联互通及志愿者贡献数据。
数据类型主要包括岩浆岩样品的基本属性(空间信息、构造信息、数据来源信息等)、年代学、地球化学、全岩Rb-Sr-Sm-Nd-Pb-Hf-Li同位素,矿物Hf-O-U-Th-He等同位素数据。数据量约40万多条,涉及全球重要造山带、克拉通及部分海洋数据等。此外,为了发挥各地区、各领域专家的作用和优势,依据已有的工作基础,设立了22个专题数据库。包括两大类:一类是地域性的,如阿巴拉契亚、阿拉伯地盾、中亚(北疆)、特提斯(青藏高原)、华北克拉通、华南等;另一类是学科领域性,如非传统同位素、锆石微量、实验模拟等。此外,还包括实验室测试数据专题数据库。
与国际最常用的有关数据库相比,本数据库具有下优势:(1)“数-图-文”三位一体的设计思路,拥有编图和研究平台,更有利于支撑科学研究,计划实现绝大多数岩浆岩研究工作均可在本平台上完成;(2)组织构建了22个专题数据建设,更多一线专家参与建设,突出了某些地域(如中亚等)和领域(如非传统同位素等)的专业优势;(3)数据都尽可能挖掘、补充了年代学、经纬度等时空信息,更有利于开展岩浆岩时空变化特征及其深时数字深部地球的时空演化研究;(4)创建了学术专家可以依据新的发展和需求及时调整数据库结构的技术与功能;(5)有强大的DDE平台支持,为与国际有关数据库互联互通提供了有利条件。
依据有关(年代学、同位素等)核心数据,在探索复杂大陆拼合过程、地壳生长、地球深部物质组成架构与演化等重大地球科学问题方面取得研究进展。
致谢本项工作得到DDE及有关负责人王成善、侯增谦、成秋明、沈树忠、周成虎、翟明国、陈骏、杨树锋、李献华院士的大力支持和帮助。感谢王新兵、闾海荣等DDE信息化团队在数据抓取、整理方面的帮助。感谢两位审稿人提出的修改建议。