全球矿床数据库建设现状、应用与展望

2024-01-30 04:06张洪瑞
岩石矿物学杂志 2024年1期
关键词:矿床成矿数据库

史 蕊,张洪瑞

(中国地质科学院 地质研究所, 北京 100037)

“大数据”时代人类认识和研究世界的思维方式正在发生着深刻改变,基于大数据和人工智能技术形成的数据密集型科学成为继理论科学、实验归纳和计算科学之后的第4种科学研究范式(Heyetal., 2009)。地球科学指一切研究地球的科学,主要包括地质学、地理学以及其他衍生学科,属典型的数据密集型学科(Bristoletal., 2012)。地质数据是一种典型的时空大数据(吴冲龙等, 2016),将大数据与地质学更好地结合,让已有和即将产生的海量数据服务于地球科学,已成为地球科学家们新的探索方向和关注热点。随着机器学习、知识图谱、大数据挖掘等技术相继引进地质学领域(周永章等, 2018, 2021; 耿厅等, 2019; Zuoetal., 2019, 2023; Zhou, 2021; Guoetal., 2022; 贾敬伍等, 2023; 诸云强等, 2023),地质大数据与人工智能驱动的科学发现时代已开启。在这样的时代背景下,澳大利亚的“玻璃地球”、欧洲的OneGeology、联合国教科文组织全球尺度地球化学国际研究中心的“化学地球”等大科学计划相继提出并得到部分国家的支持与实施,推动了全球地学知识共享和地质大数据整合(周永章等,2021)。近年来,中国科学家倡议发起的国际大科学计划“深时数字地球”(Deep-time Digital Earth,DDE)应运而生,该计划以整合全球海量数据、共享全球地学知识为使命,重建各个历史时期的地球演化,构建地质构造与工程地质条件,精确识别全球资源与能源矿产的宏观分布规律,从而更准确地预测地球和人类的未来(Wangetal., 2019, 2021)。

矿床学又称为经济地质学,是研究矿床在地壳中的形成条件、矿床成因和分布规律的科学,是能够产生经济价值的重要地质学分支(翟裕生等, 2011; 张旗等, 2018)。随着分析测试技术的日益提升和研究程度的不断提高,矿床数据的数量和质量显著增长,形成了庞大的数据集合。全球一些重要科研机构分别建立了基于各自数据优势的矿床数据库。大数据发展趋势下,矿床学与大数据人工智能的融合研究势如破竹,在矿床成因(周永章等, 2017; 陈华勇等, 2022)、成矿规律及矿产资源预测与评价(王登红等, 2015; 吴永亮等, 2017; 罗建民等, 2019; Cheng, 2019; Xiaoetal., 2020; 路英川等, 2021)、成矿过程模拟(袁峰等, 2019)等方面都取得了突破性进展。

矿床学大数据属于数据密集型科学,高效安全地存储、管理、共享分布在不同研究机构、文献和报告中的重要矿床学数据是关键,而建立支撑科学处理算法的数据库是开展矿床学大数据研究的重要基础。本文介绍了全球已有的主要矿床数据库及其运行情况,为未来DDE计划整合全球海量矿床数据、建设大数据平台提供基础和借鉴。同时,结合近年来开展的以矿床学大数据驱动的科学研究典型实例,论述了建设开放、共享、统一的矿床大数据平台的科学价值。

1 已有矿床学数据库及运行情况

随着矿床的不断勘探、开发以及地球化学理论与方法在矿床学研究中的广泛应用,矿床学相关数据(元素地球化学、同位素地球化学、流体包裹体数据、成矿年代学数据、蚀变带及矿物组合数据等)爆发式增长。这些数据得到国际科研机构的高度重视,多个国家或组织建立了国家层面或全球规模的矿产资源数据库。最简单的形式为一张矿床地质图配上说明书或者一本专著,比如伊朗,以专著形式将矿床名称、经纬度位置、规模、成矿时代、矿床类型等基本信息记录在表格中(Ghorbani, 2013);再比如加拿大地质调查局出版的《Mineral Deposits of Canada》专著,系统总结了加拿大12个主要矿床类型以及不同矿床的分布和成因、地质省的演化及勘查模型和方法;还有些国家地质调查局和研究机构建立了包含矿产、地球物理、地球化学、同位素、年代学等在内的综合地学数据库,如中国的“地质云”、澳大利亚的AuScope和英国地质调查局的OpenGeoscience等。下文选择了几个主要国家矿床数据库进行重点介绍。

1.1 中国“地质云”与全球矿产资源储量动态评估数据库

20世纪80年代中国就开始了矿床相关数据库的构建工作,如武警黄金地质研究所于1986年初步建立了中国金矿资源数据库,整合1 700个大中小型金矿床,实现了数据组织、图件编修及查阅、检索、统计等功能(董晓辉, 1989)。中国有色金属工业总公司矿产地质研究院1990年开发的“全国伴生金、银矿产数据管理系统”实现了全国近600个伴生金、银矿床的重要数据资料计算机管理(马滋宇, 1990)。臧忠淑(1996)报道了涉及大中型矿床1 902处、小型矿床3 384处的40种矿产的矿床数据库,载入了矿床的产地、坐标、储量、品位等基本数据以及矿床类型、成因、成矿及围岩时代等地质信息。2003~2007年,中国、俄罗斯、蒙古、哈萨克斯坦和韩国合作编图项目,中国地质科学院完成了主要矿种的矿床数据库,其结构特征包括矿床名称、坐标、矿种、成因类型等22项。中国地质调查局郑州矿产综合利用研究所2014年建立了中国重要矿产矿山数据库,包含煤炭、石油、铁、铜等22种矿产16 061个重要矿产矿山企业基本信息、矿山储量情况、矿山开采技术条件、采矿情况、选矿基本情况、共伴生矿利用情况、尾矿废石等处置及利用情况、矿山经济指标等多方面矿山生产信息数据。

中国地质调查局主持研发了一套综合性地质信息服务系统,“地质云1.0”于2017年正式上线,为社会公众、地质调查技术人员、地学科研机构、政府部门等提供了各类丰富的地质信息服务,数据来源于多年财政项目和企业勘查等存量数据。2018年“地质云2.0”和2021年“地质云3.0”分别在原基础上升级并投入服务。目前,“地质云3.0”包含了基础地质、能源矿产、水资源、土地资源、森林资源、草地资源、湿地资源、海洋地质、地下空间等11大类数据。能源矿产大类下属的矿产资源数据库提供了黑色金属、有色金属、贵金属、稀有金属、非金属和能源矿产等各种矿产的全国分布图和成矿区带分布图(图1),可查询矿产地名称、矿种、规模、矿床成因类型、利用现状和地质工作程度等属性信息,但是吨位、品位、矿床地质特征和矿床地球化学测试数据等信息比较缺乏。此外,自然资源实物地质资料中心完成了中国典型矿床实物地质资料波谱数据库建设,该数据库采用成熟的信息提取技术方法,将岩芯、标本等实体资料数字化,利用“地质云”开展在线服务(史维鑫等, 2020)。

近年来,中国地质调查局全球矿产资源战略研究中心牵头建立了基于CRIRSCO (矿产储量国际报告标准委员会)分类规范为基础的全球矿产资源储量评估体系。目前已通过地质云平台公开发布锂、钴等24种战略矿种资源储量评估报告,主要内容包括各矿种的资源类型及分布、储量及资源量、储量经济性概况和资源潜力等,附图包括各矿种的全球高级项目及主要国家储量分布图(图2)、典型矿床吨位-成本模型图,其数据来源于公司报告(含年报/储量报告、勘探报告、公司官网/内部报告)、商业数据库、政府或官网、文献等多渠道,建立了包含矿业项目名称、坐标等基本信息,证实储量、可信储量等信息以及选矿产能、资本成本等信息的数据库,准确提供了全球资源储量信息。

1.2 澳大利亚AuScope Discovery Portal

深部地球探测计划AuScope是澳大利亚2006年提出并启动的,其目标是在全球尺度上从时间到空间以及从表层到深部,建立国际水平的表征澳洲大陆结构和演化的研究架构(熊小松等, 2016),包括AuScope网格和交互(Discovery Portal)、国家岩芯库(NVCL)、地球化学和演化、地球物理探测成像和深部结构、地球模拟和三维建模以及地球空间架构和地球动力学等6个方面。

图 1 “地质云”平台矿产地质数据资源 (网站截图, https://geocloud.cgs.gov.cn/)Fig. 1 Mineral geological data resources of the “Geological Cloud” platform (screenshot of website from https://geocloud.cgs.gov.cn/)

图 2 全球铜矿及主要国家储量分布(据江思宏等, 2022)Fig. 2 Global copper deposits and reserves in major countries (after Jiang Sihong et al., 2022)

AuScope网格和交互是一个网络大型数据存贮管理信息系统,它能提供方便且快速的查询、检索、下载和利用全澳范围内的遥感影像、钻孔、矿床、地球物理、地球化学、地质年代学等各种探测数据,还能提供地球科学相关报告和部分地区的三维地质/地球物理模型,并通过接口来确保数据的可持续性。同时,提供了各类在线资源链接信息。

矿床学相关的数据图层为Earth Resources,可提供澳大利亚全境矿床数据的查询和下载服务(图3),具体信息包括矿床名称、矿种、地质年代、精确位置、矿物赋存类型等等。此外,钻孔数据图层Boreholes中提供了澳大利亚国家岩芯库获取的钻孔样品,用于建立澳洲大陆1~2 km的矿物和组分的高分辨率图像库。

图 3 AuScope地球资源图层和数据 (网站截图,https://portal.auscope.org.au/)Fig. 3 AuScope earth resource layers and data (screenshot of website from https://portal.auscope.org.au/)

1.3 美国地质调查局矿产资源在线空间数据库

美国地质调查局在20世纪70年代就建立了矿产资源数据库,随后推出了矿产资源在线空间数据库,可提供包含矿产资源、地质、地球物理和地球化学内容交互式的地图和数据资源下载服务。其中美国国内数据库(图4)内容包含: ① USMIN mineral deposit database: 该数据库是美国正在发展建设的国家级地理空间数据库,它将成为美国重要的矿山、矿床和矿区的权威信息来源。数据结构包括矿床名称、位置、矿床模式、勘探开发情况、矿山生产数据、资源量和储量、相关文献和报道等(图5)。 ② Mineral Resources Data System (MRDS): 这是一套金属和非金属矿产的数据集,包含矿床名称、位置、矿种、矿床地质特征、开发利用现状、储量、资源量和相关文献、报道等信息,可提供数据的查询检索和下载服务。③ US mine features: 主要包括美国西部地区与采矿有关的探矿坑、矿井和坑道、采石场、露天矿、尾矿堆和尾矿池、砾石以及其他特征数据。④ 地球物理探测子系统:可提供美国大陆的布格重力异常、剩余重力异常的网格数据以及北美的航空辐射测量数据。⑤ 地球化学测试分析子系统:包括美国国家地球化学数据库NGDB的岩石、土壤、沉积物、矿物的样品测试分析数据和美国铀资源评价项目NURE中美国各地水样的地球化学分析数据335 547条以及沉积物样本的地球化学分析数据397 625条。

图 4 美国矿产资源在线空间数据 (网站截图, https://mrdata.usgs.gov/general/map-us.html)Fig. 4 U.S. mineral resources online spatial data (screenshot of website from https://mrdata.usgs.gov/general/map-us.html)

图 5 USMIN矿床数据库(网站截图, https://www.usgs.gov/centers/gggsc/science/usmin-mineral-deposit-database)Fig. 5 USMIN mineral deposit database (screenshot of website from https://www.usgs.gov/centers/gggsc/science/usmin-mineral-deposit-database)

与此同时,其提供的全球矿产资源在线空间数据库服务既支持在线地图显示,也支持Google Earth和GIS平台显示,还可以下载ArcGIS Shape file格式、DBF数据库格式和CSV文本表格格式全部数据到本地(图6)。该数据库主要包括: ① 矿产资源数据子系统:它是描述世界各地金属和非金属矿产资源的一组数据集。包括矿床名称、位置、矿种、矿床地质特征、储量、资源量和相关文献、报道等。然而该系统在2011年停止了更新。② 全球铜矿资源评价子系统: 对世界各地的斑岩型和沉积型铜矿资源的矿床、远景和许可区进行描述,并对未发现的铜矿资源进行了定性和定量评价。③ 全球矿床类型子系统: 统计了世界各地火山成因块状硫化物矿床、沉积型铅锌矿床、斑岩型铜矿床、镍铬矿床、碳酸岩矿床、稀土矿床、磷酸盐矿床、铬铁矿、钾盐矿床等不同类型的矿床信息,包括基于地质环境和矿物学的一般分类、品位和吨位模型以及矿床位置数据等。④ 国家地球化学数据库子系统:包括岩石、沉积物、土壤和矿物样品的地球化学分析数据,大多数样品来自美国大陆和阿拉斯加,也有少部分遍布全球的样品数据。

图 6 全球矿产资源在线空间数据 (网站截图, https://mrdata.usgs.gov/general/map-global.html)Fig. 6 Global mineral resources online spatial data (screenshot of website from https://mrdata.usgs.gov/general/map-global.html)

1.4 国际经济地质学家学会(SEG)Geofacets数据库

除各国地质调查机构建立的矿床相关数据库外,一些学术机构、研究团队以收集公开发表数据为主,也纷纷建立和发布了矿床相关的数据库,致力于为公众提供开放共享服务。国际经济地质学家协会(Society of Economic Geologists,SEG)与Elsevier公司合作,基于Geofacets平台为SEG成员提供查找、提取和下载科学出版物中可靠、可操作的地图和数据的功能,还提供部分ArcGIS的插件功能如图层和数据叠加分析,实现更深入的工作流无缝集成,为能源和矿业提供不断更新的情报信息。 Geofacets数据库拥有超过250万张的地质图件和图表等数据,包括构造图、地层柱状图、地震剖面、地质剖面、钻孔数据、地球化学测试分析数据等等(图7)。 矿产资源方面的数据源主要来自出版物 《Ore Geology Reviews》和《Economic Geology》,涉及地质背景和沉积环境、岩石类型和矿物学以及矿床、地球化学元素含量分析、地球物理电磁震和地形地貌数据等多方面,以此为稀土和关键矿产资源的勘探开发和投资决策提供帮助。

图 7 SEG Geofacets操作界面 (网站截图, https://www.segweb.org/apps/membership/geofacets.aspx)Fig. 7 SEG Geofacets operation interface (screenshot of website from https://www.segweb.org/apps/membership/geofacets.aspx)

1.5 美国标准普尔(S&P)公司SNL金属与矿业数据库

SNL金属与矿业数据库涵盖大量的大宗商品,跟踪初始勘探、项目开发和商品生产,包括全球超过3.5万个矿山、项目和加工设施的资产级别信息,3 600多家上市矿业公司的企业数据和财务指标,历史和预测商品供应与矿山经济学模型等。2018 年被标准普尔(S&P,简称标普)收购,使其一跃成为唯一能提供完整的全球矿业信息和分析服务以及高质量资产级别信息和可靠数据的公司,拥有比较齐全的全球矿业项目数据库,包括企业和产业概况、采矿权申请信息、储量与资源信息、开采历史、钻探结果、全球并购和融资信息以及生产和矿产经济学数据等,涵盖了9.8万多家私营矿业公司和3 700多家上市矿业公司、3.5万多个矿业项目(6 000多个正在运营的矿井)、20多年勘探预算数据,是覆盖从全球勘探、发现、开发、生产、矿山成本分析、收购活动、工业和基本金属市场预测和分析、供应链和可持续发展全面视图的平台(图8)。

2 矿床大数据的科学应用

随着地球科学的发展,矿床学及相关地质数据量快速增长,这些数据包括各国地质调查局等政府机构的基础地质调查数据、国际矿床学会和国际矿产勘查学会等学术机构的研究数据、学术期刊论文和矿业公司勘探报告以及相关图件等。基于数据驱动的矿床大数据不仅为探索全球尺度的矿产资源潜力评价和成矿预测新模式提供了数据基础,也为全球矿产资源接续基地定位、资源定量评价提供了数据支持。

2.1 揭示区域成矿规律

矿床大数据可揭示全球矿产资源的分布规律与控制机制,刻画全球矿产成矿规律。大多数矿床的形成与地球动力学背景密切相关(如斑岩型铜金钼矿床与火山弧的俯冲和发展有关等)。Daveau和Nicoll(2022)利用美国地质调查局矿产资源在线空间数据库,将其中已发现斑岩铜矿及未发现铜矿资源数据与包含板块边界的全球板块构造模型(涵盖600 Ma至今)进行地理空间和时间分析,提出了一个可更新的、可追溯至600 Ma的全球尺度岩浆弧活动总累积持续时间的时空模型,既展示了矿床分布规律又可作为预测斑岩矿床可能性的一个指标。

图 8 S&P 全球矿业信息分析服务平台(网站截图, https://www.spglobal.com/marketintelligence/en/campaigns/metals-mining#snl-metals-mining)Fig. 8 S&P global mining information analysis and service platform (screenshot of website from https://www.spglobal.com/marketintelligence/en/campaigns/metals-mining#snl-metals-mining)

作者将模型输出与斑岩铜矿产状数据集进行测试,发现在整个显生宙的大多数地质时期,该模型结果与数据控制的一致性都很高(图9)。例如,在缓冲岩浆弧的情况下准确度可达90%,加入弧的搜索距离后则达到了100%。因此板块构造模型不仅适用于斑岩矿床的成矿规律总结和找矿预测,也打开了筛选其他与地球动力学环境有关的成矿作用潜力(例如造山型金矿、火山成因块状硫化物镍矿和铂族元素硫化物矿床)的新思路。

Yang 等(2022)根据前人学术期刊论文等数据总结了全球喀斯特型铝土矿床时空分布特征。研究发现,该类矿床主要集中在温暖特提斯带及相连中高纬地区,成矿动力学背景与特提斯由南向北单向汇聚过程相关。

图 9 全球显生宙和新元古代晚期岩浆弧的板块模型推导的累积时间与斑岩铜矿叠加图(据Daveau and Nicoll, 2022修改)Fig. 9 Plate model-derived cumulative duration of Phanerozoic and Late Neoproterozoic magmatic arcs (modify from Daveau and Nicoll, 2022 )

张洪瑞等(2015, 2022)对全球尺度的碰撞造山与成矿作用进行了综合对比研究。其团队基于前人发表的119条变质岩数据,4 161余套岩浆岩数据、28组壳幔包体和61座矿床数据,创新提出: 热结构是碰撞造山带成矿差异性的主要决定因素。冷碰撞带不发育岩浆热液矿床;而热碰撞带则盛产岩浆有关矿床。其中,斑岩型铜矿床在欧亚大陆南缘构成5 000 km长的巨型矿带,MVT铅锌矿床则构成上万千米长的巨型矿带(张洪瑞等, 2015; Zhang and Hou, 2018, 2022)。

2.2 深化矿床成因机制

大量研究表明,大型矿床的产出与岩石圈结构密切相关。Hoggard等(2020)收集前人学术期刊论文和专著、咨询公司及协会数据库、美国地质调查局矿产资源在线空间数据库等数据统计分析了全球2 166个贱金属矿床的空间分布,包括沉积岩容矿Cu矿床(Cu-sed)、碎屑岩容矿铅锌矿床(PbZn-CD)、密西西比河谷型Pb-Zn矿床(PbZn-MVT)、斑岩型铜矿床(Cu-por)、岩浆Ni-Cu-PGE矿床和火山块状硫化物矿床(VMS)。发现世界级碎屑岩型铅锌矿(PbZn-CD)呈弧线状分布于地壳地质边界附近,暗示受深部岩石圈尺度构造控制(图10)。在全球范围内约95%的Cu-sed、约90%的PbZn-CD和约70%的PbZn-MVT资源位于170 km LAB厚度等值线两侧的200 km范围内。其中180~220 km的LAB厚度可能代表了克拉通岩石圈,170 km等值线代表了克拉通边界(Hoggardetal., 2020)。

Hou等(2015)以中新生代岩浆岩(花岗岩类和长英质火山岩)为探针,运用Hf同位素填图技术,利用230套全岩和4 762套锆石Hf同位素数据,构建了青藏碰撞带拉萨地体的三维岩石圈格架(图11)。结果显示,拉萨地体由3个块体构成:南拉萨新生地壳块、北拉萨新生地壳块和中拉萨古老再造地壳块。研究提出,中拉萨古老再造地壳块反映拉萨地体是一个长期活动的不断被改造的太古宙-元古宙古老微大陆,裂离自南部冈瓦纳大陆。南北拉萨新生地壳块是特提斯洋向拉萨地体之下俯冲消减、弧岩浆底侵-注入和岩浆弧不断向拉萨地体拼贴的结果。同时发现,青藏高原主要成矿系统及其矿带分布与岩石圈三维架构存在明显的空间对应关系(图12)。冈底斯斑岩铜矿带严格地位于南拉萨新生地壳块内,班怒带斑岩铜矿位于北拉萨地体新生地壳块内,证明含矿岩浆起源于新生下地壳。青藏高原主要大型铅锌矿集中分布于中拉萨地体古老地壳域内或边缘,反映古老地壳的熔融产生了含矿花岗岩岩浆并提供了成矿物质。青藏高原大型铁矿或铁铜矿通常分布于古老地壳块的同位素边缘,介于新生地壳与古老地壳接触带,暗示岩石圈不连续控制了壳幔岩浆混合和铁铜富集。

图 10 全球沉积岩容矿贱金属矿床分布与岩石圈厚度关系图(据Hoggard et al., 2020)Fig. 10 Global distribution of sediment-hosted base metal deposits as a function of lithospheric thickness (after Hoggard et al., 2020)

图 11 拉萨地体Hf同位素填图结果(据Hou et al., 2015)Fig. 11 Hf isotope contour map in the Lhasa terrane (after Hou et al., 2015)

图 12 拉萨地体岩石圈架构与主要成矿系统分布(据Hou et al., 2015)Fig. 12 Lithospheric architecture and distribution of main metallogenic system in the Lhasa terrane (after Hou et al., 2015)

2.3 判别矿床成因类型

Wu等(2022)综合5 000套已发表的中酸性火成岩年代学和地球化学以及2 000套全岩Nd同位素等资料探讨斑岩成矿规律,提炼出能精确判别不同亚类斑岩铜矿的地球化学标志。洪双等(2021)收集了学术期刊论文上主要矿床类型的磁铁矿元素地球化学数据7 388条,初步构建了基于电子探针(EPMA)和激光剥蚀-电感耦合等离子体质谱(LA-ICP-MS)磁铁矿元素地球化学大数据集,研究结果表明:基于磁铁矿大数据和机器学习算法构建的判别模型,能有效区分主要矿床类型,整体分类准确度高达95%。研究发现V元素在矿床成因分类过程中起到了较为重要的作用。基于大数据和机器学习建立的判别模型对新的磁铁矿数据进行测试,可给出该数据属于每种矿床类型的概率,能有效判别矿床成因类型。Zhao等(2023)选取全球86个不同成因矿床的4 095套闪锌矿微量元素数据进行了整理和分析。多元统计分析表明,闪锌矿中Mn-Ge-Sn含量具有良好的成矿类型判别潜力,可用于区分岩浆热液矿床和非岩浆热液矿床。此外,机器学习模型对闪锌矿微量元素数据的矿石类型识别准确率高达93.02%(随机森林)和92.82%(梯度增强),并通过接收机工作特征验证了其可靠性。通过对闪锌矿微量元素数据进行机器学习和多元统计分析,可以区分成矿成因和成矿条件。Cao等 (2023)对全球67个造山带金矿4 092组黄铁矿微量元素地球化学数据进行了大数据和机器学习分析。对不同成矿年龄、不同围岩、不同构造成矿背景的造山带矿床中黄铁矿微量元素的差异进行了分析。随机森林回归结果表明,黄铁矿中硫铁矿As-Sb含量与改造温度呈显著负相关,而Se含量则呈非线性影响。提出造山带金矿中黄铁矿As-Sb-Se含量可作为地温标尺。

2.4 矿产资源潜力评价

对矿床大数据进行专业化处理,可服务于找矿勘查。应用大数据和人工智能方法具备分析科学问题的能力,从定量的角度更加精准地研究矿床与控矿要素的关系,提升成矿预测的准确程度。肖克炎等(2015)以大数据时代的预测思维方法,结合重要矿产资源潜力评价具体工作,探索了矿产资源预测评价的基本理论基础。Zou等(2022)通过提取全球典型斑岩型矿床成矿岩浆岩中锆石的微量元素大数据,基于机器学习不同方法,计算成矿潜力指数。结果表明,机器学习模型能够较好地识别出成矿岩体,并通过表征岩浆成矿潜力来缩小找矿勘查范围,是一种快速有效地评价斑岩成矿潜力的新方法。Lawley等(2022)系统收集了美国、加拿大和澳大利亚的沉积岩容矿铅锌成矿系统的地球物理数据和“源-运-储”过程的地质数据,通过梯度提升机 (Gradient Boosting Machine,简称GBM)机器学习算法,圈定出成矿的有利地段。其划定区域与现有矿区相比,成功拟合度高达 98%以上,极大提高了找矿勘查效率。胡鹏等(2021)利用标准普尔数据库和各公司年报,开展西非铁矿资源现状和潜力评价工作,提出西非地区未发现铁矿床数量为63个(置信90%),铁矿石资源量潜力为264. 6亿t,找矿资源潜力大。Li等(2022)提出地质大数据智能找矿原型理论与方法,试图将逻辑推理转变为知识图谱关联规则,将理论模型转变为算法模型中的推理规则,从而成功地将专家知识与人工智能相结合,最终设计并初步搭建出地质大数据智能成矿预测平台。

然而,数据驱动矿产预测方法主要关注预测变量与矿床空间分布的相关关系,往往没有充分考虑它们之间的成因联系。Zuo等(2023)提出了包括成矿知识嵌入和成矿知识发现的新一代矿产预测人工智能模型。成矿知识嵌入和成矿知识发现形成闭环,实现成矿知识、找矿大数据和深度学习模型的深度融合,进而提升矿产预测人工智能模型的泛化能力、准确性和可解释性。

2.5 资源战略研究

矿床数据库可为国家矿业政策战略咨询提供基础数据。杨晓坤等(2022)采用标准普尔数据库资料和国外矿业企业公开披露的数据,聚焦全球主要铅锌矿业公司的铅锌资源状况,通过分析其主要项目的矿床类型及其分布特征、资源储量、品位及其勘探、开发利用情况等,认为国外矿业巨头均以资源保障能力获得行业竞争力与话语权;同时通过我国矿业企业境外锌资源开发情况,揭示我国矿业企业“走出去”任重道远。Liu等(2023)通过大量收集和整理世界各上市公司公开报告、政府工作报告和学术论文,汇编了包含全球146个稀土开发项目的稀土资源项目数据集,通过对数据集的分析和估算,从全球稀土项目分布、项目价值分布、稀土供应链等方面报道全球稀土开发的最新进展并开展供应链评估。

3 矿床数据库建设理念

上述基于数据驱动的矿床学各研究方向实例展现了矿床大数据在大尺度-系统性认识上的优越性,这些成果有的集中在深入挖掘矿床学本身的各种指标,从而提供大数据支撑的、更为可信的研究认识;有的贯彻地球系统科学理念,综合地质、地球化学、地球物理等各个学科中的成矿有关信息,从而对成矿系统成因机制、成矿规律等得出创新性认识。然而,矿床数据库是矿床大数据处理的基础,从前文所述矿床大数据的应用可看出,数据(包括文本、表格等不同格式)大部分来源于已发布的各种文献,仅有少部分是依托现有矿床数据库数据完成,并且这些数据库由不同的专业机构和组织所开发、运行和维护,缺乏一个统一的平台对不同数据库的数据进行整合、交互处理和可视化,导致数据难以在研究人员之间流动,限制了高水平、综合性研究成果的产出。

“深时数字地球”(Deep-time Digital Earth, DDE)是国际地质科学联合会(IUGS)发起的第一个大型科学计划,为期10年(2018~2028),由各国地质调查、专业协会、学术机构和科学家共同开发。DDE旨在提供一个开放的平台,用于连接现有的深时地球数据和整合地质数据,用户可以通过指定时间、空间和主题进行查询,并使用可提供计算能力、模型、方法和算法的知识引擎处理数据以获得知识发现。DDE可以帮助科学家进行耗时的数据清理和处理,使他们能够专注于研究和发现。目前DDE已建设完成网站平台,陆续向公众发布岩石学、年代学、矿物学等多个学科数据。矿床学作为地球科学重要组成,在DDE框架下矿床学工作组拟整合全球海量矿床数据,建设覆盖矿床学各学科知识体系、本体、数据、知识(图谱)、标准的大数据平台,实现全部资源的集成共享与推广应用,从而推动和促进矿床学科研范式变革。同时,矿床数据库平台还将与地球物理、地球化学、大地构造、古生物和古地理学等其他学科数据库平台资料互通,促进信息资源开放共享。DDE矿床数据库平台的核心理念是“开放、共享、统一”,平台网站为https://deposit.deep-time.org/。该平台有望为成矿理论、成矿预测、地球演化以及气候变化等提供技术及数据支撑。

4 展望

大数据正在改变地质学家的思维方式,随着大数据时代和人工智能技术的飞速发展,目前已经建立了一些矿床数据库,如美国地质调查局USMIN 矿床数据库、标准普尔(S&P)公司下属的SNL金属与矿业数据库以及Geofacets数据管理平台等。这些是当今全球不同部门普遍引用的数据来源,为全球科研人员提供了地图和数据,推动了数据驱动的矿床学研究,在区域成矿规律、关键控矿要素、成矿预测等方面显示了无可比拟的优越性。

目前已有全球矿床数据库存在数据不齐全、数据格式不统一、资源量标准不同,个别数据库认可度、知名度以及引用率不高等问题。建立更权威更齐全的矿床数据库,形成开放、共享、统一的矿床大数据平台,提供可靠数据的深度分析和二次开发,服务全球矿产成矿规律、资源评价与供应评估等势在必行。

猜你喜欢
矿床成矿数据库
欢迎订购2022年《大地构造与成矿学》
欢迎订购2022年《大地构造与成矿学》
构造叠加晕法在深部找矿中的应用——以河南小秦岭杨砦峪金矿床S60号矿脉为例
欢迎订购2021年《大地构造与成矿学》
欢迎订购2021年《大地构造与成矿学》
黑龙江省林口县三合村探明超大型石墨矿床
数据库
数据库
数据库
西昆仑新发现盐湖型卤水硼锂矿床