基于大数据分析的地热勘探潜力区预测方法的新进展

2020-01-06 05:03祁士华程万强黄学莲肖志才
高校地质学报 2020年1期
关键词:勘探数据库预测

蒋 恕,王 帅,祁士华,程万强,旷 健,黄学莲,田 峰,肖志才

1.中国地质大学(武汉)资源学院,武汉430074;2.中国地质大学(武汉)环境学院,武汉430074;3.中国地质大学(武汉)生物地质与环境地质国家重点实验室,武汉430074;4.中国电建集团华东勘测设计研究院有限公司,杭州311122

在过去的20年中,各个领域都出现了大规模的数据增长,包括基础科学和各应用领域等等。大数据的特点是是数据量巨大,无法通过简单的方式进行管理,并且具有数据量大(Volume)、模态多(Variety)、更新速度快(Velocity)、真伪难辨(Veracity)等特点(Hey et al.,2009;张引等,2013;吴冲龙等,2016;罗建民,2019)。大数据应用就是利用数据分析的方法,从大数据中挖掘有效信息,为用户提供辅助决策,实现大数据价值的过程。大数据科学已经成为科学研究的第四范式(Hey et al.,2009;郎杨琴和孔丽华,2012;Ceci et al.,2014;Chen et al.,2016;吴冲龙等,2016),传统的单一学科研究已经很难适应社会发展的需求。地质学是典型的数据密集型科学(陈建平等,2015;杨宗喜等,2013),基于此此背景,国际地质科学联会(IUGS)支持发起了“深时数字地球”(Deep-time Digital Earth,DDE)国际大科学计划,目的是建立新的全球公开共享的地质大数据平台,利用大数据系统驱动和探索行星地球及其多圈层演化规律和耦合关系。

地热资源具有清洁、储量大、可持续发展的特点,但当前地热资源无论用于发电还是其他直接应用在效率上都相对低下。根据能源信息署报道,2018年美国地热发电不到美国总发电容量的1%(International Energy Agency 2018)。主要的原因是当前勘探发现的水热型地热系统数量有限。目前大量的水热型地热系统还没有进行勘探,并且干热岩还处于实验阶段(陆川和王贵玲,2015;曾义金,2015;Olasolo et al.,2016a,b;Zhu et al.,2015;Watson et al.,2019),仅有美国、法国、德国等8个国家开展试验。通过多指标综合判断潜在的地热能有利区的可开发性,是地热勘探与开发面临的最重要挑战。过去由于资料有限,地热的勘探主要靠野外温泉露头、温度指示矿物、热流测试、钻井测量温度等。随着大量数据的积累,地热研究者开始采用石油勘探中综合沉积体系、烃源岩、盖层、圈闭等数据资料预测潜在油气藏分布的有利区带分析方法(Play Fairway Analysis)来预测有利地热区的分布(Fisher and Mudge,1991;Erdlac,2007;Siler et al.,2017;Wannamaker et al.,2017;Faulds et al.,2018;Lindsey et al.,2018),其中的基本条件之一就是需要建立专业地热数据库。

地热学是DDE国际大科学计划的发展内容之一,也是地热资源勘探和开发的理论基础,因此建立科学合理的地热数据库显得尤为必要。本文将介绍国内外已有的地热数据库建设及运行情况,并列举大数据驱动的地热资源勘探的案例,为DDE全球地热数据库的建设提供重要参考。

1 地热相关数据库建设及运行概况

目前,中国拥有较丰富的地热数据,但尚缺乏专业的地热数据库。中国地质调查局“地质云”中,零星的地热数据主要包含在以水文信息数据库中。中国地质科学院水文地质环境地质研究所积累了大量的地热基础数据、野外水样数据、同位素测试成果、水质分析、各省和典型地热田地热资源综合评价、地热井综合描述等地热数据资料,但相关数据库还在建设中;中国科学院地质与地球物理研究所胡圣标等也正在构建中国大陆及海域的大地热流数据库(Jiang et al.,2019);其他单位如石油公司、地勘单位和部分地方政府等,建有各单位收集的地热资料库。总体而言,国内地热数据库建设还处于起步阶段,多数数据库不具备有效的数据查询和数据分析功能。

国外的有全球地热数据库(Global heat-flow database),美国国家地热数据系统(National Geothermal Database Systerm,NGDS)、国际地热协会的数据库(International Geothermal Association,IGA)的地热田数据库、AAPG的Geothermal Survey of North America(GSNA)、 Global Gravity dataset、GETECH、一些国家和地区的数据库(如欧洲的GEODH、冰岛的地热数据库、意大利的国家地热数据库、德国的地热信息系统等)、政府机构(如美国能源部的GDR)、各国地调局(如美国地调局USGS)、地热协会的数据库(IGA,GRC)和项目数据库等。但国际上的地热数据库也都有优缺点,比如IGA的地热数据库虽然有大量的会议论文和地热分布的图件,但没有数字化,不具备地热资料空间成图和数据分析功能。美国地调局的地热数据库主要分布在美国西部。美国地热能研究前沿观测计划(Frontier Observation for Research in Geothermal Energy,FORGE)干热岩前沿观测数据库虽然有项目的所有地质、地球物理、地化、钻井、压裂等数据,但没有统一数据格式的数据库,目前FORGE项目的数据已经接入NGDS数据库。目前全球很多机构都有自己的地热数据库,各有特点,但现有地热数据库没有深度的数据统计和分析功能,其发展趋势是地热数据库系统渐渐变为基于网页和地理信息系统的数据库。

1.1 美国国家地热数据系统NGDS

美国国家地热数据系统(National Geothermal Data System,NGDS,http://geothermaldata.org/) 作为支持奥巴马总统的开放数据政策以及2009年美国恢复和再投资法案的一部分,由美国能源部地热技术计划资助,并于2014年5月28日正式宣布启用(杨宗喜等,2013;Anderson et al.,2013)。NGDS是一个集存储库和数据站点的分布式网络,通过采用最先进的信息科学来提供对高质量和综合地热数据的访问并通过数据可视化更好地理解地下的地热能(Clark et al.,2013)。NGDS主要通过确定地热潜力,指导勘探和开发,制定数据驱动的政策决策,最大限度降低开发风险等方式帮助研究人员认识并开发地热能。NGDS主要贡献单位为美国地质调查局(United States Geological Survey,USGS),南卫理公会大学(Southern Methodist Universsity,SMU)和美国国家地质学家协会(American Association of State Geologists, AASG)(Clark et al.,2013;Anderson et al.,2013)。

NDGS建立在美国地球科学信息网络(U.S.Geoscience Information Network,usgin)的基础上,允许第三方开发应用程序(Arcgis,UDig,QGIS,GvSIG)访问。代码存储在usgin-github存储库中,并通过usgin实验室的开发人员论坛进行数据存储。NGDS旨在使用分层数据传输方案(表1),Tier 3数据采集是首选方案(图1)。该传输方案允许必要的灵活性以适应任何形式的非托管遗留数据,以及标准化内容模型和/或交换格式中的高价值数据。该系统使用社区治理方案来采用新的交换格式,并提供一个存储库,其中所有人都可以使用每个数据交换的规范。有关系统设计的其他信息参见Clark等(2013)。

NGDS是基于使用顶级NGDS资源来表示NGDS系统中任何资源的模型,NGDS资源可以进一步分类为数据资源、元数据或注释(图2)。NGDS包含八个数据来源:Wisconsin Geological&Natural History Survey NGDS Node,Geothermal DataRepository,Testharvestusgin,USGIN Geothermal Catalog,Alaska NGDS node, USGS, Energy&Geoscience Institute GINstack node,Southern Methodist University Geothermal Laboratory。最近更新时间为2019年8月22日,共计87091个数据集,包括全球(主要为美国)的井测温数据、地热梯度、活动断层和地球化学分析等。数据集包括与地热相关的地球物理、地球化学、构造活动、断层特征、接触带特征、地质单元、测温数据、井头观察、测井数据、水化学和热导率等数据。迄今为止可用的内容模型包括:水化学、钻孔测温数据、钻孔测温观测、数据交换、直接使用功能、钻杆测试观测、断层特征、流体注入、地质接触带特征、地质单元特征、地热区、地热流体产生、地热发电厂、热流、热泵设施、岩性间隔记录特征、元数据、物理样品、放射性产热、地震事件、导热系数、热/温泉特征、火山喷口、井流体及井头和测井观测等(每个模型的详细见http://geothermaldata.org/page/ngds-content-models)。

表1 NDGS分层数据采集方案Table 1 A tiered data acquisition scheme for NGDS

除此之外,NGDS的有利区分析团队正在开展专门针对NGDS数据的新型勘探和开发分析软件或模型,包括为地热电力行业开发的可通过Web访问的绘图工具NREL Geothermal Prospector,一种用于从文本或位置搜索加载和显示NGDS WFS的Web应用程序NGDS Data Explorer,帮助用户评估可能与给定地热资源发电相关的资源潜力和财务风险的地热金融风险分类和评估工具GeoFRAT以及用于模拟当前可用的美国地热电力系统的估计性能和成本的地热电力技术评估模型GETEM。

图1 Tier 3数据集的NGDS数据项的顶级模型Fig.1 Top level model of NGDS data items for Tier 3 data set

图2 NGDS高级数据模型Fig.2 High level NGDS data model

1.2 欧洲地热区域供暖数据库GEODH

欧洲地热区域供暖数据库(Geothermal District Heating,GEODH,http://geodh.eu/),是由欧盟资助的GEODH项目(2011~2014)所开发的关于欧洲地热区域供暖信息的数据库,由欧洲地热能源委员会管理(EGEC),以开放标准为基础提供地质数据始终是GEODH的一项关键任务,其数据可通过开源软件产品获得。

该数据库网站对欧洲的GEODH现状、市场、管理、金融和潜力进行了介绍。欧洲有超过5000的区域供暖系统,其中地热区域供暖系统只有240多个,占比小;超过25%的欧盟人口生活在直接适合地热区域供暖的地区,GEODH系统在22个欧盟国家投入运营,潜力巨大。该数据库的数据资源主要是欧洲14个项目成员国的GeoDH项目成果,包括装机容量、DH深度、注入井生产井的地热资源温度、地热流体速率等参数。GEODH项目旨在克服地热区域供暖发展的非技术障碍,尤其是提高国家当局决策者对地热供暖技术潜力的认识,制定简化行政和监管的战略,并在某些情况下填补监管空白,发展创新型金融模式。

GEODH数据库还提供了基于web的GIS视图,用于为GEODH项目成员国提供在欧洲范围内根据深部地热潜力(主要提供地表以下2 km范围)和现有热需求确定未来GEODH潜在靶区。图3显示了web视图示例,表2为图3中的图层分类列表,根据所选不同的分类叠加可进行更深入研究,使用户能够从不同角度对地热潜力进行比较,从而对地热潜力进行更准确的评估。例如:可以通过勾选不同的分类选出在1 km深度下温度高于50℃,2 km深度下温度高于90℃,以及热流密度大于90 mW/m2的范围。根据不同图层结合底图可以绘制成点位分布图或者等值线图;该数据库还可以根据地区进行查询,用于对同一地区不同分类条目进行分析。

图3 GEODH基于网页和地理信息系统的地热分布示例Fig.3 Web GIS of GEODH’s geothermal distribution

表2 GEODH基于地理信息系统的图层(子图层分类未列出)Table 2 Layers of Web GIS of GEODH(Sublayers not listed)

1.3 美国地质调查局数据库

美国地质调查局(U.S.Geological Survey,USGS)是美国内政部所属的公益性科学研究机构,负责对自然灾害、地质、矿产资源、地理与环境、野生动植物信息等方面的科研、监测、收集、分析;对自然资源进行全国范围的长期监测和评估(魏春生,1993),为决策部门和公众提供广泛、高质量、及时的科学信息。USGS根据其职责定位,自成立以来,为社会和公众提供了丰富的地质信息产品,涵盖专业范围广,产品的质量高。

USGS根据其职责定位和历年来工作成果,于2016年在其网站上推出了USGS地质信息产品系列,主要包括七大类,分别是数据和工具、地图、出版物、图书馆、软件、多媒体库和公园通行证(张明超等,2016;图4)。

图4 美国地调局数据库内容(张明超等,2016)Fig.4 Content of USGS database

USGS的数据都是能是在统一的地理信息中以合适的数据格式直接输入到相应软件系统中的数字信息,直接用于在科学、工程或商业环境中的实际应用分析。数据和工具类产品目前主要包括数据和工具主题、实时数据、应用程序接口、科学数据目录、科学数据集、数据管理、数据管理工具、GIS数据。

为了推进地热研究,以更好地查明地热资源、开发地热能及评价地热开发的影响,USGS地热资源调查项目通过应用广泛的研究方法来描述资源发生、执行监视和开发资源评估,从地热勘探、开发和评估研究中收集并公开提供相关数据。USGS提供了218本地热资源相关的出版物,涵盖了地热能源的勘察、开采和利用;提供了地热资源的可下载数据和地图,包括美国西部中低温地热系统的分布图,地热潜力点的互动地图等,互动地图上可以快速地进行标记和绘图。提供了新墨西哥州梅斯拉盆地1972年至2018年间收集的379个钻孔温度剖面的数据汇编,包括样本日期、测量方法和钻孔类型。

1.4 国际地热协会和地热资源委员会

国际地热协会(International Geothermal Association,IGA,www.geothermal-energy.org) 是地热资源研究和开发领域世界领先的权威机构,在至少65个国家/地区拥有近5000名成员。IGA的目标是通过在地热专家、商业界、政府代表、联合国组织、民间社会和公众之间发布科学和技术信息,鼓励全球范围内的地热资源的研究、开发和利用。它联结全球地热资源研究和开发团队,制定地热行业标准,提供全球能源开发利用方面的执行方案和技术支持,促进全球地热开发网络平台建设,并为处于地热开发早期阶段的国家提供特别支持。

另外一个国际地热组织地热资源委员会(GeothermalResourcesCouncil,GRC,geothermal.org)是非营利性的专业教育协会,成立于1970年。GRC在40多个国家/地区拥有1000多个会员,占IGA会员总数的20%,积极寻求扩大其作为国际地热界主要专业教育协会的作用。GRC通过其外展,信息传递和教育服务,成为其成员持续专业发展的联络点。

IGA、GRC创立的地热数据库包含42000多条记录,并可访问超过21000个PDF文件,涉及地热能源的勘探、热储工程、地热发电厂设计和运行、直接利用、地源热泵、能源政策、能源市场、新闻宣传等方方面面。IGA的论文数据库包括在地热会议和活动中发表的科学地热论文,该数据库目前包含18157篇技术论文,并对外开放网上检索下载功能。

2 基于地热大数据的地热勘探研究

2.1 内华达州地热发电潜力评估

美国可再生能源实验室(National Renewable Energy Laboratory,NREL)开发了基于NGDS等数据库的地热勘探软件Geothermal Prospector,能提供数据的空间可视化、数据分析和预测勘探目标等功能。该软件数据库系统包括环境、地质、勘查、地热相关数据(温度、温泉、确定的地热系统等)、基础设施、土地拥有权和租赁等。该系统为地热勘探提供众多信息,如环保条件、地理和基础设施、交通、地形、水文条件等(图5)。

利用该软件先通过政府规定环保敏感区剔除不能勘探的区域,然后根据基础地质、温度、地化、岩石学和前期勘探成果等数据库,通过叠加断层、温度、火山岩、已知水热地热系统的数据预测地下3 km潜在的地热的资源分布,清晰显示内华达州Reno周缘及犹他州南部Beaver周缘高温和断裂发育区域是有利的地热勘探区(图6)。通过大量数据统计的井底温度也可以看出浅层到3 km温度基本都高于210℃(图7)。在此基础上可以预测不同地方的地热发电潜力(图8)。

图5 美国西部地热勘探条件评估图Fig.5 Assessment map of geothermal exploration conditions in the western United States

图6 美国西部地下3 km潜在地热资源分布预测Fig.6 Prediction of geothermal resource potential distribution of 3 km underground in the western United States

2.2 有利区带法预测地热资源潜力

为了从深层热储中增加30兆瓦的地热发电,美国能源部借鉴石油勘探的有利区带分析方法,资助内华达大学里诺分校、犹他大学、犹他州立大学、夏威夷大学、华盛顿州地质和资源局、红宝石山公司等,在地表没有显示的低勘探程度或者未勘探地区,利用有利区带分析方法预测深部地热资源的潜力。Faulds等(2018)利用有利区带预测方法,在考虑构造背景、断层活动年龄、断距、断裂活动速率、渗透率、热源以及这些参数不同权重的基础上预测了最有潜力的地热系统的分布和勘探目标。其中活动的构造背景、大断层、年轻断层、年轻的火山活动、高热流、高地温、有高温地质温度计指示等位预测地热有利取代的有利条件,与之相对的则为不利条件。勘探潜力区分布在活动大的几个断层交汇处,并且地温计和测温指示高温、地球物理显示有热源的地方(图9)。

图7 Reno东部到犹他州南部Beaver周缘地热资源潜力分析Fig.7 Analysis of geothermal resources potential from the eastern part of Reno to Beaver in southern Utah

图8 美国地调局预测的美国西部地热发电潜力图Fig.8 USGS forecasted geothermal power potential map in the western United States

图9 多指标叠加的布格异常模型图(据Faulds et al.,2018修改)Fig.9 Map of complete Bouguer anomaly model with multiple index(from Faulds et al.,2018)

Siler等(2017)利用石油有利区带分析的方法,用模糊逻辑(fuzzy logic)方法分析断层、火山年龄、构造背景、热流、温度等参数,预测出地热资源高勘探和低勘探潜力区,并且根据数据的多少和资料可靠程度等给出了勘探的风险(图10)。

美国夏威夷地区是火山活动地区,但地热资源勘探开发进展缓慢。Ito等(2017)综合重力、断裂、火山、地下水、地化、温度、电阻等资料,通过线性模型联合定量表征关键地热资源参数(如异常高地热、渗透率和流体),计算出地热前景区成功概率,采用该有利区带预测的方法成功预测了夏威夷的地热资源潜力分布,认为夏威夷Kilauea东部裂谷PGV地热电站附近有更大的地热潜力,有利区分布在Kilaurea和Mauna高地地区,这些被温度达100多度的气孔所证实。但该方法的预测精度取决于地下水模型的准确性,而地下水模型空间变化较大,是有利区带预测的难点所在。

图10 美国西部Modoc研究区基于模糊逻辑方法的总地热勘探的有利性和风险评估图(使用模糊逻辑方法分析断层长度,断层年龄,断层应力状态,构造背景,热量和地温测量数据;Siler等,2017b)Fig.10 Total geothermal favorability and exploration risk for the Modoc study area in the western US(Using fuzzy logic method to analyze the fault length,fault age,fault stress state,structure setting,heat,and geothermometry data;from Siler et al.,2017)

犹他大学能源与地学研究院(Energy&Geoscience Institute at the University of Utah),内华达大学里诺分校(University of Nevada-Reno,UNR)和劳伦斯伯克利国家实验室(Lawrence Berkeley National Laboratory,LBNL)的地热技术项目组,一直在应用大地电磁场(Magnetotelluric,MT)、土壤气体通量和构造分析来识别美国大盆地伸展体系中隐藏的高焓地热系统。利用地球物理方法(如MT)寻找纵向的低电阻率地质结构,这些结构通常可以将深部地壳中的岩浆或高变质条件下的流体输送到可利用的深度,并通过土壤气体地球化学成分来验证深源的性质(Wannamaker et al.,2017)。犹他大学主要采用概率克里金法数据分析方法和多标准决策系统,考虑了第四纪流纹岩和玄武岩活动(权重为0.25)、热流(权重为0.3)、Si、Na/K、Cl及Mg地化温标(权重0.15)、MT(权重0.3)表征的热源和断裂密度(权重为0.4)、临界应力(权重为0.4)和MT(权重为0.2)表征的渗透率来预测潜在地热区,其中热源和渗透率权重分别占0.65和0.35。图11为利用该方法系统预测的美国西部大盆地东部地区地热有利区尤其是隐藏式地热的分布。预测的结果被现有的地热发电区域(如RH-Roosevelt Hot Springs电站,CF-Cove Fort电站等)及高温及高热异常区DV-Dog Valley热异常区验证(Wannamaker et al.,2017)。

图11 美国西部大盆地东部地区利用有利区带分析方法(PFA)模型预测的地热有利区预测结果图Fig.11 Geothermal risk/favorability map for the eastern Great Basin using play fairway analysis(PFA)model

3 结论及展望

积累的大量的地质、地球物理、地球化学、构造、岩石力学、岩石物理、水文资料、测温资料、地质温度计等数据可以被综合起来预测潜在的地热勘探区。根据资料的类型以及丰富和可靠程度,用来自石油工业的有利区带分析思路预测地热资源分布的有利区。在定性资料多和定量资料少的情况下,可以用简单的地热系统各要素属性的平面叠加预测有利区域,有利的常规水热型地热分布区具有地温高、储层发育和有利构造背景形成高渗透率和大的水流量等条件。若定量资料多而且数据可靠,可以结合模糊逻辑(Fuzzy Logic)或者根据概率克里金法数据分析方法和多标准决策系统以及各要素的权重等具体数据分析方法预测有利的地热分布区。

尽管目前全球各个国家都重视地热数据库的建设,在欧美已经开始利用地热数据库开展基础地质和地热资源勘探开发研究,但目前仅刚开始用于有利勘探区带预测,而且大多数地热数据库的数据缺乏在数据结构和格式上不统一,很难在地理信息系统(GIS)中查询和分析数据。在世界各国急需将地热作为后补清洁能源以及配合DDE大科学计划开展背景下,通过梳理地热知识体系,设计新的基于GIS和依据知识体系可对数据进行查询和分析的数据结构,然后完善我国和其他全球典型地热区的地热数据库建设,通过运用深度机器学习的人工智能等计算机新技术对地热数据库海量大数据进行规律分析,从而预测隐藏式地热有利区的分布。同时,在地热知识体系建设的基础上,可以利用机器学习对海量的地热大数据进行分析,进而预测地热学各分支学科的发展趋势和未来地热学的发展方向。

猜你喜欢
勘探数据库预测
油气勘探开发三年滚动计划编制的思考
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
勘探石油
不必预测未来,只需把握现在
数据库
春晓油气田勘探开发的历史
数据库
数据库