王树华 于会臻 陈学国
摘 要:当前,全球整个石油行业随着油价下降,面临巨大的生存压力。如何在新形势、新挑战下,降低成本,提高勘探精度,成为这个行业不可避免的问题。由此,本文提出将深度学习应用于石油勘探中,在阐述深度学习理论方法的基础上,探讨石油勘探领域深度学习的关键技术。
关键词:深度学习;石油勘探;样本制作
中图分类号:TE34;TP391.41文献标识码:A 文章编号:1003-5168(2018)28-0022-02
Abstract: At present, the global oil industry as a whole is facing tremendous pressure of survival with the decline of oil prices. How to reduce costs and improve exploration accuracy under the new situation and challenges has become an unavoidable problem in this industry. Therefore, this paper put forward the application of deep learning in petroleum exploration. On the basis of expounding the theory and method of deep learning, the key technology of deep learning in petroleum exploration field was discussed.
Keywords: deep learning;petroleum exploration;sample preparation
深度學习是近年来快速发展的大数据挖掘新技术,该技术基于神经网络算法(CNN、RNN等),通过模拟人脑分析、建立学习模型,从而实现模仿人脑进行识别的目标。深度学习在各个领域迅速发展,取得了令人意想不到的成果。本文主要分析深度学习在石油勘探中的应用。
1 深度学习
深度学习是机器学习的核心算法之一。该方法起始于人工神经网络,特点是利用其具有的多隐层的多层感知结构,通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。
深度学习方法主要有2种:一种是监督学习,另一种是无监督学习。其中,卷积神经网络(Convolutional Neural Networks,CNN)就是一种深度监督学习下的机器学习模型,而深度置信网(Deep Belief Nets,DBN)则是一种无监督学习下的机器学习模型[1]。
2 深度学习在石油勘探中的应用现状
因为石油勘探行业属于技术密集型产业,新的方法和技术都较早地被引入到该行业。深度学习的鼻祖,BP神经网络在1996年就引入了石油勘探行业。但是,由于当时计算速度和算法特别是石油行业由于地震分辨率的限制所造成的多解性,BP神经网络一直没有在该行业中得到较好的发展。
随着深度学习的发展,相应的计算方法和计算能力提高,特别是低油价的市场环境,必然要求提高勘探成功率,这也为深度学习应用于石油勘探领域提供了契机。
虽然图像识别和分类在人脸识别、数字识别以及语音识别中取得了良好的应用效果,但由于石油行业数据成像的差别,仍旧限制了该技术在石油勘探行业中的应用,主要体现在以下两方面:①石油勘探行业的数据成像精度和要识别的地质体还有一定的差别;②石油勘探行业的样本制作和标签标示困难,具有很大的多解性。
由此,石油勘探行业目前还没有比较成熟的方法和应用软件平台,更没有比较成功的案例。
3 石油勘探领域深度学习的关键技术
3.1 样本制作
在石油勘探领域,通过对地震资料和测井数据的处理和研究,实现对地下地质体的识别是间接方法,不是直接方法(人脸识别、车牌识别等都是直接方法,完全类似人视觉成像)。同时,又由于受到数据分辨率、数据噪声以及判别经验等的影响,造成识别结果不确定、样本标签不准确。换言之,针对同一个地质体,不同地震资料有不同的特征。同一个地震图像,不同的专家有不同的解释,而这使得样本标签具有多解性。
另外一个问题是样本数量问题。深度学习取得好的训练结果的前提是需要海量的样本数据,石油勘探数据虽然也是海量数据,但建立有效的样本数据,特别是海量的样本数据仍比较困难。
综上所述,石油勘探领域的标签,以地震成像和测井成像数据建立的间接标签为主,岩心直接标签为辅。因为区块内有大量的地震成像资料,可以利用三维地震资料,从不同的方向和切片方向分别成像,建立间接样本数据。此外,还需要编写专门的程序来实现具体样本的制作,从而提高建立样本的效率[2]。
3.2 模型构建
在确定建立样本的方法后,下一个关键的技术问题是构建深度学习模型。当前,比较流行且执行效率比较高的模型(模式)有以下几种。
①Caffe。Caffe是中国人贾扬清于2013年在Github上发布的深度学习工具,主要应用于视频和图像的处理等领域,是一种常用的深度学习框架。该平台对递归网络和语言建模的支持较差,在图层需要使用C++定义。
②CNTK。目前,CNTK已经发展成一个通用的、平台独立的深度学习系统。该平台网络利用其独有的细粒度构件块,具备不需要使用低层次的语言就能创建新的、复杂的层类型的能力,提高了其开发的便捷性。
③TensorFlow。TensorFlow是Google公司的产品,其支持Python等语言,具有强大的开发库,开发效率高,是一个理想的深度学习开发平台,具有CNN、RNN等模型。TensorFlow使用了向量运算的符号图方法,使得新网络的指定变得相当容易。
④Theano。Theano引领了符号图在编程网络中使用的趋势,且Theano的符号API支持循环控制,保证了RNN的实现更加容易且高效。
⑤Torch。Torch平台的CNN(卷积网络)方法非常好。与TensorFlow和Theano相比,Torch利用时域卷积的本地接口,使用非常直观。
这些模型都有比较成功的案例,但对于石油勘探行业,结合模型特点,笔者认为,Theano较好,该模型具有前馈和后馈的功能,并且该模型能较容易实现GPU的并行化。
3.3 参数优化
在确定模型后,需要根据模型的特征优选模型参数。勘探领域主要包括以下几个参数。
①确定样本的大小。样本太大,虽然信息量大,但造成速度较低,如果太小,一则包含的信息量小,二则不能建立较多的隐层层数(因为需要池化)。
②隐层层数的确定。隐层层数在很大程度上决定了最终训练模型的精度。该参数需要根据样本的大小以及要求的模型训练精度共同确定。
③学习率及核函数。这两个参数主要影响模型训练的精度,一般而言,学习率小,训练时间加长,但最终达到的精度会有所提高;学习率大,训练时间虽短,但精度很难提高。这两个参数有点类似数据网格化参数,网格化间隔小,精度高,需要时间长,反之,精度低,需要时间短。
4 初步应用效果及分析
在VS2015环境下,笔者通过Python语言利用Theano模型,對小样本数据进行了测井岩性及测井相识别试验。试验结果表明,Theano模型能较好地实现对一般沉积条件下的测井数据的岩性识别和地震相(微相)识别。
4.1 测井岩性及测井相识别
首先,在编写样本采集软件的基础上,利用20口测井数据,每口井优选20个砂组,分3类,建立了400个样本小数据。在构建3层隐层的基础上,利用测井数据GR进行测井岩性及测井相识别,识别精度约75%。
4.2 地震相(微相)分类
首先,在编写样本采集软件的基础上,利用100km2含5口钻井,对其中一层系优选3种地震相(亚相)类型,分3类,建立了200个样本小数据。在构建了5层隐层的基础上,利用地震数据进行地震相(亚相)识别,识别精度约65%。
上述两个应用的精度都不是很高,这主要是因为:①样本数据较小,同时由于多解性的原因,所给的标签也不一定完全对,这就造成了训练困难,降低了精度;②所采用的模型及模型参数不是最优参数,还需要进一步进行优化。
5 结论
深度学习较好地实现了人类思考判断(特别是视觉判断)模式的计算机化,是人类信息技术发展进步的一个里程碑的标志。随着该项技术的不断进步和发展,必将改变人类的生产和生存模式。当前,全球整个石油行业随着油价下降,面临巨大的生存压力,国外石油勘探业务更为如此。如何在新形势、新挑战下,降低成本,提高勘探精度,成为整个行业不可避免的问题。由此,笔者提出将深度学习技术应用于石油勘探中,以提高石油勘探精度。
参考文献:
[1]陈仕云.人工智能在石油勘探上的应用[J].化工管理,2018(25):223-224.
[2]徐沐霖,邱涛.人工智能在石油勘探中的应用[J].电子世界,2017(8):142.