程国建++刘丽婷
摘要:近年来,机器学习领域中的“深度学习”开始受到国内外学者的广泛关注。借助深度学习,具有多处理层结构的计算机模型可通过多层抽象来学习数据表征。这些方法推动了语音识别、视觉识别、目标检测以及许多其它领域的技术发展。深度学习被应用到计算机视觉、语音识别、自然语言处理、在线广告等领域,并取得了良好效果。将计算机技术与地质勘探相结合,在岩石处理方面已取得了不少成果,不断有新的或者改进方法用于提高处理效率和改善效果,以更好地投入到实际生产中去。针对目前传统的岩石薄片图像处理方法,试图将深度学习中典型的两类算法模型:深度信念网络(Deep Belief Networks,DBNs)、卷积神经网络(Convolutional Neural Networks,CNNs)引入到岩石图像的处理中,分析算法在操作中的可行性及优势。
关键词:深度学习;深度信念网络;卷积神经网络;岩石图像处理
DOIDOI:10.11907/rjdk.161408
中图分类号:TP317.4
文献标识码:A文章编号文章编号:16727800(2016)009016304
基金项目基金项目:陕西省自然科学基础研究计划项目(2014JQ5193);西安石油大学青年科技创新基金项目(2014BS13)
作者简介作者简介:程国建(1964-),男,陕西扶风人,西安石油大学计算机学院教授,研究方向为机器学习、模式识别、图像处理与数据挖掘;刘丽婷(1991-),女,江苏靖江人,西安石油大学计算机学院硕士研究生,研究方向为智能计算与可视化技术。
0引言
机器学习已经逐渐渗透到现代生活的方方面面,从网页搜索到社交网络内容过滤,再到电商推荐,在相机、智能手机等电子产品中的应用也越来越多。自20世纪80年代以来,机器学习在算法、理论和应用等方面都获得了巨大成功。从2006年起,国外开始了深度学习方面的深入研究,并取得了一定的阶段性成果。深度学习(Deep Learning,DL)[1]的概念来源于人工神经网络,所谓“深度”是含多隐层的感知器。深度学习可以将低层次特征有效组合起来,逐步进行学习与特征提取,形成能够表示属性类别的抽象高层次特征。
传统的岩石薄片图像鉴定以肉眼观察和描述为主,存在一系列问题,如实验周期偏长、定量困难、效率较低、受主观影响较大等,在低孔隙度、低渗透率岩心条件下存在问题很多,因此已不能满足现场测井资料解释评价的需要。针对目前岩石分析工作中存在的实际问题,应用现代图像处理以及人工智能技术领域的深度学习算法对岩石薄片图像进行矿物识别、信息提取、岩石分类、岩心重构、特征标注等处理极具理论和现实意义。人工神经网络因其多隐层结构而具有良好的特征学习能力,能将数据本质更好地表现出来,对数据的可视化和模式分类十分有利。这对于测井解释中的岩石物理研究是非常必要的。同时,深度学习模型的层次、参数多,容量大,满足了岩石图像分析中海量数据的处理需要。
1深度学习(Deep Learning)
根据加拿大多伦多大学教授Geoffrey Hinton 2006年在《Science》上发表的文章[2],以及Yoshua Bengio、Yann Lecun等人的相关工作,深度学习逐渐被人们关注。“深度学习”指多层的人工神经网络和训练方法。一层神经网络会把大量矩阵数字作为输入,通过非线性激活方法取得权重,再产生另一个数据集合作为输出。其类似生物神经大脑的工作机理,通过合适的矩阵数量,将多层组织链接在一起,形成神经网络“大脑”来进行精准复杂的处理,并通过“逐层初始化”(layerwise pretraining)克服深度神经网络在训练上的难度[3]。用较少的参数表示复杂函数是多层优势的体现。深度学习将具有多隐层的机器学习模型和海量的训练数据构建起来,用“深度模型”的手段达到“特征学习”的目的,最终提升分类或预测的准确性[4]。
在对岩石图像的特征信息提取、岩石分类、岩心重构、特征标注、孔隙识别等处理中运用了大量图像处理与人工智能技术,经过大量反复实验表明,图像处理技术在测井实际应用中已经有了良好基础[57]。将深度学习运用到岩石图像的处理分析中,具有重要的研究意义与较大的发展空间。
深度学习模型有多种,如深度信念网络、卷积神经网络、自动编码器等,通过与其它方法的结合改进,又出现了一些新方法。深度学习的各类算法模型有着各自的特点与优势,在语音、图像、自然语言、在线广告等领域的应用取得显著进展[8]。Volvo采用NVIDIA车载深度学习电脑来提供更安全的驾驶服务;中国科学院计算机技术研究所发布了全球首个能“深度学习”的神经网络处理器芯片,名为“寒武纪”;不久前,谷歌DeepMind开发的人工智能围棋程序AlphaGo战胜世界冠军李世石,在深度学习领域取得了重大突破。但在岩石图像处理中采用深度学习方法仍不多见,人们大多还是采用传统方法,如滤波算法、边缘检测、决策树、支持向量机等。通过阅读学习大量有关深度学习的资料,结合岩石图像的实际特征,分析各类算法在岩石图像处理中的可行性是本文的主要目的。
2深度信念网络及其在岩石图像处理中的应用
2.1深度信念网络简介
深度信念网络(DBNs-Deep Belief Networks)是无监督的概率生成模型,2006年由Hinton等人提出。从结构上看,DBNs是由多个无监督的受限玻尔兹曼机(RBM-Restricted Boltzmann Machines)堆叠而成,最后还有一层有监督的反向传播BP网络。对于图像而言,可视层与像素层对应,隐层与特征描述因子对应。
DBNs需要经过预训练(per-training)和微调(fine-tuning)两个阶段:在预训练阶段采用无监督方式训练第一层的RBM,固定其权值和偏置值,将该层的输出作为第二层RBM的输入,再训练第二个RBM,然后将其堆叠在第一个RBM的上方,重复堆叠多次,构建DBN网络的初步模型。在微调阶段使用Contrastive Wake-Sleep(对比唤醒-休眠)算法修改权重,使每一层的RBM特征向量映射达到最优。
图3中的y1部分是在最顶层RBM中参与训练的标签。微调过程是一个判别模型。
2.2DBN在岩石孔隙识别中的可行性分析
DBN模型是一种逐层贪婪预训练的深层神经网络模型,它克服了传统神经网络在训练上的难度,挖掘隐藏在图像像素特征之中的高维抽象特征。它是深度神经网络模型的典型代表,受到了学者们的广泛关注[910]。在现有研究成果中,已有将模糊C均值聚类和BP神经网络结合起来处理铸体薄片图像的方法[11],达到了良好的孔隙度识别效果;还有学者提出岩石图像分类的自动模式识别方法[12],通过神经网络建立特征空间与岩石图像之间的映射关系,能够快速准确地识别岩石图像类型。由此可见,利用神经网络进行岩石图像的处理已有不少具体应用,而深度信念网络是在传统神经网络基础上加以优化改进,例如:根据人脸特征提出基于Gabor小波与深度信念网络的人脸识别方法[13],取得了较高的学习效率和很好的识别效果;将深度信念网络应用于轴承的故障识别[14];运用DBN模型,将环境和气象数据编码,对特定区域进行PM2.5的检测等[15]。因此,基于现有的岩石图像处理和深度信念网络的研究成果,针对岩石图像的孔隙提取问题,结合传统的图像处理技术,尝试采用DBN模型进行特征提取。该方法不仅在理论层面上具有可行性,在具体应用中也具有现实意义。拟定技术路线如图4所示。
分析应用步骤如下:①将岩石薄片图像转换为CIE lab彩色空间;②采用图像分割技术将预处理后的图像分割为目标和背景两类;③在目标和背景中各选取10组特征向量,提取特征;④随机选取部分特征向量送入DBN模型中进行训练;⑤选取500组256×256的图像,将分割后的图像整幅送入训练好的神经网络中,运用训练好的网络进行岩石孔隙的识别。
3卷积神经网络及其在岩石图像处理中的应用
卷积神经网络(CNNConvolutional Neural Networks)[16,17]是第一个真正成功实现多层网络结构的学习算法。它提高普通前向BP算法训练性能的方式是利用空间关系减少需要学习的参数数目。其权值共享网络结构与生物神经网络类似,网络模型的复杂度在一定程度上得到了降低,并且权值数量也有所减少。该优势集中体现在网络的输入是多维图像时,能够直接将图像作为网络输入,避免了传统识别算法中复杂的特征提取和数据重建过程。
在卷积神经网络中,输入图像特征图的产生是由输入图像本身与卷积滤波器进行卷积得到的,再提取图像中的局部特征。图6中的C1层(采样层)即为经过滤波和加偏置操作后得到的特征映射图,之后再进行像素求和、加权等操作产生S2层(亚采样层)的特征映射图。依次进行操作,最后将得到的多个特征映射转化成特征向量,以完全连接的方式输出。CNN的训练算法与传统的BP算法类似,主要有向前传播和向后传播两个阶段:第一阶段主要是从样本集中选取样本输入网络中,并计算实际的输出结果:第二阶段相当于调整阶段,用极小化误差法反向传播来调整矩阵权值,目的是缩小实际输出与理想输出的差。
卷积神经网络的主要优势为:①输入图像和网络的拓扑结构有较高吻合度;②特征提取和模式分类能够同时进行并在训练中产生;③权重共享减少了网络的训练参数,使神经网络结构具有更强的适应性。鉴于卷积神经网络的特点,已有基于CNN的各类具体应用:有学者提出了一种基于卷积神经网络的视频图像失真检测及分类方法[18],在目前的大数据背景下,采用卷积神经网络对高分辨率遥感影像进行分类[19],提高了分类精度;还有将卷积神经网络应用到植物叶片、商品图像、奶牛个体等分类中[2022]。岩石图像数据集较大,内部结构复杂,借鉴现有的研究成果,采用卷积神经网络根据岩石之间的不同属性对岩石图像进行分类。
基于CNN的岩石薄片图像分类方法如下:①输入层。当原始图像不是灰度图像时,首先进行灰度化;②C1层。C1层是一个特征提取层,获得二维特征图,卷积得到的结果先经过激活函数(一般采用Sigmoid函数)y=Sigmoid(wx+b)进行计算,再将计算所得作为特征值赋予C1层的某个神经元。运算中x为图像子块,w为卷积核,b为偏置项,y为输出;③S1层。S1层是子采样层,子采样的计算过程为y=Sigmoid[w·sum(xi)+b][]xi∈x;④C2层。C2也是一个特征提取层,感受进一步扩大,其将S1中的特征图进行组合输入再作卷积得到,相当于将原始图像翻倍;⑤剩余卷积层与子采样层。所提取的特征随着深度的增加更加抽象;⑥输出层。输出层与S3是全连接,每个神经元都与输出的一个神经元相连。S3到输出层的映射相当于使用该向量进行分类。
4结语
本文在当下热门的深度学习的环境背景下,重点介绍了深度学习的基本模型。从岩石图像处理的角度出发,针对传统岩石图像处理存在的问题,将深度学习中的特征和分类器结合在一起,根据数据学习特征,提出了基于DBN的岩石孔隙识别方法和基于CNN的岩石图像分类方法。分别介绍了两种模型的基本结构,拟定了岩石图像处理的技术路线及框架。在参考了诸多应用实例后,通过分析,证明了本文提出的方法在具体应用中的可行性和可操作性。深度学习能够更好地表示数据特征,并在大规模训练数据上取得更好的效果,减少了手工设计特征的巨大工作量,使用起来也非常方便。
参考文献参考文献:
[1]Mf J. Scientists see promise in deep learning programs[N].The New York Time,20121123.
[2]HINTON G E, SALAKHUTDINOV R.Reducing the dimensionality of data with neural networks[J].Science,2006,313(5786):504507.
[3]MOHAMED,HINTON G E,PENN G.Understanding how deep belief networks perfom acoustic modeling[M].kyoto:ICASSP,2012.
[4]孙志军,薛磊,许阳明,等.深度学习研究综述[J].计算机应用研究,2012(8):28062810.
[5]SWARUP CHAUHAN, WOLFRAM RHAAK, FAISAL KHAN,et al. Processing of rock core microtomography images: using seven different machine learning algorithms[J].Computers&Geosciences 2016(86):120128.
[6]HEIKO ANDR A,NICOLAS COMBARET,JACK DVORKIN,et al.Digital rock physics benchmarks—part I: imaging and segmentation[J].Computers & Geosciences,2013(50):2532.
[7]HEIKO ANDRA, NICOLAS COMBARET, JACK DVORKIN,et al. Digital rock physics benchmarkpartⅡ: computing effective properties[J].Computers&Geosciences,2013(50):3334.
[8]余凯,贾磊,陈雨强,等.深度学习的昨天,今天和明天[J].计算机研究与发展,2013(9):17991804.
[9]HINTON G E, OSINDERO S, THE Y. A fastarkof learning algorithm for deep belief nets[J]. Neural Computation, 2006,18(7):15271544.
[10]HINTON G E.Learning multiple layers of representation[J].Trends in Cognitive Sciences, 2007,11(10):428434.
[11]程国建,杨静,刘烨.结合模糊C均值聚类与BP神经网络的岩石孔隙识别方法[J].电脑知识与技术,2013(30):68726873,6876.
[12]郭超,刘烨.多色彩空间下的岩石图像识别研究[J].科学技术与工程,2014(18):247251,255.
[13]柴瑞敏,曹振基.基于Gabor小波与深度信念网络的人脸识别方法[J].计算机应用,2014(9):25902594.
[14]单外平,曾雪琼. 基于深度信念网络的信号重构与轴承故障识别[J].电子设计工程,2016(4):6771.
[15]郑毅,朱成璋. 基于深度信念网络的PM_(2.5)预测[J].山东大学学报:工学版,2014(6):1925.
[16]LECUN Y, KAVUKCUOGLUK, FARABET C. Convolutional networks and applications in vision[C].IEEE International Symposium on Circuits and Systems ,2010:253256.
[17]KRIZHEVSKY A, SUTSKEVER I, HINTON G E. ImageNet classification with deep convolutional neural networks[C].Advances in Neural Information Processing Syetems, Annual Conference, Lake Tahoe, Nevada,2012:10971105.
[18]邬美银,陈黎,田青.基于卷积神经网络的视频图像失真检测及分类[EB/OL]. http://www.cnki.net/kcms/detail/51.1196.TP.20151028.1119.010.html.
[19]曹林林,李海涛, 韩颜顺,等.卷积神经网络在高分遥感影像分类中的应用[EB/OL].http://www.cnki.net/kcms/detail/11.4415.p.20160127.1150.040.html.
[20]龚丁禧,曹长荣.基于卷积神经网络的植物叶片分类[J].计算机与现代化,2014(4):1215,19.
[21]贾世杰,杨东坡,刘金环. 基于卷积神经网络的商品图像精细分类[J].山东科技大学学报:自然科学版,2014(6):9196.
[22]赵凯旋,何东健.基于卷积神经网络的奶牛个体身份识别方法[J].农业工程学报,2015(5):181187.
责任编辑(责任编辑:黄健)