王良玉, 张明林, 祝洪涛, 刘 洋
(1.核工业二四三大队, 内蒙古 赤峰 024000; 2.中国核工业地质局, 北京 100013)
在地球科学研究中,地学数据常常是定性和定量数据,且不同的获取技术和获取手段直接导致了地学数据的不确定性、经验性、间接性、不完整性及数据量大等特点[1]。地质工作者面临的重要问题是如何从多源综合信息中找到地学本质的特征,并对地学问题进行研究。传统的分析方法是采用数理统计分析、聚类分析、回归分析、判别分析、因子分析和线性规划等方法分析定量数据,利用数量化理论等方法分析定性数据,从而揭示地学现象与本质之间的关系[2]。由于地球的演化过程是复杂的,未知变量比较多,且不具有某种统计分布条件,同时传统方法对多源的地学数据进行综合和定量处理存在不足,因而在实际的地质问题中传统的方法难以有效的解决问题[3]。而人工神经网络(ANNs)具有较强的学习能力,具有高度的并行结构和并行实现能力,有较好的耐故障能力、信息融合能力、综合推理能力和较快的总体处理能力,能有效解决地学数据处理中常见的困难[4],是近年来地学应用领域里的一个热门研究课题。
因此,论述人工神经网络及其在地学中的应用特点和现状,总结人工神经网络在地学中主要应用,展望人工神经网络在地学中的发展趋势,对推动地学领域数字化、智能化具有参考意义。
20世纪40年代,Warren McCulloch和Walter Pitts(1943)提出了第一个人工神经元的数学模型(MP神经元模型)[5],该模型权重值都是预先设置的,并不能学习。此后,Donald Hebb(1949)提出了第一个人工神经网络学习规则—Hebb学习规则,即连接神经元之间的突触联系强度是可变的[6]。虽然神经元的数学模型和Hebb学习假设早已提出,但是限于当时计算机的能力,直到近10年后才诞生出第一个真正意义的人工神经网络。
20世纪50年代末,计算科学家Rosenblatt(1958)推出了第一个可以学习的人工神经网络—感知器,感知器是由两层神经元组成的神经网络[7],其现场学习识别简单图像的过程在当时引起了巨大轰动。此后,许多学者和科研机构纷纷投入到神经网络的研究中,这是神经网络研究的第一次高潮。
1969年,Minsky和Papert出版了《Perceptron》一书,书中用数学方法详细地证明了感知器的弱点,指出感知器无法解决XOR(异或)这样的分类问题[8]。Minsky还认为感知器的计算层增加到两层后,计算量过大,同时缺乏有效的学习算法,因此他认为更深层的网络研究将毫无意义[8]。由于他们的悲观态度,加之当时人工智能取得的成就有限,迫使许多学者和实验室纷纷放弃了研究,人工神经网络的研究也由此进入了低潮。
20世纪80年代,Rumelhar和Hinton(1986)等提出的反向传播(Back propagation,BP)算法成功解决了两层神经网络过大的计算量问题,也轻松解决了10年前困扰神经网络界的异或问题,有力地回答了60年代Minsky对神经网络的责难[9]。同时,人工神经网络也开始进入语音识别,图像识别,自动驾驶等领域,带动了业界两层神经网络研究热潮。20世纪90年代中期,Vapnik(1995)等推出了SVM(Support Vector Machines,支持向量机)算法,有效地避免了神经网络算法需要调参、耗时低效和局部最优解的问题[10],很快打败了神经网络算法成为当时的主流。
直到2006年,Hinton首次提出了“深度信念网络(DBN)”的概念,并将多层神经网络相关的学习方法命名为“深度学习”[11]。Hinton在训练过程中增加了“预训练(pre-training)”过程,通过“预训练”可以找到一个接近最优解的权值,再采用“微调”(fine-tuning)技术优化训练整个网络[11],上述技术的运用成功解决了深层神经网络结构优化问题,大幅度减少了多层神经网络的训练时间。很快,深度学习开始在语音识别、图像识别、自然语言处理等领域获得了优异的成果,并解决了许多模式识别难题,由此开启了深度学习在工业界和学术界的研究浪潮。
值得注意的是,人工神经网络最早应用于地学领域中地球物理反演问题。20世纪80年代,大部分地球物理反演问题主要为多参数、多极值的非线性优化问题,常规的线性反演技术无法解决这类问题。此时,非线性的BP算法刚经推出,就迅速在地球物理学领域崭露头角。自1993年以来,国内才逐步研究神经网络在地球物理学中的应用研究[12]。此后,大量关于人工神经网络在地学中的应用研究相继报道,人工神经网络的应用也从地球物理学领域逐渐扩展至地学其他领域。深度学习方法提出之后,尤其是在2012年,Hinton基于CNN(卷积神经网络)的图像分类模型获得了ImageNet图像分类比赛冠军,自此,新一轮的人工神经网络研究在地学中掀起了一波浪潮,深度学习方法开始应用于地学遥感领域及其他领域。
1.2.1 人工神经网络模型
人工神经网络(ANNs)是对人脑神经元信息处理活动的模拟,是一种具有分布式并行信息处理的特征抽象数学模型,是大量简单神经元广泛相连而成的一个自适应动力系统[4]。在许多方面更接近人对信息的处理方法,信息处理以神经元之间的相互作用来实现,知识与信息存贮在神经元之间的权值当中,学习和识别取决于动态演化的各神经元连接权系数[3]。
图1显示了单个神经元的数学模型,对于某个神经元来说,假设来自神经元i的信息为Xi,它们与本神经元的互相作用强度即连接权值为Wi(i=1,…,n),神经元的内部阈值为θ。
图1 神经元数学模型图Fig.1 Diagram of neuron mathematical model
式中:Wi—第i个神经元与本神经元的连接权重;Xi—第i个神经元的输入;f—激活函数;θ—隐含层神经节点的阈值。
图2显示了一个经典3层次的神经网络结构,包括输入、隐藏和输出层。结构图2中,每个小圆圈表示一个神经元,每条连接线表示一个不同的权重(权值),可由训练得到,各神经元之间通过相互连接形成一个网络拓扑结构。
图2 神经网络结构图Fig.2 Diagram of neural network structure
人工神经网络是一个独立系统,其结构由神经元、互连模式和学习规则构成。运行状态时,人工神经网络的工作就是建立模型和确定权值。信号输入时,神经元的输入连接将输入信号的连接强度放大,每个输入量对应一个相关联的权重。经过权重的输入量化后,通过激活函数相加求得加权值之和,并计算出输出量。信号输出时,神经网络会进行学习或训练,在该过程中,神经网络将会依据输出误差不断调整神经元权值和阈值,直到输出误差达到预期而结束[13]。正是通过这种学习规则,神经网络才能调节权值向网络的目标方向移动,以达到不同的要求,如模式识别,分类,控制和优化等。正是如此,同一神经网络才会因学习方式和内容实现不同的功能。
人工神经网络具有学习能力,因此,它可以发展知识,甚至超过设计者已有的知识水平。一般来说,神经网络的学习(或训练)模式分为两类,一类是有监督(supervised)学习,另一类是无监督(unsupervised)学习。有监督学习是利用已知的样本标准建立一个数学模型,并对未知样本进行分类或预测;无监督学习只设定学习方式或某些规则,学习的内容会随输入信号情况而变化,这种学习方式可以发现环境的特征和规律性,更近似于人脑的功能。
1.2.2 人工神经网络的基本特征
人工神经网络是一种模仿人脑神经网络结构和功能的信息处理系统,它具有以下4个基本特征:
1) 非线性:非线性关系普遍存在于自然界,人脑的智慧也是一种非线性现象。人工神经元与人脑神经元类似,存在激活或抑制二种状态,在数学上就是一种非线性关系[14]。
2) 非局限性:神经网络是由许多神经元广泛连接而成,它的行为是由神经元的特征、神经元之间的相互作用和相互连接共同决定。神经元之间的大量连接模拟了人脑的非局限性, 联想记忆就是非局限性的典型[14]。
3) 非常定性:人工神经网络具有自学习、自组织、自适应的能力。它处理的输入信息可以存在各种变化,同时它本身的网络结构和节点权值也在不断调整,可用迭代来描述它的演化过程[14]。
4) 非凸性:非凸性是指系统的能量函数具有多个极值,故系统具有多个稳定的平衡态,这将决定系统的演化方向[14]。如人工神经网络的训练或者优化过程就是能量函数逼近极值的过程,多个极值将影响网络的演化方向。
1.2.3 人工神经网络的拓扑分类
人工神经网络的分类有多种方式,常见的分类方式有:性能分类、拓扑结构分类、学习方法分类和连接突触性质分类。按照网络的拓扑结构,可以分为前馈网络、反馈网络。
前馈网络:一般指前馈神经网络,网络中神经元分层排列。各神经元只接受前一层神经元的输入,并输出给下一层,各层之间无反馈,可以用一个单向无环图表示。该网络的信息处理是通过简单非线性函数的多次复合实现的,网络结构简单,容易实现,是目前应用最广泛、发展最迅速的人工神经网络之一[15]。
反馈网络:又称自联想记忆网络,网络内神经元间有反馈,可以用一个无向的完备图表示。它的信息处理是通过动力学系统理论处理来实现,信息处理状态是变化的,网络的稳定性与联想记忆功能有关,常见的反馈网络有HN网络和波耳兹曼机[15]。
目前已有上百种人工神经网络模型被提出,随着应用研究的不断深入,新的人工神经网络也在不断推出。其中,常用于地学领域的人工神经网络模型有以下几种(表1),其中,深度信念网络(DBN)和卷积神经网络(CNN)是近年来提出的深度学习网络,目前已开始在地学领域中应用。
表1 地学领域常用人工神经网络模型对比Table 1 Comparison of common used artificial neural network models in Geosciences
不同人工神经网络模型具有以下差别:
1)BP、HN、RBF和KN网络相较于深度学习网络(DBN、CNN)而言,其重要区别在于前者隐含层一般不超过2层,而深度学习网络含多个隐含层,能够针对不同概念(多维度)提取特征,来学习更有用的特征,从而最终提升分类或预测的准确性。
2)BP网络为监督学习模式,HN 、KN、DBN网络属于无监督学习,RBF网络首先无监督学习求解隐含层基函数的中心与方差,之后有监督学习求解隐含层到输出层之间的权值,CNN网络可进行可监督和无监督两种模式。
3)BP、RBF网络结构相同,属于前向多层网络,区别在于BP网络隐藏节点选用Sigmoid函数为激活函数,线性函数为基函数,RBF选用距离函数为基函数,径向函数作为激活函数,还原能力优于BP。
4)BP、RBF、KN和网络CNN网络属于前馈神经网络,HN网络是一种循环神经网络,属于单层反馈网络,有连续性和离散型之分,DBN网络是由多个无监督限制玻尔兹曼机(RBM)和一层有监督的反馈网络组成的深层结构。
5)DBN、CNN网络均属于深度学习网络,DBN处理一维数据建模较好,如语音,CNN处理二维数据较好,如图像。
人工神经网络模型在地学领域的应用特点通常具有模型自身智能特点,如联想记忆、分类与识别、优化计算、和非线性映射等;同时还具有处理地学问题时的学科特点,如地学数据的时空属性和不确定性、地学事件区域上的异质性、地质过程的复杂性和地学数据的多解性等,在处理这些地学数据时,常需要结合数据的优化理论和技术,如遗传算法、模拟退火算法、模糊数学方法、粒子群优化算法、马尔科夫链蒙特卡洛方法、蚁群算法等。
1) 联想记忆:地学数据具有噪声干扰、数据不完备和不确定的特点,因此需要将不完整的信息和噪声干扰中恢复原始的完整的信息,对缺损地质空间数据的插值、重建等。处理这类问题时,可用人工神经网络进行联想记忆尝试,通过预先存储信息和学习机制进行自适应训练,从而实现对外界刺激和输入信息联想记忆。
2) 分类与识别:地学中对数据特性的识别(如多源、多尺度、高维、时空异构等)、变量之间的关系识别以及数据解译等识别,是地学领域的主要应用之一,它主要是在样本数据空间中找到符合分类要求的分割区域。
3) 优化计算:优化计算是地学领域最重要的应用,常用于地球物理的特征参数提取、参数反演等,主要是将优化约束条件(与目标函数有关)存储在神经网络的连接权矩阵当中,设置一组随机数据作为起始数据,通过神经网络的动态系统方程,寻找一组参数组合,使该组合与确定的目标函数达到接近,当网络的状态趋于稳定时,神经网络方程的解作为输出优化结果。
4) 非线性映射:由于地球的起源、演化和发展过程的不可重复性和地球科学技术发展的历史原因,地学数据具有多尺度、多时段、多精度、多比例尺和多解性等特点,地质观测数据与研究对象的本质内在之间就具有非线性特征,因此,地质领域应用中均使用了其非映射功能[2]。
20世纪80年代末,在国外掀起了一股地球科学领域人工神经网络研究应用的浪潮。我国也在90年代初也开始启动这方面的研究工作,并且取得了较好的成果。目前人工神经网络模型已广泛的应用于判别分类、模式识别、预测评价、数据处理(特征提取、函数逼近、数据插补和数据压缩)等方面。下面就人工神经网络在地球科学中的应用做简单介绍。
地球科学研究中,常常会遇到一些判别分类问题。过去常用判别分析方法,该方法分类方式是构造一个统一不变的数学函数形式,用统计量来的度量其分类效果,允许在一定范围内判错(错分)已知样品,待判样品只能且必须归属于某个已知类别。而人工神经网络判别方法与传统方法相比,不仅能对确定性因素进行分类,还能对非确定性变量进行分类,可以很好地模拟人类地质专家的判别效果:已知样品的误判率为零,待判样品的归属既可以是某个已知类别,又可能不属于任何已知类,还可以亦此亦彼,应用效果明显优于传统方法。并且,随着模糊神经网络理论的建立和发展,神经网络科研对非确定性指标进行模糊分类。
早期应用于地学领域分类的人工神经网络模型主要为SOM网络、RBF网络和ART网络等。如蔡煜东等(1994)利用SOM神经网络模型对碳酸盐型锰矿的菱锰矿进行分类,获得的结果与传统的多元统计方法获得的结果一致[16]。Morlini(1999)采用k-均值算法的径向基函数网络(RBF)对野外调查采集数据进行处理,效果比判别分析好[17]。罗先香等(2001)利用自适应共振理论ART构建的A-K网络对水资源进行分类,与模糊综合评判和灰色聚类方法相比,其效果最佳[18]。
近几年来,随着深度学习的提出之后,深度学习神经网络模型用于地学领域判别分类呈现增长态势。如张野等(2018)将深度学习网络应用于岩石图像的岩性自动识别与分类方法,自动识别率可以达到80%以上,部分结果甚至可以达到95%以上[19]。刘大伟等(2016)利用深度信念网络(DBN)对高分辨率遥感影像进行了基于光谱- 纹理特征的分类,与传统方法相比DBN对于高分辨率遥感影像的空间分布规律的挖掘更加准确,分类准确度高[20]。张春菊等(2019)测试了基于双卷积池化结构的3D-CNN网络对3D遥感影像的分类,测试结果与其他深度学习模型相比,设置参数少,计算效率高,且分类精度高[21]。
模式识别实际上也是一类判别分类,它不是依据对象本身的属性特征或组成结构进行分类,而是用计算的方法对表征事物或现象的各种形式(如数值、文字和逻辑关系)的信息分析和处理,来对事物或现象进行描述、辨认、分类和解释,它处理信息的过程更接近人脑,是信息科学和人工智能的重要组成部分[22]。目前,模式识别的研究方法有两种:模式识别方法和结构模式识别方法。近年来,随着人工神经网络在模式识别中广泛应用,已逐渐取代了传统的模式识别方法。
高通滤波器的三维仿真,电容和电感的值可以参考ADS中的数值,通过MIM电容和螺旋电感的计算公式估计电容和电感的体积大小 [6]。为了降低微带线拐角处存在的特性阻抗不连续性,进行了削角处理[7]。三维设计模型如图5所示。
目前,人工神经网络在模式识别上已成功应用于地球物理勘探应用领域。在岩性识别方面,范训礼(1999)将神经网络方法引入测井资料的处理和解释中,实现了砂岩、泥岩和灰岩的自动识别[23]。张莹(2009)在处理钻井火山岩层段时,通过SOM神经网络对经过主成分分析的测井数据进行识别分类,取得了良好的识别效果[24]。在储层识别方面,罗利(1999)从常规测井资料中提取出指示孔洞、裂缝发育程度及指示储层均质性和纵向变化情况的测井响应平均值、均方差、关联度及残差等参数,组成识别储集类型的样本利用3层BP神经网络,对储集类型进行识别,识别结果与成像测井识别结果和岩心分析结果吻合[25]。赵佐安(2002)在准噶尔南部区块的测井资料时,采用电阻率特征判别法、三孔隙度重叠法、阵列声波能量法、纵横波时差法、声阻抗与声波时差重叠法、交会图法以及神经网络识别技术的合理组合进行了有效识别,准确地识别出该地区低阻油气层[26]。
此外,人工神经网络还应用于卫星影像图片上的地形、地貌、地物、构造的识别和解释。如在陆地卫星图像、孔径雷达图像和微波图像等采用人工神经网络进行识别取得了较好的应用。Yoshihisa H等(1993)采用无导师学习矢量量化器(LVQ)模型,并结合最大似然算法对合成孔径雷达图像进行识别分析试验,其效果较传统常用的滑动平均法更好[27]。Miller D M(1995)采用SOM模型对遥感图像进行了识别分类,获得了较好的效果[28]。Baraldi A(1995)利用ART网络模型对意大利北部Modena地区的卫星图像进行了识别分类,其效果优于常用的ISODATA法[29]。
近年来,深度学习广泛应用于遥感图像识别领域。如张鑫龙等(2017)为提高遥感影像的变化检测精度,利用深度学习识别影像变化区域,该方法在变化检测精度方面优于对比方法[30]。另外,人工神经网络模型还可应用于显微镜图像识别领域,实现矿物相、晶体结构、岩石组构等的自动识别。
传统的定量预测与评价方法主要有统计学方法和数值模拟法。应用传统方法都需要假设(如多元统计中的样本正态分布假设、地质统计学中的本征假设)或简化的约束条件(如数值模拟中的控制参量的简化与取值等)作为建立数学模型的基础,因而也就造成了其结果与地质事实存在差距。相比而言,人工神经网络对假设条件不作要求,也不要求提前建立预测和评价的数学模型。它只要求提供足够的学习样本(实例),通过自学习过程,自己会总结出一套规则(常常是非线性的定量关系),并以隐式方式存储于网络权阵中。
目前,人工神经网络已可以在储层预测、成矿预测、地质灾害预测、地震预报等有广泛的应用。如Morgan K(1990)曾采用BP网络对美国怀俄明州香农盆地的烃类资源进行预测评价,获得的结果与实际情况吻合[31]。克拉里西等(1995)利用BP网络对矿床可采储量进行了预测计算,与普通克立格法和条件模拟法计算结果相比,BP网络更适合于资源储量的计算,且其估算整体精度随训练集的增加将大大提高[32]。李晓晖等(2014)尝试使用采用人工神经网络针对提取的多种三维控矿因素法进行三维成矿定位预测,预测能很好的定位出已知矿体[33]。项月文等(2016)选取闽粤赣交界及东南沿海地区的地震目录作为研究样本,提取出7个测震学前兆指标作为预报因子,构建GA-BP神经网络进行训练和仿真,震例检验结果显示,该方法的震级预测精度较BP神经网络有较大提升,具有对地震震级预测的可行性[34]。
除了上述人工神经网络模型外,近年来深度学习在地学预测领域也有较多的报道。如陈进等(2020)将山东大尹格庄金矿三维矿体转为二维图像,采用卷积神经网络在矿体二维图像中提取找矿指标,并构建模型于矿化富集地段的定量关联,与人工找矿指标预测模型的对比,该预测模型准确性大幅提升[35]。陈建平等(2019)采用深度卷积神经网络模型挖掘Mn元素与松桃—花垣地区不同的控矿要素的空间耦合关系,以此训练并对该区沉积型锰矿进行二维矿产预测[36]。向杰等(2020)基于三维地质建模技术以及成矿信息定量提取技术,构建了区域找矿信息量的预测数学模型,并采用机器学习随机森林算法,计算出研究区成矿概率分布,以此圈定出5 个找矿远景区[37]。张国印等(2020)将频谱分解与深度学习相结合,采用卷积神经网络挖掘基于小波变换的二维时频谱图中的高频和低频信息进行储层预测,结果表明深度学习反演预测岩性和储层类型的分辨率和精度更高,能够识别小河道砂体,优于常规地震反演方法[38]。
在地学领域,地学数据具有多源、异构、海量的特点,同时地学原始数据集合的维度较高,在处理时,地学信息数据既不完整,又无章可循,有时数据还存在假象和矛盾,给信息处理带来了很大的困难,而神经网络却能解决这些问题,并快速地给出识别和判断。此外,神经网络系统还具有较好的容错性、鲁棒性和自适应性,可广泛应用于特征提取、参数反演、数据插补和数据压缩等领域[39]。
地学原始数据往往具有许多线性或非线性特征,在对复杂的地学数据进行空间降维、完成重要特征提取,选择反应地质数据本质特征是众多数字地质专家与学者的主要研究方向。目前,地学数据特征提取的研究主要集中地表、遥感图形特征,地化物探异常特征和矿产预测模型参数变量等。如张耀华(2019)采用基于遥感像素的SOM网络算法,结合特征提取对SOM进行优化,可对同类遥感数据的进行快速提取和分类[40]。白林(2018)对15种常见岩石的图像数据采用卷积神经网络构建岩石识别深度学习模型,并在学习过程中能有效提取岩石的矿物成分特征,取得了较好的岩石识别效果[41]。许东丽等(2019)基于随机特征选择卷积神经网络(RanSelCNN)对遥感影像配准,结果表明该方法能提取更多的特征点,有效降低错误匹配率,能明显提高卫星影像配准的精度[42]。朱培民等(2019)采用卷积神经网络(CNN)和长短期记忆(LSTM)模型混合结构神经网络模型,训练输入地震速度谱图像并输出“时间- 速度”对序列,测试结果表明,该方法提取的地震速度具有更高的精度[43]。
3.4.2 参数反演
由于地质体和地质条件之间的复杂关系,同时地学数据具有的多解性特点,导致地质体与观测数据间存在着相当复杂的非线性关系。正因如此,很难使用一般的数学方法(如回归分析)对这些非线性参数进行反演。而神经网络具有强大的非线性处理功能,在参数反演时,不仅会考虑地质体的定量因素,还会考虑定性因素,在参数的选取上具有强大的优势。大量研究表明,神经网络的学习样本越多,其对预测的未知参数越准确[44]。
目前,地学领域中应用参数反演主要集中在地震参数反演、储层参数反演、地震反演、遥感数据参数反演、测井资料渗透率参数反演等方面。如田景文等(2002)基于改进的模拟退火人工神经网络对(薄互)储层参数进行反演,反演参数通过实例验证了该方法的正确性和实用性[45]。陆文凯等(1996)基于BP神经网络逼近反演问题中的正演和反演过程,并根据地震反演的具体问题,给出该系统的能量函数,对实际资料的测井速度外推结果表明,此法具有好的应用前景[46]。孙致学等(2004)研究了改进的BP网络对测井资料参数的反演,该模型定量计算了川西某气田多口井的渗透率值,其解释结果及精度均令人满意,取得了较好的实际应用[47]。奚先等(2018)采用卷积神经网络对散射波场进行网络深度学习并反演成像,获得的图像(反演结果)非常直观容易辨识,可大致辨识出测试模型中各散射点的准确位置[48]。刘力辉等(2019)基于深度学习的方法使用分频地震数据对深水陆坡水道沉积井岩相曲线进行反演,结果表明,与其他反演方法相比,该方法反演结果与测井曲线吻合,准确度和分辨率更高[49]。
3.4.3 数据插补
人工神经网络作为解决非线性问题强有力的工具,尤其是在人工神经网络插值及对非线性动力系统逼近能力等方面的研究是人工神经网络理论研究的热点。在地学研究中,处理区域性资料常遇到“不完备数据”其他的问题,利用人工神经网络可充分利用历史资料和已知信息,能在尽量减小估计误差的条件下对缺失数据进行预测或插补,能有效地提高预测质量。
目前,地学领域应用数据插补主要集中在空间地球化学数据插补、水文资料的插补延长、土壤元素空间插值等。如何凯涛等(2005)利用RBF网络对不完整的地球化学数据进行插补,获得了良好的效果[50]。吴媛等(2005)采用人工神经网络双向时间序列插补模型研究了水文资料的插补延长问题,利用缺测时段前后已知时段水文资料,插补出缺测水文资料,应用流量较大年份的径流资料预测未知年份的径流资料,结果表明该模型对水文资料的插补或对未知年份的径流量都能够进行较好的预测[51]。董敏(2010)研究土壤有效锌的空间分布问题时,应用基于遗传算法的RBF网络对该元素属性值进行空间插值,结果表明,该方法误差最小,插值精度最高[52]。郑浩等(2020)基于深度学习卷积神经网络(CNN)对缺失地震数据进行地震数据插值,该方法通过卷积算法提取地震数据的特征信息,并利用池化层实现数据压缩降维,引入修正线性函数(ReLU)提高模型的非线性表达能力,再通过反卷积层恢复数据,与现有技术相比,测试结果表明该方法能有效实现地震数据插值,且精度更高[53]。
3.4.4 数据压缩
数字图像压缩是指以较少的数据有损或无损地表示原来像素矩阵的技术,实际上就是减少图像数据的冗余,如时间冗余,空间冗余,频谱冗余,从而用更加高效的格式存储和传输数据。图像的压缩系统的基本过程主要为编码,量化,解码,而图像压缩的编解码问题实质就是神经网络过程中的映射与优化的问题[54]。
在人工神经网络中,输入层到隐藏层之间的映射关系相当于编码器,用于对于图像信号进行线性或者非线性的变换,而隐藏层到输出层之间的映射关系相当于编码器,通过对于压缩后的信号数据进行反变换来达到重建图像数据。压缩比率S=输入层神经元个数/隐藏层神经元节点数。人工神经网络的输入层与输出层的神经元节点数从理论上说是一致的,而隐含层的神经元数目比输出层输入层的数目要少得多。这样理论上就可以通过调节隐藏层神经元节点数目来达到对于不同图像压缩比的效果。
目前,人工神经网络主要应用于地学领域中图像数据的压缩、重建。如张锐菊等(2002)基于多层前馈神经网络对遥感图像进行压缩,取得了较好的压缩效果[55]。冯燕等(2004)利用自组织映射(SOFM)神经网络对机载64波段多光谱遥感图像数据进行压缩测试,结果表明,无论是对训练内图像还是训练外图像,均取得了较好的压缩效果,平均压缩比达到了3.2以上[56]。蒋同海等(2018)基于网络删减和参数共享结合的深度神经网络,删减MNIST数据集中权重低于阈值的网络连接,保留重要的连接;然后使用聚类算法将删后每层的参数进行聚类,每簇内的各个参数共享该簇的中心值作为其权重,实验获得9.5×和12.1×的压缩结果[57]。
当前,人工神经网络已广泛应用于地学的各个领域,在判别分类、模式识别、预测评价以及信息数据处理上均取得了令人满意的结果,显示出人工神经网络在地学领域中有广泛的应用前景。特别是对于地学领域信息数据存在多源、多尺度、高维、时空异构,具有噪声干扰、数据不完备和不确定等固有的属性,人工神经网络能有效并快速地给出识别和判断,具有无可比拟的天然优势。当然,未来人工神经网络与地学领域在更深层次上有机结合,还需结合地学领域中实际特点,将人工神经网络对知识的表达模型化和形式化。另外,随着人工智能领域发展的大量优化理论和技术,如遗传算法、模拟退火算法、模糊数学方法、粒子群优化算法、马尔科夫链蒙特卡洛方法、蚁群算法等,未来将这些方法结合到人工神经网络的学习规则中,将成为解决地球科学中非线性问题的利器。
随着深度学习的提出和计算机硬件能力的飞速提升,具有超强学习能力、更深层次的神经网络模型也在不断的涌现。目前,深度学习已经开始尝试探索处理大量地学领域的图片数据,基于深度学习的语音识别也已经开始应用于地质语音勘查。未来,装上先进人工智能的无人机结合矿物特有的几何特征可进行“刷脸识别”:如结合统计学、透射光技术进行岩性定名;结合统计学、反射光技术进行岩相定名。未来,人工智能进一步融合传统成熟的技术和方法,将会给地质行业带来巨大的变革。