杨庭伟,冉孟坤,李静和,姜洪亮,4,5,卢超波,4,5
(1.桂林理工大学 地球科学学院,广西 桂林 541000;2.广西交科集团有限公司 隧道与岩土工程研究院,广西 南宁 530007;3.广西壮族自治区公路隧道安全预警研究中心,广西 南宁 530007;4.广西道路结构与材料重点实验室,广西 南宁 530007;5.高等级公路建设与养护技术、材料及装备交通运输行业研发中心,广西 南宁 530007)
当前,我国隧道及地下工程建设迅猛发展,投入运营的隧道超过35 000座,总长度超过37 000 km,[1]。而根据我国地貌特点及国民对生态环保的要求,公路、铁路及城市地铁的隧道建设将是交通网络功能最优化选择之一,未来我国隧道建设量依然会保持较高增长水平[2]。国内外统计表明,受外部恶劣环境及内部复杂荷载失衡等因素影响,隧道运维期间常出现衬砌病害(裂缝、水体渗漏、脱空及变形等)[3-5];而隧道施工过程中掌子面前方的地质情况不明,常导致施工挖掘中发生塌方、突泥、突涌等严重灾害[6-10]。上述隧道病害及灾害的发生,轻则影响了整个隧道建设项目施工进度,重则发生隧道事故,危及国民生命、财产安全。因而,对于当前地下工程建设安全施工、保质保量而言,高效的隧道地质预报、最大限度地降低隧道安全事故发生几率、减少人员伤亡具有重要的现实意义。
隧道地质预报手段通常有传统的人工检测、基于掘进设备的钻探检(监)测及地球物理领域探测方法等。与传统检测技术相比,地球物理方法以其对探测目标破坏小,探测速度快及部署使用方便等优势,已经成为目前隧道地质超前预报的主要手段[11-13]。实践表明,检测成本花费方面,隧道等地下工程潜在病害或灾害检测遵循“五倍定律”,即人工隧道巡察检测费用是采用设备进行有损检测(如钻探)费用的五倍,而有损检测费用是无损先进检测(地球物理方法)的五倍[14]。因此,地球物理方法同时亦是降低隧道运维、隧道施工地质预报成本的首选方法之一。
基于介质波阻抗差异特性,隧道地震勘探(Tunnel Seismic Prediction, TSP)通过测量地震波速度,转换为介质密度、泊松比等力学参数进行预报,探测范围较大,是地球物理隧道地质预报普遍应用的方法[15-17]。但由于复杂隧道病害和灾害目标反射的地震波信号难以准确计算波速度,TSP仅适用于具有规则界面特性的隧道病害及灾害目标的检测。瞬变电磁法对低阻介质反应较为敏感,是隧道地质预报中含水病害及灾害探测主要方法[18]。然而,受隧道观测环境限制,瞬变电磁法的发射和接收线圈无法有效展布,地质预报有效范围及效果受到严重的影响[19]。
探地雷达(Ground Penetrating Radar,GPR)是隧道地质预报领域另外一种普遍应用的方法,其通过发射高频电磁波和接收前方介质反射的电磁波脉冲,实现隧道地质预报。相比较于地震波探测类方法,采用高采样率、宽频短脉冲的GPR方法针对破碎带、溶洞、隧道衬砌后空洞等病害和灾害目标体具有更高的分辨率[20]。而地质预报目标区域含水量是影响介电常数的主要因素,基于对介电常数变化的敏感性,GPR在识别含水病害和灾害、完整围岩介质方面亦具有较好的效果[21]。然而,GPR隧道地质预报解译推断存在以下技术瓶颈:一是对观测数据异常的识别常常定性依赖于解译人员的工程经验或简化方法,其主观性强,导致错误推断率高,普适性低,方法应用推广难,且效率较低,造成地质预报成本提高,缺乏对隧道病害及灾害目标有效的辨识算法;二是定量解译处理过程目标模型反演(或偏移成像)问题,由于观测数据的欠定性,常常具有病态性、非线性和多解性,导致地质预报目标体难以准确成像,甚至无法识别[22]。
因而,如何高精度、高效利用GPR进行隧道地质预报是当前地下建设工程领域极具挑战的一项任务。发展GPR隧道地质预报智能化框架及算法平台,是解决上述问题的关键。目前,有关GPR隧道地质预报智能化解译方法研究的文章已经发表了很多,但尚缺乏系统而完整的归纳总结。本文以人工智能为研究对象,在详细阐述GPR隧道地质预报智能化解译领域发展现状的基础上,从人工智能学习框架、复杂环境人工智能训练集获取、跨域泛化能力的提高等方面,阐述了当前GPR隧道地质预报存在的问题及其进展,最后对GPR隧道地质预报下一步发展方向进行了初步展望。
传统隧道地质预报方法主要由专家技术人员分析岩体目标特征,依据目标体与背景或标准数据的差异性信息识别对象。针对传统方法的局限性,基于计算机大数据分析以及人工智能技术的发展,隧道地质预报识别逐步向智能化方向发展。
基于机器学习的目标识别方法主要包括特征提取和分类器两部分。其中,提取方面,基于变换域(如傅里叶变换、Hough变换、离散余弦变换、S变换、小波变换、短时傅里叶变换等)、子空间投影(主成分分析法、线性判别分析法)、图像特性(方向梯度直方图、边缘直方图)等方法手工提取几何特征(双曲线特征)或空间域、时域、频域、时频域、小波域等特征是特征提取领域主要的发展方向。分类器方面,通常利用模糊聚类、神经网络、支持向量机(Support Vector Machine,SVM)、隐马尔可夫模型、金字塔模式识别等方法进行分类识别。在众多机器学习算法中,基于神经网络进行GPR隧道地质预报智能化解译是当前研究的主流方向,下文将主要介绍神经网络的基本理论。
图1 卷积神经网络Fig.1 Convolutional neural network
对于GPR地质预报数据的目标识别及分类,基于图像特征的卷积神经网络(Convolutional Neural Networks, CNN)的效果较为突出。如图1所示,神经网络通常包括输入层、隐含层及输出层。其中,隐含层内的卷积运算是利用参数共享原则降低网络结构中参数,同时利用卷积核提取出图像信息中的有效特征;而池化操作是为了降低图像的维度,减少参数的数量,提高模型的泛化能力。首先将GPR地质预报数据模型分为断层类、蚀变类、风化地层类、岩溶类、岩脉侵入类和岩层接触类,经过输入层对GPR数据做归一化处理,加大数据收敛速度,再由卷积层通过卷积核与输入数据的卷积运算得到下一层的特征图。卷积的操作实际上是卷积核对输入特征数据的滤波处理,经过池化层与全连接层,将GPR数据的局部特征通过权重矩阵从矩阵形式转化为向量,并映射输出。最后在分类层上利用某种映射关系得到输入数据属于某种模型类别的可能性,选择最大的结果作为输出。
如图1所示,输入层为信号传输作用,隐藏层1含有传递函数,可采用线性或非线性函数,隐藏层2用来记忆隐藏层1单元前一时刻的输出值,输出层线性加权。其空间表达式如下:
其中,y表示m维输出结点向量;x表示n维隐藏层结点单元向量;u表示r维输入向量;xb表示n维反馈向量;ω1、ω2、ω3分别表示输入层、隐藏层、输出层,输入层为信号传输作用,隐藏层1含有传递函数,可采用线性或非线性函数,隐藏层2用来记忆隐藏层1单元前一时刻的输出值,输出层线性加权。
图2 卷积神经网络两阶段结构算法示意图Fig.2 Schematic diagram of two stage structure algorithm of data neural network
图3 SSD模型卷积神经网络计算示意图Fig.3 Schematic diagram of SSD convolutional neural network model
基于深度学习的目标识别算法可以分为两类,分别是两阶段(Two-Stage)结构算法和单阶段(One-Stage)结构算法。两阶段结构算法包含两个分支,一个分支是把输入图像通过卷积和池化层处理形成特征图,由区域候选网络(Region Proposal Networks,RPN)在特征图上生成稀疏的系列候选区域;另一分支是通过感兴趣区域池化(Region of Interest,ROI Pooling)对特征图和RPN输出的候选区域信息进行结合,进而提取候选区域特征,输入到后续全连接层判定目标类别。两阶段结构代表算法有R-CNN(Region-CNN),SPPNet(Spatial Pyramid Pooling Network),Fast R-CNN,Faster R-CNN,R-FCN(Region-based Fully Convolutional Network),FPN(Feature Pyramid Network),Mask R-CNN等。其中,Faster R-CNN的结构示意如图2所示。而单阶段结构算法是基于回归的端到端(End-to-End)目标检测算法,主要通过对位置、比例和纵横比进行定点密集采样,进而检测目标。单阶段结构算法的候选区域提取和检测分类均在主线上即可实现,大大减少了网络的复杂度,使网络结构变得简单。因而,单阶段结构算法主要的优点是检测速度快,计算效率高,其代表算法有OverFeat,YOLO(You Only Look One),YOLOv2,YOLOv3,SSD (Single Shot Multibox Detector)等。
深度学习方面,若要实现具备识别某一类别物体的能力,则必须通过样本的输入来训练算法模型。以SSD (Single Shot Multibox Detector)模型卷积神经网络监督学习训练为例,如图3所示,即利用人工添加标签的数据,在模型中学习从输入到输出的特征映射,将这种映射关系应用到未知的数据中,以达到分类或回归的目的。当把无标签的图像数据用于SSD模型的检测时,图像被输入到基础网络进行特征的提取,以生产多层特征图,通常提取六个特征图层生成默认框和利用Jaccard Overlap策略筛选正例,默认框则用于目标种类的评分与位置回归。
在图像识别中,默认框的选取直接影响识别的准确程度。如SSD模型提取的六个特征图层经卷积和池化处理次数不同,对应的感受野不同,则在不同层上生成的默认框大小亦不同。生成默认框时,通过滑动窗口在特征图的每个单元格上生成一系列同心的默认框,其规格Sk由以下公式确定,其中m是提取的特征图层的数量(m=6):
(4)
其中,k∈[1,m]。每一层的默认框有正方形和矩形两种,根据不同的高度比例ar={1,2,3,1/2,1/3}生成。其中,第k层特征图的默认框高和宽分别由式(5)和式(6)计算得到:
一般为了选择优质的默认框内容用于进一步地损失计算和参数更新,需要合理选择正例和反例。默认框与真实框的交并比匹配策略被应用到正反例选择中,计算公式如下:
(7)
式中,A代表的是默认框;B代表的是真实框。正反例的判断阈值设为β=0.5。当J≥β时,默认框为正例;反之为反例。
早期,随着计算机技术和数字图像处理技术的发展,通过机器视觉设备所获得的图像识别和分类理论与应用研究不断涌现。其中,基于神经网络的图像识别方法在GPR数据解译领域得以发展。如Millard等(1997)[23]基于GPR管道探测图像数据,采用神经网络方法,依据不同灰度值实现GPR数据解译推断。Davis等(2002)[24]提出根据多种不同曲线形状特征,通过BP(Back Propagation)神经网络来识别不同类物质轮廓。如图4所示,孟陆波等(2009)[25]基于GPR时间剖面上双曲线特征,对应掌子面前方溶洞不良地质体的先验知识,提出采用神经网络模式识别方法,自动识别地质雷达图像中的双曲线,以此实现智能预测掌子面前方溶洞不良地质体的目的。但早期智能化GPR解译的效果严重依赖于人工给定的训练样本及训练模式。同时,受限于计算设备的计算能力,早期GPR智能化解译不能满足实际工程批量数据处理应用需求。
图4 地质雷达图像BP神经网络特征识别流程[25]Fig.4 BP neural network feature recognition flow chart of geological radar images
图5 探地雷达回波的极点特征分布Fig.5 Pole feature distribution of GPR echo
近年来,得益于人工智能算法、系统及图像识别技术、平台的迅猛发展,GPR智能化解译的进程不断得以推进。如刘宗辉等(2019)[26]建立了典型不良地质体预测指标体系,基于专家系统工具(C Language Integrated Production System,CLIPS)构建知识库和推理机,实现GPR地质宏观预报专家系统功能。周丽军(2020)[27]提出极点特征聚类的公路隐藏裂缝GPR自动识别算法(图5),其对雷达回波信号,利用奇点展开法提取晚时响应部分的极点信息,根据已知环境样本信息,对待识别目标回波的极点特征空间进行聚类。程博文等(2020)[28]提出采用道路沉陷、松散类病害区域的探地雷达图像模拟方法,获取模拟图像对应区分道路深层结构病害类型,以及计算病害区域的影响范围。然而,上述智能化进程的发展并不涉及真正意义上的学习过程,针对复杂多变目标体的GPR勘探,实际应用效果因泛化能力弱而受到局限。
作为人工智能领域的一个分支,机器学习关注开发智能化系统,通过数据样本训练积累经验,进而提高智能化系统的处理能力[29,30]。如Daniel等(2012)[31]通过迭代霍夫变换,进行机器学习识别GPR时间剖面多重双曲线特征,并从宽频带GPR数据中根据学习的双曲线特征,提取地下管线对应的空间分布信息。由于假设地下管线分布单一或多根管线之间可识别,以上神经网络的模型构建相对简单,并易于实现[32]。
基于神经网络机器学习,实现GPR快速正演模拟及偏移成像,并在探测地下管线空间位置领域得到了有效试验[33]。需要注意的是,上述霍夫变换类型机器学习的实现需要提前输入简单双曲线特征对应地下管线的类型样本信息。而在GPR图像中由于探测目标的多样性,目标体对应的信号也并不局限于双曲线。同时,真实介质的不均性和噪声的干扰普遍存在,GPR信号复杂而变化多样。因而,更高层次、更完备特征提取的机器学习算法仍然是当前GPR智能化数据解译急需解决的问题。
针对复杂GPR数据,基于支持向量机及深度学习理论的智能化GPR数据解译算法及平台研究,近年来得到了爆发式的发展。如采用支持向量机对GPR检测路基下空穴的单道雷达信号进行识别[34]、利用支持向量机对层位信息识别的公路路基病害检测[35]、基于支持向量机的隧道衬砌GPR空洞机器识别方法[36]等等。尽管支持向量机在识别准确率、模型结构以及训练简便性等方面均优于神经网络方法,但其特征提取较为复杂,分类模型的泛化性能稳定性差。对此,组合支持向量机和Hough变换确定隧道衬砌钢拱架的位置和间距的学习算法[37]、支持向量机与H-Alpha分解组合GPR检测不同介质学习算法[38]、支持向量机与字典学习融合的GPR地雷探测[39]等不断发展,基于支持向量机类机器学习的泛化特性得到提高。
GPR数据解译深度学习方面,常规神经网络类机器学习算法理论与应用研究不断得到发展,如地下掩埋目标体检测[40]、基础结构监测[41]、目标物识别[42,43]、隧道地质超前预报[44,45]及隧道衬砌病害检测[46]等。研究表明,由于卷积神经网络的应用,其识别的特征已经超越了传统的双曲线检测,在样本数据足够的前提下,可以检测异常体对应的更多、更复杂的特征,使判断结果更加准确。
但卷积神经网络需要提前截取异常体位置再进行预测分类,而不能直接在网络中定位异常体位置并分类。基于VGG (Visual Geometry Group),Faster R-CNN 及 YOLO 系列(已更新至V3)的面向目标检测的神经网络算法的发展[47-49],如图7所示,在一定程度上提高了机器学习算法直接定位异常体位置的能力。
可见,上述有监督深度学习类机器学习算法GPR智能化数据解译的发展面临了诸如缺乏足够精确的标签特征样本数据、用于有效训练的大数据量及数据维度严重不足、训练获取学习模型泛化能力弱等技术瓶颈。针对隧道地质预报特殊工程应用领域,每次地质预报观测的数据极其有限(限于观测环境及检测成本等)。尽管可综合利用整条隧道观测数据进行深度学习训练模型,但每次重新训练模型缺乏时效性及可操作性。因而,开展针对小样本观测数据条件下隧道地质预报GPR智能化数据解译算法与框架研究成为目前的一个前沿方向。
(3)人类的赛博格化愈演愈烈,手机、iPod和笔记本电脑已经发展到近乎人类附属器官的程度,摄影将延伸为一种全日制策略,包括因无意识刺激而拍摄的照片,比如脑电波和血压。相机也将在我们的体内循环,在我们的家中常驻,积极主动地警告甚至可能试图纠正任何错误(疾病、火灾以及事故),甚至是在分子的层面上。[1]149
如前所述,特征提取是高效、高准确率的人工智能算法实现的基础。例如图片的特征提取是深度学习中最为基础,也是最为重要的研究问题。特征提取可视为一个数据降维过程,即将图片数据转化为具有一定区分度及维度向量的图片特征过程。因而,如何构建一个有效的图片特征识别和进行数据降维的学习模型至关重要。BP神经网络是早期隧道地质灾害GPR超前预报解译应用比较广泛的智能方法[25,50,51],但由于训练模型局部极小化及网络结构人工选定等问题,其应用效果不佳。
近年来,通过构建包含一个隐层的三层BP神经网络结构,采用图像窗口的方式对神经网络结构进行训练和判识测试,被证明是一种对雷达图像双曲线特征进行智能判识有效的方法[51]。通过卷积进行特征提取时,浅层网络往往可提取简单目标检测中的小目标特征;而深层网络具备更大的感受野,可有效提取复杂大目标特征;但同时对不同尺度目标进行特征提取时,网络模型的设计则更为复杂。其中,LENET模型是通过设计卷积层和全连接层进行梯度下降训练的卷积神经网络,当应用于隧道地质灾害GPR图像超前预报解译时,其明显缺陷是仅包含少数低隐含层,主要应用于小目标特征提取[44]。因而,结合诸如SVM分类器的LENET模型或将是有效途径之一[52]。深度置信网络(Deep Belief Network, DBN)是另外一种针对计算机解决复杂和不确定性问题的学习模型,通过结合压缩感知理论,其在实测GPR隧道地质超前预报自动解释方面具有较好的应用效果[53],并一定程度上解决了特征提取量与计算量过大、训练时间过长相矛盾的问题。
基于深层学习模型的目标识别算法其后不断得到发展,如结合感兴趣区域池化信息的Fast-R-CNN成功应用于提取候选区域特征,输入到后续全连接层判定探地雷达图形中双曲线特征,进行目标类别;结合候选区域(RPN)特征图的Faster-R-CNN,即前者负责区域选取,后者负责目标检测,应用于探地雷达管线目标智能识别[48]。YOLO系列(V1,V2和V3等)是另外一种应用于隧道地质灾害GPR图像超前预报解译的端到端回归目标识别学习模型,这种系统学习模型在主线上进行候选区域提取和检测分类,极大地降低了网络的复杂度,同时使得网络结构变得简单,是当前GPR智能化解译领域广泛采纳的策略。如SSD学习模型有效解决了GPR隧道衬砌中钢筋智能检测问题。其基本原理是通过结合6个不同规格的卷积特征图,对目标进行分类和位置回归,不同规格特征图的联动和组合,可提高目标的检测精度。大规格的特征图由于经历的卷积较少,保留了图像更多的微小特征,对小目标的检测非常有利;而经过多次卷积池化后的小规格特征图保存了大目标的特征,能够更快速地实现对大目标的检测。SegNent是一种有监督的编解码结构的对称网络模型,其通过处理任意尺寸的输入图像,最大池化逐阶段缩小输入图像的尺寸和降低参数量,记录图像中的池化索引位置,成功应用于隧道衬砌病害检测[46]。混合学习模型亦得到了不断的发展,如冯德山等(2020)[49]将Faster R-CNN和YOLOv3应用于隧道衬砌GPR图像的识别;张东昊等(2020)[54]利用Mask-R-CNN深层学习模型和RESNET卷积神经网络进行GPR隧道支护初期检测;李曼如(2022)[55]基于YOLO和RESNET(Residual Neural Network)开发了GPR道路地下病害智能检测算法。
图8 GRP的D-S模型融合算法框架Fig.8 D-S model fusion algorithm framework for GRP
尽管如此,目前普遍应用于隧道地质灾害GPR图像超前预报解译的学习模型,仍然以简单目标体检测问题为主,如具备明显双曲线特征隧道管线及钢筋GPR图像,具有明显的电磁反射同相轴的空洞或空腔GPR图像等。图8为D-S理论模型融合算法框架,由图8可知,D-S理论分类模型需要明显特征的异常波形。然而,隧道地质灾害GPR图像超前预报解译真正面对的环境是复杂多变的地下空间介质,一方面其围岩介质明显区别于隧道管线及衬砌钢筋、空洞或空腔等周围的混凝土或土层围岩介质;另一方面隧道地质灾害目标体(例如常见的无明显病害、低含水破碎围岩、富含水破碎围岩、泥夹石破碎围岩、局部围岩破碎和空腔型溶洞六大类)空间分布形态多变,亦有别于通常为规则形态的管线及衬砌钢筋、空洞或空腔等。
上述复杂隧道地质灾害目标体空间分布非契合性(即受限隧道环境,探测目标并不在雷达观测主剖面范围,而是在旁侧剖面),常常引起形态多变的GPR图像特征。如何构建面对实际复杂隧道地质灾害目标体,GPR图像特征提取学习模型的是一个较困难的问题。针对隧道地质灾害GPR超前预报问题,足够数量、适用于训练的实测训练集数据获取、足够数量正确实测数据标签的实现,对复杂隧道地质灾害GPR超前预报智能化解译具有重要的研究意义。但在小样本训练集、仅有部分正确标签数据前提条件下,面对实际复杂隧道地质灾害目标体GPR图像特征提取学习模型构建,仍是一个没有完全解决的问题。
如前所述,足够数量且包含高质量标签的训练集数据,理论上可以保证人工智能算法实现准确的目标检测及智能解译。然而现实情况是,可能由于训练数据的数量或者质量不符合要求,导致大多数人工智能项目最终夭折。特别是针对某些特定应用场景的人工智能项目,训练集数据获取本身是一个难以满足的条件。例如隧道地质灾害GPR超前预报智能解译领域,通常超前预报与隧道掘进依次顺序同步进行,但并不是每一次掘进前都需要地质灾害超前预报;且由于隧道内空间有限,GPR测线布置亦有限,因此,一般情况下隧道地质灾害GPR超前预报数据较为有限。
某些特殊情况下,隧道地质灾害GPR超前预报可达数公里[44,45,53],这种情况下通过数据处理,可获取数百乃至上千个有效训练集数据,但相比较深层学习模型的高要求而言,直接通过上述实测数据作为训练集的效果并不是都满足智能化解译的需求[56]。基于数量较少的实测数据,通过对GPR图像进行裁剪、平移、翻转、变化色调及局部比例调整等数据扩增过程[48],进而获取足够数量的训练集数据,是当前针对特征形态较为简单的管线或钢筋探测对象广泛应用的方法。
但如前所述,隧道地质灾害超前预报的环境及目标较为复杂,针对简单及规则的双曲线特征GPR图像有效的扩增技术,并不能有效地应用于复杂的环境及目标体智能解译。通过设置不同地电模型参数,采用正演模拟算法,计算各种模型条件下GPR数据,是另外一种保证深度学习网络训练集较为广泛应用的策略[36,46,57]。由于可人为根据探测目标类型需求有针对性地设置模型,在一定意义上保证了足够数量的数据集及有效的标签数据质量[58]。但通过数值模拟获取训练集的方式存在的缺陷也很明显,即人为设定的地电模型不能涵盖复杂地下目标体类型,因而该方法亦主要应用于简单的特征提取。当前,人工智能领域已发展了多个开源的数据集库,这些数据集库囊括了多种不同领域类型的大型(超万级数量以上)、高质量标签的训练数据。通过训练集训练学习模型的各种能力理念,先在已有开源数据集上训练,再结合少量可获取的实测数据二次训练,亦是当前比较流行的做法。如COCO(Common Objectsin Context)数据集是一个包含物体检测、分割和字符的大规模数据集[49,54];VisTex图像集是一个专门提供纹理图像的大数据集,可使网络模型获取较强的曲线、边缘、轮廓等特征的提取能力[59]; PASCAL VOC ( Pattern Analysis, Statistical Modelling and Computational Learning, Visual Object Classes)数据集为图像识别和分类提供了一整套标准化的优秀的数据集[60]。
为了解决目标特征标签及用于训练模型数据量不足的问题,大多数机器学习算法常采用重采样或人造数据(如数值模拟)的方法,但此类方法不能保证识别结果的准确性。迁移学习是充分利用机器学习在大样本集(源域数据)上学得的特征(预训练),去解决与其相似但不同的小样本集(目标域数据)中的分类任务。如无人机地震泥石流信息检测领域,在已构建地震泥石流灾害样本库的基础上,将卷积神经网络训练得到的特征迁移到地震泥石流灾害信息检测中,完成地震泥石流灾害信息的自动检测。医学肿瘤人工智能诊断方面,通过一定量自然影像训练后的深层卷积神经网络模型,采用少量医学样本进行参数优化,并将微调后的深度学习模型进行新的病例诊断[61,62]。机械控制领域,小样本下基于迁移学习的轴承状态深度学习识别是通过人为预先标签故障数据进行学习训练,将迁移学习获取的新模型应用于新的机械故障诊断数据[63]。研究表明,深度学习的特征迁移可以解决目标域数据少、数据分配不均衡等问题,但有限的源域数据及其与目标域数据的特征提取问题需要谨慎处理。
合成孔径雷达(Synthetic Aperture Radar,SAR)数据解译智能化领域,如图9所示,基于仿真SAR图像深度迁移学习的自动目标识别[64]、基于MSTAR数据集卷积神经网络结合迁移学习的SAR目标识别[65]、基于协会标准数据集迁移学习的小样本机载激光雷达点云分类[66]、基于GoogleNet训练模型迁移学习的雷达信号类型自动识别方法[67]不断涌现。可见,在源域与目标域数据满足同构条件下,基于大数据集预训练的迁移学习与神经网络相融合,进而开发智能化算法,获得了较好的应用效果。但需要注意的是,SAR数据观测环境相对简单,同时,预训练数据集质量控制是当前迁移学习在SAR智能化数据解译研究领域的关键因素。
图9 基于仿真图像的迁移学习过程Fig.9 Transfer learning process based on simulated images
针对GPR探测领域而言,上述有效的预训练大数据集在通常情况下无法得到满足,深度学习模型缺乏有效的泛化能力,迁移学习在该方向的理论与应用研究甚少,但潜在应用前景较好。如地下管线GPR探测迁移学习智能化研究,利用数值模拟获得大量预先设置模型的数据集,用于迁移学习预训练。由于管线目标相对单一,特征提取较为简单,该研究成果取得了一定的试验效果[68]。再如隧道地质预报方面,通过引入数据扩增技术,增加标记某段工程的样本数据量,开展迁移学习的探索试验。而基于隧道实测数据具有明显的纹理特征与VisTex图像集(由麻省理工学院提供)特征相似策略,采用上述VisTex图像集作为源域数据来预训练网络模型[59]亦得到了发展。因而,如何搭建满足迁移学习所需相似特征分布的同构源域数据集,是GPR迁移学习智能化数据解译发展的重要研究方向。
综上所述,深度神经网络学习对复杂GPR智能化数据解译能力的提高、迁移学习预训练特征提取对小样本数据智能化检测的效果改进,意味着两者结合或将是未来极具潜力的智能化技术。
隧道地质灾害超前预报智能化解译是GPR领域的研究热点,这种智能化解译的实现与推广,可有效解决观测数据异常识别定性依赖于解译人员的工程经验或简化方法问题;可提高检测效率,并降低地质预报成本;改善定量解译处理过程目标模型反演(或偏移成像)问题由于观测数据欠定性出现的病态和多解性现状,实现地质预报目标体准确成像。因而,隧道地质灾害GPR超前预报智能化解译研究得到了快速发展。随着隧道地质灾害GPR工程勘探对象的日益复杂化和智能化预报要求的日益精细化,为使GPR智能化解译算法更好地应用于实际问题中,解决复杂隧道环境下高效、高精度的智能解译问题,笔者认为隧道地质灾害GPR超前预报智能化解译未来的发展趋势主要集中在以下三个方面:
1)人工智能学习模型研究一直是所有智能化解译算法的核心部分,目前GPR隧道地质预报智能化解译应用主要在规则灾害的种类识别方面,考虑到现实GPR隧道地质灾害目标体是不规则的,智能化预报解译智能算法特征提取与规则目标体的学习模型具有明显的不同,同时亦并不意味着学习模型层数越多,其特征提取能力越强;针对GPR隧道地质灾害预报特殊数据集及不规则地质灾害多目标检测进行构建特征提取学习模型、适应动态持续特征提取、不断完善特征提取能力的高效学习模型构建将得到重视。
2)针对隧道地质灾害超前预报特殊的工作环境及检测目标,足够数量训练数据集及高质量标签数据的获取,仍然是GPR智能化解译算法实现的必备条件之一。尽管某个隧道或某条隧道个别项目数据极其有限,但如何通过区域内隧道地质灾害GPR超前预报数据的收集、分类并动态持续高质量进行标签工作;如何基于小样本训练集构建、数据增强满足无监督学习、半监督学习及增量学习等或将是今后研究的重点。
3)由于隧道地质灾害GPR超前预报数据集的特殊性,观测的GPR数据难以满足人工智能算法训练和测试要求,大部分情况是需要根据不同工区领域的数据训练得到目标检测模型,进而提高模型效果;随着GPR大行业实测数据集的发展和开源,基于现有数据集的迁移学习,亦将是未来GPR隧道地质预报智能化解译跨领域泛化能力提高的主要发展方向之一。