面向工程大数据智能算法的交互式教学研究

2022-08-05 13:31聂利超许新骥刘征宇
高教学刊 2022年22期
关键词:智能算法梯度深度

蒋 鹏,刘 斌,聂利超,许新骥,刘征宇,陈 勐,曾 琼

(1.山东大学 齐鲁交通学院,山东 济南 250002;2.山东大学 岩土与结构工程研究中心,山东 济南 250061;3.山东大学 软件学院,山东 济南 250101;4.山东大学 计算机科学与技术学院,山东 青岛 266237)

随着经济社会的发展,我国城市轨道交通、高铁、高速公路等基础设施建设进入快速发展时期。以轨道交通工程为例,截至2011 年我国有28 个城市获得规划批准,线路总长超2 500 km;至2020 年已建成轨交运营线路177 条,运营总里程6 100 km,产生大量地质数据、掘进参数数据、施工日志以及运营检测等数据。同时,地下仓储、地下管廊、地下综合体等地下空间工程蓬勃发展,我国已成为地下空间工程的建设和开发大国,预计未来地下工程产业规模达每年上万亿元。

城市地下空间开发和工程建设面临着“复杂地质条件、多发灾害事故、脆弱生态环境、敏感公共安全”等重大挑战,亟需借助人工智能等新一代信息技术手段帮助勘查、施工和运营人员对工程的情况进行全面掌握,提供基于大数据的风险评估、施工进度估计和辅助决策。这些智能算法依赖对于过往大数据的分析,而这些重大工程从勘察、设计、建造到运营积累的地质数据、掘进参数数据、施工日志以及运营监测等数据正好提供了足够的大数据支撑。因此,基于工程大数据的智能算法普及与推广不仅是“安全、高效、优质”的工程建设和运营的必然要求,也是人工智能算法发挥优势体现价值的绝佳渠道。

目前,人工智能算法课程已在地下空间工程等工程学专业开设,人工智能已经成为基础课程。但是,人工智能算法处理高维复杂数据时背后的原理很难直观理解。此外,人工智能算法理论研究还不完善,例如深度学习,人们一般依赖于可视化交互式手段探究其背后的规律原理。因此,根据人工智能算法课程的特点,在课堂教授时除了教授算法流程、公式等固定知识,还应该引入交互式可视化的手段,帮助学生快速理解背后的原理。这对课堂授课效果,特别是对于非信息类专业背景学生的理解尤为重要。本文重点研究面向工程大数据智能算法的交互式教学方法,探讨适合城市地下空间工程专业人才培养的智能化算法教学模式。

一、工程大数据智能算法需求

(一)在TBM 掘进参数预测和决策方面

以往TBM 操作主要依靠人为经验,一旦遭遇不良地质和岩性突变,难以及时合理应对,易造成异常损毁、效率低下甚至卡机等严重灾害等。通过分析过往大量的TBM 掘进参数、地质岩体条件信息,可以有效合理优化、调整TBM 掘进参数,使之与地质、岩体条件良好匹配。因此,引入人工智能算法对这些工程大数据分析,成为TBM 智能掘进的关键,这是连接地质岩体信息与TBM 安全高效掘进的“桥梁”,并且可以揭示掘进参数随岩体地质条件的变化规律,对于TBM 安全、高效掘进具有重要指导意义。

(二)在隧道超前地质预报方面

隧道超前地质预报是一种多采用地球物理勘探,探测隧道、隧洞等地下工程的岩土体开挖面前方的地质情况,力图在施工前掌握前方的岩土体结构、性质、状态等地质信息的手段。地球物理勘探最常采用的技术是地球物理反演,试图通过观测到的有限数据重建地质结构,是一种高度非线性和病态的问题。目前大多采用线性方法去求解该问题,因此存在初值敏感、多解性、不准确等问题。事实上,过去几十年不同地区的历史勘探数据和开挖揭露能为反演提供足够大数据约束,有效缓解以上问题。为有效利用工程大数据,目前深度学习方法已被引入地球物理反演并成为研究热点,在实际问题中也展现了强大的非线性映射能力。

(三)在地质素描方面

地质素描是以野外地质物象为对象,用素描技法描绘出地质客观实体的空间形态及相互关系,用一张素描图往往可以把复杂的地质现象描述清楚,这对提高工效和工作质量起着重要作用。地质素描的绘制过程较为复杂,利用人工智能算法,挖掘以往实际照片与地质素描的关系,有望达到自动地质素描。

二、工程大数据智能算法教学模式

(一)工程大数据人工智能算法课程群

目前工程大数据已成为最重要、最有价值的资源。尤其我国经历了十几年建筑工程的高速发展,在各种工程中已积累了海量数据。但是,目前人工智能算法在工程大数据上的应用案例等课程内容匮乏。因此,学生往往在学习人工智能算法后,面对实际工程数据仍不知从何着手。人工智能算法和传统工程数据处理手段只是作为独立的内容供学生学习,未能做到前沿方法与课程和实际案例的有效结合。此外,前置课程的缺失也影响了学生对于前沿知识的理解。这些不足严重制约了学生用新思想新方法来利用工程大数据,创新地解决实际工程中的问题。鉴于此,本项目提出建立工程大数据人工智能算法课程群。

首先,重新梳理工程大数据和人工智能的课程体系,例如分析城市地下工程教学中引入智能化课程所需要的基础知识点,研究如何把这些知识点汇总融合并设计课件材料,形成工程大数据人工智能算法前置课程,从而使学生快速掌握智能化的基础知识。其次,分析传统工程数据处理和人工智能课程中的相同知识点,把人工智能的前沿内容引入到工程大数据的教学当中。例如针对地球物理勘探,该门课程同样涉及优化方法、人工神经网络等涉及人工智能的知识,但是这些内容已相对老旧,因此可以把人工智能课程中的这部分的最新内容及时引入,形成工程大数据人工智能算法基础课程,使学生接触最前沿的基础知识。最后,紧跟人工智能的前沿,汇总人工智能与其他学科结合创新事例,从而结合前沿理论和最新应用,形成工程大数据人工智能算法创新课程,启发学生用前沿方法创新解决实践工程中的问题。表1 中列举了工程大数据人工智能算法课程群。

表1 工程大数据人工智能算法课程群

(二)工程大数据人工智能算法课堂交互式教学

不同学科的教学有不同的特点。例如城市地下工程学科,一般涉及岩土工程、工程力学、勘探等课程,这些课程的教学内容相对固定,教学主要是课堂讲授为主课后练习为辅的模式。而对于人工智能学科,算法往往处理的是高维海量数据,算法背后的原理很难通过课本上的文字内容描述明白。此外,人工智能很多知识内容的应用已走在了理论研究的前面。例如深度学习,该技术在很多领域有了成功的应用,但是其理论研究还非常滞后。根据人工智能算法的特点,其课堂除了教授算法流程、公式等固定知识,还应引入交互式可视化的手段,帮助学生快速理解背后的原理。这对课堂授课效果,特别是对于非信息类专业背景学生的理解尤为重要。

具体做法包括:首先,研究将现有的人工智能学科课堂中的可视化手段,应用到前置课程的相关内容教学中,方便学生直观理解。其次,对基础课程中的理论概念设计交互式的仿真实验和编程练习,及时让学生巩固和验证学习到的理论知识。最后,针对创新性的培养,在创新实践课程中,研究人工智能应用于工程大数据若干范例的动机、思路和方法,在课堂教学中启发学生如何发现问题解决问题。总结来说,利用可视化、交互式技术直观展示人工智能算法计算流程,帮助学生理解算法原理,使学生可以灵活应用人工智能解决工程大数据问题。

(三)人工智能算法教学和工程大数据实践的双向互动机制

工程大数据处理分析的目的是解决实际工程中存在的问题,同时新的人工智能算法也需要在实际工程实践中验证。尽管智能化方法的研究对象是数据,是一种数字信息,但是目标仍然是服务实际工程建设,脱离工程实践检验的智能化只是自娱自乐。只有不断探索利用智能化手段挖掘工程大数据中的知识信息,并且在实际工程中验证和改进,才能使智能化方法在未来大型化、复杂化的工程中真正发挥作用。

对于工程大数据人工智能算法课程中理论和实践并重的要求,也要求我们在教学中创新地提出课堂教学和实际工程实践的双向互动机制。具体来说,对于一些课程,我们将研究如何把大部分教学内容留在课下,从而使课堂教学聚焦在关键知识点,并把课堂延伸到实际工程实践当中,加深学生对于知识的理解,从而建立“基础自学-课堂拔高-实践巩固”的“翻转课堂”教学形式。此外,研究设立反馈机制,收集工程实践中的难点问题,汇总分类形成专题课程,改进课堂教学内容,使学生所学可以真正应用于工程实践当中。通过课堂教学和实际工程实践的双向互动,锤炼巩固基础知识,提高科研学习兴趣,切实提高学生实际创新能力。

三、工程大数据智能算法课程

(一)深度学习基础原理与方法

考虑到工程学科学生算法基础较薄弱的问题,需适当补充线性代数和最优化的知识,特别是求解线性方程组、矩阵特征值特征向量、矩阵求导、梯度下降等内容。此外,深度学习算法与传统机器学习算法相比,工作机制不易解释,实现上有非常多的细节。如果纯粹从公式推导的角度进行讲解,很难直观讲清楚。因此,在讲解中应溯源到深度学习的由来,从生物神经系统的工作机制出发,引出人工神经网络的设计。具体来说,首先讲解人工神经元-感知机的定义和作用,然后提出多层感知机和它的特性及适用的问题,最后给出人工神经网络,展示其强大的非线性拟合能力,并且对于每一步都给出丰富的可视化实例。通过以上步骤,把深度学习这一复杂原理和面向的问题,逐层次地、直观地讲授给学生,有利于传统工程学科学生的快速掌握。

在实现层次,深度学习也有非常多的问题需要解决,主要问题包括梯度的高效计算和参数的有效更新,基于此各种各样的解决方法被提出。猛一看上去,这些知识非常不成体系杂乱无章,并且作为一个正在发展的学科,之前的很多方案和认识经常发生巨大的变化甚至是被推翻,所以有必要把这些方法进行梳理,从背后的动机、起源、发展和现在的应用情况进行说明,有利于学生真正掌握深度学习发展脉络、了解深度学习目前存在的问题和主要的解决思路,达到灵活的实际应用。

1.基础原理的直观解释交互式教学实例

感知机(图1),即人工神经元,通过模拟生物神经元的机制可以具备二分类的能力,进行逻辑与或非的运算。叠加多个感知机可以进行非线性运算,如异或门,进一步叠加更多的神经元,可以形成多层感知机MLP,具有强大的非线性映射能力,如图2(a)所示。根据万能逼近定理,对于含一层隐藏层的多层感知机,只要有足够多的人工神经元,可以拟合任意复杂的函数,如图2 所示。其中图2(b)是一个可交互的小程序,每两个人工神经元组合成一个小Bump,适当调整参数可以使每个Bump 拟合函数的一部分,当有足够多的人工神经元时可以很精细地拟合任意复杂函数。图2 中的素材部分来自于文献[6-7]。

图1 感知机直观解释实例

图2 多层感知机的交互式教学实例

进一步扩展多层感知机,形成一个6 层的人工神经网络,并针对一个具体问题(双螺旋线的分类)开展交互式教学实验,通过交互与可视化可以发现不同神经元所响应的特征以及权重更新的过程,帮助学生直观理解人工神经网络的工作机制,如图3 所示。

图3 人工神经网络的交互式教学实例(来源于文献[1])

2.梯度反向传播的直观解释交互式教学实例

梯度反向传播是深度学习成功的重要技术,依赖反向传播深层的人工神经网络梯度得以有效更新。因此,梯度反向传播的理解是深度学习过程的重要环节。梯度反向传播的学习有两种模式,纯基于数学推导和利用计算图的推导,后者在表述上更直观,因此更适合工程背景学科的学生。利用计算图的梯度反向传播方法有两个关键点,计算图和链式法则。链式法则是复合函数求导的基本性质,这在高数中已有讲授,因此这里不需要再详细说明。

计算图是一种将计算过程用图表示出来的方法,把所有操作用节点表示,把所有中间结果写在节点之间的有向边上,如图4(a)表达了这样一个计算“在超市买了2 个苹果、3 个橘子。其中,苹果每个100 元,橘子每个150 元,消费税是10%,请计算支付总金额”。进一步通过链式法则可以计算梯度,即每个输入变量对总金额的影响程度,梯度写在反向边下,如图4(b)所示。

图4 利用计算图和链式法则的梯度反向传播方法

通过引入计算图和利用链式法则,包含复杂操作的神经网络计算所对应的各层梯度可以很方便高效地进行自动微分求解。目前多种深度学习程序库都已经继承了auto-grad 自动微分机制,这大大方便了用户搭建深度神经网络应用深度学习。用户在使用时只需要关注如何定义网络层结构和从输入到输出的操作,不需要再关注梯度计算。图5 表示了几种复杂网络层操作对应的梯度反向传播运算,素材源于文献[6-7]。

图5 几种典型深度学习操作的计算图和反向传播梯度

(二)基于PyTorch 的深度学习实践

如前所述,深度学习是一种集成了多种课程知识的新兴前沿技术,尽管实现每个功能不需要学习特别深奥的数学知识,但是把这些模块实现高效集成并能适用于百万千万级的大数据尤为困难。因此,从零开始实现每一个基础模块对于非专业背景的学生显然不现实。目前,深度学习的基础模块已有非常高效的实现,如TensorFlow、PyTorch、MXNet 等。基于这些成熟的深度学习库,非专业背景学生也可以比较易于上手使用深度学习处理各类问题。特别是考虑到工程学科学生编程基础较薄弱的问题,依托本研究开展课程时,我们搭建了基于Jupyter 的在线交互式可视化编程环境,准备了相关教学程序,通过交互式可视化的方式大大提升了学生用深度学习解决工程大数据问题的能力,如图6 所示。

图6 基于Jupyter 的在线交互式可视化编程环境

四、地下空间工程专业教学实践

依托本项目研究,我们在城市地下空间工程专业开设了深度学习微专业课程、人工智能通选课课程;并且改造了传统勘探地球物理课程,新加入了基于深度学习的反演方法。这些课程的开设,大大拓展了学生对于人工智能最新技术和基本理论的了解,并且有效帮助学生快速掌握应用深度学习解决工程大数据的能力。在2021-2022 年的本科毕设和各类竞赛活动中,涌现出了大量的应用深度学习的案例。

例如本科毕设《基于深度学习方法的隧道地震波超前探测的反演方法》把深度学习应用于隧道超前探测中,在仿真数据上表现出了远超过传统地球物理反演的结果,如图7 所示。该学生目前正进一步研究生深造,仍继续这一课题。分析利用工程大数据是工程学科未来的热门方向,相关课程的开设能培养本科生的研究兴趣,帮助顺利衔接到研究生阶段。近年来,深度学习相关毕设每年近十项,这说明了工程学科对利用工程大数据有强烈的需求以及学生们有极大的兴趣。

图7 深度学习隧道地震波超前探测结果

此外,在本科生竞赛活动中也展现出了一批应用深度学习解决各类问题的优秀作品,例如参加中国国际“互联网+”创新创业大赛的作品——《隧道掘进机智能掘进平台领航者》(图8(a)),以及掌子面智能素描项目(图8(b))。

图8 本科生竞赛活动优秀作品

五、结束语

发展新工科、打造产业升级、交通强国战略等一系列理念政策推动着传统工程学科人才培养的变革,当前各大院校传统工科专业无不从课程、教学模式、培养方案上进行大力的改造更新,积极引入前沿的信息技术、人工智能、物联网等解决工程领域的固有问题。其中面向工程大数据的智能算法有望充分利用中国近年来积累的大量工程数据,帮助企业达到“安全、高效、优质”的工程建设和运营。本项目以地下空间工程专业为例,研究了工程大数据智能算法的需求,工程大数据智能算法教学模式,工程大数据智能算法课程。通过引入交互式可视化的各类人工智能教学示例、编程环境和案例,打造升级相关的课程,可以有效地帮助传统工程学科背景的学生理解应用最新的深度学习相关理论。近年来依托开设的微专业课程和通选课程,城市地下空间专业学生在毕设和各类竞赛中涌现出了大批结合最新人工智能技术的成果。除切实解决了工程问题外,还提升了专业的吸引力,为未来打造智能建造智慧交通等新工科专业奠定了基础。

猜你喜欢
智能算法梯度深度
四增四减 深度推进
深度思考之不等式
一个具梯度项的p-Laplace 方程弱解的存在性
内容、形式与表达——有梯度的语言教学策略研究
简约教学 深度学习
航磁梯度数据实测与计算对比研究
改进的多目标快速群搜索算法的应用
烟草香级智能集成分类方法
基于Robocode的智能机器人的设计与实现
组合常见模型梯度设置问题