应用实践导向的机器学习导论课程教学探讨

2024-07-16 00:00:00闫静杰朱康唐贵进魏昕庄文芹朱辰琦
高教学刊 2024年21期

摘 要:机器学习技术有很强的理论性和实用性。为提高学生对机器学习课程的兴趣和主动性,以计算机科学与技术专业机器学习导论教学为例,探究应用实践导向的机器学习导论课程教学改革,对每个机器学习算法设置对应的应用实践项目,构建1学时机器学习理论知识对应1学时项目实践的教学方式,将机器学习算法融入到实践项目中。教学实践证明,应用实践导向的机器学习导论教学模式能够明显提高理论和实践结合教学方法的效率,提高学生的积极性和主动性,培养学生解决实际问题的能力。

关键词:应用实践导向;机器学习导论;计算机科学与技术专业;实践项目;课程教学改革

中图分类号:G642 文献标志码:A 文章编号:2096-000X(2024)21-0130-04

Abstract: Machine learning technology has strong theoretical and practical significance. In order to enhance students' interest and initiative in machine learning courses, this study takes the teaching of Introduction to Machine Learning in the Computer Science and Technology major as an example, and explores the reform of the practical application oriented machine learning introduction course teaching. This study installs the corresponding application practice projects for each machine learning algorithm, constructs a teaching method where 1 class hour of machine learning theoretical knowledge corresponds to 1 class hour of project practice, and integrates machine learning algorithms into practical projects. Teaching practice proves that the application oriented machine learning introduction teaching model can significantly improve the efficiency of combining theory and practice teaching methods, enhance students' enthusiasm and initiative, and cultivate their ability to solve practical problems.

Keywords: application oriented practice; Introduction to Machine Learning; computer science and technology major; practical projects; course teaching reform

近些年来,随着卷积神经网络、图神经网络、递归神经网络和Transformer等新型机器学习和深度学习方法的出现,人工智能领域得到了迅猛的发展。车牌识别软件、智能音箱、人脸识别软件、阿尔法狗、ChatGPT、人工智能机器人、Sora文生视频大模型和多模态大模型等各种人工智能产品层出不穷。目前,人工智能在医疗、安防、教育、娱乐、金融、交通和智能制造等领域得到了广泛的应用,人工智能在很大程度上改变和促进了社会的快速发展和进步,可以说新的人工智能时代已经到来[1]。

随着人工智能时代的到来,人工智能相关行业和企业的发展和对人才的需求也得到了很大程度的增加。但是这也对高校里的人工智能、计算机科学与技术、电子信息工程和自动化等相关专业的本科学生培养有了新的要求和挑战。人工智能相关行业和企业也期待高校本科毕业生们具备丰富的人工智能理论知识和相应的编程实践能力,能够在企业实践中高效解决各种人工智能应用和问题并创造出更符合需求的人工智能产品[2]。

机器学习导论是计算机科学与技术专业的一门非常重要的人工智能相关课程。该课程的教学目标是培养学生理解和掌握机器学习的基本概念、发展历史、思维方式、传统主流算法和各种深度学习网络模型,并能够利用各种机器学习方法来解决工业界的实际问题[3]。本文将针对现有的机器学习导论课程存在的问题,深入探讨如何以应用实践导向来提高计算机科学与技术专业本科学生对机器学习导论课程的兴趣和主动性,进而提升理论和实践结合教学方法的效率,培养学生利用各种机器学习方法分析问题和解决实际问题的能力。下面本文将首先分析现有的机器学习导论课程教学存在的问题,然后针对存在的问题提出以应用实践导向的教学模式,并以基于卷积神经网络的面部表情识别项目为例,详细阐述以应用实践导向的教学模式在机器学习导论课程中的应用和最后的教学实践结果。

一 机器学习导论课程教学存在的问题

机器学习导论是南京邮电大学(以下简称“我校”)计算机学院计算机科学与技术专业大三学生的一门非常重要的人工智能相关基础课程,主要学习机器学习的基本原理、各种传统机器学习方法和新的深度学习方法,并能够利用各种机器学习方法解决实际的机器学习问题,为将来能够进一步从事人工智能、计算机视觉、图像和语音处理、自然语言处理及模式识别等相关工作和研究打下坚实基础[3]。

机器学习导论课程是一门理论性和应用性都非常强的多领域交叉学科课程。该课程内容主要包括线性回归、最小二乘法、KNN算法、支持向量机、聚类、PCA降维、随机森林、决策树、AdaBoost、关联规则、卷积神经网络、图神经网络和递归神经网络等机器学习传统算法和深度学习算法[4]。这些算法普遍都是以高等数学、优化数学、概率论和随机过程,以及线性代数和矩阵论等数学知识为核心基础,但是大三的计算机科学与技术专业本科生没有学过部分数学理论知识比如优化数学和凸分析。此外,除了机器学习和数学理论知识外,学生还需要有扎实的程序设计编程能力(比如Python、C++、Java)来完成对应的机器学习算法上机实践,但是我校的机器学习导论课程实践学时设置得相对过少,总共只有6个学时。过多的数学理论基础知识及过少的课程实践学时导致学生们普遍觉得各种机器学习算法枯燥且晦涩难懂,理解和掌握机器学习方法难度较大,降低了学生的学习兴趣、积极性、主动性,部分学生产生了厌学和逃课的情绪,影响了最终的机器学习课程教学效果[5-6]。

二 应用实践导向的机器学习导论教学模式

根据上述分析,针对机器学习导论课程的机器学习算法理论知识难度过大、课程实践学时过少及学生们理解和掌握机器学习方法难度较大的问题,本文提出了应用实践导向的机器学习导论教学模式,压缩和精简机器学习算法理论知识,增加相应的课程实践学时,并且针对每个机器学习算法设置对应的应用实践项目,构建1学时理论知识对应1学时项目实践的教学方式,将机器学习算法融入到实践项目中,培养学生的理论结合实践能力,更好理解和掌握机器学习方法,提高学生的积极性和主动性,最终提升机器学习课程教学效果。下面我们以基于卷积神经网络的面部表情识别项目为例来详细阐述卷积神经网络理论知识的教学过程及对应的项目实践过程。

在讲解卷积神经网络理论知识的时候,首先给学生们介绍卷积神经网络总体架构(这里以经典的VGG16架构为例,其网络结构图如图1所示)。VGG16是在2015年由牛津大学提出的一种非常经典的卷积神经网络架构,该架构采用的卷积核大小为3×3尺寸,由卷积层和池化层循环嵌套构成16层的网络结构。VGG16网络架构简单高效,很多图像识别、语音识别、目标跟踪和目标检测等任务都采用VGG16架构作为基干网络[3-4,7-8]。

VGG16网络架构主要由输入层、卷积层、激活函数、池化层和全连接层(输出层)等组成,卷积层和池化层又循环嵌套在一起构成连续的5个卷积-池化模块,每个卷积-池化模块由数量不等的卷积层和池化层组合组成。如图1所示,卷积模块CONV1和CONV2由两个卷积层和一个池化层按顺序组合组成,而后续的卷积模块CONV3、CONV4、CONV5由三个卷积层和一个池化层按顺序组合组成[7-9]。

介绍完整体的VGG16卷积神经网络架构后,我们再分别介绍组成卷积神经网络的输入层、卷积层、激活函数、池化层和全连接层(输出层)的具体结构。输入层是尺寸为224×224×3的三通道RGB图像。卷积层是使用多个参数不同的卷积核对上述三通道RGB图像依次进行卷积得到多组特征图。其中,VGG16卷积层的卷积核大小固定为3×3尺寸。卷积层之后是输入激活函数,使用激活函数对线性的卷积特征进行非线性变换操作得到对应的非线性特征,以此增强图像的非线性结构表达特性。目前主流的激活函数主要包括tanh激活函数、Sigmoid激活函数、Relu激活函数,其中Relu激活函数在图像识别任务中的性能往往更加稳定和鲁棒,所以VGG16网络结构大部分时候都是采用Relu激活函数。由于经过卷积层和Relu激活函数非线性操作后的特征图大小跟输入图像大小变化不大,因此在图像识别任务中往往会导致计算量过大并且信息冗余较多,所以需要进行后续的池化层操作,减小对应图像的特征图尺寸大小,加快训练速度并在一定程度上去掉冗余信息。目前主流的池化层方式主要包括最大池化方式和平均池化方式,两种池化方式各有优缺点,其中VGG16网络大多数时候都是采用最大池化方式来进行图像的降维。VGG16网络结构的最后部分是由几个全连接层依次组合组成,其目的是将经过多次卷积层和池化层操作之后的图像局部特征组合成一个图像全局特征并采用Softmax函数分类器进行图像分类和识别[10-12]。

讲解完卷积神经网络的总体结构和每个层的理论知识后,再分别详细介绍卷积神经网络中卷积层、池化层、激化函数、全连接层和Softmax函数分类器的具体实现代码(以Python为例),以及如何用于面部表情识别实验。基于卷积神经网络的面部表情识别实验是对输入的每一张人脸面部图像,经过图像预处理得到尺寸大小为224×224×3后,用预训练好的VGG16卷积神经网络来判断每张人脸图片的情感类别是高兴、悲伤、愤怒、惊讶、厌恶和恐惧6种类别中的哪一种[13]。基于卷积神经网络的面部表情识别实验的主要部分代码如图2所示。

最后,讲完上述卷积神经网络理论知识及对应的用于面部表情识别代码后,先让同学们复习一遍卷积神经网络的具体结构及每一层的功能并读懂对应的每一行代码,然后就让每一个学生进行上机实验实践操作,完成图像的输入、图像的预处理、图像的卷积过程、图像的激活函数非线性变换过程、图像的最大池化过程、图像的全连接层及Softmax函数分类器完成最后的基于卷积神经网络的面部表情识别项目,得到每张图片的情感识别结果,以此方式来更好理解卷积神经网络理论知识及如何把卷积神经网络算法应用于面部图像表情识别任务,直观感受到卷积神经网络能够有效解决面部表情识别问题。图3为基于VGG16卷积神经网络的面部表情识别结果图。

三 应用实践导向的机器学习导论教学效果验证和分析

类似于上述项目,每个算法我们都设置了对应的实践项目,一共设置了8个项目,其他7个项目包括:基于循环神经网络的语音识别、基于支持向量机的垃圾邮件检测、基于AdaBoost的目标跟踪、基于最小二乘法的天气预测、基于KNN的手写体字符识别、基于关联规则的推荐系统,以及基于图神经网络的化学分子结构分析和预测。经过上述应用实践导向的机器学习导论教学模式后,我们以大作业报告结合现场PPT汇报和代码演示的方式进行考核。要求学生完成关于机器学习方法在人工智能应用领域的研究报告并演示代码及实验结果。

经过应用实践导向的机器学习导论教学模式学习,学生们更好地掌握了机器学习理论知识,上机实践能力得到明显的提升,学生对机器学习导论课程充满兴趣和自信,纷纷表示机器学习方法没有想象中那么枯燥和困难,并对进一步学习人工智能相关课程或从事人工智能相关工作研究充满了期待。

四 结束语

针对现有机器学习导论课程存在的问题,本文提出了应用实践导向的机器学习导论教学模式。该模式旨在通过精简和优化机器学习算法的理论知识内容,同时增加实践课程的学时,来帮助学生更好地将理论知识与实践应用相结合。该模式为每个机器学习算法设置相应的应用实践项目,构建一种1学时理论加1学时实践的教学模式。实践结果表明,该模式能够激发学生的学习主动性和积极性,促进他们更积极地参与到课程学习中来,最终提升机器学习导论课程的教学效果。

参考文献:

[1] 马晓晖,毛晶,张金凤,等.探索新工科背景下创新创业人才培养模式[J].实验室科学,2023,26(6):223-230.

[2] 方莹,王帅芳,卫一帆,等.新工科背景下人工智能专业建设三大问题探讨[J].计算机时代,2022(7):119-111.

[3] 李延超.基于渐进式的留学生机器学习课程实践研究[J].计算机时代,2023(7):136-139.

[4] 卢官明.机器学习导论[M].北京:清华大学出版社,2020.

[5] 葛琦,庄文芹.结合实践的启发式计算机图形学课程教学探讨[J].计算机时代,2023(2):119-121.

[6] 赵小燕,梁瑞宇,童莹,等.项目驱动法在语音信号处理课程中的探索和应用[J].计算机时代,2022(6):112-115.

[7] SIMONYAN K, ZISSERMAN A. Very deep convolutional networks for large-scale image recognition[C]// arXiv preprint arXiv:1409.1556,2014.

[8] 朱康.基于深度学习和特征融合的多模态情感识别研究[D].南京:南京邮电大学,2021.

[9] 王晓华,侯登永,胡敏.复合时空特征的双模态情感识别[J].中国图象图形学报,2017,22(1):39-48.

[10] 李炳臻,刘克,顾佼佼,等.卷积神经网络研究综述[J].计算机时代,2021,8(4):12-17.

[11] ZADEH A, LIANG P P, PORIA S, et al. Multi-attention recurrent network for human communication comprehension [J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2018,32(1):16-20.

[12] MA F, SUN B, LI S. Facial expression recognition with visual transformers and attentional selective fusion[J]. IEEE Transactions on Affective Computing, 2021,15(3):1-1.

[13] 叶继华,祝锦泰,江爱华.人脸表情识别综述[J].数据采集与处理,2020,35(1):21-34.