摘 要:机器学习是一门多领域交叉学科,让机器模拟人类的学习行为。图像处理是利用计算机对图像数据进行变换、预处理、特征提取与识别的技术。将机器学习方法融入到“图像处理”课程中,有利于实现“新工科”专业课程内容的更新。以机器学习方法为主线,将深度学习渗透到图像处理课程教学内容中,并与林业图像相结合,制定具体的教学实施方式,满足“新工科”课程建设的需求。
关键词:机器学习; 图像处理; 新工科
中图分类号:G642 文獻标识码:A 文章编号:1006-3315(2021)11-217-002
“新工科”[1]是在第四次工业革命、工业4.0等重大战略下,提出来的工科专业,具有实用性、综合性、交叉性等特点,产生于传统专业,又高于传统专业。在专业建设目标、理念、方法、内容上,都要体现未来需求驱动,创新与交融、协调与卓越等思想。新工科专业主要以智能和互联网为主轴,有人工智能、大数据、区块链、5G等相关工科专业。利用智能对传统专业进行存量更新,实现信息化、智能化。还有增加新兴工科专业,提前布局培养引领未来技术和产业的人才。人工智能是新工科的核心技术之一,主要包括:问题表示与解决、自然语言、语音识别、视觉理解、机器学习与控制等。机器学习属于人工智能的一部分。
机器学习就是给定一系列数据构建一个模型,然后用此模型对新数据进行预测和判别[2]。可简化为:数据-模型-属性。首先要找到大量的数据,构成数据集,并找出数据的概率分布规律,确定模型的形式和参数,此步骤称之为训练。训练好的模型对新数据进行概率计算,得到属性评价。图像处理是对图像数据进行计算的技术。图像是数据最常见的一种形式,因此,机器学习的各种方法都可以应用到图像处理中来[3-4]。
机器学习包括深度学习,两者的本质区别在于特征提取环节,传统的机器学习提取精确的特征集,此特征能够区分不同类别,然后用分类器加以识别。深度学习是多参数、多层的神经网络(或称之为模型),利用多参数可以提取每一层的特征,没有必要与具体物理意义对应的特征,更具有通用性、一般性、智能性。以“深度学习”为代表的新技术,是“新工科”课程建设的标志之一。本文将机器学习方法应用到图像处理教学的整个过程中,实现教学内容更新,适应新时代需求。
一、机器学习、深度学习与图像处理的关系
机器学习是人工智能研究的一个分支,人工智能研究包括专家系统、机器学习、进化计算、模糊逻辑、计算机视觉、自然语言处理、推荐系统等。而机器学习是一种实现人工智能的方法,传统方法主要有K-均值、K-近邻(KNN)、决策树(Decision Tree)、EM(Expectation-Maximization)、自适应增强(Adaboost)、支持向量机(Support Vector Machines, SVM)、贝叶斯分类(Bayesian Classification)、聚类(Clustering)等方法。根据不同的分类方法有:监督学习(如分类问题)、无监督学习(聚类问题)、弱监督学习、半监督学习、集成学习、深度学习和强化学习等。深度学习是机器学习的一部分,本质上是一种深度结构的神经网络,主要有卷积神经网络(Convolutional Neural Networks, CNN)、深度置信网络(Deep Belief Networks,DBN)等。主要模拟人的大脑中神经元的通信和计算方法。
人类获取信息中80%以上为视觉信息,视觉有视频和图像,视频本质上是由一张张图片按时间轴叠加在一起而形成,因而视频处理最终还是要归结到图像处理。机器人通过视觉传感器获取图像,机器人要进行机器学习、理解、分析,并得出有用的结论和解决方案。深度学习是模仿人类大脑的一种机器学习方法,比传统的机器学习方法学习效果更好,同时计算成本更大,对硬件设备要求高,是一种升级的新颖的机器学习方法。因此,机器学习及深度学习都是一种理论和知识,可用于各种数据,例如图像、语音、文本、传感器数据、网络数据等各类数据,而图像处理是一门技术和方法,主要包括:图像采集、图像变换、图像增强和复原、图像编码、图像分割、图像特征及描述、图像分类和识别等。图像处理也可以为机器学习提供更多的数据进行训练和测试,进而获得更好的数学模型和神经网络结构,使得机器更加智能化。可以将传统的机器学习及较新的深度学习等理论应用到图像处理的技术和教学中去,赋予传统教学内容的“新工科”特性。
二、机器学习在图像处理教学中的应用
机器学习分类方法有很多,主要有统计学习、强化学习、进化学习和群体智能等。统计学习主要以概率论为基础,分为参数学习和非参数学习。强化学习,又称再励学习、评价学习或增强学习,交互过程中通过学习策略以达成回报最大化。进化学习和群体智能主要解决优化问题。图像去噪是将噪声和目标分开,并采用不同的阈值办法,将噪声去除,目标保留。因此可以利用有监督学习方法或聚类法实现目标和噪声的分离。图像分割是将感兴趣的区域和背景区分开,本质上是像素的分类或聚类问题。可以将监督法、半监督、弱监督法用于图像分割,比如SVM和KNN。图像目标检测、分类和识别都可以采用机器学习方法实现,即分类器,包含决策树、逻辑回归、朴素贝叶斯、神经网络等算法。以“进化学习和群体智能”为例,说明其在图像处理优化问题求解中的应用。进化计算最典型原始的算法包括遗传算法、进化策略、进化规划、遗传编程等;群体智能包括蚁群算法、微粒群算法、蜂群算法、细菌觅食算法、细菌去药性算法等。利用优化算法实现灰度变换系数的最优求解,实现图像增强;优化算法与各种分割准则相结合,得到最佳的单阈值或多阈值,实现图像分割;利用优化算法得到纹理特征描述,进而实现纹理分割、合成、分类等。对图像配准、图像特征提取和选择、分类器、图像融合中的参数进行优化,得到最优的图像处理效果。
三、深度学习在图像处理教学中的应用
深度学习是一种基于深度神经网络的机器学习方法,比传统的神经网络的结构要深,参数量大,能刻画数据内在的丰富信息,典型的有卷积神经网络、深度信任网络、堆栈自编码网络等[5-6]。深度学习可以用于各种类型的大数据,如文字、声音、图像等。用于图像处理的主要有TensorFlow(Google公司开发,在图像分类、音频处理、推荐系统和自然语言处理有广泛应用)和PyTorch(Facebook开发,配置灵活,简洁高效)框架,应用于图像分类、图像目标检测、图像分割和图像生成等。图像分类有ResNet-18、ResNet-34、ResNet-50、ResNet-101、ResNet-152残差神经网络、InceptionNet-V1、InceptionNet-V2、InceptionNet-V3、InceptionNet-V4网络。目标检测有SSD模型,预测对应物体的选框和选框对应物体的种类信息,有SSD300与SSD500两种。图像分割包括语义分割、实例分割、全局分割。全卷积网络(Fully convolutional network,FCN),使用最后一层特征进行卷积,然后上采样得到和原来图像一样的形状,通过和原始图像的Mask进行比较来实现像素级物体分割;Unet网络借鉴了FCN,并增加了残差链接部分,不同层次的特征进行组合,实现上采样和下采样结合,图像分割更加精确。生成图像主要采用生成模型,给定一组随机数,根据随机数生成服从训练数据分布的图像。主要有变分自编码器(VariationalAuto-Encoder, VAE)和生成對抗网络(Generative Adversarial Networks, GAN)。VAE采用编码器和解码器,编码器将训练图像转换成隐含变量,解码器将输入的隐含变量转换成图像。GAN包括生成网络和判别网络,生成网络将输入隐含变量转换成对应图像,判别网络判别测试图像是否和生成图像一致。深度学习的核心就是卷积神经网络模块,本质上是特征提取功能,不需要构造具体特征,通过自动学习,获得模型参数,得到特征值。此外,数据集的构造和选择是深度学习结果好坏的重要因素之一。常用的数据集分为:小型、中型、大型。小型的有MNIST(来自美国国家标准与技术研究所,由手写数字的图片和相应的标签组成)和CIFAR(由Alex Krizhevsky、Vinod Nair和Geoffrey Hinton收集,CIFAR-10和CIFAR-100);中型的有Pascal VOC(为图像识别和分类提供了一整套标准化的优秀的数据集);大型的有ImageNet(用于视觉对象识别软件研究的大型可视化数据库)和COCO(大型的、丰富的物体检测,分割和字幕数据集)。Torchvision(有图片分类、语义切分、目标识别、实例分割、关键点检测、视频分类等工具)提供了数据包装类数据集进行载入。深度学习图像处理流程为:构建和搜集图像数据库、选择深度学习模型、模型训练、模型验证及图像数据测试。利用深度学习可以提高图像处理教学质量。
四、结语
以“人工智能和深度学习”为代表的第四次工业革命即将到来,论文将机器学习和深度学习融入到图像处理课程教学当中,紧密结合图像增强、图像分割、图像特征提取、图像分类及生成等教学内容,突出教学内容的“创新”元素。初步构建了“新工科”课程教学体系,满足新形势下的教学内容更新需求。
基金项目:南京林业大学2021教学质量提升工程项目(2021-SXJS-006)
参考文献:
[1]王峰,赵小刚,汪鼎文.新工科背景下案例化教学在《数字图像处理》课程中的研究与实践[J]汉江师范学院学报,2021,41(03):89-93
[2]万琳,裴小兵,张倩,李轩涯.面向软件工程专业的机器学习课程实践教学探究[J]计算机教育,2021,{4}(04):155-158
[3]赵雪峰,施珺.面向本科生机器学习课程的教学探索[J]计算机教育,2021,{4}(02):170-174
[4]王永强,贾瑞丽,柳明,刘瀚,佟文超.科教结合的MatLab图像处理课程教学模式探索[J]中国现代教育装备,2021,{4}(05):111-113
[5]陈舒涵,胡学龙,姚志均,陈万培.深度学习在“数字图像处理”课程教学中的应用探讨[J]工业和信息化教育,2019,{4}(02):84-88+94
[6]莫建文,张彤,袁华,欧阳宁.深度学习在图像处理技术课程教学实践中的应用探讨[J]教育教学论坛,2016,{4}(09):115-116
作者简介:程玉柱,1980年生,男,汉族,江苏盐城人,博士,讲师,研究方向:林业图像分割与识别研究。