深度学习在园林植物学教学中的应用

2020-01-04 07:18路海兰
安徽农业科学 2020年24期
关键词:卷积神经网络深度学习

路海兰

摘要 采用深度学习算法实现植物图片的自动识别,并将该算法嵌入手机APP,应用到园林植物学教学中,辅助教师的教学工作和学生课后的自主学习活动。算法中数据采集与标记采用园林植物专家筛选和标记,数据处理采用随机增强算法避免过拟合,卷积神经网络采用MobileNet以适用于移动终端,损失函数采用正例损失和负例损失,参数优化采用Adam算法。最终训练结果达到90%以上的精度,满足实用需要,达到优化园林植物学课程的课堂与课后教学活动的效果,有效地解决植物识别在种类数量、准确度和速度上的难点。

关键词 深度学习;卷积神经网络;园林植物学;植物识别;教学辅助

中图分类号 S-058文献标识码 A

文章编号 0517-6611(2020)24-0238-04

doi:10.3969/j.issn.0517-6611.2020.24.066

开放科学(资源服务)标识码(OSID):

Application of Deep Learning in the Teaching of Horticulture and Forestry Botany

LU Hailan (Zhongshan College of Vocation and Technology,Nanjing,Jiangsu 210049)

Abstract The application of deep learning algorithm was used for automatic recognition of plant pictures,and the algorithm was embeded in mobile APP to horticulture and forestry botany teaching,assisting teachers teaching and students selflearning activities after class.In the algorithm,data acquisition and labeling were screened and labeled by experts,data processing was enhanced randomly to avoid overfitting,convolution neural network was used for mobile terminals,loss function includes positive loss and negative loss,and parameter optimization was based on Adam algorithm.The final training results reached more than 90% accuracy and met the practical needs,so as to optimize the effect of classroom and afterclass teaching activities.Deep learning could effectively solve the difficulties of plant recognition in the number,accuracy and speed of species.

Key words Deep learning;Convolutional neural network;Horticulture and forestry botany;Plant recognition;Teaching assistance

隨着互联网和移动终端的迅猛发展和大规模普及应用,人工智能在教学和科研上的应用价值也越来越突出。园林植物学是风景园林等相关专业的专业基础课,是一门应用性很强的学科,植物识别是园林植物学等学科教学中的重要环节和重点内容。自然界植物种类繁多,传统人工植物识别需要一定的专业知识和相当丰富的经验积累,而且速度慢、效率低,有时候植物专家都很难准确地辨识植物种类。学生课后在没有教师或植物学专业人士指导的情况下,只能依靠植物特征,通过植物检索表、植物志和植物图谱等工具书进行查询和识别,费时费力且需要一定的专业基础和资源,也很难提高植物识别水平。

将深度学习技术应用于植物识别课题中,通过使用大量标记数据对模型进行训练,使得机器能进行自动识别,这不仅可以有效地解决植物图像识别的种类数量,还将大大提高识别的速度和效率难题。将该技术嵌入手机APP中,并应用到园林植物学教学过程中,不仅有助于提升和优化教学手段和教学内容,使得学生可以随时随地使用,有利于学生辨识植物种类和小课题研究,而且对提高学生学习兴趣和学习自主性有显著的促进作用。鉴于此,笔者采用深度学习算法实现植物图片的自动识别,并将该算法嵌入手机APP,应用到园林植物学教学中,从而辅助教师的教学工作和学生课后的自主学习活动。

1 应用原理

深度学习(DL)是机器学习(ML)的子集,受到人类大脑的启发,DL采用多层互联的人工神经网络算法。现代深度学习通常采用数十甚至上百层神经网络结构,每一层都在上一层的基础上逐步抽象,最终从训练数据中提取特征。图1为采用的深度学习算法框图。植物图片经过人工采集和标记后进行预处理,预处理后的数据随机分批对卷积神经网络进行训练,优化算法针对训练损失对网络参数进行优化,然后进行下一轮训练直至损失满足要求。

2 数据采集与标记

首先,对1 000种常见园林植物进行拍照采集数据。由于植物在不同时期的形态、色彩、纹理等都有变化,因此在春、夏、秋、冬每季选取阴晴2 d,每种植物每天拍摄50张,共计1 000×4×2×50=400 K张原始照片。然后请园林植物专家对原始照片进行筛选,剔除不符合要求的照片,并对每张照片进行标记,最后形成1 000种植物约300 K张照片。将这些照片按JPEG格式存放于硬盘上,每种植物1个目录,目录名即为该植物名称。

将标记后的数据划分为3个集合,分别为训练集、验证集、测试集。训练集占总数据的60%,用于训练深度学习模型;验证集占总数据的20%,用于调整超参数,调整过程需要使用模型在验证集上的性能作为反馈;测试集占总数据的20%,用于对训练结果进行评估。

3 数据预处理

由于数据集是有限的,所以在训练时可能出现过拟合的情况,导致泛化性能变差。为了减少神经网络训练过程中的过拟合现象,对数据进行了预处理(图2),预处理会从训练集数据中随机生成更多的数据。预处理共有5个步骤,每一步的参数都是随机产生的。其中,第1步图像旋转,参数包括旋转中心和旋转角度;第2步图像剪裁,剪裁区域的位置随机选取,剪裁后大小为原图像的80%;第3步镜像,包括X轴镜像和Y轴镜像;第4步γ校正,对RGB 3个颜色通道分别进行γ校正;第5步高斯白噪声,加入N(μ,σ2)的高斯白噪声,其中(μ=0,σ=10);最后将数据格式化为张量。

4 卷积神经网络

卷积神经网络是采用卷积(convolution)运算的神经网络,它是计算机视觉中应用最多的一种学习模型。卷积神经网络的特点是稀疏连接(sparse connectivity)、参数共享(parameter sharing)和等价表达(equivariant representation),这些特点使得卷积神经网络非常适合图像分类和图像识别。目前主流的卷积神经网络包括AlexNet、VGG、GooLeNet、ResNet、MobileNet,如表1所示[1-5]。 其中MobileNet基于深度可分离卷积,把标准卷积分解成深度卷积(depthwise convolution)和逐点卷积(pointwise convolution),使得MobileNet在保持较高精度的情况下,大幅度减少了模型容量和运算量,并可以在手机等移动终端上获得较高的运算速度。因此,該研究采用MobileNet作为卷积神经网络模型。

深度可分离卷积将标准卷积分解成深度卷积和一个1×1的逐点卷积。深度卷积针对每个输入通道使用1个滤波器进行滤波,逐点卷积使用1×1的卷积操作来组合所有深度卷积得到的输出。深度可分离卷积将卷积分为了2层,这种分解能够有效地大量减少计算量以及模型的大小。

标准卷积如图3,其卷积核K大小为DK×DK×M×N,其中DK是卷积核的空间维度,M是输入通道数,N是输出通道数。那么输出特征图G为:

Gkln=ijmKijmn×Fk+i-1,l+j-1,m

式中,F为输入特征图,其空间维度DF。所以标准卷积的运算量为:

DF×DF×M×DK×DK×N

深度卷积如图5,可表示为:

G~=ijK~ijmn×Fk+i-1,l+j-1,m

式中,K~是大小为DK×DK×M的卷积核,G~是输出特征图,则其运算量为:

DF×DF×M×DK×DK

与标准卷积相比,深度卷积大大减少了运算量。

逐点卷积如图5,通过卷积将深度卷积的输出进行线性组合。则深度可分离卷积的运算量为:

DF×DF×M×DK×DK+DF×DFM×N

与标准卷积相比,深度卷积的运算量减少为原来的1N+1DK2。

由表2可知,MobileNet网络输出植物图片特征F,F为512维向量。二范数Dij=‖Fi-Fj‖2表示2张植物图片的相似程度,其中Fi表示植物图片i的特征。

5 损失函数

损失函数(loss function)又称为代价函数(cost function),它用来度量模型的预测值与真实值的不一致程度,是一个非负实值函数,损失函数的值越小,预测正确程度越高,通过最小化损失函数的值来调整模型的参数和评估模型的性能。该研究采用的损失函数为L=Lp+Ln,其中Lp表示正例损失、Ln表示负例损失:

Lp=1Npi≠j[Dij-T+M]+I(ti=tj)

Ln=1Nni≠j[T+M-Dij]+I(ti≠tj)

式中,T和M为超参数,分别表示阈值和余量;[x]+=max(x,0);I(c)当c为真时为1,否则为0;ti表示植物图片i的标记类;Np=i≠jI(ti=tj),Nn=i≠jI(ti≠tj)。

反向传播时梯度LFi=LpFi+LnFi,

LpFi=1Npi≠ju(Dij-T+M)Fi-FjDijI(ti=tj)

LnFi=-1Nni≠ju(T+M-Dij)Fi-FjDijI(ti≠tj)

式中,u(x)为单位阶跃函数,当x<0时u(x)=0,当x≥0时u(x)=1。

6 参数优化

在深度学习中,大部分问题都很难计算出全局最优解,所以通常会采用迭代优化的方法来计算出局部最优解。常用的优化算法包括批量梯度下降法、随机梯度下降法、Momentum、AdaGrad、Adadelta、RMSprop、Adam(表3)。

该研究采用的参数优化为Adam[6]算法,其名称来源于适应性矩估计(adaptive moment estimation)。Adam 算法的优点在于[7]:①实现较简单,计算较高效,对内存需求较少;②参数的更新不受梯度伸缩变换的影响;③ 超参数具有较好的解释性并且无需调整或仅需很少的微调;④步长能够被限制在一定的范围内;⑤ 能实现学习率自动调整过程;⑥适合于较大规模的数据及参数的需要;⑦能适用于不太稳定损失函数;⑧能有效缓解梯度稀疏或梯度存在较大噪声的问题。

Adam算法和随机梯度下降法不同,随机梯度下降法保持单一的学习率对所有权重进行更新,学习率在训练过程中不会改变。而Adam通过计算梯度的一阶矩估计和二阶矩估计,对不同的参数设计独立的自适应性学习率[8-9]。

Adam算法为2种随机梯度下降算法的组合,自适应性梯度算法(AdaGrad)为每参数保留一个学习率以提升在稀疏梯度上的性能;均方根传播算法(RMSProp)基于权重梯度最近量级的均值为参数适应性地调整学习率[8]。Adam 算法在非稳态和在线问题上有很优秀的性能,同时获得了自适应性梯度算法和均方根传播算法的优点。Adam算法不仅与均方根传播算法一样基于一阶矩均值计算适应性参数学习率,它同时还充分利用了梯度的二阶矩均值,算法计算了梯度的指数移动均值,超参数β1和β2控制了这些移动均值的衰减率[10]。移动均值的初始值和β1、β2值接近于1,因此矩估计的偏差接近于0,该偏差通过先计算带偏差的估计,然后计算偏差修正后的估计而得到提升。

Adam运算过程为:初始化v=0,s=0。在第m轮训练中更新v和s:

v=β1v+(1-β1)dW

s=β2s+(1-β2)dw2

修正后得:

v^=v1-β1m

s^=s1-β2m

更新网络参数W,得

W=W-αv^s^+ε

式中,α为学习率,β1、β2为超参数,ε避免除0错误。

图6为训练误差,最终训练精度超过90%。以后将加入更多训练数据,训练精度将进一步提高。智能手机APP作为移动终端用户的应用程序已成为大学生学习中必不可少的工具,在教学和科研上的应用价值也越来越突出[11-12]。深度学习可以有效地解决植物识别在种类数量、准确度和速度上的难点。

7 结论

将该研究采用的算法嵌入到手机APP中(遇见植物),为园林植物学教学中出现问题的解决提供了新方案。该APP的核心功能有手机拍照植物识别、大数据汇总、植物知

识介绍和网络鉴定。笔者将该APP推广给教育者、学生、植物研究者、花卉养护者、园艺工作者和植物爱好者,都得到了比较好的反馈。另外,该研究采用的算法不仅可以应

用在园林植物学教学中,也可以应用到园林植物相关学科的其他方

面,如植物病虫害防治、植物群落结构调查等。

参考文献

[1]

KRIZHEVSKY A,SUTSKEVER I,HINTON G E.ImageNet classifi cation with deep convolutional neural networks[J].Communications of the ACM,2017,60(6):84-90.

[2] SIMONYAN K,ZISSERMAN A.Very deep convolutional networks for large-scale image recognition[R].2015.

[3] SZEGEDY C,VANHOUCKE V,IOFFE S,et al.Rethinking the inception architecture for computer vision[R].2015.

[4] HE K M,ZHANG X Y,REN S Q,et al.Deep residual learning for image recognition[R].2015.

[5] HOWARD A G,ZHU M L,CHEN B,et al.MobileNets:Efficient convolutional neural networks for mobile vision applications[R].2017.

[6] KINGMA D P,BA J.Adam:A method for stochastic optimization[R].2014.

[7] 何紫陽.基于神经网络的心电数据分类算法研究[D].郑州:郑州大学,2019.

[8] 赵晓丽.面向图像分割的智能算法研究[D].上海:上海大学,2018.

[9] 徐俊男.数据驱动的风电机组参数优化方法研究与实现[D].南京:东南大学,2018.

[10] 董启宏.基于智能手机传感器的用户隐私安全研究[D].南京:东南大学,2018.

[11] 赵鹏,郭垚鑫,段栋,等.智能手机植物识别App在植物学教学中的应用[J].高校生物学教学研究(电子版),2018,8(1):47-51.

[12] 徐燃,王宏勋,张胜全,等.智能手机在构建“药用植物学”“理实一体化”教学模式中的应用研究[J].科教文汇,2019(7):91-92,100.

猜你喜欢
卷积神经网络深度学习
基于卷积神经网络温室智能大棚监控系统的研究
基于深度卷积神经网络的物体识别算法
有体验的学习才是有意义的学习
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望