高圣寒 赵在东 孔维舸
摘 要:当前,无论是学生食堂和企事业单位员工食堂,还是盈利为目的的餐厅,传统的用餐模式主要三种,即窗口、套餐、自选。窗口模式就是就餐人员在许多个窗口排队选择菜品,服务员给打菜,菜选完以后,总额由服务员计算;套餐模式就是在规定套餐中,将菜品选择,服务员给打菜准备就餐,按照不同的套餐价格,收银员进行结算;自选模式就是服务员按份给打菜,放到窗口,就餐人员按自身喜欢取菜,将选好的菜放到托盘上,收银员将整单总价人工核算。卷积神经网络智能网络,是一种新的自助结账系统[1-2]。该文分析和研究了运用卷积神经网络智能识别技术进行餐厅的自助结账。
关键词:卷积神经网络;智能识别技术;餐厅自助结账
卷积神经网络智能识别技术,无论是学校食堂,还是企事业单位的员工食堂,都比较适用,点餐模式主要以自选为主,智能机器运用识别判断和扫描等一系统的流程,将就餐人员餐盘上的点菜总额结算出来。该自助结账系统,既优化了点餐系统,又简化了用餐流程,克服了人工结算的繁琐和不便,从而使成本降低。
一、概述卷积神经网络
卷积神经网络由偏置常量的神经元和可学习的权重构成[3-4]。主要作用就是在图片中将图像特征提取。卷积神经网络在变化图像时,适应性非常好,无论是图像旋转和平移,还是倾斜变化和大小缩放,其都能够适应,主要是由于卷积神经网络的非线性学习能力结构非常好。
(一)卷积层。在神经网络中,卷积层是最重要的组成部分,其由许多个卷积单元构成,每个参数都是通过优化反向传播算法而获得的。卷积层的作用主要是将输入的不同特征提取,有些角和边缘以及线条等低级的特征等,第一层卷积层就可以提取。为了将更加复杂的特征在低级特征中提取,必须要应用多层卷积层。应用卷积运算,很大程度地减少了神经网络的参数,但是,还是一个很大的数量。此时卷积层权值的共享机制,能够使神经网络训练的参数进一步地减少。权值共享机制,就是图像中一部分与其他部有相关的联系。参数共享机制运用以后,能够很大程度地减小参数数量。
(二)池化层。池化层,在卷积层以后,可以获得比较大维度的特征,切割这些特征,多个区域就会获得,无论是这些区域的平均值,还是最大值都能够获得,并且较小维度的新的特征也能够获得。通常池化层放在两个卷积层之间,主要用于特征映射维度的降低和避免过拟合以及计算量的减少等问题。通常其输入是从上一层获得的,将强大鲁棒性提供为主要的作用。
(三)激活层。激活函数就是激活层,引用激活函数,主要是由于网络中不可以只有线性模型,激活函数是将非线性引入的因素。在神经网络中,通常非线性部分主要来自于神经元之间选择性的激活,这样对于学习稀疏特征非常有利。在卷积神经网络中,Sigmoid和Tanh以及ReLU等为常用的激活函数。
针对于各个输入数据,Sigmoid运用Sigmoid函数操作。该设计很简单,无需太多的参数。以下为计算公式:
从当前来看,应用比较广泛的激函数就是ReLU,其广泛应用的原因,就是在确保ReLU效果比较良好的情况下,收敛的速度会更快。从本质上,ReLU是一个分段的线性函数,致使无论是前向计算,还是反向传播计算,都比较简单。相对于其他激活函数,ReLU具有很大的优势。通常Tanh和Sigmoid等激活函数具有饱和的现象,消失梯度的问题就容易出现,原因是在函数两端这些函数的导数通常近于零,致使反向传播以后,导致前面层数的梯度也基本变成了零。ReLU的计算公式:
(四)全连接层。在卷积神经网络中,全连接层为最后的部分,通常全连接层能够转化卷积出的多维特征为一维向量[5-6]。其作用是将前一层全部的激活函数结果在模型最后两层完全连接。在全部连接层中,为了避免过拟合产生,通过运用Dropout算法避免过拟合产生。在深度神经网络中训练模型时,训练的数据若比较少,过拟合现象就容易出现,即模型可以将训练集的特征更好地学习,但是,泛化能力欠缺。为了防止产生过拟合,除了应用传统的正则化方法,还有一种就是Dropout方法,该方法主要用于对深度神经网络过拟合问题进行解决。2014年,Srivastava等人提出Dropout,他们指出每次进行训练时,需要更新一部分参数,不用更新另一部分参数,这样可以避免有些特征协同的作用。在标准神经网络中,各个参数具有的导数怎样变化其都会告知,一直到最终减小损失的函数。
二、运用卷积神经网络智能识别技术实现餐厅自助结账
(一)构建中餐菜品检测数据库和识别数据库。在VIREO Food-172的数据库中,随机在每一类菜品中抽取图片100张,共计17200张图片,并且手工标注图片中中餐菜品的位置,将检测中餐菜品的数据库构建起来。检测中餐菜品任务中可以应用该数据库,主要作用是训练菜品检测模型。识别中餐菜品的数据库,主要是以VIREO Food-172为基础,应用检测菜品,精准切割各张图片中的菜品图像,将数据库构建起来。
(二)在识别中餐菜品任务中应用检测菜品。主要运用YOLOv2模型,检测中餐菜品。YOLOv2模型能够准确快速地检测中餐菜品,具有很大的应用价值。通过对比实验几种常见的深度卷积神经网络模型,运用实验方式,可以了解到检测中餐菜品加入以后,的确有提高识别中餐菜品准确率的作用。在识别中餐菜品任务中应用检测菜品,通过检测中餐菜品,使识别中餐菜品的准确率有效地提高。
(三)建立集成模型,解决识别中餐菜品的任务。主要在4种选择性集成算法中应用,即基于准确率的排序、Orientation Ordering、Kappa Pruning、DHCEP,对识别中餐菜品的任务更好地解决。分析這几种选择集成算法获得的最终集成模型,主要分析准确率和多样性。根据Kappa Pruning的算法,在准确率识别得以保证的情况下,模型的多样性比较好,识别的准确率为84.56%,相对于VIREO Food-172的构建者,在识别中餐菜品中用的算法识别准确率的82.06%,已经超过了,根据DHCEP选择的集成算法,集成模型最终具有识别最高的准确率为85.18%。在识别中餐菜品任务中应用选择性集成算法,也是一种创新。
在餐厅自助结账中,有效运用卷积神经网络智能识别技术,既能够将用餐人员点的菜品总额结算出来,又能够使传统人工结算的繁琐和不便也能够克服,非常值得应用和推广。
参考文献
[1] 吴云华,张泽中,华冰,陈志明.应用卷积神经网络的遥感图像云层自主检测[J].哈尔滨工业大学学报,2020(11):1-8.
[2] 叶灵枫.基于深度学习的食品自动识别算法研究[D].浙江师范大学,2020.
[3] 朱沛贤.基于卷积神经网络的单目图像深度估计研究[D].南京邮电大学,2018.
[4] 张晓明.基于卷积神经网络与3D几何语义的室内场景理解研究[D].北京交通大学,2018.
[5] 崔建华.卷积神经网络在食材图像分类中的应用[D].湖南大学,2017.
[6] 杨勇.基于卷积神经网络的RGB-D图像室内场景识别研究[D].浙江大学,2017.
基金项目:利用卷积神经网络智能识别技术实现餐厅自助结账,编号:201913301023。