马艺菲
摘 要:本文规划和设计了基于卷积神经网络、采用分布式架构的手绘画的识别系统,该系统通过深度学习,利用卷积神经网络自动提取手绘画图像的特征,并实现图像特征提取过程可视化,最终实现手绘画的智能识别。
关键词:手绘画识别;分布式系统;卷积神经网络;特征提取和分类
中图分类号:TP391 文献标识码:A 文章编号:1671-2064(2018)23-0041-02
1 引言
手绘画与我们的现代生活密不可分,是人类最直观且最原始的沟通工具,广泛应用于电子商务、电子政务、财政、建筑、家居软装设计、工业设计、美术等领域。近年来,随着智能移动设备、可触屏设备的普及,手绘画可方便地从智能手机、平板电脑等移动设备上获取, 这给手绘画识别带来更多的应用场景。目前己有的手绘图识别方法通常依赖于手工特征提取,但是由于手绘画中线条的多变性、个人的主观因素的不确定性等原因,使得人工提取特征变得十分困难, 导致了现有的手绘画的识别率较低,且通用性较差。
在传统的计算机手绘画识别中,是将手绘画以图像的方式录入计算机,建立手绘画识别系统,根据手绘画的几何特征进行识别。由于手绘画千差万别,所以提取其特征比较困难,而卷积神经网络可以自动提取特征,并且能够迭代多次、反复训练,识别结果优于传统的提取特征的识别方法。
2 智能分布式手绘画识别系统的关键技术
在智能分布式手绘画识别系统中,采用分布式架构,将手绘画的信息采集、特征提取、智能识别和分类,以及结果输出等识别任务分散到不同的计算机节点上运行,各个识别任务协同完成手绘画的智能识别,该系统涉及的主要关键技术包括分布计算技术和卷积神经网络。
2.1 卷积神经网络
所谓神经网络就是将许多个单一“神经元”联结在一起,一个“神经元”的输出是另一个“神经元”的输入。卷积神经网络是一种多层的神经网络,其网络模型是一种特殊的深层次的神经网络模型,它的特殊性体现在两个方面,一方面它的神经元的链接是非全连接的。另一方面同一层次中某些权重是相同的、共享的。它的非全链接和权值共享的网络结构更类似生物的神经网络,从而降低了网络模型的复杂度。卷积神经网络包含输入层、隐藏层和输出层,其中隐藏层包括卷积层、池化层、全连接层和分类层,以及输出。卷积层,也可称为特征提取层,包括卷积、激励和池化,它通过利用不同的卷积来突出不同方面的特征以达到提取特征的效果。卷积是分析数学中的一种运算,具体过程卷积核与上层整个特征图卷积,得到这一层的一个特征图,每一输出的特征图都与前一层的特征图存在关联性,代表了这个输入图像不同的特征。并利用图像局部相关性的原理,对图像进行抽样,达到减少数据处理量同时保留有用信息的效果。在卷积层后后是池化层,池化层由多个特征映射组成,每个特征映射是一个平面,平面上采用权值共享技术,通过激励函数进行运算。全链接层用来将所有特征图展开得到一维向量,然后把一维向量输入到分类层进行分类,最后由输出层输出结果。一般根据具体的应用和问题确定需要多少卷积层和池化层,采用什么样的分类器。
在智能手绘画识别系统图1和图2中,采用Eits收集的250类手绘画数据集并进行反转、旋转等作为训练数据集,对每个卷积结果都进行relu(x)=max(0,x)运算,采用dropout优化训练和分类,图像特征提取分类可视化,从而提高手绘画识别的速度和准确率。
2.2 手绘画识别与分布计算技术
分布计算是一种计算方法,简单来说,是把一个大计算任务拆分成多个小计算任务分布到若干台机器上去计算,使对计算、数据处理等分散到构成整个系统的各个节点中,然后再进行结果汇总。在分布式系统中的涉及的主要关键技术包括资源调度和负载均衡、信息共享和同步。在智能分布式手绘画识别系统中,手绘画的信息采集、图像特征提取和分类以及智能识别的结果输出分布在不同的计算节点,这些节点的计算任务由管理节点进行任务调度和管理,通过共享文件系统和消息机制实现各节点计算任务的信息共享和交换。
3 智能分布式手绘画识别系统的规划和设计
智能分布式手绘画的识别系统由数据采集器、管理服务器、工作服务器、存储服务器、通讯服务器和输出器组成。数据采集器实现被识别手绘画信息采集处理。管理服务器完成对智能识别网络集群的管理、参数更新以及配置管理等。工作服务器完成智能识别的特征提取和分类。工作服务器包括特征提取器、分类器。特征提取器基于卷积的神经网络模型完成识别对象的特征提取,由卷积器、激励器和池化器组成,卷积器主要作用是提取输入数据特征。分类器由全连接器和分类器组成,全连接器将所有特征图展开得到一维向量,然后输入到分类器进行分类,将分类的结果由输出器输出,整个识别过程的可视化。通讯服务器提供的可靠的通讯服务,存储服务器由内存数据库和文件系统提供信息共享存储服务。管理服务器和工作服务器之间由消息队列提供网络模型参数的传递和控制信息的传递。在工作服务器中包括5层卷积,2层全链接。每层卷积有卷积器、激励器和池化器组成。在2层全链接中,每层全链接进行全连接处理和采用dropout优化。独立的输出器,由一层全链接和Finser分类器组成。结构如图3所示。
输入器完成图像的采集和预处理。数据集和训练集采用扩展后的Eits 250类手绘画。在250类手绘画中,都是日常生活中常见的物品,且包含80幅灰度图像。对250类画进行水平翻转和旋转扩展,数据集数量达160000。采用去均值和归一化处理,及先就和求中心值求均值,而后减去均值,把各个维度的数据都中性化到0,进行归一化处理。工作服务器主要完成特征的提取和分类,通过利用不同的卷积核来突出不同方面的特征以达到提取特征的效果。具体过程为上层得到的特征图与一个卷积核卷积,然后经过激活函数,加上偏置,形成这一层特征图的局部特征,得到这一层不同的特征图。在卷积器后面是激励器,激励器由多个特征映射组成,每个特征映射是一个平面,平面上采用权值共享技术,通过激励函数进行运算,采用relu函数作为网络的激活函数,对每个卷积结果都进行relu(x)=max(0,x)运算。池化器是将得到的特征进行抽样,对每个子块进行池化,对运算结果选取最大值,及找出最大值作為输出的值。卷积神经网络通过卷积器和激励器和池化器的循环往复提取到图像特征。整个智能识别系统有3层全链接层,在工作服务器有2层全连接层。在输出器中有1层全链接层,输出器中全连接层将所有特征图展开得到Fisher向量,进行分类输出识别结果。分布式手绘画识别系统将特征提取信息可视化,根据可视化结果进行相应分析及规律总结,调试和优化卷积神经网络结构。管理服务器,完成对智能识别网络集群的管理、网络模型参数的更新以及配置管理,完成对工作服务器的特征提取参数、分类参数管理等,完成同工作服务器定时心跳管理,工作服务器的注册、自动接入管理。管理服务器和工作服务器之间基于通讯服务器提供的RPC和MQ进行信息交换。
4 智能手绘画识别系统的识别分析
智能手绘画识别过程包括系统各部件初始化过程、加载数据和预处理过程、手绘画特征提取和分类网络模型定义和构建过程,以及训练、预测和评估过程。
在初始化、加载数据及预处理过程中,涉及管理服务器和网络参数的初始化,创建工作服务器,工作服务器的注册、工作服务器和管理服务器的心跳的建立,采集输入器和输出器的初始化,工作服务器的卷积器、激励器、池化器的初始化,以及数据预处理。
在训练以及预测和评估过程中,主要包括训练,前向传播和反向计算,前向传播特征信息,而反向计算体现在基于误差信息对模型进行校正,以及识别预测。
5 结语
智能手绘画识别系统基于卷积神经网络,采用端对端的数据处理方式,能够自动提取输入图像的特征,其图像的特征提取就像一个黑盒子,图像特征提取过程可视化,根据可视化结果优化卷积神经网络模型及网络参数,迭代多次、反复训练,实现手绘画的智能识别,识别结果优于传统的提取特征的识别,可广泛应用于电子政务、电子商务和工业设计等领域,应用前景广阔。
参考文献
[1]山下隆义.图解深度学习[M].人民出版社,2018.
[2]李飞鹏.卷积神经网络及其应用[D].大连理工大学,2014.
[3]George Coulouris著.金蓓弘译,概念与设计[M].机械工业出版社,2008.