深度学习框架Caffe在图像分类中的应用

2016-09-24 01:31:39王茜张海仙四川大学计算机学院成都610065
现代计算机 2016年5期
关键词:印文印章框架

王茜,张海仙(四川大学计算机学院,成都 610065)

深度学习框架Caffe在图像分类中的应用

王茜,张海仙
(四川大学计算机学院,成都610065)

0 引言

在深度学习概念的提出以及GPU被用于科学计算之前,大型神经网络几乎鲜有问津。究其原因,其一,深度神经网络面临着由梯度消失和过拟合等原因导致的训练困难的问题。其二,大型神经网络动辄百万甚至千万级的参数数量不仅令人生畏,而且面临着训练周期以周甚至月为单位计量的尴尬局面。深度学习的提出在很大程度上解决了梯度消失和过拟合的问题。而GPU计算平台被直接用于科学计算能极大地提高数据的计算速度。GPU用于科学计算主要以NVIDIA(英伟达)公司的CUDA框架为底层系统,在此基础上,科研人员开发出了众多的深度学习开源框架,例如Caffe、Theano、Torch、CXXNet、MXNet等,Caffe是其中较为成熟和完善的一个深度学习框架。在Caffe的基础上,NVIDIA公司进一步推出了Digits系统,Digits系统提供简单易用的Web页面对Caffe进行了包装,使深度学习在图像分类中的应用变得更加简单轻便。

印章是国内应用最广泛的签章设备,由于印章具有重要的作用,其仿造成本又极为低廉,不少不法分子制贩假章,伪造的印章层出不穷,给社会带来了巨大的负面影响。因此,对印章图像的快速识别和精准鉴定已成为当今重要的研究课题。传统的印章鉴别方法主要依靠人工对两幅印章图样进行对比,但人工对比有很多缺陷,第一,印章识别准确率无法保证,达不到实用要求,第二,实际情况复杂,限制条件较多、适应性弱。第三,使用不够便捷[1]。因此,对印章的自动化识别和鉴定具有重要的应用价值。

由于印章类型多种多样,对印章的自动识别第一步便是对印章的章型进行识别。本文将采用深度学习的开源框架Caffe完成印章类型的自动识别。

1 算法设计

1.1算法流程

在进行印章类型识别时,首先需要通过扫描仪等图像输入设备采集印章图像,采集到图像后要将先将待识别的印文从图像中的目标区域提取出来以排除背景及噪声的干扰。紧接着对提取出的目标印文进行一定的预处理。由于前馈式神经网络要求输入图像大小固定,因此首先要对图像进行缩放使之大小固定。最后,将归一化后的印文图像传入神经网络模型进行分类。

如图1所示,算法主要包含四个步骤。

①从扫描仪或其他设备输入含有待识别印文的文档图像。

②从文档图像中提取出待识别印文,这一步我们采用脉冲耦合神经网络 (PCNN,Pulse Coupled Neural Network)燃烧的技术实现对印文的提取[2]。

③对提取到的印文进行预处理,在这一步中我们将印文图像归一化,统一缩放为大小等于128×128的图像。

④章型识别,我们采用前馈式神经网络来实现对输入图像的分类。

图1 算法流程

1.2模型设计

我们采用两种不同的网络结构进行实验,如图2所示,图中(a)是著名的LeNet结构图,(b)是一个简单的四层前馈式神经网络。

LeNet由Yan LeCun等人于1998年提出,在手写数字的识别上有极高的准确率[3]。该网络采用两个卷积层、两个池化层以及两个全连接层。输入层大小为128×128,第一个卷积层窗口大小为5×5,有20个过滤器共生成20张特征图,第二个卷积层窗口大小为5× 5,50个过滤器共生成50张特征图,两个池化层窗口大小均为2,第一个全连接层共有500个神经元,第二个全连接层共有6个神经元,最后输出层采用Softmax函数作为损失函数。

图(b)中的模型采用的是一个简单的四层前馈式神经网络,输入层大小为128×128,第一个隐层神经元个数为100,第二个隐层神经元个数为50,输出层共有6个神经元,最后同样采用Softmax函数作为损失函数。各层内的激活函数均为Sigmoid函数。

图2 网络结构图

2 实验

现有的标准章型共分六类,分别为单位公章、发票专用章、合同专用章、法人名章、财务专用章及其他章型,标准章型如图3所示:

图 3 标准章型示意图[4]

实验采用的数据为600张印章图像,6类印章每类各100张图像。每类训练数据各90个共计540张,验证数据各10张共计60张。

实验结果如图4所示,图中(a)为LeNet模型的训练结果,在一个Epoch之后网络便收敛,在验证集上取得了100%的分类精度。图中(b)为四层前馈式神经网络模型的训练结果,在5个Epoch之后网络也得到收敛,在验证集上同样取得了100%的分类精度。

图4 网络训练过程及验证结果

为考察网络的运行状况,我们将给出测试样本在LeNet网络中各层的激活情况,如图5所示,图中显示了输入图像经过各层神经元变换后的输出图像,最后得到前五个降序排列属于各类别的概率。

3 结语

随着技术的发展,越来越多的深度学习开源框架展现在我们面前,这些工具不仅性能优异而且使用便捷。对先进的GPU计算平台的利用,大大提高了神经网络的训练速度,更为重要的是,使用这些框架训练得到的模型可以直接高效地部署到工业应用中,这必将推动深度学习在各方面的应用。本文将深度学习框架Caffe应用于印章类型的识别中,分别采用了两个不同的网络模型进行分类,实验证明,在印章章型分类问题上均具有相当高的分类精度。

图5 测试样例在LeNet网络中的逐层变换

[1]郭泉.稀疏表达及其在图像处理中的应用[D].四川大学,2013.

[2]尚利峰.脉冲耦合神经网络在图像处理中的应用[D].电子科技大学,2007.

[3]Lecun Y,Bottou L,Bengio Y,et al.Gradient-Based Learning Applied to Document Recognition[J].Proceedigs of the IEEE,1998,86 (11):2278-2324.

[4]高振涛.判别自动编码机在分类问题中的应用[D].四川大学,2015.

Deep Learning;Caffe Framework;Seal Type Recognition

Application of Deep Learning Framework Caffe in Image Classification

WANG Xi,ZHANG Hai-xian

(College of Computer Science,Sichuan University,Chengdu 610065)

国家自然科学基金资助项目(61303015)、四川省科技计划项目(No.2014GZ0005-5)

1007-1423(2016)05-0072-05

10.3969/j.issn.1007-1423.2016.05.016

王茜(1990-),女,四川眉山人,在读硕士研究生、研究方向为机器智能、电子邮箱

张海仙(1980-),女,河南邓州人,博士研究生,副教授,研究方向为机器智能

2015-12-24

2016-01-15

2006年深度学习的提出为机器学习领域带来新的革命,深度学习的成功不仅依赖于理论和模型上的突破,也离不开大数据环境下的海量训练样本以及不断革新的先进计算技术。在GPU被应用于科学计算之前,神经网络特别是大型神经网络的训练时间往往令人生畏。GPU特别适应于并行计算的特性给神经网络的训练速度带来数十倍的提升。开源的GPU计算框架也不断地推陈出新,推动深度学习在各方面的应用,Caffe就是其中的一种。由于简单易用、性能强大,Caffe框架受到了广泛的认可。利用Caffe框架对印章类型进行识别,所采用的两种模型都取得极好的实验效果,对印章的自动识别提供新的参考。

深度学习;Caffe框架;章型识别

The proposal of deep learning in 2006 brought a revolution to the field of machine learning.Huge amount of available training data and new computational techniques lie in the key position of deep learning’s success.GPU has the very feature of parallel computation,and this feature can speed up the training of neural networks by a factor of more than 40.Many open source frameworks of GPU computation have been proposed during the years.Among them,Caffe is one of good reputation for its many merits.Utilizes the Caffe Framework for the task of Seal type recognition,both models used have shown very good performance.

猜你喜欢
印文印章框架
我终于有了自己的印章
我们有印章咯
大灰狼画报(2022年4期)2022-06-05 07:13:16
框架
广义框架的不相交性
基于印文印迹特征判别印章类型技术的研究
法制博览(2020年19期)2020-07-01 12:12:04
浅谈司法鉴定中手工制作硬质印章因盖印条件不同而形成的差异
自制橡皮印章
童话世界(2017年14期)2017-06-05 09:13:49
WTO框架下
法大研究生(2017年1期)2017-04-10 08:55:06
印章
关于光敏印章印文鉴定问题的分析