基于卷积神经网络的图像识别算法的探究

2021-08-27 06:47王岩姬一波
中国新通信 2021年12期
关键词:图像识别卷积神经网络算法

王岩 姬一波

【摘要】    近年来,社会经济快速发展的同时,计算机信息技术更新的速度不断加快,逐渐渗透到各个领域当中,为人们带了极大的便捷。互联网的普及也使得信息量呈爆炸式增长,卷神经网络能够大幅度提升图像的识别率,从而更加高效的挖掘图片信息数据,人工智能技术越来越成熟,深度学习也备受人们的高度关注。传统图像识别技术相对落后,且识别率低,面对海量的图像信息数据,传统识别方式显然已经无法满足当前的实际需求。

【关键词】    卷积神经网络    图像识别    算法    逻辑回归

引言:

卷积神经网络是一种基于人工神经网络,并将深度学习理论融入其中,从而探索出的一种新型识别算法,这也是目前图像识别领域发展过程中的重点研究方向。自上世纪九十年代末以来,CNN识别技术便步入了高速发展阶段,且逐渐趋于稳定,但是该网络技术结构存在一定局限性,在对自然图像进行识别过程中,整体效率与速度依然存在不足之处,无法达到理想化的程度。为了有效改进与优化CNN在自然图像识别过程中的整体效果,文章通过对当前CNN网络结构进行了深入分析,并进一步提出了自然图像识别的卷神经网络算法,从而逐步实现CNN识别算法可在短期时间之内进行快速收敛,从而达到理想的识别效果。

一、图像识别与卷神经网络简述

1.1图像识别算法

1.1.1贝叶斯分类法

该方法是统计学中的一种,以统计学为基础,并采用叶贝斯定理对其进一步分类,这样的分类方法可以将分类问题逐渐转化为概率的形式进行表达,并且概率为已知,对图像特征进行提取分类,通过贝叶斯定理公式计算验证,之后将图像进行分类,公式如下:

从以上公式当中我们能够看到,P(B)能够表明B条件下的概率,P(AB)指的是相同条件下实现概率,P(A/B)指的是B条件发生后,A件的发生概率。该方法有一定的缺点,并非每个图像都可有效提取具有一定代表性的特点,当出现该情况时,采用该方法进行图像分类,会造成图像分类出现非常大的误差[1]。

1.1.2模板匹配法

从名字当中便能够看的出来,其是由根据模板在目标图像当中对其进行匹配,这样的方法也被广泛应用于图像处理过程中。具体的过程为,先制定模板,之后再针对目标图像以及对应模式,匹配和模板大致相似的图像,比较相似的部分还包含图像的方向与大小,再经过匹配之后,便能够确定图像的具体位置。这样的方法也存在缺点和不足,需要结合图像设计类似的模板,因此对设计者的研究经验要求较高[2]。

1.2卷积神经网络

卷积神经网络结构属于人工神经网络,对映射特征图和卷积神经网络当中的卷积核进行计算,并采用函数计算,一般经常使用的是双曲正切函数。卷积层获取图像特征,从不同局域获取单元节点数据,需要覆盖整个数据集,如果是相同的图像,使用卷积核时是不同的,输入图像不同,应当采用相同卷积核,这便是权值共享。在池化层当中,为降低平面图大小,可取映射平面图中的矩形区域最大值,这样可有效降低平面图大小,并且维持空间不发生变形,避免发生过度拟合的情况。如映射层面特征图大小为8**,在经过池化后,便会得到4*4大小的特征图[3]。

二、基于卷积神经网络的图像识别算法设计

2.1 Mapreduce编程结构模型

Mapreduce是一种并行编程模型,主要应用于大型计算机集群工作中,可对TB、PB数据集进行有效处理,编程模型具有包容性强、操作简单以及整体扩展能力强等诸多优势和特征,被广泛应用于计算机科学领域当中,Mapreduce编程结构是一种树状图结构,采用主节点对大数据集操作模块进行管理,主节点之后再将任务分发到不同分界点,由分节点对数据进行处理后汇总到主节点。Mapreduce整个处理过程中主要是由Map函数与Reduce函数两个部分共同组成,两个函数的具体处理任务也有很大不同,Map函数是对需要进行处理的任务进行分解为多个模块,Ruduce函数是对完成处理之后的模块汇总。流程如下图1所示。

2.2基于Mapreduce的CNN算法设计

该算法是对所训练数据进行分类,分为大致相同的小部分,和Hadoop平台中的节点对应,并且通过平均分布的方式进行有效存储,通过不同节点储存CNN网络数据,进行网络训练过程,Mapper任务接受数据,可作用在不同节点,并利用正向和方向传播,计算权值和偏置的变化量,并形成中间键数值,完成样本计算后,对本地文件进行处理,本地文件进行汇总处理之后,各次训练获取到的数据再写进全局文件当中[4]。

2.3 CUDA技术及平台分析

CUDA编程模型属于一种能够支持GPU处理计算的数据开发利用环境,其由NVIDIA公司提出,GPU是一种图像处理器,GPU的发展及应用大幅度提升了计算机图形的处理效率与质量,且对计算机图像仿真、虚拟现实环境以及图像处理技术等领域的发展具有重要的促进作用。CUDA和GPU之间的有效结合,使得编程人员在CUDA平台上可采用一般通用化的匯编语言C语言进行汇编,之后再采用GPU完成汇编程序整个运行过程,这样便不需要单独的去学习图像知识,从而有效降低GPU数据计算的难度,使其更加简化,从而大幅度提升了系统的整体稳定性。CUDA平台下的数据处理结构由CPU与GPU两者共同组成,GPU+CPU结构可有效提升计算机性能,同时也能够节约能源。[5]

2.4多区域逻辑回归计算的网络具体改进方法

图像识别过程中,为了不断提升实际训练过程及速度,是需要针对图像实际情况,对其进行预处理的,这样也能够有效去除图像当中过多的干扰信息数据,之后再对处理之后的图像进行划分以及识别,文章将其主要划分为5个区域,即四个角区域与中心区域,在测试识别过程中,只对中间区域进行测试。

三、图像识别结果分析

3.1结果

通过系统的筛选以及训练整个过程,输入系统当中的数据集主要分为两类结果:系统预测分类和期望值符合情况下,系统会显示分类正确,系统预测分类各期望值不相符情况下,系统会显示分类错误的情况,采用通用数据集输入接口方式,这样可对数据集进行合理有效分类。

3.2不同区域测试对识别结果产生的影响

这里主要采用的是COFAR10数据集测试,系统会针对每个具体测试结果以及错误率进行合理保存,并采用Python脚本查看错误率的整个变化状况,每个epoch为128个样本。对参数与网络结构参数进行调整,在未采用逻辑回归计算时,系统分类错误率为18%,采用逻辑回归后,系统分类错误率为13.4%,准确率大幅度提升。原始图像处理过程中,图像未经裁剪,但在MR-CNN-G使用过程中,图像是经过裁剪的,训练过程中,前者所用时间更少,在测试环节当中,时间明显增加了。

四、结束语

近年来,随着互联网计算机技术的快速发展与普及,已经逐渐渗透进人们生活中的方方面面,为人们带来了极大的便捷,图像识别算法作为一项新型的技术,经过长期的发展,CNN算法也取得了显著的成果,通过对其进行优化改进之后,运用到图像识别过程中,这样也极大的提升了图像识别的实际准确率,并且在整个提升过程当中,数据处理效果明显增加,但是就目前现状来看,依然存在诸多问题,如图像处理过程复杂化,预处理时间也比较长,在对GPU引入过程中,因为数据接口不通用,因此,需要选择及输入相关数据集。

参  考  文  献

[1]张荣磊, 田爱奎, 谭浩,等. 基于卷积神经网络的图像识别算法研究[J]. 山东理工大学学报(自然科学版), 2018, 032(001):48-50.

[2]田壯壮, 占荣辉, 胡杰民,等. 基于卷积神经网络的SAR图像目标识别研究[J]. 雷达学报, 2016, 5(3)33-34

[3]杜兰, 刘彬, 王燕,等. 基于卷积神经网络的SAR图像目标检测算法[J]. 电子与信息学报, 2016(12).22-23

[4]许振雷, 杨瑞, 王鑫春,等. 基于卷积神经网络的树叶识别的算法的研究[J]. 电脑知识与技术, 2016, 12(010):194-196.

[5]李志明. 基于卷积神经网络的虹膜活体检测算法研究[J]. 计算机工程, 2016, 42(005):239-243,248.

猜你喜欢
图像识别卷积神经网络算法
基于计算机视觉的图像识别技术研究
人工智能背景下图像识别技术浅析
Travellng thg World Full—time for Rree
基于字典学习的正则化鲁棒稀疏表示肿瘤细胞图像识别
学习算法的“三种境界”
算法框图的补全
算法初步知识盘点
基于深度卷积神经网络的物体识别算法
图像识别交互系统
深度学习算法应用于岩石图像处理的可行性研究