基于卷积神经网络的图像识别算法的探究

2021-08-27 06:47王岩姬一波

中国新通信 2021年12期

王岩姬一波

【摘要】近年来，社会经济快速发展的同时，计算机信息技术更新的速度不断加快，逐渐渗透到各个领域当中，为人们带了极大的便捷。互联网的普及也使得信息量呈爆炸式增长，卷神经网络能够大幅度提升图像的识别率，从而更加高效的挖掘图片信息数据，人工智能技术越来越成熟，深度学习也备受人们的高度关注。传统图像识别技术相对落后，且识别率低，面对海量的图像信息数据，传统识别方式显然已经无法满足当前的实际需求。

【关键词】卷积神经网络图像识别算法逻辑回归

引言：

卷积神经网络是一种基于人工神经网络，并将深度学习理论融入其中，从而探索出的一种新型识别算法，这也是目前图像识别领域发展过程中的重点研究方向。自上世纪九十年代末以来，CNN识别技术便步入了高速发展阶段，且逐渐趋于稳定，但是该网络技术结构存在一定局限性，在对自然图像进行识别过程中，整体效率与速度依然存在不足之处，无法达到理想化的程度。为了有效改进与优化CNN在自然图像识别过程中的整体效果，文章通过对当前CNN网络结构进行了深入分析，并进一步提出了自然图像识别的卷神经网络算法，从而逐步实现CNN识别算法可在短期时间之内进行快速收敛，从而达到理想的识别效果。

一、图像识别与卷神经网络简述

1.1图像识别算法

1.1.1贝叶斯分类法

该方法是统计学中的一种，以统计学为基础，并采用叶贝斯定理对其进一步分类，这样的分类方法可以将分类问题逐渐转化为概率的形式进行表达，并且概率为已知，对图像特征进行提取分类，通过贝叶斯定理公式计算验证，之后将图像进行分类，公式如下：

从以上公式当中我们能够看到，P（B）能够表明B条件下的概率，P（AB）指的是相同条件下实现概率，P（A/B）指的是B条件发生后，A件的发生概率。该方法有一定的缺点，并非每个图像都可有效提取具有一定代表性的特点，当出现该情况时，采用该方法进行图像分类，会造成图像分类出现非常大的误差[1]。

1.1.2模板匹配法

从名字当中便能够看的出来，其是由根据模板在目标图像当中对其进行匹配，这样的方法也被广泛应用于图像处理过程中。具体的过程为，先制定模板，之后再针对目标图像以及对应模式，匹配和模板大致相似的图像，比较相似的部分还包含图像的方向与大小，再经过匹配之后，便能够确定图像的具体位置。这样的方法也存在缺点和不足，需要结合图像设计类似的模板，因此对设计者的研究经验要求较高[2]。

1.2卷积神经网络

卷积神经网络结构属于人工神经网络，对映射特征图和卷积神经网络当中的卷积核进行计算，并采用函数计算，一般经常使用的是双曲正切函数。卷积层获取图像特征，从不同局域获取单元节点数据，需要覆盖整个数据集，如果是相同的图像，使用卷积核时是不同的，输入图像不同，应当采用相同卷积核，这便是权值共享。在池化层当中，为降低平面图大小，可取映射平面图中的矩形区域最大值，这样可有效降低平面图大小，并且维持空间不发生变形，避免发生过度拟合的情况。如映射层面特征图大小为8**，在经过池化后，便会得到4*4大小的特征图[3]。

二、基于卷积神经网络的图像识别算法设计

2.1 Mapreduce编程结构模型

Mapreduce是一种并行编程模型，主要应用于大型计算机集群工作中，可对TB、PB数据集进行有效处理，编程模型具有包容性强、操作简单以及整体扩展能力强等诸多优势和特征，被广泛应用于计算机科学领域当中，Mapreduce编程结构是一种树状图结构，采用主节点对大数据集操作模块进行管理，主节点之后再将任务分发到不同分界点，由分节点对数据进行处理后汇总到主节点。Mapreduce整个处理过程中主要是由Map函数与Reduce函数两个部分共同组成，两个函数的具体处理任务也有很大不同，Map函数是对需要进行处理的任务进行分解为多个模块，Ruduce函数是对完成处理之后的模块汇总。流程如下图1所示。

2.2基于Mapreduce的CNN算法设计

该算法是对所训练数据进行分类，分为大致相同的小部分，和Hadoop平台中的节点对应，并且通过平均分布的方式进行有效存储，通过不同节点储存CNN网络数据，进行网络训练过程，Mapper任务接受数据，可作用在不同节点，并利用正向和方向传播，计算权值和偏置的变化量，并形成中间键数值，完成样本计算后，对本地文件进行处理，本地文件进行汇总处理之后，各次训练获取到的数据再写进全局文件当中[4]。

2.3 CUDA技术及平台分析

CUDA编程模型属于一种能够支持GPU处理计算的数据开发利用环境，其由NVIDIA公司提出，GPU是一种图像处理器，GPU的发展及应用大幅度提升了计算机图形的处理效率与质量，且对计算机图像仿真、虚拟现实环境以及图像处理技术等领域的发展具有重要的促进作用。CUDA和GPU之间的有效结合，使得编程人员在CUDA平台上可采用一般通用化的匯编语言C语言进行汇编，之后再采用GPU完成汇编程序整个运行过程，这样便不需要单独的去学习图像知识，从而有效降低GPU数据计算的难度，使其更加简化，从而大幅度提升了系统的整体稳定性。CUDA平台下的数据处理结构由CPU与GPU两者共同组成，GPU+CPU结构可有效提升计算机性能，同时也能够节约能源。[5]

2.4多区域逻辑回归计算的网络具体改进方法

图像识别过程中，为了不断提升实际训练过程及速度，是需要针对图像实际情况，对其进行预处理的，这样也能够有效去除图像当中过多的干扰信息数据，之后再对处理之后的图像进行划分以及识别，文章将其主要划分为5个区域，即四个角区域与中心区域，在测试识别过程中，只对中间区域进行测试。

三、图像识别结果分析

3.1结果

通过系统的筛选以及训练整个过程，输入系统当中的数据集主要分为两类结果：系统预测分类和期望值符合情况下，系统会显示分类正确，系统预测分类各期望值不相符情况下，系统会显示分类错误的情况，采用通用数据集输入接口方式，这样可对数据集进行合理有效分类。

3.2不同区域测试对识别结果产生的影响

这里主要采用的是COFAR10数据集测试，系统会针对每个具体测试结果以及错误率进行合理保存，并采用Python脚本查看错误率的整个变化状况，每个epoch为128个样本。对参数与网络结构参数进行调整，在未采用逻辑回归计算时，系统分类错误率为18%，采用逻辑回归后，系统分类错误率为13.4%，准确率大幅度提升。原始图像处理过程中，图像未经裁剪，但在MR-CNN-G使用过程中，图像是经过裁剪的，训练过程中，前者所用时间更少，在测试环节当中，时间明显增加了。

四、结束语

近年来，随着互联网计算机技术的快速发展与普及，已经逐渐渗透进人们生活中的方方面面，为人们带来了极大的便捷，图像识别算法作为一项新型的技术，经过长期的发展，CNN算法也取得了显著的成果，通过对其进行优化改进之后，运用到图像识别过程中，这样也极大的提升了图像识别的实际准确率，并且在整个提升过程当中，数据处理效果明显增加，但是就目前现状来看，依然存在诸多问题，如图像处理过程复杂化，预处理时间也比较长，在对GPU引入过程中，因为数据接口不通用，因此，需要选择及输入相关数据集。

参考文献

[1]张荣磊，田爱奎，谭浩，等. 基于卷积神经网络的图像识别算法研究[J]. 山东理工大学学报（自然科学版）， 2018， 032（001）：48-50.

[2]田壯壮，占荣辉，胡杰民，等. 基于卷积神经网络的SAR图像目标识别研究[J]. 雷达学报， 2016， 5（3）33-34

[3]杜兰，刘彬，王燕，等. 基于卷积神经网络的SAR图像目标检测算法[J]. 电子与信息学报， 2016（12）.22-23

[4]许振雷，杨瑞，王鑫春，等. 基于卷积神经网络的树叶识别的算法的研究[J]. 电脑知识与技术， 2016， 12（010）：194-196.

[5]李志明. 基于卷积神经网络的虹膜活体检测算法研究[J]. 计算机工程， 2016， 42（005）：239-243，248.