基于卷积神经网络的四种图像识别算法设计

2018-10-21 03:57于得宝何笑笑王璇河南师范大学河南新乡453000
新生代 2018年14期
关键词:模式识别识别率特征值

于得宝 何笑笑 王璇 河南师范大学 河南新乡 453000

1.引言

模式识别是人类的一项基本智力。人们一直在进行模式识别。随着计算机技术的普及和发展,计算机的识别能力越来越受到人们的重视。这也是人工智能和机器人技术发展的前提。

模式识别是处理和分析各种事物或现象(数字、文字和逻辑关系)来描述、识别、分类和解释事物或现象的过程。它是信息科学和人工智能的重要组成部分。生活中最简单的事物无过于简单的数字0-9,同时,数字被广泛应用于车牌识别、邮政编码识别等多个方向,因此数字字符识别是一个很有实用价值的课题。

2 数字识别的基本步骤

通过将识别的数字图像的特征值读入定义的识别算法并输出识别结果来识别数字识别。识别步骤主要有:数据提取、预处理、特征值提取与选择、分类器设计与分类决策。

2.1 数据提取

本文对0~9灰度图像进行处理。有400组图片。分为十组,每组0~9个数字,每组40个。他们被分成30个训练样本和10个测试样本。本文借助MATLAB软件的读写功能和DIR函数读取“数字”文件夹下的所有图片,并得到包含36×20×40×10的图片数据的四维数组。每张图片的数据是36×20的数据矩阵。

2.2 预处理

图像预处理应根据实际图像进行操作,将处理时间和正确率结合起来。一般来说,预处理的目的是去除图像中包含的干扰噪声,增强有用的信息,恢复退化的信息。图像预处理包括图像去噪、图像二值化处理、分割处理和归一化处理等一系列操作。

2.3 特征值提取与选择

提取和选择特征值的主要目的是对分割的矩阵块的特征值进行统计。其主要目的是从数字的拓扑结构中提取一些结构特征,并减少数字的干涉相位,例如位移、尺寸变化和形状失真,以及数字特征的关键。信息被提供给分类器。特征的选择一般有以下原则:一是充分性原则,即提取的特征应该能够充分保持原始图案中的信息量;其次,在充分的SU的基础上最小化特征的维数;此外,提取特征时所花费的计算量也不太大,否则会影响识别速度。本文将分割后的每个矩阵块中的黑像素数作为矩阵块的特征值,作为图像的特征值。

3 数字识别方法

从模式识别开始作为一门学科,研究人员提出了多种识别方法。本文主要研究了最小距离法、最近邻法、K近邻法和BP神经网络理论,并通过MATLAB进行了实验分析。

3.1 最小距离法

最小距离法是一种简单的模式识别方法,它是基于模式的采样来估计各种类型的统计参数,并且完全由各种类型的均值和方差来确定。当两种均值之间的距离大于该类中相应均值的距离时,最小距离分类器可以很好地工作。

最小距离法可以直接计算待测样本之间的距离和样本中的平均值,并将样本分类为最小距离。

3.2 最近邻法

最小距离法是一种简单直观的模式识别方法。然而,当每个模式样本的均值(“代表”)不能很好地表示每个模式时,结果将是所设计的分类器出现较大的错误率。

针对这个问题,利用覆盖和HART提出最近邻方法。为了更好地表示每一个模式类别,一个极端的方法是使用模式类别中的所有样本作为“代表点”,并将被测试的样本分类为一类最小距离。

3.3 K-近邻法

K近邻法是上邻近邻法的推广,因此神经网络中输入神经元的数目是36。为了识别0-9的10个数,本文使用8421个码来识别输出“0”,使用(0,0,0,0)主目标向量表示输入“1”,使用输出向量,如(0,0,0,1)等,输入“9”,并使用输出向量,如(1,0,0,1)。因此,我们可以确定输出层中神经元的数量是4,也就是输出向量的维数。

4.结果和结论

本文中所识别的数字为0~9。训练样本从每个班的前30名中选出,共300个,而测试样本则是后者100。在训练样本经过预处理和四种方法识别后,识别率如表1所示。

表1 识别率比较

结果表明,矩阵的分段数可以在一定程度上提高识别率,但增加分割块的数目将大大增加计算量并延长识别时间。同时,在四种方法中,最近邻法可以获得最高的识别率,达到100%。BP神经网络作为一种智能算法,在理论上的识别效果应该更好,但并没有达到预期的效果。这与BP神经网络在实验中的学习和训练功能的选择以及其各种参数的调试有关。这也是进一步研究的一种方式。

猜你喜欢
模式识别识别率特征值
轻身调脂消渴片的指纹图谱建立、化学模式识别及含量测定
I、II类单点故障模式识别与质量管控浅析
基于扩展FEAST的大规模特征值求解问题研究
伴随矩阵的性质及在解题中的应用
档案数字化过程中OCR技术的应用分析
求矩阵特征值的一个简单方法
基于PCA与MLP感知器的人脸图像辨识技术
科技文档中数学表达式的结构分析与识别
汽车外观造型创新设计遗传算法的应用
人工智能现状和发展