余聂芳
摘 要:神经网络是一种新型的信息处理模型,通过对生物神经系统的模拟,凭借自适应学习以及自动处理等功能,可达到预期目的。脱机手写汉字识别难度较大,为提高识别速度和精确度,采用了建立在反向传播法基础上的神经网络模型,对脱机手写汉字进行识别。以小字符集汉字识别为例,针对反向传播法中存在的缺陷,如收敛速度过慢,易陷入局部最小点等,对其算法进行了改进,取得了较好的效果。
关键词:BP神经网络 BP算法改进 脱机手写汉字识别 误差函数
中图分类号:TP183 文献标识码:A 文章编号:1674-098X(2014)01(b)-0047-01
汉字识别有两种,一种是印刷体汉字,因比较规范,容易识别;第二种是手写汉字,分联机手写和脱机手写两类,前者准确率较高,后者则偏低,是当前的研究重点。作为模式识别的重要组成部分,汉字识别技术应用广泛,但由于涉及图像处理、人工智能、计算机、数字信号处理等多种技术,加上汉字的复杂繁多,使得汉字识别存在着很大困难,如尤其是相似字,使得识别更为困难,如“裸”和“祼”、“壶”和“壸”、“禅”和“褝”等,极易出现错误。
1 神经网络和BP神经网络
1.1 神经网络
神经网络是在现代神经科研成果的基础上提出并发展起来的,通过对生物大脑神经的模拟建立的一种信息处理系统,由许多简单元件连接构成,具有非线性和容错性,从能力特征来讲,具有自适应和自组织性。其优势主要体现在:能够模仿人脑进行联想记忆;对存储的信息进行分类识别;能够自动总结归纳经验。在长期的实践发展中,神经网络技术不断完善,在语音处理、机器人研究、模式识别等诸多领域都有广泛应用。
1.2 BP神经网络
用于文字识别的神经网络模型有很多,BP神经网络是其中较为常用的一种,该网络模型是以BP算法(即反向传播算法)为基础的,除了函数逼近功能,还具有良好的机器学习能力。
BP神经网络属于多层前向网络,能够进行反向传递、修正误差,通过结构和权值将颇为复杂的非线性映射关系表达出来。多由输入层、输出层以及隐含层组成,每层都有若干神经元,前向网络是指其计算过程呈单向型,即由输入层到中间层,再到输出层。
BP算法有两个阶段,一是正向传播,二是反向传播,在第一个阶段,将信号输进系统的输入层,由其内部神经元进行处理,主要是加权求和、激励函数等,而后传递到中间层(即隐含层),在经过内部逐层处理,传到输出层,将实际的输出值和预期值相比,若超过了规定的误差范围,就开始反向传播,把误差值从输出层输入,向中间层和输入层传递,求得每层内各单元的误差,将相应的权值进行修改,经不断的调整,直至误差值符合要求。
2 BP网络神经在小字符集汉字识别中的实际应用
2.1 缺陷
(1)站在数学的角度看,BP网络神经所使用的梯度下降法属于非线性优化算法的一种,以至于局部极小值大的问题很难得到解决,在实际计算中,BP算法能够将网络权值进行收敛,但收敛值为局部极小解的可能性较大,是否是全局的最小解则没有可靠的保证。若解决的问题比较复杂,很容易致使误差函数陷入局部的极小区域。
(3)中间层的结点
在确定训练集之后,输入层和输出层的结点数目也相应的确定下来,然而中间层及选取层内结点时,缺乏足够的理论作指导,中间层的结点数直接影响着网络的学习效率和复杂程度,因此,在选取中间层变得结点时,也应做一定的改进,积极建立相关的指导理论。
3 结语
针对脱机手写汉字识别技术存在的难度,可运用BP神经网络技术,而实际应用中,收敛速度过慢以及局部最小点问题对BP神经网络技术影响较大,为此,需从初始权值的选取、激励函数、误差函数等方面对其算法加以改进,以达到提升脱机手写汉字识别速度和精确度的目的。
参考文献
[1] 张中.汉字识别技术综述[J].语言文学应用,2007,26(22):77一86.
[2] 余华,曹亮,李启元.BP神经网络算法的改进及其在手写体汉字识别中的应用[J].江西师范大学学报,2009,33(5):598-603.endprint
摘 要:神经网络是一种新型的信息处理模型,通过对生物神经系统的模拟,凭借自适应学习以及自动处理等功能,可达到预期目的。脱机手写汉字识别难度较大,为提高识别速度和精确度,采用了建立在反向传播法基础上的神经网络模型,对脱机手写汉字进行识别。以小字符集汉字识别为例,针对反向传播法中存在的缺陷,如收敛速度过慢,易陷入局部最小点等,对其算法进行了改进,取得了较好的效果。
关键词:BP神经网络 BP算法改进 脱机手写汉字识别 误差函数
中图分类号:TP183 文献标识码:A 文章编号:1674-098X(2014)01(b)-0047-01
汉字识别有两种,一种是印刷体汉字,因比较规范,容易识别;第二种是手写汉字,分联机手写和脱机手写两类,前者准确率较高,后者则偏低,是当前的研究重点。作为模式识别的重要组成部分,汉字识别技术应用广泛,但由于涉及图像处理、人工智能、计算机、数字信号处理等多种技术,加上汉字的复杂繁多,使得汉字识别存在着很大困难,如尤其是相似字,使得识别更为困难,如“裸”和“祼”、“壶”和“壸”、“禅”和“褝”等,极易出现错误。
1 神经网络和BP神经网络
1.1 神经网络
神经网络是在现代神经科研成果的基础上提出并发展起来的,通过对生物大脑神经的模拟建立的一种信息处理系统,由许多简单元件连接构成,具有非线性和容错性,从能力特征来讲,具有自适应和自组织性。其优势主要体现在:能够模仿人脑进行联想记忆;对存储的信息进行分类识别;能够自动总结归纳经验。在长期的实践发展中,神经网络技术不断完善,在语音处理、机器人研究、模式识别等诸多领域都有广泛应用。
1.2 BP神经网络
用于文字识别的神经网络模型有很多,BP神经网络是其中较为常用的一种,该网络模型是以BP算法(即反向传播算法)为基础的,除了函数逼近功能,还具有良好的机器学习能力。
BP神经网络属于多层前向网络,能够进行反向传递、修正误差,通过结构和权值将颇为复杂的非线性映射关系表达出来。多由输入层、输出层以及隐含层组成,每层都有若干神经元,前向网络是指其计算过程呈单向型,即由输入层到中间层,再到输出层。
BP算法有两个阶段,一是正向传播,二是反向传播,在第一个阶段,将信号输进系统的输入层,由其内部神经元进行处理,主要是加权求和、激励函数等,而后传递到中间层(即隐含层),在经过内部逐层处理,传到输出层,将实际的输出值和预期值相比,若超过了规定的误差范围,就开始反向传播,把误差值从输出层输入,向中间层和输入层传递,求得每层内各单元的误差,将相应的权值进行修改,经不断的调整,直至误差值符合要求。
2 BP网络神经在小字符集汉字识别中的实际应用
2.1 缺陷
(1)站在数学的角度看,BP网络神经所使用的梯度下降法属于非线性优化算法的一种,以至于局部极小值大的问题很难得到解决,在实际计算中,BP算法能够将网络权值进行收敛,但收敛值为局部极小解的可能性较大,是否是全局的最小解则没有可靠的保证。若解决的问题比较复杂,很容易致使误差函数陷入局部的极小区域。
(3)中间层的结点
在确定训练集之后,输入层和输出层的结点数目也相应的确定下来,然而中间层及选取层内结点时,缺乏足够的理论作指导,中间层的结点数直接影响着网络的学习效率和复杂程度,因此,在选取中间层变得结点时,也应做一定的改进,积极建立相关的指导理论。
3 结语
针对脱机手写汉字识别技术存在的难度,可运用BP神经网络技术,而实际应用中,收敛速度过慢以及局部最小点问题对BP神经网络技术影响较大,为此,需从初始权值的选取、激励函数、误差函数等方面对其算法加以改进,以达到提升脱机手写汉字识别速度和精确度的目的。
参考文献
[1] 张中.汉字识别技术综述[J].语言文学应用,2007,26(22):77一86.
[2] 余华,曹亮,李启元.BP神经网络算法的改进及其在手写体汉字识别中的应用[J].江西师范大学学报,2009,33(5):598-603.endprint
摘 要:神经网络是一种新型的信息处理模型,通过对生物神经系统的模拟,凭借自适应学习以及自动处理等功能,可达到预期目的。脱机手写汉字识别难度较大,为提高识别速度和精确度,采用了建立在反向传播法基础上的神经网络模型,对脱机手写汉字进行识别。以小字符集汉字识别为例,针对反向传播法中存在的缺陷,如收敛速度过慢,易陷入局部最小点等,对其算法进行了改进,取得了较好的效果。
关键词:BP神经网络 BP算法改进 脱机手写汉字识别 误差函数
中图分类号:TP183 文献标识码:A 文章编号:1674-098X(2014)01(b)-0047-01
汉字识别有两种,一种是印刷体汉字,因比较规范,容易识别;第二种是手写汉字,分联机手写和脱机手写两类,前者准确率较高,后者则偏低,是当前的研究重点。作为模式识别的重要组成部分,汉字识别技术应用广泛,但由于涉及图像处理、人工智能、计算机、数字信号处理等多种技术,加上汉字的复杂繁多,使得汉字识别存在着很大困难,如尤其是相似字,使得识别更为困难,如“裸”和“祼”、“壶”和“壸”、“禅”和“褝”等,极易出现错误。
1 神经网络和BP神经网络
1.1 神经网络
神经网络是在现代神经科研成果的基础上提出并发展起来的,通过对生物大脑神经的模拟建立的一种信息处理系统,由许多简单元件连接构成,具有非线性和容错性,从能力特征来讲,具有自适应和自组织性。其优势主要体现在:能够模仿人脑进行联想记忆;对存储的信息进行分类识别;能够自动总结归纳经验。在长期的实践发展中,神经网络技术不断完善,在语音处理、机器人研究、模式识别等诸多领域都有广泛应用。
1.2 BP神经网络
用于文字识别的神经网络模型有很多,BP神经网络是其中较为常用的一种,该网络模型是以BP算法(即反向传播算法)为基础的,除了函数逼近功能,还具有良好的机器学习能力。
BP神经网络属于多层前向网络,能够进行反向传递、修正误差,通过结构和权值将颇为复杂的非线性映射关系表达出来。多由输入层、输出层以及隐含层组成,每层都有若干神经元,前向网络是指其计算过程呈单向型,即由输入层到中间层,再到输出层。
BP算法有两个阶段,一是正向传播,二是反向传播,在第一个阶段,将信号输进系统的输入层,由其内部神经元进行处理,主要是加权求和、激励函数等,而后传递到中间层(即隐含层),在经过内部逐层处理,传到输出层,将实际的输出值和预期值相比,若超过了规定的误差范围,就开始反向传播,把误差值从输出层输入,向中间层和输入层传递,求得每层内各单元的误差,将相应的权值进行修改,经不断的调整,直至误差值符合要求。
2 BP网络神经在小字符集汉字识别中的实际应用
2.1 缺陷
(1)站在数学的角度看,BP网络神经所使用的梯度下降法属于非线性优化算法的一种,以至于局部极小值大的问题很难得到解决,在实际计算中,BP算法能够将网络权值进行收敛,但收敛值为局部极小解的可能性较大,是否是全局的最小解则没有可靠的保证。若解决的问题比较复杂,很容易致使误差函数陷入局部的极小区域。
(3)中间层的结点
在确定训练集之后,输入层和输出层的结点数目也相应的确定下来,然而中间层及选取层内结点时,缺乏足够的理论作指导,中间层的结点数直接影响着网络的学习效率和复杂程度,因此,在选取中间层变得结点时,也应做一定的改进,积极建立相关的指导理论。
3 结语
针对脱机手写汉字识别技术存在的难度,可运用BP神经网络技术,而实际应用中,收敛速度过慢以及局部最小点问题对BP神经网络技术影响较大,为此,需从初始权值的选取、激励函数、误差函数等方面对其算法加以改进,以达到提升脱机手写汉字识别速度和精确度的目的。
参考文献
[1] 张中.汉字识别技术综述[J].语言文学应用,2007,26(22):77一86.
[2] 余华,曹亮,李启元.BP神经网络算法的改进及其在手写体汉字识别中的应用[J].江西师范大学学报,2009,33(5):598-603.endprint