一种概率神经网络在图像识别中的应用方法

2021-07-19 22:11肖利芳
电脑知识与技术 2021年14期
关键词:图像识别人工智能

摘要:图像识别精度的高低直接影响着态势感知系统的性能,针对在复杂异构环境中提取图像关键要素难以识别的问题。该文提出了一种概率神经网络识别图像的方法。应用这种方法,首先,该文通过粗糙集属性约简原始数据,过滤掉冗余属性;然后,该文使用概率神经网络这种模型对提取的数据集进行分类训练。这是一种有效、可行的图像识别方法,与其传统方法相比,该方法明显地提高了图像识别的准确性,为图像识别态势评估和预测提供了有力的理论保障。

关键词:概率神经网络;图像识别;人工智能

中图分类号:TP18      文献标识码:A

文章编号:1009-3044(2021)14-0181-03

1 背景

世界上许多事物都有一定的结构,我们可以用它来组织思想。我们使用心理数字线组织其他类型的信息,最明显的就是数字。概率神经网络应用到网络空间安全[1],图像的识别中。概率神经网络的一个定义特征是它们的词表征,是高维的实值向量,在这种结构中,词被一些学习到的查找表(lookup-table)转换成实值向量,这些向量被用作一个神经网络的输入,其主要优势是其分布式表征实现了一定水平的泛化,而使用经典的 n-gram 语言模型是不可能办得到的。作为概率神经网络中一种概念,数量大小可表征在单一维度上(即在一条心理数字线上,一般来说,小数字、坏的、悲伤、不道德、年轻表征在这条线的左侧,大数字、好的、开心、高尚、年老等表征在右侧)。牛津大学实验心理学系Luyckx和Summerfield等人在eLife杂志上发表文章,他们做健康训练实验,将被试6个不同颜色的驴子照片与六种不同的奖励概率联系起来,通过试误,被试学会了根据驴子获得奖励的可能性对它们进行排序。Luyckx等人将被试驴子观察大脑活动与观察数字1-6时的大脑活动进行比较。驴的EEG活动模式对应于它们在心理数字线上的数字。因此,驴子1以最低的奖励概率,产生了类似于数字1的大脑活动模式,以此类推,产生了类似于对应数字的大脑活动模式。实验表明,我们不是以非结构化的方式学习,而是利用过去关于刺激之间的关系知识来组织新的信息,这种现象称为结构对齐。Luyckx等人的研究结果表明人类是通过对世界结构的一般理解来学习新事物,这对教育和人工智能有着重要意义。例如,人教授计算机了解项目之间的关系,而不是孤立地学习项目,计算机可能会更有效地学习。

新工科中人工智能中的机器学习是研究训练计算机的学习行为。深度学习是属于机器学习,人工神经网络的研究促进了深度学习的发展,深度学习有多种模型,其中,多个隐藏层的多层感知器是一种深度学习的模型[2]。建立模拟人脑进行分析学习的神经网络是研究深度学习的動力源泉,图像识别、声音识别、文本识别等都是模拟人脑的运行机制来分辨识别的[3]。在深度学习的理论下,机器可以模仿人的活动,例如视听和思考等,克服了人脑的一些局限性,从而人工智能相关技术有了突飞猛进的发展[4]。香港中文大学的多媒体实验室是最早应用深度学习进行计算机视觉研究的华人团队。

20世纪40年代,美国数学家W.Pitts和心理学家W.McCulloch首次提出人工神经网络的概念。1957年,F.Rosenblatt提出了一种新的人工神经网络感知器模型,使用最小二乘法或者是Hebb学习规则来训练感知器模型的参数,这也是目前提出时间最早且结构最简单的人工神经网络模型。之后又出现了新的感知器模型(Mark I),这是第一个通过硬件实现的模型,标志着人工神经网络的计算开始向硬件方向发展。感知器采用的是阈值型激活函数,这是只有一层神经元的前向人工神经网络。通过对数据的提取训练之后获得网络权值,对应于一种输入可以得到1或者0两种输出,这就实现了对目标的分类。但是,这也表明了感知器的分类能力没有足够的优秀,目前只能处理二元分类,这取决于它只有一层神经网络,所以不能处理不可分问题。

2 概率神经网络简介

2.1 概率神经网络的特点

1989年,D.F.Speeht博士提出概率神经网络(Probabilistic Neural Network)。概率神经网络经过这多年的发展,它凸显出自身独特的特点:

1)快速度收敛,训练简单,方便使用。在PNN网络中,训练样本的值赋予隐含层的神经元,输入样本值作为神经元的权值。这样,用PNN网络所形成的判决曲面与贝叶斯最优准则下的曲面可以很逼近。

2)隐含层由非线性映射函数作为径向基,这样选择的优点是具有很强的容错性。若样本数据充足,概率神经网络函数就能收敛,避免陷入局部极小的困境。

3)取概率密度函数作为隐含层的传输函数,分类结果不受影响。

4)扩充性能好,易于硬件实现。网络的学习过程简单,增加或减少类别模式时不需要重新进行长时间的训练学习,各层神经元的数目比较固定。

从本质上说,它属于一种有监督的网络分类器,基于贝叶斯最小风险准则。

2.2 概率神经网络的技术特点

概率神经网络的结构是属于一种前向型的神经网络结构,而且是径向基网络的一个重要分支。概率神经网络建立在贝氏法则理论基础上,可以快速且有效地解决任意维度输出的分类应用问题上关于输入向量大小的问题。由于网络结构上的特点,连续值或二进制值都可以处理的,因而,可以解决不同形式的问题。而且在面临因为系统外界环境因素改变时,概率神经网络仅需对新进的分类数据定义权值而无须改变全部的网络权值。概率神经网络连接权值采取一次设定,并且直接从训练范例中加载所需数据,无迭代过程,所以,概率神经网络的学习速度十分快速,这对网络的训练是一个很重要的过程。

2.3 概率神经网络的结构图

概率神经网络的结构如图1。

首先,输入层接收一个m维的向量X,经过加权,再传给模式层的所有节点,模式层的节点根据不同的输出分成不同的类,这些节点执行高斯函数转到总和层;总和层节点计算特征层节点的输出来产生与每一类相对应的概率密度函数再合成计算;在一定决策规则下,输出层产生输出。

3 图像识别技术的特点及应用

图像识别是机器视觉的一个分支。计算机应用机器视觉理论的处理方法和技巧,结合神经网络以及设备来进行图像采集和识别。在机器视觉理论中,图像识别主要利用软件对图片中的地理位置、物品、人物、形态动作和手工笔迹进行分辨的能力[5]。

3.1 图像识别技术的特点

对于人类和动物的大脑来说,识别物体是很简单的,但是同样的任务对计算机来说却是很难完成的。当我们看到一个东西像树或者汽车或者我们的朋友,我们在分辨它是什么之前,通常不需要下意识地去研究它。然而,对于计算机来说,辨别任何事物(可能是钟表、椅子、人或者动物)都是非常难的问题,并且找到问题解决方法的代价很高。图像识别采用模拟人脑进行识别的方式。根据机器学习,我们可以通过图片的训练,教会计算机识别图像元素。在大型数据库中,计算机对数据呈现的模式进行识别,对图像进行辨别,然后形成图像相关的标签和类别。

3.2 图像识别技术的应用

图像识别技术有许多应用,其中最常见的就是图像识别技术助力的人物照片分类[6]。谁不想更好地根据视觉主题来管理巨大的照片库呢?小到特定的物品,大到广泛的风景。图片识别技术赋予了照片分类应用的用户体验新感受。除了提供照片存储,应用程序也可以更进一步,为人们提供更好的发现和搜索功能。有了通过机器学习进行自动图像管理的功能,它们就可以做到这一点。在应用程序中整合的图像识别程序界面可以根据机器所鉴定的特征对图像进行分类,并且根据主题将照片分组。图像识别的其他应用包括存储照片和视频网站、互动营销以及创意活动,社交网络的人脸和图像识别,以及具有大型视觉图像库网站的图像分类。

3.3 图像识别应用领域

图像识别的过程为:将图片信息输入到含有多层次概率神经网络中进行处理;在最低层中对刚开始输入进来的原始像素进行常規操作,处理之后就是原始输入的图像纹理以及它自己的边缘特征,这些特征包含了像曲线,直线等各种形状;中层网络会把上一次从下层网络上获得的信息再仅需进行加工处理操作,把这些信息抽象变成更高层次的效果;最高层网络因为能够描绘出整个输入图像的全部整体特征,经过多次处理之后,机器会获得识别该输入原始图像的强大能力。但是电脑识别图像的全部过程里,电脑进行自主的学习完全没有人的干预操作,机器自己发现图像的特征,不需要人工干预。

深度学习中应用程度最高的就是图像识别,ImageNet比赛更是将图像识别的热浪推向高潮。通过过拟合技术,使得神经网络可以对拟合数据进行更好的处理,提高了识别的效率。深度学习模型是图像处理技术的完美融合,不仅可以提高效率,还可以提高准确率。

深度学习的快速发展让机器学习来到了从没有过的高度,受到了各界的广泛的关注,一定程度上推动了相关领域的发展。相信随着算法和理论进一步发展,深度学习将会在更多的领域得到应用。

4 概率神经网络对图像识别技术的作用

图像识别不是一项容易的任务,一个好的方法是将元数据应用到非结构数据上。聘请专家对音乐和电影库进行人工标注或许是一个令人生畏的艰巨任务,然而有的挑战几乎是不可能完成的,诸如教会无人驾驶汽车的导航系统将过马路的行人与各种各样的机动车分辨出来,或者将用户每天传到社交媒体上的数以百万计的视频或照片进行标注以及分类。解决这个问题的一个方法是使用概率神经网络。简单地说,过拟合一般发生在模型过于贴合训练数据的情况下,一般而言,这会导致参数增加(进一步增加了计算成本)以及模型对于新数据的结果在总体表现中有所下降。理论上,我们可以使用传统概率神经网络对图像进行分析,但是实际上从计算角度来看代价很高。举个例子,一个传统的概率神经网络在处理一张很小的图片时(假设30*30像素)仍然需要50万个参数以及900个输入神经元。一个相当强大的机器可以运行这个网络,但是一旦图片变大了(例如500*500像素),参数以及输入的数目就会达到非常高的数量级。根据概率神经网络的构建方式,一个相对简单的改变就可以让较大的图像变得更好处理。改变的结果就是我们所见到的卷积概率神经网络,概率神经网络的广适性是他们的优点之一,但是在处理图像时,这个优点就变成了负担。卷积概率神经网络对此专门进行了折衷:如果一个网络专为处理图像而设计,有些广适性需要为更可行的解决方案做出让步。对于任意图像,像素之间的距离与其相似性有很强的关系,而概率神经网络的设计正是利用了这一特点。这意味着,对于给定图像,两个距离较近的像素相比于距离较远的像素更为相似。然而,在普通的概率神经网络中,每个像素都和一个神经元相连。在这种情况下,附加的计算负荷使得网络不够精确。概率神经网络通过消除大量类似的不重要的连接解决了这个问题。技术上来讲,概率神经网络通过对神经元之间的连接根据相似性进行过滤,使图像处理在计算层面可控。对于给定层,概率神经网络不是把每个输入与每个神经元相连,而是专门限制了连接,这样任意神经元只能接受来自前一层的一小部分的输入(例如3*3或5*5)。因此,每个神经元只需要负责处理一张图像的一个特定部分。(顺便提一下,这基本就是人脑的独立皮质神经元工作的方式,每个神经元只对完整视野的一小部分进行响应)。

5 结束语

本论文总结了概率神经网络技术特点和应用方法,涉及从简单的应用到通用人工智能实体概念化等一系列应用问题的开发。图像识别和语音识别的研究领域是人工智能的重要研究领域。概率神经网络未来的工作,我们打算实验性地比较不同的图像识别方法,以作为迭代地构建高质量的用于未来机器学习模型,人类对奖励概率的学习伴随着对价值表征的结构比对,这种比对与抽象大小概念的神经编码相一致,表明结构对齐可以促进学习的迁移,促进概率神经网络在图像识别与应用技术中的使用。

参考文献:

[1] 肖利芳,陈向阳.网络空间安全专业课程体系建设规划[J].电脑知识与技术,2019,15(28):177-178.

[2] 许婷婷,马晨晔,张静敏,等.基于深度学习的LAMOST光谱分类研究[J].天文学报,2019,60(2):15-24.

[3] 韦坚,刘爱娟,唐剑文.基于深度学习神经网络技术的数字电视监测平台告警模型的研究[J].有线电视技术,2017(7):78-82.

[4] 陈先昌.基于卷积神经网络的深度学习算法与应用研究[D].杭州:浙江工商大学,2014.

[5]冈萨雷斯.数字图像处理[M].2版.北京:电子工业出版社,2019.

[6] 李耀辉,刘保军.基于直方图均衡的图像增强[J].华北科技学院学报,2003(2):65-67.

【通联编辑:谢媛媛】

猜你喜欢
图像识别人工智能
我校新增“人工智能”本科专业
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
图像识别在物联网上的应用
人工智能与就业
图像识别在水质检测中的应用
数读人工智能
浅谈模式识别在图像识别中的应用
基于多组合内容的图像识别机制