基于神经网络的计算机视觉探讨

2018-10-26 11:38王瑞丽
科技资讯 2018年11期
关键词:计算机视觉应用探讨

王瑞丽

摘 要:在大数据时代背景下,各个行业中都涉及到更加复杂的管理内容,为了实现更加有效的管理,需要行业具有针对大数据管理的方法,而神经网络就是一种针对大数据的网络处理结构,其在计算机视觉中的应用也有效提供了计算机技术的性能,下面,本文就针对基于神经网络的计算机视觉进行探讨,来了解其具体的实现和应用。

关键词:神经網络 计算机视觉 应用探讨

中图分类号:S126 文献标识码:A 文章编号:1672-3791(2018)04(b)-0017-02

计算机视觉应用作为一种新型的技术类型,其受到了人们的欢迎和追捧,为了更好地实现计算机视觉的功能,就可以利用神经网络来建立相应的网络结构来进行计算机视觉功能的实现,但是,由于神经网络还处于一种探索的阶段,在探索的过程中国也产生了多种神经网络模型,本文主要针对卷积神经网络在计算机视觉中的应用进行探讨,来了解其对计算机视觉的实现。

1 计算机视觉的神经网络模拟发展现状

神经网络模拟技术的发展还处于一种探索的阶段,并没有达到实时的处理效果,而随着长期的研究和探索,目前国内外对于神经网络在计算机视觉中的应用研究也在不断进步,计算机视觉主要是将视觉感知到的处理以及表现进行综合,进而实现其自动化处理的技术,在神经网络的计算机视觉应用中,对于图像的处理、统计模式的分类以及几何的建模和处理等技术都比较实用,但是其研究中依然存在一定的难题。比如:利用相应的神经网络实现了对图像的恢复,但是其完成任务的过程中,需要神经元的数量过多,即所用的神经元数量至少要等于其输入的图像像素的个数。另外,神经网络的计算机视觉应用中也取得了不错的效果,比如:利用三层神经网络对其纹理实现了有效分割,利用多值Boltzmann机来对其纹理进行分割,在其有限的迭代次数下,取得的效果却不错,在边缘的检测中,也取得了很大的突破[1]。

2 基于神经网络的计算机视觉分析

2.1 神经网络的结构

对于一个简单的卷积神经网络模型来说,其主要有两个卷积层(C1,C2)以两个子采样层(S1,S2)交替组成。其原始的输入图像先经过3个可以训练的卷积核可加偏置的向量来进行相应的卷积运算,进而在C1层呈现出3个具有特征的映射图,然后针对其每一个特征映射图局部区域来进行相应的加权平均求和,在通过增加相应的偏置后,通过其非线性的激活函数于S1层呈现出3个新特征的映射图,这些具有特征的映射图在C2层3个可训练的卷积核中进行卷积,再经过S2层,输出相应的3个特征的映射图,最后S2层3个输出特征图像被向量化,输入到其传统神经网络进行训练。

2.2 图像分类

图像分类主要是通过对相关图像进行分析,进而将相应的图像划分为若干类别中某一种,它主要用来强调图像整体语义的判定。目前,常用评判图像的分类算法带标签数据集有很多种,ImageNet的使用就比较频繁,其包含了超过15000000张的带标签高分辨率的图像,而这些图像进一步被划分成超过22000种类别,在训练深度神经网络时,一般常用归一化的输入数据预处理手段,它可以有效地减少网络的训练参数和初始权重,从而避免对训练的效果产生影响,加快其收敛的速度,相关人员也将这种归一化方法使用到了网络内部激活函数中,从而实现对层和层之间数据传输的归一化[2]。

2.3 物体检测

物体检测相对于图像分类来说更加复杂,在对于一张图像的处理中,其还可能具有不同类别多个物体,因此,这就需要针对这些内容,进行相应的定位和识别,要想在物体的检测中取得好良好的效果,就比物体的分类更有难度,在物体检测中,其深度学习的模型结构和构建也就更为复杂。卷积神经网络在物体检测中的使用,主要是利用R-CNN模型,这一模型是使用Selective search这一种非深度的学习算法来提出相应的待分类候选区域,进而再将其每一个候选区域进行输入于相应的卷积神经网络,并提取其特征,然后将这部分特征输入于线性支持的向量机进行分类,为了保证其定位准确,R-CNN还训练了一种线性回归模型,对候选的区域坐标实现修正。

2.4 姿态估计

在计算机视觉呈现中,除了图像分类以及目标检测外,对于姿态的估计也是应用十分广泛,比如:在很多网络游戏、动画视频等中都需要用到,因此,这就需要计算机视觉快速实现姿态的估计,在姿态估计和检测中,一般包含很多的类别,姿态估计也是目前计算机视觉实现中最关键的内容,主要是由于其应用于人物的追踪、动作的识别以及视频分析中,比如:生活中常用到的视频监控以及视频搜索功能等。对于姿态估计的网络结构来说,其主要有5个卷积层以及3个pooling层和3个全连接层来组成,其每一层都能够提取一定的特征进而进入于下一层的训练中,再经过最后的全连接层得出一个2k维向量,就作为其输出结的果,如果想要得出原图的大小,还需要进行相应的逆操作[3]。

2.5 图像分割

在以上的基础上,对计算机视觉功能的发展就是对相应图像的每个像素点进行预测,也就是对图像的分割。对于图像的分割来说,一张图像可能会存在多个的物体、多个的人物或者多层的背景,这就需要对原图上每一个像素点进行分析,进而预测其属于的哪部分图像分割内容,这也是计算机视觉应用中关键性内容。卷积神经网络模型对于图像分割的实现,先使用一些常用分类网络,保留它们对图像分类训练的参数基础之上,再进行相应的处理,将其转变成图像分割模型,然后,再将一些网络比较深的层特征以及一些比较浅的层特征进行有效结合,最后再用相应的反卷积层放大到相应的原始图像大小提供更加准确分割结果,这种网络结构也被称作跳跃结构。

2.6 人脸识别

人脸识别在图像识别的领域是非常重要研究的内容,其在人们生活中也逐渐的得到了使用,人脸图像功能的实现,需要其具有易采集特性,它也受到了很多行业重点关注,因此,其具有广阔的使用前景以及巨大商业市场。对于人脸识别技术来说,其主要有人脸检测、人脸识别以及人脸特征提取3个过程,人脸检测主要是在输入图像以及视频中,检测和提取相应的人脸图像,进而给出相应的人脸位置以及相应的主要的面部器官位置信息,一般采用Haar特征以及Adaboost算法的训练级联分类器来对图像的各个矩形子区域实现分类,特征提取通过对一组数据进行人脸信息的获取,其主要是提取人脸的特征,人脸特征一般有几何特征以及表征特征[4]。

3 结语

神经网络的计算机视觉应用对计算机技术的发展具有着重要的意义,其可以有效提高计算机技术的功能,进而更好地服务于人们,为了更好地促进其应用,需要相关人员继续对神经网络的计算机视觉应用进行研究和探索,这也是其发展中的重点内容。

参考文献

[1] 卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016,31(1):1-17.

[2] 李彦冬.基于卷积神经网络的计算机视觉关键技术研究[D].电子科技大学,2017.

[3] 包晓安,张瑞林,钟乐海.基于人工神经网络与图像处理的苹果识别方法研究[J].农业工程学报,2004,20(3):109-112.

[4] 戴逸松,陈贺新.人工神经网络的研究及在计算机视觉中的应用[J].吉林大学学报,1991(2):102-110.

猜你喜欢
计算机视觉应用探讨
基于深度卷积神经网络的物体识别算法
双目摄像头在识别物体大小方面的应用
机器视觉技术发展及其工业应用
危险气体罐车液位计算机视觉监控识别报警系统设计
品牌价值驱动下的品牌策略研究
ADS—B在空管中的应用探讨
生物监测及其在环境监测中的应用探讨
水溶性色粉在防冻液中的应用探讨