基于视频的车载屏幕互联与识别算法研究

2019-05-22 09:27潘雨哲黎静
无线互联科技 2019年4期
关键词:图像识别深度学习神经网络

潘雨哲 黎静

摘 要:文章研究了基于视频的车载屏幕互联与识别算法。基于智能后视镜搭建路况识别原型系统,依托车载摄像头收集训练图片,运用神经网络与深度学习,将视频图像进行特征提取后,利用支持向量机进行分类识别,实现车辆检测技术。

关键词:人工智能;图像识别;神经网络;深度学习

在车载系统愈发智能化的今天,智能云镜的功能不断创新,导航可用车载导航系统甚至可以用手机,行车记录有传统的行车记录仪和全方位摄像头,停车监控在很多车载操作系统中也有相应的功能,智能云镜功能日益重复[1]。日前,已有部分国家对汽车后视镜的相关政策做出了修订,日本颁布新政策称允许汽车用摄像头代替反光镜;同时,联合国欧洲经济委员会制定的后视镜相关规则也被修订。在智能云镜的发展过程中,物体识别一直是一个重要的研究方向,移动网络由4G走向5G时代,这为移动设备提供了更快的数据传输渠道,因此,对云镜的视频识别功能要求也越来越高[2]。基于以上背景,本文提出了利用视频识别算法与车载屏幕互联实现车辆检测。

1 神经网络与深度学习

人工神经网络(Artificial Neural Network,ANN),简称神经网络或类神经网络,是一种模仿生物神经网络(动物的中枢神经系统)的结构和功能的数学模型或计算模型,用于对函数进行估计或近似[3]。

神经网络由大量的人工神经元联结进行计算,大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统。人工神经网络可处理非线性统计型数据,具有并行结构对神经网络中的每个神经元进行同样的运算,便于计算机的运算处理。此外,有学习和记忆的功能,通过对一个神经网络的训练能够判别事物和联想记忆[4]。

深度学习是神经网络的一个大分支,深度学习的基本结构是深度神经网络。深度学习网络与传统的神经网络之间的相同之处,就是二者都是相似的分层结构,包括输入层、隐层和输出层的多层网络,其中只有相邻层之间有链接,同一层及跨层之间是没有连接的。不同之处在于,传统神经网络一般只有两层或者三层的神经网络,参数和计算单元有限,对复杂函数的表示能力有限,学习能力也有限;而深度学习具有更多的神经网络,并且引入了更有效的算法[5]。

云计算时代来临之后,作为目标检测两大派系之一的“R-CNN系二刀流”,是第一个成功将深度学习应用到目标检测上的算法,解决了“生成可能区域(Region proposal)&卷积神经网络(Convolutional Neural Networks,CNN)提取特征”和“放入分类器分类和修正”的问题[6]。

不同于经典目标检测算法(如overfeat)中的滑动窗口扫描所有可能区间,R-CNN使用效率更高的selective search方法预先提取所有候选区域。R-CNN结合了高容量CNN应用于自下而上的生成区域算法中,以便对物体进行定位和分割,当标记的训练数据稀缺时,对辅助任务进行监督的预训练,然后进行特定领域的微调,性能将得到显著提升。因此,本文基于R-CNN(Region-CNN)算法,在CNN、线性回归和支持向量机(Support Vector Machine,SVM)等算法的基础上,实现目标检测技术[7]。

2 支持向量机介绍

SVM的基本模型是在特征空间中找到最佳的分离超平面,以便训练集上的正负采样间隔最大。SVM是用来解决二分类问题的有监督学习算法,在引入了核方法之后SVM也可以用来解决非线性问题。且训练完成之后,大部分的训练样本都不需要保留,最终的模型仅与支持向量有关。

一般SVM有下面3种:硬间隔支持向量机(线性可分支持向量机):当训练数据可线性分离时,可以通过硬间隔最大化学获得线性可分支持向量机;软间隔支持向量机:当训练数据近似线性可分时,可以通过软间隔最大化获得线性支持向量机;非线性支持向量机:当训练数据线性不可分离时,可以通过核方法和软区间最大化来获得非线性支持向量机。由于在实际任务中很难找到合适的核函数,因此,样本在样本空间或特征空间中是线性可分的,所以本文使用SVM的软间隔支持向量机。SVM可以很容易地获得中小样本数据与特征之间的非线性关系,从而避免使用神经网络结构选择和局部最小值问题。它可以高度解释并且可以解决高维问题[8]。

3 车辆识别算法步骤介绍

本文研究内容主要为通过摄像头和智能云镜的相关技术,基于车载智能后视镜平台,研究前后车识别算法,实现基于前后车特征分类的方法,实现特定场景下的识别性能验证。而视频中的图像识别及特征提取主要包括以下4个步骤。

(1)利用摄像头对路况进行实时收集,如图1所示,将视频通过硬件设备进行图像分割形成独立的二值图像,本文采用图像目标检测算法对其进行形状检测,并经过灰度变换、灰度拉伸、去噪、滤波等过程对图像进行预处理得到灰度图。

(2)经过形状检测的灰度图还需进行形状提取,即对经过预处理的灰度图进行二值化处理,用以区分得到更加鲜明的图像,有利于后续的快速处理及分析,即深度学习。在二值化处理过程中,利用迭代法统计并计算出图像的各灰度分布,分为目标及背景两部分并进行多次迭代确定图像的最佳分割阈值。

(3)利用边缘检测算法分离目标与背景区域,仅对车辆部分进行增强。

(4)使用基于形态特征的分割法进行车辆定位,对视频中的图像帧进行特征提取,将提取出的图像利用支持向量机SVM进行图像分类获得车辆特征,如图2所示。

4 结语

本文利用车载摄像头提取视频图像,基于图像识别、特征提取以及神经网络与深度学习,在复杂背景下进行车辆检测。视频识别算法对于智能云镜的研究具有重要意义,定位视野前方的车辆并精确测量其相对于本车的位置,根据危险性给出不同程度的危险预警是进一步的研究方向。

[参考文献]

[1]GIRSHICK R,DONAHUE J,DARRELL T,et al.Rich feature hierarchies for accurate object detection and semantic segmentation[C].Columbus:2014 IEEE Conference on Computer Vision and Pattern Recognition(CVPR),2014.

[2]MARK S N,ALBERTO S A.Feature extraction and image processing[M].Second Edition.London:Elsevier Academic Press,2002.

[3]劉仁云,孙秋成,王春艳.数字图像中边缘检测算法研究[M].北京:科学出版社,2015.

[4]CYGANEK B. 数字图像目标检测与识别:理论与实践[M].宋晓炜,杨蕾,瞿博阳,译.北京:电子工业出版社,2016.

[5]才溪.多尺度图像融合理论与方法[M].北京:电子工业出版社,2014.

[6]周志华.机器学习[M].北京:清华大学出版社,2016.

[7]华校专,王正林. Python大战机器学习[M].北京:电子工业出版社,2017.

[8]佚名.深度学习概述:从感知机到深度网络[EB/OL].(2015-08-27)[2019-02-15].http://www.cnblogs.com/huicpc0212/p/4761875.html.

猜你喜欢
图像识别深度学习神经网络
神经网络抑制无线通信干扰探究
基于Resnet-50的猫狗图像识别
高速公路图像识别技术应用探讨
图像识别在物联网上的应用
图像识别在水质检测中的应用
MOOC与翻转课堂融合的深度学习场域建构
大数据技术在反恐怖主义中的应用展望
基于神经网络的拉矫机控制模型建立
复数神经网络在基于WiFi的室内LBS应用
基于支持向量机回归和RBF神经网络的PID整定