崔华+纪宇+李盼侬
摘 要:近年来,高速路的拥堵问题变得越来越严重,传统的交通拥堵识别采用视频进行研究,其具有代价昂贵,识别速度慢的缺点。文章提出了一种基于图片进行交通拥堵识别的方法。因为卷积神经网络(CNN)在图像识别方面有着识别速度快,适用范围广,识别准确率高的优点,所以文章使用了带有relu激活函数代替传统的sigmod函数和tanh函数,并引入了dropout层的卷积神经网络模型GoogleNet,并对网络结构和参数进行了调整优化,得到了一个交通拥堵图片识别的改进的GoogleNet改进模型,该模型的样本内测试准确率达到了98.6%。在对2000张现实高速路上的图片进行识别测试后,测得其准确率为96.5%。采用文理特征的传统方法的高速路交通拥堵图像识别准确率为90%。
关键词:卷积神经网络;GoogleNet模型;拥堵
中图分类号:TP391.41 文献标志码:A 文章编号:2095-2945(2018)05-0018-02
Abstract: In recent years, the problem of highway congestion has become more and more serious. Traditional traffic congestion identification is studied by video, which has the disadvantages of high cost and low recognition speed. This paper presents a method of traffic congestion identification based on pictures. Because the convolution neural network (CNN) has the advantages of high recognition speed, wide range of application and high recognition accuracy in image recognition, we use the ReLU activation function instead of the traditional Sigmod function and Tanh function, and introduce the Dropout layer convolution neural network model GoogleNet. The network structure and parameters are adjusted and optimized, and an improved GoogleNet model for traffic congestion image recognition is obtained. The test accuracy of the model is 98.6%. After the recognition test of 2,000 images on the real highway, the accuracy rate is 96.5%. The recognition accuracy of highway traffic congestion image using traditional methods of literary and scientific features is 90%.
Keywords: convolutional neural network(CNN); GoogleNet model; congestion
1 概述
近年來,随着社会经济的发展,我国社会呈现的交通拥堵问题越来越严重,传统的交通拥堵识别方法基于视频中车辆的移动速度,这种方法设备昂贵,代价较高,覆盖面窄。如今,深度学习成为机器学习的一个重要研究方向,卷积神经网络广泛应用于图片的识别和分类。
2 CNN的GoogleNet模型结构
CNN的GoogleNet模型是一种由卷积层(convolutional),降采样层(pooling)和全连接层(full-connected)组成的深度神经网络模型,它有两方面的优势:一方面是它是非全连接的型的神经元连接方式,另一方面是一层中神经元之间是共享权重的。CNN主要应用在语音分析和图像识别领域,本文采用了经典的GoogleNet模型,其模型结构如图1。
在典型的CNN模型里,前面几层主要是卷积层和子采样层,后面是全连接层。一般地,CNN的基本结构包括两层,其一为特征提取层,每个神经元的输入与前一层的局部接受域相连,并提取该局部的特征。一旦该局部特征被提取后,它与其他特征间的位置关系也随之确定下来;其二是特征映射层,网络的每个计算层由多个特征映射组成,每个特征映射是一个平面,平面上所有神经元的权值相等。特征映射结构采用影响函数核小的sigmoid函数作为卷积网络的激活函数,使得特征映射具有位移不变性。此外,由于一个映射面上的神经元共享权值,因而减少了网络自由参数的个数。卷积神经网络中的每一个卷积层都紧跟着一个用来求局部平均与二次提取的计算层,这种特有的两次特征提取结构减小了特征分辨率。
3 基于GoogleNet的高速路交通图片拥堵识别
3.1 方法流程
对于交通拥堵图片识别,GoogleNet的处理流程,首先将训练样本进行大小为256*256的归一化,为防止出现连续的劣质样本对实验结果产生不良影响,实验的训练过程中对训练样本一般采取批处理的方式,即每次随机迭取固定数目的训练样本作为一个批次(epoch),然后将这个批次(epoch)作为输入,然后通过bp算法对每个批次(epoch)进行一次权值更新,当达到一定的迭代次数或者误差达到给定阈值时停止训练。将测试样本作为输入数据,将输入数据输入训练好的GoogleNet模型中,通过前向传播进行误差计算,然后根据结果得出分类的结果。endprint
前向传播阶段包括卷积过程和降采样过程。
卷积过程:用一个可训练的滤波器fx去卷积一个输入的图像,然后加一个偏置bx,得到卷积层Cx.卷积层的形式如(1)所示。其中l代表层数,k为卷集合,Mi表示选择的输入特征图的集合,每个输出特征图会给一个额外的偏置b。
采样过程:将图像的特征提取为卷积特征,然后将卷积特征划分为数个n x n的不相交区域。然后通过ωi+1进行一个加权,再通过增加一个偏置bx+1对结果进行评估,最后通过一个激活函数(sigmod),结果会产生一个缩小n倍的特征映射图。降采样层的一般形式如式(2)所示。其中down(·)表示一个下采样函数(pooling)。
4 实验数据和分析
4.1 实验数据集
本文的实验数据采自各高速路、城市道路的视频中采集样本,部分样本如图2所示。本实验随机从样本中每类选择出7000张作为训练样本,1000张作为测试样本。训练样本和测试样本不重复,所有的图片的分辨率归一化为256x256。
4.2 GoogleNet模型中参数的选择
本文主要调整了GoogleNet模型中的学习率、网络层数、各层滤波器数量和大小。然后通过对比实验,得出最优的学习率。然后调节该网络的层数、每层卷积核大小及数量,总结出了样本内准确率最高的参数值,从而提高目分类的准确率。
学习率的影响
本文通过对学习率进行线性的调整,从1开始,每次减小0.01调整模型的学习率,根据不同的学习率对损失函数产生的影响来进行调整。学习率的初始值为0.1,每次学习率递减0.01进行实驗。实验结果显示当学习率为0.01时收敛速度最快而且收敛时损失函数达到最小,所以本实验选用0.01作为GoogleNet最优的学习率的值。
4.3 GoogleNet模型网络结构优化
GoogleN模型可以改进的方法有多种,例如在误差函数上增加一个惩罚项,通过训练使得权值参数趋于稀疏。本文主要是针对GoogleNe中的学习率、网络层数、各层滤波器数量和大小进行实验和调整。学习率主要用来改变权值,如果学习率选择的太小,比较容易得到收敛结果,但收敛速度太慢;如果学习率太大,虽然收敛速度比较快,但可能导致损失函数曲线震荡或发散,出现局部收敛而非全局收敛。
4.4 识别结果
本文提出的改进的cnn模型的样本内测试准确率为98.6%。训练样本为45000张,测试样本为2000张。样本外测试准确率为98.3%,测试样被为1500张。
5 实验结果
本文提出一种基CNN中的GoogleNet模型的交通拥堵图片识别的方法,GoogleNe模型可以避免显式特征提取,然后在对大量实验数据的训练中进行隐士学习。这使得GoogleNet模型和其他分类器有明显的区别。GoogleNet模型通过直接处理灰度图像,它的优点在于可以自动处理图像,进行图像的自动分类,然后自动进行目标的识别。利用GoogleNet模型,进行多组对比实验。通过比较实验结果选取最佳的学习率、网络层数和各层滤波器数量和尺寸,使得识别的准确率最高。在接下来的计划中,我将对模型进行进一步改进,从而进一步提高交通拥堵图像目标识别的准确率。
参考文献:
[1]R.M. Bell and Y. Koren. Lessons from the netflix prize challenge. ACM SIGKDD Explorations Newsletter,9(2):75-79,2007.
[2]A. Berg, J. Deng, and L. Fei-Fei. Large scale visual recognition challenge 2010. www.image-net.org/challenges. 2010.
[3]曲景影,孙显,高鑫.基于cnn模型的高分辨率遥感图像目标识别[J].国外电子测量技术,2016,08.endprint