基于卷积神经网络的地铁客流识别系统应用

2022-09-01 02:29庞婷婷王玮
微型电脑应用 2022年8期
关键词:客流车厢卷积

庞婷婷, 王玮

(西安交通工程学院,交通运输学院,陕西,西安 710000)

0 引言

随着计算机技术、网络技术应用在公共交通系统的逐步深入,公共交通出行将向着智能化、网络化、信息化方向发展,乘客对公共交通的便捷性提出更高的需求。地铁车厢内客流量信息可为乘客提供实时的车厢拥挤情况信息,避开人流高峰期,提高出行效率和舒适度。同时,车厢客流信息可为地铁调度策略提供参考依据。地铁车厢客流量识别问题成为近年热门研究课题。DALEY等[1]利用红外温度检测技术对车厢客流进行检测,实现对车厢内乘客数量的统计。MUDOI等[2]采用背景差分法,通过人工神经网络对目标图像进行训练,并结合目标形状和颜色特征实现对车厢拥挤度的识别。徐明远等[3]利用卷积神经网络,通过神经网络的改进实现对车厢拥挤程度的判别。本文以车厢监测视频图像为对象,利用卷积神经网络实现对车厢乘客流量的识别,通过卷积神经网络的结构优化,提升了网络训练速度和检测准确性。

1 卷积神经网络结构

地铁客流识别系统框架如图1所示[4]。该算法的核心在于卷积神经网络的设计,主要原理是通过对图像特征的训练优化神经网络参数,从而建立客流识别模型。首先利用车厢内视频监控系统获取车厢内的实时图像信息;然后对图像做进一步的预处理,使其满足卷积神经网络模型输入格式的要求,主要包括图像剪切、灰度处理、图像直方图处理等。将处理后的图像输入卷积神经网络模型,通过样本训练优化网络参数,将训练完成后的网络作为检测识别模型,实现对车厢客流的实时输出。卷积神经网络主要包含卷积层、池化层,可实现图像的特征提取,减少了需要调整的参数数量,降低了模型复杂度。

图1 客流识别系统框架

1.1 卷积层

卷积层属于卷积神经网络的特征提取层,网络输入数据在该层实现卷积运算,是该网络模型的基本组成单元。其中,卷积核存在于卷积层中,起到滤波作用。通过卷积核运算可得出特征图矩阵,且特征图层数与卷积核的数目相关。卷积层降低了模型参数的个数,提升了模型的适用性,通过样本训练可将卷积核用于形状、颜色、边缘等特征的检测器。卷积层公式为

(1)

卷积层的计算过程如图1所示。最顶端为图像输入,图像设定为3个通道,图像大小为8*8;第二层为卷积核,每个卷积核的结构相同且参数共享,卷积核之间互相独立。卷积核在输入图片后依次进行卷积运算,输出特征图的大小,将卷积核输出的所有特征图进行组合则得到所需要的特征图组。

1.2 池化层

池化层同样是卷积神经网络的基本单元,局部运算对卷积层输出的特征图,保持数据主要特征的同时降低特征向量数目,降低特征向量纬度,减少模型参数数量,从而防止网络发生过拟合现象[5-6]。池化层可以保留数据平移、旋转、拉伸等特性,但在对特征向量降维的过程中会造成部分信息的损失,且随着池化矩阵大小的增大,特征信息丢失得越厉害,因此池化矩阵尺寸选择应适中。

池化最常用的方法有概率池化法、平均池化法和最大池化法[7]。其中,平均池化法是直接采用图像特征值的平均值作为其特征值。最大池化法是取图像特征值中的最大数值作为其特征值。概率池化法主要是利用概率矩阵尺寸,通过对概率矩阵进行加权后再进行均值计算,完成池化运算。

2 网络激活函数

隐含层中的非线性激活函数对神经网络模型提取数据特征具有关键性作用,且具有较好的拟合能力,具备对抽象特征和层次特征的提取能力。由于现实研究的问题多为非线性问题,无法实现线性分割,需要通过非线性映射关系,将数据特征从低维度空间映射到高维度空间,在高维度空间中再对数据特征进行线性分割,非线性激活函数在这一过程中起到至关重要的作用。常用的激活函数可分为Sigmoid函数、Tanh函数、Relu函数,三种函数曲线图如图2所示[8-9]。

图2 三种激活函数曲线

其中,Sigmoid激活函数公式为

(2)

Tanh激活函数公式为

(3)

Relu激活函数公式为

(4)

Sigmoid函数可将输入数据压缩至[0,1]区间,其具有严格单调递增性,比较适用于二类分类问题。但其存在两方面缺陷:一方面是其输出结果的平均值不为0,以至于后续的隐含层输入的平均值也不为0,当输入均值为正值时,导致隐含层梯度也为正值,影响模型训练结果;另一方面,Sigmoid函数容易发生饱和,导致参数更新失败,降低数据特征提取能力。Tanh函数可将输入数据压缩至[-1,1]区间,能够保证输出数据的平均值为0,但其同样存在不足,当输入数值过小或过大时,梯度变化速率将非常小,致使训练收敛速度过慢。

Relu函数属于分段函数,但输入值小于0时,输出值置零,当输入置大于0时,输出与输入相等。该激活函数不用进行指数运算,仅需与设定的阈值做比较,计算简单,大幅度提升了运算速度。另外,该函数不容易出现饱和现象,当输入为正值时梯度值为常数,输入为负数时梯度被置零,从而保证梯度一直存在。同时,该函数可使神经元状态具有一定稀疏性,不易出现过拟合现象。比较三种激活函数的特性,选用Relu函数作为卷积神经网络的激活函数。

3 基于GoogLeNet模型的样本训练

对于地铁车厢客流识别问题,需要同时考虑识别的准确性和快速性。在保证识别准确率符合需求的前提下,应尽量简化网络结构的宽度和深度,降低网络规模和参数数量,以提升模型训练和图片处理速度,保证地铁客流检测的实时性。选用GoogLeNet模型作为客流检测的基础算法,该卷积神经网络模型只需增加少量参数,即可实现网络深度和宽度的提升,且具有很强的非线性表达能力。由于地铁车厢客流识别算法需要运行于嵌入式设备,对网络的规模和层深要求苛刻,改进型GoogLeNet模型结构比较适用于此类应用环境[10]。

GoogLeNet神经网络模型是在LeNet和AlexNet模型的基础上进行改进发展而来,提升了网络层的最大深度,最大可达到22层,同时对网络宽度进行了扩展,在参数增加很少的情况下,降低过拟合度,提升网络性能,可大量节约计算资源。GoogLeNet神经网络模中的Inception模块可提升网络的非线性表达能力,将相同输入的特征图通过多路卷积运算合并为一个特征图,Inception模块结构如图3所示。

图3 Inception模块标准结构

为了提升模型运算效率,对GoogLeNet模型做进一步改进,Inception模块中存在四路独立的卷积运算通道,在每路卷积通道中分别存在一个1*1大小的卷积核,其主要作用是特征提取和降维,可对卷积核进行剪切删除,只要保留不小于2个卷积核,其网络模型性能就不会受到明显影响。通过卷积核剪切,将原有的5*5卷积核简化为3*3卷积核,数据运算量得到明显减少,剪切改造后的Inception 模块结构如图4所示。

图4 Inception模块改进结构

4 实验结果

对某地铁线路中的一节车厢进行图像采集,每10 s采集一幅图片,共获取15 000张图片。如果将车内乘客简单分为拥挤和宽松两个状态,分类不够精细,无法为乘客和铁路调度提供具有参考意义的客流量参考状态。因此,将地铁车厢内客流量分为5类状态:S1(非常拥挤);S2(一般拥挤);S3(适中);S4(一般宽松);S5(非常宽松)。其中:S1(非常拥挤)状态表示车厢内座位已坐满且过道站立面积占用80%以上;S2(一般拥挤)状态表示车厢内座位已坐满且过道站立面积占用50%~80%左右;S3(适中)状态表示车厢内座位基本坐满且过道站立面积占用30%~50%左右;S4(一般宽松)状态表示车厢内座位可有空余且过道站立面积占用不足30%;S5(非常宽松)状态表示车厢内座位有明显空余且过道几乎没有站立乘客。安排3名评审人员对每张图片的状态进行评估和标注,对于处于两种相邻状态的图片进行模糊评估,最终获得5类状态的图片数目:S1为4 016张;S2为3 336张;S3为2 591张;S4为2 325张;S5为2 732张。

从每个状态分组中随机抽取出500张图片作为测试图片,其他图片作为训练样本,训练学习率设定为0.01,批处理数量定为32,限定最大迭代运算次数不超过5 000次,样本训练的损失函数与训练次数的对应关系如图5所示。

图5 样本训练的损失函数曲线

由图5可见,随着运算迭代次数的增加,损失函数值向逐步减小的方向变化,且递减速度逐渐减小,数值最终稳定收敛在0.15左右。模型训练结果准确率与训练次数的对应关系如图6所示。随着迭代次数的增加,准确率逐步上升,且上升速度逐步减少,准确率最终稳定收敛于95.5%左右。整个过渡过程中,训练曲线无明显大幅度波动,表明模型具有很好的稳定性和较快的学习速度。当训练迭代次数超过4 000次,模型准确率基本稳定,提升幅度不大,单纯的提高迭代次数已无法进一步提升准确率,可通过对模型结构的进一步优化研究(例如调整卷积核维度等)来实现准确率的提高。

图6 识别准确率曲线

5 总结

利用图像信息实现车厢客流状态的识别,可借助车厢原有的监控系统,无效额外增加前端检测终端,简化了系统结构且节约构建成本。本文将车厢客流状态划分了五类状态,由于该改进型算法具有较快的训练收敛速度,可对状态做进一步扩充,在保证运算度的前提下,为乘客提供更精细的状态分类。可对卷积神经网络的卷积层和池化层做进一步的优化研究,扩充分类量,提升模型对相邻分类之间模糊区域的特征提取和识别能力,使得系统具有更精细的识别能力。

猜你喜欢
客流车厢卷积
一种基于卷积神经网络的地磁基准图构建方法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
城市轨道交通节假日期间大客流行车组织思考与实践
车厢
基于系统动力学的城市轨道交通车站客流控制仿真与优化
六号车厢
从滤波器理解卷积
地铁换乘客流预警及应对
地铁线网客流优化配置研究与应用