SOM与HL融合的地铁异物分类算法

2020-07-13 10:43刘伟铭杜逍睿李静宁郑仲星
铁道标准设计 2020年7期
关键词:异物神经元标签

刘伟铭,杜逍睿,李静宁,郑仲星

(华南理工大学土木与交通学院, 广州 510640)

1 概述

地铁因具有运量大、速度快、准时率高等优点,已经成为了城市最主要交通方式。以广州为例,截止2019年6月,其日最高客运量已达到1 062.0万人次[1]。地铁在方便人们出行的同时,也因为其检测技术的不完善频频给乘客带来人身伤害,仅2019年上半年,全国由于地铁列车门和屏蔽门之间夹物造成的乘客受伤事件就有多起,所以一套能检测列车屏蔽门和列车门之间是否存在异物并能对所检测到的异物进行分类的系统变得尤为重要,这不仅能为驾驶员提供夹物警告且能为驾驶员提供所夹异物的种类信息,便于驾驶员对是否继续启动列车进行综合判断,也将极大地保障乘客的乘车安全并大大提高列车的运行效率。

2 地铁异物分类方法

通过对地铁的实地调研,发现夹在或掉落在地铁站台门与列车门之间的异物有5类,包括包类、衣服、人四肢、人头、手机。目前基于深度学习的图片分类器,如CNN,Faster R-CNN,YOLO,SSD[2-5]虽然具有准确率高鲁棒性好的特点,但是其需要大量的带标签数据和昂贵的GPU作为前提,且由于神经网络其巨大的参数量使得每次对图片的分类都将进行数百万甚至数千万次的浮点运算。考虑到地铁狭小的安装环境和安装成本,选择NanoPC-T2嵌入式板作为基础硬件,若在其上运行深度学习网络,那么上百万次的浮点运算对于性能较弱的NanoPC-T2嵌入式板来说是无法想象的,同时对于大量带标签训练数据的获取也是十分困难的。为了解决无法获得大量带标签数据的问题,将采用无监督学习算法SOM[6]分别学习图片数据和标签数据的分布;为了解决分类异物实时性的问题,将采用Hebbian Learning(HL)[7]算法学习图片数据分布与标签数据分布之间的数学关系并编码在HL矩阵中,最终以查表的方式实现异物分类,达到实时分类异物。

3 基于SOM+HL的异物分类模型

3.1 SOM算法简介

SOM算法是一种无监督的神经网络,区别传统的深度学习,SOM算法不依靠梯度下降和反向传播进行权重更新而是采用竞争学习的方式,依靠神经元之间通过竞争、合作、适应来优化网络,最终达到学习输入数据分布的目的[8-11]。其优点在于不需要标签训练数据且能获得较好的聚类效果,其缺点是传统的SOM网络无法对神经元的资源进行合理的配置,即网络无法根据训练数据的特性使需要精确表达的数据部分获得更多的神经元表示,这将导致神经元权重聚类的不合理,影响对训练数据分布的表达,进而使得聚类的准确度降低。

3.2 改进的SOM网络

本文提出的基于SOM+HL的异物分类模型,用于提取图片数据与标签数据之间的数学关系,最终通过解码学习到的相关性矩阵完成异物图片分类。

为了介绍SOM+HL模型,本文将提供一个可视化的例子,以证明此模型具有学习不同类数据分布之间复杂数学关系的能力。本例中SOM在模型中的作用有:(1)负责提取输入样本的数据分布,如图1所示,经过学习SOM神经元的权重将呈现出与图1中蓝色和红色数据相似的分布;(2)以分布活动模式对输入样本进行编码,如图2所示,这种活动模式使得与输入样本最接近的神经元被强烈激活,领域神经元的激活强度与其距获胜神经元的距离成比例衰减。

图1 非线性的输入数据关系及其分布

图2 模型内部结构

为了使SOM网络能更好地学习样本的数据分布,改进了原有的SOM网络,使得每个SOM神经元不止学习一个特定的权重,同时也学习对输入数据的敏感曲线(呈正态分布),敏感曲线代表了神经元对输入数据的偏好程度,输入数据越接近神经元权重激活值越大。通常SOM网络的训练过程包括4个阶段:(1)计算激活值过程;(2)竞争过程;(3)合作过程;(4)适应过程,本文在传统SOM基础上增加了(5)对敏感曲线的调整过程。以下为本文SOM网络的训练过程。

(1)

(2)竞争过程:通过公式(2)可获得第p个SOM神经网络中在第k轮训练中获胜的神经元bp(k),即激活值最大的神经元为获胜神经元。

(2)

(3)

(4)适应过程:通过公式(3)的核函数能确保网络中的神经元能专注于数据空间的不同区域,使神经元的输入权重向样本数据靠近,通过公式(4)获得每个神经元权重的更新幅度,其中α(k)为第k轮训练的学习率。

(4)

(5)敏感曲线调整过程:每个神经元的敏感曲线的调整取决于神经元的空间位置,神经元距离输入样本的距离,核函数的大小以及衰减学习率α(k),即通过式(5)对敏感曲线进行更新。

(5)

图3 使用提出模型提取的数据关系

如图3所示,本文只考虑2个SOM中的5个神经元的敏感曲线(即神经元2,7,14,41,46),可以注意到神经元若对某小区间的数据有很强的敏感性,其敏感曲线尖锐且密集,反之若对数据的敏感性不高,则其敏感曲线宽长且稀疏。利用这个机制,本文的模型可以优化资源(即神经元):使用更多的神经元去表征需要精细表示的数据区域,使用较少的神经元粗略地表示已经表现很好的数据区域。

3.3 SOM+HL融合

本文模型的第二个部分是Hebbian Learning[17],它是一个连接不同SOM之间所有神经元的全连接矩阵,它使用全连接的方式将每个SOM神经元之间的关系投射到HL矩阵中,如图3所示,最终HL矩阵会将学到的关系进行编码。可以看到,若神经元之间存在相关性那会在全连接矩阵中高亮显示,反之则会呈现暗色。Hebbian Leaning使得SOM神经元之间的相关性能被拉向正确的方向。原始的Hebbian Learning在神经元被激活时只允许权重增长,为了阻止权重的无限增长本文使用了改进后的Hebbian Leaning,当神经元以相关的方式被激活时他们之间的连接(权重)会被加强,而如果他们的激活效果是反相关的,那么他们的连接(权重)会被削弱。每个HL矩阵位置(i,j)在第k轮学习中的权重更新大小通过式(6)实现。

(6)

其中,

(7)

图4详细展示了当向模型输入样本数据时的模型学习过程,可以看到不同数据之间具有强相关性的神经元将其在HL矩阵的权重得到增强,而具有弱相关性的神经元之间其在HL矩阵中的权重将减小。

图4 详细模型结构与具体执行

图5~图10展示了HL通过SOM学习两个不同类的数据分布来获得不同类数据之间的数学关系的过程。从图5可以看出,在初始阶段HL矩阵是随机的,通过50次的迭代后逐渐在出现一条明亮的曲线,此条曲线即是HL矩阵通过学习2类数据的SOM分布获得的两类数据的数学关系式,可见其形状与所期待的data2=(data1)3曲线是非常接近的,也就说明了HL矩阵具有学习不同数据分布之间复杂数学关系式的能力,也就启发通过SOM和HL来学习图片像素矩阵与图片标签矩阵之间的复杂数学关系。

图5 Epoch=0

图6 Epoch=10

图7 Epoch=20

图8 Epoch=30

图9 Epoch=40

图10 Epoch=50

在利用SOM+HL模型对异物图片进行分类时,首先将6类异物分别放在6个贴有标签的文件夹中(1-衣服,2-包,3-人手/人脚,4-人头,5-行李箱,6-无异物)。然后将数据分为两类,第一类为图片数据,第二类为图片数据对应的标签数据,将500张异物图片数据和对应的标签数据输入各自的SOM网络,利用SOM网络学习两类数据的分布,再将每轮训练数据获得的神经元激活值作为HL矩阵的输入,利用式(6)学习不同SOM神经元之间的相关性并将其编码在HL矩阵中,经过100轮的迭代学习,最终得到的图片数据与标签数据的相关性矩阵编码如图11所示。图中每个点的明亮程度代表了不同SOM中神经元之间的联系强弱,越明亮代表联系越强,反之则越弱。

图11 图片数据与图片标签数据相关性

对于新图片分类预测的过程,则直接采取解码HL矩阵即可。即向SOM网络输入待分类的图片数据并获得其激活神经元的位置,通过查找HL学习矩阵,获得图片数据,SOM激活神经元位置对应的标签数据并激活神经元的位置,最后通过解码标签矩阵激活神经元的权重矩阵获得标签值,完成图片的分类。

本文对改进后的SOM+HL模型和原始SOM+HL网络模型性能进行对比,结果如表1所示。可以看出,改进的SOM+HL模型在整体分类精度上有了较大提升,尤其是对小目标的分类精度上,通过分析可知这正是SOM网络利用敏感曲线在小目标的表达上分配了更多的神经元资源的结果。

表1 SOM+HL模型性能对比

4 模型优化

考虑到NanoPC-T2嵌入式板的算力问题,所以对图片有效特征的提取变得尤为重要,这不仅能降低图片的维度加快检测速度,还能消除非主要特征对检测结果的影响,使模型在性能上得到优化。

PCA(Principal components analysis)[12-14]技术是Hottel在1993年提出的一种全局特征提取的技术,主要利用不同维度数据之间的相关性进行数据的压缩和降维。目前PCA技术已经广泛用于图片领域,使用PCA算法提取图片特征的应用流程如下。

(1)创建一个矩阵[X1,X2,…,Xm],代表了N2×m的矩阵。其中每个Xi代表一张N×N的图片,m代表训练图片的数量。

(2)计算所有图片像素值的平均数

(8)

(3)计算差分矩阵

(9)

(4)通过差分矩阵来生成协方差矩阵,以获得相关矩阵

(10)

(5)使用相关矩阵获得特征向量

Aφi=φλi

(11)

其中,φi是正交特征向量矩阵;λ是特征值矩阵,其中对角线上的特征值关系为λ0>λ1>…>λN2-1且λ0=λmax,这是利用特征空间Φ来减少特征向量矩阵的依据[15-17]。特征向量顺序与特征值代表了其和原始数据的相似程度,特征向量空间为

Φ=[φ1|φ2|……|φn]

(12)

其中,1≤n≤N2

(6)如果Φ是一个特征向量空间,那么图片X可以通过公式(13)完成图片的降维,yn的维度为n。

(13)

本文训练图片尺寸为200×200,即对于SOM网络其输入数据的维度为40 000,通过PCA降维后,只需要104个维度就能对原图片进行表征,且保留了原灰度图99%的信息,这在保证网络训练效果的同时大大降低了训练SOM网络的计算量。图12为原灰度图,图13是利用降维后的104个维度信息恢复的灰度图。

图12 PCA降维前原图

图13 PCA降维复原图

本文分析了对训练图片采用PCA预处理流程与不采用PCA预处理流程对分类结果的影响,实验结果如表2所示。从表2可以看出,增加PCA流程不仅能提高分类检测速度,更能提高分类的准确率。

表2 有无PCA流程对分类效果的影响

5 结论

通过安装在站台门与列车门之间的RGB摄像头采集的图像,结合通过HL训练所获得的记录了SOM分类神经元之间数学关系的矩阵模型,完成了对地铁站台门与列车门之间异物的分类。通过对比实验可知,改进的SOM+HL模型能更好地分配神经元资源,对比原始的SOM+HL模型,其分类准确率从64.44%提高到72.60%。通过对待分类数据增加PCA预处理操作,降低训练难度,预先使用PCA对训练图片进行降维去噪处理会提高SOM+HL模型的分类准确率,并能提高模型分类速度。最终PCA+SOM+HL模型对异物分类的准确率达到86.2%,其检测速度在T2板上达到了60FPS,实现了实时分类异物,为进一步保障乘客乘车的安全和列车的高效运行奠定了基础,因为实时性强和准确率高的特点,使得其在轨道交通领域具有极高的使用和推广价值。

猜你喜欢
异物神经元标签
食管异物不可掉以轻心
如何处理异物进入眼睛
AI讲座:神经网络的空间对应
仿生芯片可再现生物神经元行为
采用GCaMP6 在体大规模记录感觉神经元的活动
眼耳鼻进异物咋处理
无惧标签 Alfa Romeo Giulia 200HP
不害怕撕掉标签的人,都活出了真正的漂亮
研究人员精确定位控制饮酒的神经元
让衣柜摆脱“杂乱无章”的标签