杨姣姣 李嘉辉
1.湖北文理学院 纯电动汽车动力系统设计与测试湖北省重点实验室 湖北省襄阳市 441053
2.湖北文理学院 汽车与交通工程学院 湖北省襄阳市 441053
在人-车-道路-环境系统中,驾驶人是造成交通事故的主要原因,而分心驾驶又是影响驾驶人的主要因素[1]。分心驾驶是对不同驾驶分心状态的总称,实际研究中又将其分为听觉分心、视觉分心、认知分心和动作分心四种类型。因此研究驾驶分心识别对于减少分心驾驶导致的交通事故具有重要意义。
为了有效减少驾驶分心带来的交通事故,近年来有许多学者在驾驶分心识别方面做了大量的研究。通过采用不同的指标、不同的机器学习方法和深度学习方法对分心识别展开了深入研究。目前,缺乏对驾驶分心识别方法的全面综述。本文将主要从驾驶分心类型、影响因素、识别指标、识别方法进行详细地阐述。着重对比分析机器学习和深度学习在驾驶分心识别方面的优劣,为开展驾驶分心识别研究提供借鉴。
根据国际标准化组织定义(ISO)分心驾驶是指:驾驶时注意力指向与正常驾驶不相关的活动,从而导致驾驶操作能力下降的一种现象[2]。驾驶分心目前基本被分为四种类型:认知分心(思绪走神)、视觉分心(驾驶员眼动视线离开原本道路)、听觉分心(聊天、语音)以及操作分心(接打电话、手离开方向盘)[3]。张辉等[4]通过对实际驾驶人驾驶情况的观察统计发现驾驶情况中更多的是两种以上分心活动同时出现。例如听觉-视觉分心(驾驶员与车内人员聊天时不自觉的视线离开当前眼动区域),认知-操作分心(驾驶疲劳导致操作方向盘失控)等,且不同分心状态下检验驾驶指标也存在显著性偏差。驾驶影响因素可分为三类:驾驶人影响因素、车辆影响因素和交通环境影响因素[5]。驾驶人影响因素是分心主要原因,对此研究比较多面化。不同年龄、性别、对驾驶操作的熟练度都可能会引起不同程度的驾驶分心[1]。车辆影响因素包括车辆的性能、类型、变速箱种类、驾驶辅助系统等。李晨[6]基于货车驾驶人分心识别研究一文中,分析了驾驶人分心对车辆运行状态的影响。交通环境影响因素包括道路设计、道路质量、道路绿化、道路交通量、及不同天气状况下对交通道路的影响。这三种影响因素中驾驶人本身的影响因素对分心驾驶作用最大。
根据对不同驾驶分心类别的模拟实验及实车实验,用于判断驾驶员驾驶分心的识别指标可分为六种:驾驶绩效、眼动指标、生理心理指标、面部与头部指标、融合指标。
3.1.1 驾驶绩效
驾驶员对于车辆的操作信息即驾驶绩效,驾驶绩效可具体表现为驾驶员对车辆的横向控制与纵向控制[2]。横向控制指标有:横向加速度、方向盘转向等,纵向控制指标有:纵向加速度、油门大小、前后跟车距离等[7]。已知驾驶分心研究大多采用单项指标对某一影响因素进行测量记录分析,如选取车辆横摆角速度,驾驶员在分心时车辆跟车距离等。但一般现实情况涉及到的单项指标较少,且随机两项以上指标比较常见。多项指标共存出现的情况较多,这就导致驾驶绩效测量结果偏差较大。
3.1.2 眼动数据
眼动指标是通过摄像机捕捉到瞳孔和眼角的距离变化来判断驾驶员是否分心,需佩戴眼动仪等设备进行收集瞳孔变化图像。实施起来精确程度有限。目前也有基于瞳孔的驾驶分心检测,采用Viola-jones 算法提取人脸眼睛附近区域,再通过匹配得到瞳孔和眼角位置差[8]。
3.1.3 生理数据
生理数据包括:心电信号,脑电波信号,血压等,这些数据能显著地反映当前驾驶员生理信息[9]。相较其他数据也能更科学地给出驾驶员生理情况变化,对这些测量指标在医学上也能给出较为严谨的解释。但不得不否认测量周期长,数据需得积累到一定数量才有可靠性。
3.1.4 驾驶人面部
通过头部转向及面部表情变化同样可以有效测量驾驶分心程度,随着机器学习的发展,不少驾驶分心研究采用图像识别对驾驶员面部各项数据进行采集,之后进行面部图像处理与特征提取,再与已有标准驾驶员图像进行对比,得出差异大小[9]。在一定差距值内测定为安全,超过规定差距值则判定为分心[10]。
以上四种指标都是针对某种指标的单一指标,可靠性较低。若要体现出更高的准确率,则需融合以上指标两种至三种[11]。例如将眼动数据与生理数据融合,通过构建相关模型对分心情况进行检测;或者将驾驶绩效与眼动数据进行融合,再或是将生理数据、眼动数据及驾驶人面部进行结合对驾驶员分心情况进行更精准的检测。这一融合方法体现了多方位的检测,更能说明分心驾驶时的具体情形及数据。
表1 是对部分机器学习方法的简单总结,这些已知的机器学习方法运用到分心识别上大多是通过建立学习模型对驾驶人分心行为进行识别并判断,在这些方法中向量机(SVM)分心识别模型在各类机器学习识别模型中占32.12%,模型通过遗传算法优化比对后的结果能达到93%以上的准确率。但不同的数据、数据特征也会影响机器学习模型的准确率,同时向量机(SVM)对样本数据要求较大时难以训练,因此要根据实际数据类型及需求去选择模型。
表1 机器学习方法分析
一些典型的深度学习方法见表2,算法上很大程度上依赖于高端机器,而传统的机器学习算法允许在低端机器上面工作,因此深度学习对硬件配置有较高的要求。深度学习大多通过神经网络实现分心驾驶的分类识别,同时通过不断调整数据集,训练大量模型,对多源驾驶信息进行融合,以此提高分心识别的准确率。已提出的CNN 模型、MH-SSD 网络模型、YOLOv5 模型等在算法基层网络上进行改进,引入注意力机制来加强对目标物体的检测。Video Swin Transformer 用于实时抽烟、打电话动作识别,并将局部注意力计算的范围从空间扩展到时空域,在FFN 之后添加一层Sparsification Module(SPM) 对整个网络进行分层稀疏化。在公开数据集Kinetics400 和Moments in time 中进行实验,结果与现有方法相比取得速度与精度最为平衡的结果。
表2 深度学习方法分析
深度学习源于机器学习,能通过学习、处理、分析大量数据动态检测分心行为。目前研究深度学习的文献占所有识别模型的25%,趋于这方面的研究逐渐偏多。
本文基于车辆驾驶指标,主要分析了驾驶人分心状态识别方法,主要研究结论如下:
(1)对驾驶人分心识别的指标可分为两大类:单项指标和融合指标。单项指标又包括驾驶绩效、生理指标、眼动指标等,融合指标则是融合两项及两项以上的单项指标。就各项研究数据表示,融合指标对实际驾驶分心判别的准确率更高,根据大量学者研究表示未来基于融合指标数据的研究更有效,因此未来更倾向于参考融合指标的数据。
(2)机器学习算法有决策树、向量机模型(svm)、贝叶斯网络、AdaBoost 算法等,当分心特征数量较多时,向量机模型(svm)识别更有优势一些,能较好地融合各类分心指标,保留原模型的图像特征检测能力,如机器学习对驾驶人行为、图像的检测识别,有利于实现分心驾驶行为的识别,但同时存在检测数据量偏小,稳定性较差等问题。具体识别时要根据分心识别的数据类型和特点来选择合适的模型。
(3)深度学习包括各种网络模型,像BP 神经网络、卷积神经网络、记忆神经网络等。深度学习的平均准确率较高,在稳定性和对数据的支撑上也高于传统机器学习。相对机器学习来说较少,但它有着不可忽略的优势:可处理数据量较多的模型、各模型准确率的标准差小、稳定性良好能实现端到端的解决问题。在未来驾驶分心检测模型中需分析大量样本数据,从数据中学习特征,在算法基层网络上进行改进,以及引入注意力机制来加强对目标物体的检测。