贾 辉,张 昆,顾鹏飞
(中国矿业大学 建筑与设计学院,江苏 徐州 221116)
随着汽车智能化的不断发展,特别是在自动化驾驶技术的发展下,使得驾驶人的主要驾驶任务从手动控制汽车转向自动化监督控制[1],在此过程中如果驾驶人不能及时感知、分析判断危险并做出相应避险动作,则极有可能导致交通事故的发生[2],这就强调了让驾驶人保持警觉、专心和专注的重要性[3]。在汽车驾驶安全领域,对驾驶人风险驾驶行为常见的预警干预方式以听觉预警为主[4],研究听觉预警对于驾驶人及时感知危险、减少事故概率和保障驾驶人安全驾驶具有重大意义。本文对听觉预警中的语音预警语速和音量开展研究,通过模拟实验和主观测评的方式分析风险驾驶行为下驾驶人对不同语速和音量取值的语音预警的感知效果,为语音预警的设计和优化提供一定参考。
提高驾驶员安全性和注意力的一种方法是使用听觉预警来保持驾驶员的专注。在过去,汽车上的警报器多使用听标和耳标等非语音化声音来向司机传递当前车辆的状态,现如今汽车也开始使用语音警报向司机传递信息[5]。针对风险驾驶行为下的语音预警,Moskovitch等人使用主观测量的方法来研究双重任务下传统文本转语音(TTS)和压缩语音(Spearcons)对驾驶员分心及任务处理的影响,研究发现压缩语音(Spearcons)是不会分散注意力的且可以提高多任务处理的效率[6]。Hester等通过模拟自动驾驶场景比较了声音警报、与任务无关的语音警报和与任务有关的语音警报对驾驶员的信任以及车辆自动化失败时的反应,结果表明三种警报在信任度上无明显差异,但实验参与者皆更有能力从自动化的监控角色切换到手动控制[5]。Rukonic和Nees等使用语音警报、听觉图标和视觉提醒的警报方式来研究视频模拟汽车驾驶过程中驾驶人对警报的认知负荷、信任度、有用性和烦恼度等方面的主观感知。结果发现语音提醒导致了对提醒事件更好的记忆且具有最高的信任度和态势感知,研究还表明两种听觉类型在学习任务上需要投入的精力更少,但是对警报的反感程度却有所增加[7-8]。Richie等研究了语音、耳标和经过压缩语音(Spearcons)三种听觉警告对驾驶人的影响,结果发现驾驶人对语音有最快的反应,如果使用压缩语音则要考虑单词的选择[9]。
从上述可以看出,在语音预警的研究中,多数学者采用主观测量的方法来开展研究,在研究对象上主要以语音预警类型以及语音预警同其他预警方式的比较为主,目前较少有单独考虑语音预警语速和音量对驾驶人的影响。因此本研究以风险驾驶行为下的语音预警为研究对象,探究语音预警以何种语速和音量提醒驾驶人效果最佳。
研究以风险驾驶行为发生时的语音预警为研究对象,以该行为下语音预警的语速和音量下为变量,开展对比性研究探讨当风险驾驶行为发生时语音预警以何种语速和音量提醒驾驶人效果最佳。引起事故发生的风险驾驶行为包括超速行驶、分心驾驶、疲劳驾驶等[10],而超速行驶是引发交通事故的主要风险驾驶行为之一[11]。尤其在高速公路行驶时,由于高速公路具有全封闭,单向通行和车速快的特点[12],超速行驶的风险驾驶行为时有发生。研究高速公路超速情境下的语音预警具有代表性。因此,该研究选取典型风险驾驶行为即高速公路超速驾驶行为作为研究载体,探究该情境下驾驶人对不同语音和音量取值的语音预警的感知效果进而得出风险驾驶行为下语音预警语速和音量的最佳参考值。
在感知效果评价方面,通过对38位具有三年及以上驾驶经验的驾驶人进行问卷及用户访谈,主要内容包括个人基本信息、语音预警的场景以及驾驶人对语音预警的感性描述。问卷及访谈结束后以专家小组的方式对感性描述进行总结和评估,并以此为主要依据,考虑已有研究的评价指标[13-15]、语音预警与驾驶人交互的具体情景和用户特点等因素,结合语义分析法构建出本研究中语音预警语速和音量感知效果的评价指标。感知效果评价指标共分为两个维度,其中第一个维度描述的是语音预警语速和音量对驾驶人的警示效果;第二个维度描述的是语音预警语速和音量对驾驶人的干扰效果。警示效果越优,干扰效果越弱且警示效果占干扰效果的比例越低则表明感知效果越佳。语音预警语速和音量评价指标及其阐述见表1。
表1 语速和音量评价指标及其阐述Tab.1 Speed and volume evaluation indicators and elaboration
在感知效果主观评价数据的收集方面采用李克特量表进行,该量表是社会调查和心理测试领域最常使用的一种量表形式,较为容易设计和处理。通过李克特量表能够通过快速直观地获取受测者对某事物或主题的认同程度并对其进行量化分析[16]。
实验分为语速组和音量组,两个组内各有五段超速驾驶行为下的驾驶视频,每段视频中均含有超速驾驶行为下的语音预警语料,视频噪声均维持在66~68dB以此来模拟时速110~120km时车内的噪音[17]。实验中使用的语音预警的语料是基于百度AI开发平台的语音合成技术实现的,采用女性形象来进行语音合成[18]。通过Adobe Audition将语料设计出不同的语速和音量。在语速设计方面,分别设计了240~432wpm(wpm:字/分钟,下同)五种语速下的语音预警语料,考虑到听觉预警要高出背景噪音8~15dB[14],因此音量控制在78dB;在音量方面分别设计了78~98dB五种音量的语音预警语料,语速控制在240wpm。为避免学习效应的影响,每段视频随机播放。具体语料设计和相关语速及音量的数值设计见表2。
表2 语料及语速和音量数值设计Tab.2 Corpus and speed and volume numerical design
本实验平台所用设备为模拟驾驶器,其中包括踏板和换挡单元和一台分辨率为1920×1080像素惠普显示器,实验过程中所用超速驾驶视频和语音预警采用电脑播放实现。实验一共招募24位具有三年及以上驾驶经验的驾驶员作为实验被试,男女比例为2∶1,左右耳听力正常。实验开始前对每位被试的姓名、性别、年龄和驾龄等基本信息进行统计,之后由实验员告知被试实验目的并对实验流程做简单介绍,待被试了解试验后开始实验。实验开始时,被试坐在模拟驾驶器前观看含有超速驾驶行为的驾驶视频并模仿视频中驾驶人的行为;待实验内含语音预警语料的一段超速驾驶视频播放结束后,被试填写语音预警语速和音量评分量表,待被试休息1~2min之后进行下一段视频的观看和模仿,直到该组实验全部完成。该组实验完成后被试休息5min之后进入另一组实验,步骤同上。
本次实验所得数据均通过统计学分析软件IBM SPSS 25.0完成。
该实验所用语速和音量感知效果评分量表,由表1各项评价指标依据7分李克特量表进行编写,1代表完全不,7代表完全。评分量表分为警示效果和干扰效果2个维度,每个维度3项问题共6项问题。该量表信度状况良好,各维度的信度均大于0.7,表明该评分量表具有很高的可靠性,可以进一步的探究与分析。
24位被试在两个维度上的李克特量表评分的均值数据见图1、图2,对数据进行分析得知,语音预警在五种语速取值下对驾驶人的警示效果方面都超过中性水平(4分),且均处在轻微水平(5分)之下;在对驾驶人的干扰效果方面都在中性水平(4分)之下。由此可知语音预警在五种语速取值下对驾驶人皆具有警示效果且干扰效果相对较弱;语音预警在78dB、88dB、93dB和98dB四种音量取值下对驾驶人的警示效果方面均超过中性水平(4分),且干扰效果均在中性水平(4分)之下;语音预警在83dB取值时,对驾驶人的警示效果处在轻微不(3分)到中性水平(4分)之间且接近中性水平(4分),干扰效果为五种音量中最弱。
图1 两维度下语速的李克特量表评分均值数据Fig.1 Mean likert scale score data of speed in two dimensions
图2 两维度下音量的李克特量表评分均值数据Fig.2 Mean likert scale score data of volume in two dimensions
五种语速和五种音量取值下语音预警的警示效果和干扰效果相关程度分析数据见表3。通过分析发现,当语音预警语速为309wpm时,警示效果与干扰效果呈显著正相关(P=0.038<0.05);当语音预警语速为360wpm时,警示效果与干扰效果呈显著正相关(P=0.005<0.01);当语音预警语速为432wpm时,警示效果与干扰效果呈显著正相关(P=0.024<0.05);当语音预警音量为83dB时,警示效果与干扰效果呈显著正相关(P=0.037<0.05)。
表3 语速音量警示效果和干扰效果相关程度分析数据Tab.3 Correlation analysis of speed volume warning effect and interference effect
分析309wpm、360wpm和432wpm三种语速和83dB一种音量的语音预警的警示效果对干扰效果的影响。将警示效果作为预测变量、干扰效果作为因变量,采用最小二乘回归分析对数据进行处理。线性回归分析所得数据见表4~7所示。分析结果表明随着警示效果的提高,干扰效果也会随之提高,两者呈正相关。在语速为309wpm时,影响干扰效果的因素有约为18.1%是由警示效果构成的;在语速为360wpm时,影响干扰效果的因素有约为31.2%是由警示效果构成的;在语速为432wpm时,影响干扰效果的因素有约为21.2%是由警示效果构成的;在音量为83dB时影响干扰效果的因素有约为18.2%是由警示效果构成的。
表4 S3:309wpm回归分析数据结果Tab.4 S3:309wpm regression analysis data results
表5 S4:360wpm回归分析数据结果Tab.5 S4:360wpm regression analysis data results
表6 S5:432wpm回归分析数据结果Tab.6 S5:432wpm regression analysis data results
表7 V2:83dB回归分析数据结果Tab.7 V2:83dB regression analysis data results
本研究通过语音预警模拟干预实验和主观测评的方式发现在噪音为66~68dB的模拟驾驶条件下,语音预警的语速在309wpm、360wpm和432wpm三种取值下对驾驶人的警示效果和干扰效果均呈显著正相关;当语音预警的音量在83dB取值时,警示效果和干扰效果呈显著正相关。进一步分析警示效果与干扰效果的影响关系发现,在语速为309wpm时,影响干扰效果的因素分别约有18.1%是由警示效果构成的;在音量为83dB时影响干扰效果的因素有约为18.2%是由警示效果构成的。综合现实驾驶场景中风险驾驶行为发生时预警提示信息的提醒效果及实验数据可以得出,在模拟车内噪音为66~68dB的状态下,语音预警的语速为309wpm、音量为83dB时,可以对驾驶人起到警示效果的同时使干扰效果处在较低水平,同时表明驾驶人对语速和音量取值分别为309wpm和83dB的语音预警感知效果最佳。
语音预警对驾驶人在驾驶过程中感知和规避风险起到至关重要的作用。本研究从语音预警的语速和音量的角度去探讨驾驶人对两者在不同取值下的感知效果,得出在驾驶人感知效果最佳时的语速和音量的参考数值。在风险驾驶行为发生时,传统的语音预警在语速和音量上没有明显变化。通过该实验研究发现,适当的改变语音预警的语速和音量可以使驾驶人对风险驾驶行为下的语音预警有更好的感知效果。由于在语音预警模拟干预实验中驾驶人的主观感知能力不同,导致评价结果存在差异性,未来的研究中会采用更加客观的生理衡量指标和扩大样本量以及采用实车实验的方式来保证实验结果的普适性。