赵旭阳
吉林大学汽车工程学院 吉林省长春市 130022
随着社会和经济的迅猛发展,全球的汽车保有量也随之急剧增长。但交通事故的数量也随之增长。因此,交通安全问题成为了当今全世界都必须要面对的问题。根据大量统计数据显示,由疲劳驾驶引起的交通事故数量占总数量的49%,是引发交通事故所有原因的首位。因此,研究疲劳驾驶预警系统对于驾驶安全问题的改善有重大意义。
人们研究疲劳驾驶监测的历史很长,但如何定义疲劳依旧是较困难的问题。原因就是疲劳的定义不能被实验数据精确地量化。在本文中,模糊C-均值聚类被用来分析不可精确测量的特征量,KNN分类器被用来建立特征参数值与疲劳程度间的关系。
在本文中,E6B2-CWZ3E光电编码器被选用来收集方向盘角度的数据;而光脉搏传感器被用来收集脉搏幅度的数据,进而可得到便于随后数据分析过程中处理与分析的数据;在收集方向盘握力的数据时,我们运用RFP02型压力传感器收集,传感器可以测量方向盘上各个部分的压力值,系统则可经计算得出各个非零值的平均值。
为简化实验程序和减少数据处理的难度,实验道路的路况被限定为平直路面。实验数据被分为65组。其中,第1-40组是在驾驶员清醒状况下测得的,第41-65组是在驾驶员疲劳状况下测得的。
驾驶员需不断地调整方向盘的角度以保证车辆以正常路径行驶。因此,方向盘的转动角度是驾驶员操纵车辆的重要特征指标。不像在驾驶员清醒状况下所表现的那样,在驾驶员疲劳状况下,方向盘转角信号会表现出两项特征:其一是方向盘调整频率明显下降,其二则是方向盘的调整幅度变大在方向盘转角的特征参数中,以下六个参数[1]被证明在辨别驾驶员疲劳状况方面有更好的辨别力:
方向盘转角绝对平均值(SAMEAN)是方向盘转角数据绝对值化后取平均得到(公式略)。
方向盘转角标准差(SASTD)是方向盘转角数据取标准差计算得到的(公式略)。
在数据的处理中,方向盘的转角的绝对数值如果超过绝对值的最大值的3/4被认为是角度过大,若小于绝对值的最大值的1/4被认为是角度过小。Q1MEAN代表了一定时间内方向盘转角绝对值小于绝对值的最大值的1/4的样本数量所占总样本数的比例,Q3MEAN代表了一定时间内方向盘转角绝对值大于绝对值的最大值的3/4的样本数量所占总样本数的比例,Q1MEAN和Q3MEAN统称为方向盘角度的四分位值。
方向盘角速度的绝对值平均值(SAVMEAN)是代表了方向盘转动速度的衡量指标,是由方向盘转角速度数据绝对值化后取平均得到(公式略)。
方向盘角速度的标准差(SAVSTD)由方向盘转角角速度的标准差计算得到,其值越大,方向盘的转动频率越高(公式略)。
在处理脉搏数据时,我们预先对其信号进行了降噪处理[2],降噪结果如下图所示:
在生理科学领域,脉搏信号被广泛地用来评价测试对象的生理状况[3],除了脉搏频率以外,在其余特征参数中,以下指标被验证在判断驾驶员疲劳程度时具有良好地评价能力[4]:
脉搏信号的均方根(由数据值平方加和取平均得到)
为了分析离散的数据以及为后续的KNN分类器建立做准备,我们引入欧式距离和模糊理论。为了消除各个特征参数量纲的影响,我们先对数据进行标准化处理,标准化公式
KNN分类器是一种通用的数据分类算法,由数学家Cover和Hart于1968年提出。首先,应算出样本x与每个已知的预测聚类中心的距离。而后我们将得到的距离进行分类。最后,K预测样本可从距离最近的已知样本中得到。KNN算法的原则是:在K预测样本中,若某类数据占最大比例,那么x则可被分为此类。KNN算法的具体步骤如下:
(1)利用已有的数据构建训练集并得到供预测的集合。训练集为P集合,而预测集为Q集合,P集合可由以下公式得到:i个维度的矢量矩阵,ci代表了第i个预测集合的类。
图1
(2)根据K的初始值,K被预先分为10类,K的具体数值会随着实验结果调整。
(3)本文中运用欧氏距离计算样本与训练集的距离,其计算公式为:
(4)找出与K与所有数据库样本中聚类中心的距离值,并排序。
(5)找出样本x的主的主类,计算距离K最近的几个聚类中心,列为:他们对应的类为,则其最多的标记类即为最终的预测结果(疲劳与否)。
因为系统在KNN分类器建立时可将正确的测试结果作为数据库的样本,这样便可增加数据库的样本量,提高整个系统的预测准确率。本文中,疲劳驾驶预警系统用65组数据进行验证准确性的实验,可发现,随着样本数从15变为65,预测的准确率也相应提升。
在本文中,通过对由方向盘转角数据,脉搏数据以及握力的处理,可得到10项特征参数值。在利用C均值聚类分析实验数据之后,KNN分类器被用来建立特征参数与疲劳程度的关系。通过比较验证实验的结果,本系统被证明拥有良好的准确性和鲁棒性,并且随着样本数的增加与分析的迭代,系统的预测准确性也明显提高。