李旋 沈鹏举 赵俊玮 刘永涛
(长安大学,西安 710064)
主题词:致伤部件 乘员损伤 严重程度 分析与预测 二元逻辑回归 AdaBoost 支持向量机
事故碰撞过程中乘员损伤主要由乘员与车内或车外的物体发生刚性碰撞引起[1],这与致伤部件的类型密切相关,同时,研究发现,事故中乘员的损伤往往是由多个致伤部件所造成的[2]。因此,研究多个致伤部件对乘员损伤严重程度的影响具有重要意义。
在不同的事故类型中,乘员损伤严重程度的影响因素也不相同。杨娜等人[3]发现当最大制动减速度为0.6g时,自动紧急制动(Automatic Emergency Braking,AEB)系统能够分别降低26.9%和47%的行人最大简明损伤定级(Maximum Abbreviated Injury Scale,MAIS)3+风险和死亡风险;何霞等人[4]建立了汽车前部与摩托车右侧的碰撞模型,发现汽车车速、骑车人坐高、发动机罩前端边缘离地高度等因素对损伤严重程度影响显著;Zhou 等人[5]的分析结果表明,在轻型商用车(Light Truck Vehicle,LTV)对轿车的侧面碰撞交通事故中,造成乘员伤害概率最大的毁坏区间为变形侵入量40~60 cm;Choi[6]等人发现正面碰撞时车辆损伤、乘员损伤部位扩展与车速变化呈线性关系。
针对乘员致伤部位,Abusafia 等人[7]的研究表明,适当控制车速、减小前风窗玻璃安装倾角可有效减少头部碰撞损伤;胡林等人[8]发现,骑车人头部的损伤程度随轿车碰撞速度的提高而增大,但随骑车人背部与垂直方向夹角的增大而减小;Xu等人[9]研究了车辆变形对正面碰撞驾驶员头部损伤风险的影响,发现小范围偏置的车辆变形对驾驶员头部损伤威胁最大;Tan 等人[10]运用逻辑回归确定了车辆仪表板损坏与MAIS 3+胸部损伤之间的关联;Digges[11]等人发现在车辆侧翻事故中,车辆纵向倾角的增加会加剧胸腔的损伤。
本文通过分析乘员损伤的因素,探究各因素与严重程度之间的关系,并对乘员损伤严重程度进行预测。从陕西长安大学机动车物证司法鉴定中心数据库中筛选400 例轿车碰撞事故数据,通过二元逻辑回归分析探究变量与乘员损伤严重程度之间的相关性,利用AdaBoost-SVM 预测模型对乘员损伤严重程度进行预测,以期为轿车碰撞事故中乘员损伤严重程度的降低以及车辆主、被动安全优化设计提供一定的数据分析支撑,从而尽可能降低乘员损伤严重程度。
根据美国机动车医学促进会(Association for Advancement of Automotive Medicine,AAAM)提出的《简化伤害标准》(Abbreviated Injury Scale,AIS)[12],该标准将乘员伤害划分为7 个等级(即AIS 0~6),其中,AIS 0代表无损伤,AIS 6代表死亡,等级越高损伤越严重。对于乘员同一身体区域有多种损伤的情况,本文只统计乘员损伤等级最大值。乘员损伤严重程度等级分为2类:乘员损伤等级达到MAIS 3+,表示非轻度损伤;乘员损伤等级没有达到MAIS 3+,表示轻度损伤。根据部件是否属于车辆,将致伤部件分为车辆部件和非车辆部件。本研究的数据来自数据库中11 707组事故数据,每组数据记录了乘员损伤的相关信息,为了研究多致伤部件对乘员损伤严重程度的影响,保留直接致伤部件与间接致伤部件共同存在的数据项,并组成事故信息处理数据集,同时,对于缺失的乘员损伤信息通过简易诊断书补充,依据上述条件利用Python 筛选出了400 组数据。采集的事故信息如表1所示,包括13个特征。
逻辑回归(Logistic Regression)可将因素之间的非线性关系转换为线性关系,二元逻辑回归模型用于寻找二分类因变量与自变量之间的关系。本研究基于提取的乘员损伤数据,采用二元逻辑回归分析方法将乘员损伤严重程度分为2 类,即非轻度损伤(编码为0,损伤达到MAIS 3+)和轻度损伤(编码为1,损伤未达到MAIS 3+)。
表1 特征因素的分类描述
以支持向量机(Support Vector Machine,SVM)为基分类器,选择相关性强的特征,利用核函数选定不同的非线性映射φ映射到一个高维特征空间Z,以此求得最优分类超平面,对损伤严重程度(0 和1)进行分类。由于径向基核函数(Radial Basis Function,RBF)较其他核函数具有参数少、效果好的特点,因此本文选用RBF,其表达式为:
式中,σ为核函数的宽度;x为样本;y为x的映射。
根据基分类器,采用AdaBoost建立强分类器。设样本训练集数量为N,选择的特征数据为Xi,损伤严重程度标签为Yi(i=1,2,…,N)(0或1),本文通过构建乘员损伤严重程度训练集M={(X1,Y1),(X2,Y2),…,(XN,YN)}、样本训练集权值分布At=(ω1,ω2,ω3,…,ωi),根据每次基分类器的预测结果提高上一轮预测错误样本所占的权重ωi,计算分类器的分类误差εt,加大分类效果好的基分类器的权重Wt,得到最终集成的强分类器:
式中,ωi为每个样本的权重,初始值为1/N;Dt为一个样本的误差;t为迭代次数;ht(i)为基分类器的实际输出结果;y(i)为目标结果。
流程图如图1所示。
图1 AdaBoost-SVM流程
按照车辆水平、垂直方向上的长度将车辆纵向分为A、B、C 3个部分,对应前、中、后,高度方向分为D、E、F 3个部分,对应上、中、下,如图2 所示。由非车辆部件造成的损伤划分为其他区域。图3 所示为不同区域致伤部件的损伤程度:在直接致伤部件中,BD区域乘员损伤达到MAIS 3+的比例最高,为75.00%,从整体来看,高损伤区域主要集中在B、D区域附近;在间接致伤部件中,其他区域乘员损伤达到MAIS 3+的比例最高,为53.20%,乘员损伤严重程度整体低于直接致伤部件。
图2 车辆区域划分
图3 不同区域致伤部件的损伤程度
不同致伤部件损伤统计情况如表2所示,其中环境部件指事故中车辆以外环境中的物体,其他类包括乘员自身携带的物品(眼镜、助听器)、身体运动(颈部无意识的前倾、咬舌)等。一次事故中存在2个致伤部件,致伤部件造成的伤害存在先后顺序,但同时造成了乘员某一部位的损伤。在直接致伤部件中,涉及对方车辆部件事故数量最多,同时,涉及对方车辆部件造成乘员损伤达到MAIS 3+的占比最高。在间接致伤部件中,涉及环境部件的事故数量最多,同时,涉及环境部件造成乘员损伤MAIS 3+的占比最高。从整体来看,首次受伤主要由对方车辆部件造成,后续伤害主要由环境部件造成,对应的乘员损伤达到MAIS 3+占比也更高。
表2 不同类型致伤部件的损伤统计
不同的致伤部件存在质量差异,通过质量的分类对致伤部件进行评估,记录的数据中对致伤部件的评估根据质量差异分为9类,编号为1~9,编号越小表示质量越大,其中编号3~9的质量依次为103~10-3kg量级,编号1表示质量无法估计,如路面、桥墩等,编号2表示致伤部件质量可估计并且其质量大于103kg 量级,如树木、电线杆等。直接与间接致伤部件的质量评估结果如图4所示,每一个编号分别对应直接与间接致伤部件的数量统计。图4中,自身车辆部件主要质量编号为6,环境部件主要质量编号为5,对方车辆部件主要质量编号为5。直接致伤部件质量编号主要分布在3、5、6,其中质量编号2、5、9 的部件造成乘员损伤MAIS 3+的占比较高。间接致伤部件质量编号主要分布在3、5、6、7,其中质量编号5 的部件造成乘员损伤MAIS 3+的占比最高,质量编号>5 的部件造成的损伤波动较小。从整体来看,编号<5,即质量较大的致伤部件对应乘员损伤严重程度普遍较低,编号≥5,即质量较小的致伤部件对应乘员损伤严重程度普遍较高,这是因为在车辆上质量小的部件体积往往较小,高速行驶下更具有侵害性。
图4 直接/间接致伤部件的质量评估
乘员损伤位置信息具体包括前后、左右、近远3 类区域,如图5 所示。根据车内乘员坐姿建立空间坐标系,以脊椎末端为原点,脊椎向上为Z轴正方向,驾驶员右侧平行于胸腔方向为X轴正方向,正交于X、Z轴方向为Y方向。YZ平面将损伤位置划分为左侧和右侧;作平行于X轴的辅助线Ⅲ,Ⅲ经过第一腰椎部分,线Ⅲ与X轴沿Y轴划分前面、侧面和后面;作平行于X轴的辅助线Ⅰ和Ⅱ,其中Ⅰ位于头部与颈部相交处,Ⅱ位于颈部与胸腔相交处,线Ⅰ、Ⅱ和X轴沿Z轴划分近端、中间和远端。
图5 乘员身体区域划分示意
身体区域不同部位的损伤统计如表3所示,头部损伤数量最多,胸腔、盆骨、脊椎部位损伤数量较少,全身体表处的损伤均为轻度损伤。从整体来看,受伤的区域主要集中在身体上部,主要是因为车内乘员坐在座椅上,身体上部暴露在空间中。身体损伤严重程度较高的区域主要是头部、胸腔、脊椎、盆骨,均为易损部位。
结合上述统计结果,通过SPSS 建立二元逻辑回归模型具体分析各因素对乘员损伤严重程度的影响。如表4 所示,其中B为回归系数,E为标准误差、OR表示比值比、CI 为置信区间,事故中乘员损伤身体区域、损伤部位的前后位置、直接致伤部件、直接致伤部件的高度位置和横向位置、间接致伤部件、间接致伤部件的高度位置和横向位置对乘员损伤严重程度有显著影响。
表3 身体区域不同部位的损伤统计
此外,二元逻辑回归分析结果表明,在身体区域中,盆骨和脊椎部位的损伤更严重,属特殊易损部位,故涉及的事故极少。胸腔和头部的损伤较其他部位损伤更严重,OR值分别为面部的2.901倍和2.405倍,这是因为乘员身体上部暴露在空间中,并且头部和胸腔是重要的生命活动部位;损伤部位位置在垂直方向上近端较中间(OR值为0.514)和远端(OR值为0.608)损伤更严重,与上述胸腔和头部的损伤更严重相吻合;损伤部位位置在左右方向上,右侧较左侧损伤更严重,OR 值是左侧的1.106倍,这是因为右侧一般为习惯侧,危险来临时首先受到损伤;损伤部位位置在前后方向上,后面和侧面较前面损伤更严重,OR 值分别为前面的2.793 倍和2.568倍,损伤发生在后面时更严重,这是因为危险来临时乘员下意识地保护前面。
对于直接致伤部件,对方车辆部件造成的损伤更严重,OR 值是自车部件的3.108 倍,当乘员受到来自对方车辆的伤害时,证明事故已经很严重;质量小的部件造成的损伤更严重,OR 值是质量大的部件的1.220 倍,这是因为在车辆上质量小的部件体积往往较小,高速行驶下更具有侵害性;在横向位置和高度位置上,B 区域造成的损伤更严重,OR 值是A 区域的1.549 倍,D 区域造成的损伤较F 区域(OR 值为0.712)更严重,即BD 区域(车顶部)造成的损伤最严重,这是因为事故中车顶部距离头部、胸腔最近,容易造成侵入伤害,与上述分析结果胸腔和头部的损伤更严重相吻合。
对于间接致伤部件,环境部件造成的损伤更严重,OR值是自身车辆部件的1.489倍;质量小的部件造成的损伤更严重,OR 值是质量大的部件的1.222 倍,同样这是因为质量小的部件体积往往较小,更具有侵害性;在横向位置上,其他区域造成的损伤更严重,OR值是A区域的1.556倍;在高度位置上,其他区域造成的损伤更严重,OR 值是D 区域的2.280 倍,与上述环境部件造成的损伤更严重相吻合。当环境部件对乘员造成伤害时,证明事故已经很严重,间接致伤部件造成的损伤可能是在直接致伤部件的基础上累积的。
表4 二元逻辑回归分析
结合上述统计分析和二元逻辑回归分析,通过预测模型进一步验证分析的结果。以身体区域、前后位置、直接/间接致伤部件、直接/间接致伤部件的高度位置、直接/间接致伤部件的横向位置8个特征因素作为输入变量,损伤严重程度作为输出变量,建立基于AdaBoost-SVM的损伤严重程度预测模型。
其中SVM模型的分类效果主要与核函数和内置参数有关,通过多次试验测试,SVM 内的核函数选择RBF。不断调整SVM内的惩罚参数C和核函数内的γ参数,通过接受者操作特性曲线(Receiver Operating Characteristic Curve,ROC)下方面积(Area Under Curve,AUC)判断模型的分类效果,即AUC 越大,分类效果越好,如图6所示。由图6可知,γ值的变化对模型的分类效果影响较大,当γ、C值偏小,即γ=0.23,C=0.77 时,模型的分类正确率达到69.83%。
图6 C与γ分布
为了进一步提高损伤严重程度预测精度,建立多个SVM模型作为弱分类器,如图7所示,当迭代次数t趋近500时,模型预测误差趋近稳定。通过AdaBoost 提升算法构建一个强分类器,并利用测试集数据对强分类器进行校验。采用网格搜索(gridsearchcv)调整迭代次数与步长,步长为0.01时,模型的分类正确率最高达到80.36%。分类效果如图8所示,AdaBoost-SVM模型能较好地按照MAIS 3+划分乘员损伤类型。分类效果不仅与模型中参数的调整有关,还取决于导入模型中的特征与结果的相关程度,模型分类正确率达到80.36%间接证明了上述分析中筛选出的特征对乘员损伤严重程度有显著影响。
图7 误差分析
图8 AdaBoost-SVM模型分类效果
本文通过对致伤事故的数据进行分析,得到以下结论:
a.发生碰撞事故时,乘员的头部与胸腔、垂直方向上位于近端的部位、左右方向上位于右侧的部位、前后方向上位于后面和侧面的部位损伤更严重。车辆设计过程中应加强易损部位的防护。
b.直接致伤部件中对方车辆部件和质量较小的部件造成的乘员损伤更严重,车内BD 区域即车顶部造成的损伤更严重。间接致伤部件中环境部件造成的损伤更严重,当环境部件对乘员造成伤害时,证明事故已经很严重,间接致伤部件造成的损伤可能是在直接致伤部件的基础上累积的。车辆设计时应注意高风险区域的安全措施。
c.事故中乘员损伤身体区域、损伤部位的前后位置等8 个特征因素对乘员损伤严重程度有显著影响。AdaBoost-SVM 模型预测结果的准确率达到80.36%,一定程度上验证了分析的结果。
在本研究考虑的因素外,影响乘员损伤严重程度的因素还有很多,如车速等,同时对于车辆和人体区域的划分需要更精确,在预测模型的选择和优化上可以进一步提升。