基于二维保修数据的汽车索赔及保修费用预测方法

2023-04-29 00:44庞欢石东阳宫政刘敬一

汽车安全与节能学报 2023年3期

庞欢石东阳宫政刘敬一

关键词：汽车保修；二维保修数据；索赔率；保修费用

汽车普遍采用二维保修策略，当其使用时间或行驶里程中任何一个超过限制时就会过保，保修期内由非人为故障产生的维修费用需由车企全部承担。根据WarrantyWeek公布的最新数据，2021年度全球汽车平均索赔率为2.4%，索赔总金额达1284亿美元，占到企业总收入的5%～10%，在高额的索赔费用下，汽车企业不得不预留充足的保修准备金。为此，索赔及其引起的保修费用预测成为车企关注的重点之一。

汽车经销商管理系统（dealermanagementsystem，DMS）中记录了大量保修数据，其中蕴含着丰富的可靠性信息[1-2]，对其深入挖掘，可以实现保修费用的分析和预测，从而为车企保修策略制定、产品定价及保修准备金规划等提供支撑[3-5]。区别于保修间隔只受单变量定义的一维保修，二维保修产品的失效被认为是使用时间和累计使用度共同作用的结果[6-7]，与之相关的研究也更加复杂。由于维修或更换汽车故障零部件的费用基本固定，汽车保修费用主要取决于保修期内的索赔次数以及制造商采取的保修策略。在关于保修索赔预测的研究中，一些学者假设索赔率服从某一特定分布，在此基础上利用非齐次Poisson过程（non-homogeneousPoissonprocess，NHPP）来预测保修期内的索赔次数[8-9]。其中，D.K.Majeske提出汽车保修索赔的NHPP预测模型，该模型采用NHPP的强度函数——瞬时故障率来模拟保修索赔的发生[10]。DAIAnshu基于NHPP过程对汽车的索赔次数进行建模，提出了考虑新产品使用率的保修索赔预测模型[11]。还有一些学者基于实际保修数据对索赔率分布进行拟合、检验，并进行保修索赔预测。WUShaomin利用保修数据建立了上市较长时间产品的索赔率函数，并假设新产品在未来的索赔率受该函数的影响，基于该算法建立了保修索赔预测模型[12]。但由于二维保修策略的存在，汽车保修数据存在严重删失，完全基于保修数据无法计算出准确的索赔率和保修费用，需要通过数据补充和修正的方法来实现高精度的分析和预测。WUShaomin提出汽车保修数据通常是粗糙的，它们可能被聚合、延迟、缺失和模糊，需要对索赔数据进行分类，并根据数据特点运用对应的修正方法[13]。杜文超等提出了基于使用率分布的在保产品数计算方法，并针对可维修部件建立了服务备件需求预测模型[14]。在保修费用预测方面，研究工作主要是在失效率函数基础上，研究汽车销量波动、质量波动和预防性维修等对保修费用预测的影响。T.Hrycej在考虑车辆整体制造质量波动风险的影响下，基于汽车故障数据搭建了保修费用预测模型[15]。B.Rai从零部件角度出发，考虑季节和销售情形等因素构建了保修成本预测模型[16]。WANGXin和马小敏等通过分析产品故障过程、保修期限和客户行为对保修成本预测的影响，提出了一种考虑保修期内失效但未报告事件的保修成本预测模型[17-18]。除此之外，一些学者还在保修策略和维修策略制定方面开展了相关研究工作[19-20]。可以看出，在利用实际保修数据进行汽车索赔率计算和保修费用预测时，现有的保修索赔预测模型没有明确考虑二维保修策略对在保车辆数的影响，索赔车辆不同维修方式占比以及相应维修费用的不同也未得到充分关注，直接影响索赔率计算及保修费用预测的精度。

针对上述问题，本文首先从二维保修数据特点出发，研究二维保修期对汽车在保率和索赔率计算的影响，提出了改进的索赔率计算方法。在此基础上，考虑索赔车辆在零件维修和更换两种处理模式上保修费用的差异，提出了考虑维修更换率的保修费用分析和预测方法。最后，结合某车企的实际保修数据，验证了保修费用预测方法的合理性和有效性。

1保修数据驱动的索赔率分析方法

基于保修数据的索赔率计算方法主要利用n-MIS算法展开[21]。n-MIS是指对象车辆在销售后第n个月内发生的维修案件数与行驶时间超过n个月总车辆数的比率，可以计算汽车销售后第n个月的索赔率，计算式为

其中：Xn为该批汽车在售后n-1～n月内产生的总维修件数；Nn为该批汽车行驶时间超过n个月的总车辆数。

索赔率计算方法中的维修件数Xn和总车辆数Nn可以分别从保修数据和销售数据中统计得出。但在实际情况中，由于一些用户使用强度较高，部分尚未超出使用时间限制的车辆会因超出行驶里程限制而过保，这些过保车辆的维修情况不会在保修数据中体现。因此，直接从销售数据中获取的Nn并不是保修数据中维修件数Xn所对应的总车辆数，上述索赔率计算方法未考虑该因素的影响，导致式（1）中Nn偏大，索赔率计算结果偏低。为此，需要考虑二维保修期内汽车的过保情形，对式（1）中的总车辆数Nn进行修正。

2考虑二维保修期影响的索赔率修正算法

2.1二维保修期内汽车过保情形分析

为了分析二维保修期对索赔率计算的影响，需要从二维保修期特点出发，分析汽车过保情形。汽车二维保修期是一个二维平面，通常用一个坐标轴表示使用时间，另一个坐标轴表示行驶里程[22-23]。如图1所示，tlim和Dlim分别代表保修时间限制和保修里程限制，矩形代表二维保修区域，当汽车使用时间或行驶里程中任何一个超出限制，保修到期。

定义汽车行驶里程与使用时间的比值为使用強度，则r0=Dlim/tlim为额定使用强度。当实际使用强度r大于额定使用强度r0时，汽车就会因超出行驶里程限制过保，否则因超出使用时间限制过保[24]。保修期内汽车产品的过保情形如图2所示，①代表发生过故障且超出使用时间限制的车辆；②代表未发生过故障且超出使用时间限制的车辆；③代表发生过故障且超出行驶里程限制的车辆；④代表未发生过故障且超出行驶里程限制的车辆。

在基于保修数据进行索赔率计算时，需要从总车辆数Nn中剔除上述4种类型的过保车辆。对于车辆是否超出使用时间限制，可以通过汽车销售时间和选定的索赔率分析时间直接判断。由于部分用户的使用强度r高于额定使用强度r0，未超出使用时间限制的汽车也可能因超出行驶里程限制而过保。因此在判断车辆是否超出行驶里程限制时，可以通过车辆实际使用强度计算车辆在对应使用时间内的行驶里程，判断其是否超出行驶里程限制，从而得出过保车辆数。

2.2二维保修期对汽车产品在保率的影响机理

汽车使用时间维度过保容易判断，而行驶里程维度过保则无法通过产销数据和保修数据直接判断。考虑到汽车使用强度存在较大分散性，因此，结合汽车的使用强度分布研究其在保率。记不同行驶月数下汽车达到行驶里程限制时的月平均行驶里程为Yn，计算式为

当行驶n月汽车的实际月平均行驶里程Y′n>Yn时，汽车就会因超出行驶里程限制而过保，即对于实际行驶n月的汽车而言，只要求得其月平均行驶里程小于Yn的概率，就可以得到实际行驶n月汽车的在保率。

汽车的月平均行驶里程Y被广泛认为服从对数正态分布[25-26]，记为lnY～N（μ，σ2），μ、σ为分布参数，其概率密度函数为

2.3考虑二维保修期影响的索赔率修正算法

在利用n-MIS算法计算汽车索赔率时，为提高索赔率计算精度，需对维修件数Xn所对应的总车辆数Nn乘以在保率进行修正，修正方法如表1所示。

3基于索赔率的保修费用分析及预测方法

3.1保修费用分析及预测原理

汽车保修时存在零件维修和更换两种模式，保修费用也由维修费用和更换费用两部分组成，据此利用截止预测月统计得到的总车辆数×索赔率×维修更换率×相对应维修/更换费用的方法进行保修费用的分析和预测，具体分析、预测原理如图3所示。

3.2汽车单位维修/更换费用计算方法

各行驶月份区间下的维修/更换费用和相对应的车辆数是计算汽车单位维修/更换费用的关键。在计算单位维修/更换费用之前，应先确定观测截止日期（该日期通常为获取二维保修数据的日期，也可用最后一条故障日期代替），再统计各行驶月份区间下的维修/更换费用和相对应的索赔维修/更换车辆数。利用统计数据可得出保修期内汽车在第i个行驶月份区间的单位维修费用Ai和单位更换费用Bi，计算式为

其中：Ei为汽车产品在第i个行驶月份区间的维修费用；Hi为在第i个行驶月份区间的更换费用；Fi为销售后第i个行驶月份区间的索赔维修车辆数；Gi为销售后第i个行驶月份区间的索赔更换车辆数；Qi为在第i个行驶月份区间的索赔车辆数；Zi为在第i个行驶月份区间的维修更换率。

3.3汽车保修费用预测方法

以预测车企未来一个季度的保修费用为例来说明保修费用预测方法。预测月总保修费用等于预测月各行驶月份区间索赔车辆在维修或更换零部件时所产生的费用之和，即：

由预测原理知，预测月份区间的单位维修/更换费用和相对应的维修/更换车辆数是保修费用预测方法中的2个关键参量。

3.3.1预测月区间的单位维修/更换费用计算

利用保修数据根据式（8）和（9）可求得第1～m（m为观测期总月数）个月区间的单位维修/更换费用，第m+j个月区间的单位维修/更换费用为待预测量。汽车的损伤程度可能随使用时间的增大而增大，与之对应的零件维修费用也可能受使用时间的影响。本文采用函数拟合的方法对预测月的单位维修费用进行估算，利用前m个月份区间的保修数据拟合单位维修费用函数[27]，然后将自变量设为m+j，即可求出第m+j个月区间的单位维修费用。零件更换费用等于零件费用和人工费用之和，一般不受使用时间的影响，因此可利用统计期零件单位更换费用的平均值估算预测期零件的单位更换费用。

3.3.2预测月区间的维修/更换车辆数计算

预测月的总车辆数由现有车辆数和预测区间内新销售的车辆数决定。上个月行驶够1个月的车辆在本月将行驶够2个月，由截止第m个月行驶够1～m–1个月的车辆数可得出截止第m+1个月行驶够2～m个月的车辆数。上个月售出的汽车在本月将刚好行驶够1个月，即m月售出的车辆在第m+1月将行驶够1个月。S.Fleurke评估了指数平滑模型、自回归综合移动平均模型、人工神经网络模型和向量自动回归模型等7种流行的汽车销量预测模型的效果，发现基于对几种预测方法的结果求平均值的混合预测在很大程度上比单一预测提供更好的预测结果[28]。因此，采用汽车销量混合预测法预测第m+j–1月的销售车辆数，可得到截止第m+j月行驶够1个月的车辆数。

利用保修数据根据式（7）可求得第1～m个月区间汽车的索赔率，利用函数拟合外推的方法可求得第m+j个月区间的索赔率。同理可根据统计数据求得第m+j个月区间的维修更换率。各参量的预测原理如图4所示。

3.3.3预测月保修费用计算

在得到预测月区间的单位维修/更换费用和相对应的索赔维修/更换车辆数后，进行从观测起始日期到预测月总保修费用的计算，记总保修费用为Tm+j，第m+j个预测月的当月新增保修费用为Tm+j-Tm+j-1，计算式为其中，j可取1、2、3。

4案例分析

基于国内某知名品牌汽车制动盘和悬架后上横臂的保修数据以及产销数据对所提出的汽车保修费用预测方法进行验证。所选研究对象的保修期为3年或10万千米，筛选保修数据中与所提預测方法有关的字段，主要包括：汽车VIN码、销售日期、故障日期、行驶里程、人工费用、零部件费用等。依据相似数据补充原则和3σ准则分别对保修数据中的缺失值和费用信息中的异常值进行处理，基于Python中的Pandas模块根据所提保修费用预测方法对所选保修数据进行编程处理。以2020/06—2021/02生产的制动盘为例，获取其在2022/09之前的保修数据，采用2022/06之前的数据进行保修费用分析预测，将2022/07—2022/09的数据留作对比验证。

统计3万辆汽车的年行驶里程数据，将其折算为月平均行驶里程，推导出汽车月平均行驶里程服从对数正态分布，即lny～N（μ，σ2），μ=6.9471，σ=0.60319，其概率密度函数如图5所示，基于该分布根据式（6）计算不同保修期下汽车在保率随行驶时间的变化规律如图6所示。

由图6可知：在同一保修里程限制下，汽车在保率随行驶时间增大不断减小，且保修里程限制Dlim越短，在保率下降速率越快；在相同行驶时间下，保修里程限制Dlim越短，汽车在保率越低；当保修期为3年10万千米时，行驶36月汽车的在保率为95%，与不考虑保修期相比，总车辆数的误差达到5%；当保修期为3年6万千米时，误差更是达到了显著的22%。可见，在利用保修数据计算汽车索赔率时考虑二维保修期内产品在保率的影响是必要的。

利用车企提供的产销数据容易得出截至2022/06行驶够不同月数的车辆数。由截至2022/06行驶够1～25个月的车辆数可得出截至2022/07行驶够2～26个月的车辆数。对2022/06销售的车辆数进行预测，可得出截止2022/07行驶够1个月的车辆数。考虑保修期内汽车在保率，对截至2022/07行驶够1～26个月的车辆数进行修正，修正前后车辆数的对比结果如图7所示。根据修正前后车辆数差额曲线可以看出，不考虑在保率会导致车辆基数显著增加，因此，基于在保率对车辆基数进行修正是十分必要的。

利用销售数据和故障数据可得出故障索赔发生时的行驶月区间，将相同行驶月区间内的索赔数求和，可得出截至2022/06各行驶月区间内的总索赔数，见表2。

通过上述数据，由式（7）可求得保修期内第1～25个月区间制动盘的索赔率，基于3次多项式对索赔率计算值进行函数拟合，拟合后的曲线如图8所示，从总体上看，随着行驶时间的增加，产品索赔率呈现先增后减的趋势，符合保修期内汽车产品的索赔变化趋势[29]。

利用第1～25个月份区间的产品索赔率，通过函数拟合外推得出第26～28个月份区间的索赔率。结果如下：Q26=2.137×10-3、Q27=2.036×10-3、Q28=1.957×10-3。制动盘在各行驶月份区间的维修更换率为1.589%，利用预测月修正车辆数×索赔率×维修更换率得出预测月的索赔维修车辆数和索赔更换车辆数。分析实际保修数据发现制动盘的索赔维修数目较少，单位维修费用与使用时间不存在明显的函数关系，因此利用统计期的平均维修/更换费用估算预测期的平均维修/更换费用。由保修数据统计得出，制动盘的平均维修费用为42.25元，平均更换费用为469.28元。

根据式（13）对截至于2022/07制动盘的总保修费用进行预测，预测结果为496693.67元，2022/07新增保修费用预测值为17957.81元。同理，可得到2022/08和2022/09当月新增保修费用的预测值。根据预留的保修数据，2022/07、2022/08和2022/09当月新增保修费用分别为17457.26元、18101.65元和22459.45元。依据上述方法可计算出制动盘和悬架后上横臂在未来一个季度中各月新增的保修费用，计算结果见表3。

将制动盘和悬架后上横臂不考虑产品在保率时各月新增保修费用的预测值、考虑产品在保率时各月新增保修费用的预测值和实际值进行对比，分别计算不考虑在保率时和考虑在保率时当月新增保修费用相较于实际值的误差，结果如图9所示。

可见，在保修费用预测方法中考虑产品在保率后，不论是预测未来一个月还是未来一个季度的新增保修费用时，预测误差都明显减小。受索赔率变化趋势波动的影响，在预测未来一个季度不同月份的新增保修费用时，预测误差存在波动，但从总体上看，本文提的预测方法在预测未来一个季度新增保修费用时预测精度较高，总体误差较小，能合理预测车企未来一个季度的新增保修费用。

算例中只选用了2个零部件的二維保修数据进行验证，单一零部件的保修数据量远少于整车数据量，会对预测方法中相关函数的拟合精度产生一定影响。在整车层面而言，预测方法的精度将会进一步提高。

5结论

针对汽车的二维保修特点，提出了基于在保率修正的汽车索赔率计算方法;考虑故障件的维修和更换费用差异，提出了基于索赔率和维修更换率的保修费用评估和预测方法;最后，进行了案例分析，得到结论如下：

1）在保修费用预测时考虑汽车在保率是十分必要的，汽车在保率随着行驶时间的增加而迅速下降。在具有代表性的保修期为3年6万千米且汽车月平均行驶里程服从参数μ=6.9471，σ=0.60319的对数正态分布时，行驶36个月车辆的在保率低于80%。在保修费用预测方法中考虑产品在保率对不同行驶月数下的车辆数进行修正后预测误差明显减小。

2）保修费用预测与保修期内产品的修复模式有关。汽车产品在保修时有零部件维修和更换两种修复模式。受故障率变化趋势的影响，在不同的行驶月份下产品维修和更换的比例是不同的，相应的维修成本也是不同的。在建立保修费用预测方法时，可以通过拟合产品维修更换率曲线来消除上述影响。

3）案例预测了汽车制动盘和悬架后上横臂在未来中短期的保修成本，在预测下一季度总保修成本时预测误差小于6.5%，验证了保修成本预测方法的合理性和有效性，可为汽车企业保修策略制定、产品定价和资金规划等决策提供支撑。

如何减弱索赔率变化趋势波动的影响，进一步提高索赔率的预测精度，并考虑季节等周期性因素对销量预测的影响都是本文未来的研究方向。

汽车安全与节能学报2023年3期

汽车安全与节能学报的其它文章: 考虑动能回收的电动客车长下坡制动盘温升状态; 头部旋转姿势下的颈部低速后碰响应; C1电动教练车动力系统设计与控制策略; 重型载货汽车长下坡制动工况辨识; 面向非结构化道路场景的车辆全局速度规划; 面向自动驾驶的车路云一体化框架