基于聚类分析的新能源二手车保值率评估研究

2021-09-14 18:01金加龙
内燃机与配件 2021年17期
关键词:多元回归聚类分析

金加龙

摘要:汽车保值率是衡量车辆价值衰减快慢的重要指标,针对具有自身特点的新能源二手车,进行二手车保值率预测。应用分层聚类的方法将目前市场占有率较高的15种新能源车型的保值率进行分类,聚类筛选出保值率相接近的车型,并建立其保值率回归曲线方程,经计算具体预测数值与实际市场值一致。

Abstract: The automobile hedging rate is an important index to measure the fast decline of vehicle value. For the new energy used vehicles with their own characteristics, the paper forecasts the maintenance rate of used vehicles. The paper classifies the hedging rate of 15 new energy models with high market share by hierarchical clustering, selects the models with similar hedging rate and establishes the regression curve equation of the hedging rate. The calculated results are consistent with the actual market value.

關键词:新能源二手车;保值率;聚类分析;多元回归

Key words: new energy used car;preservation rate;cluster analysis;multiple regression

中图分类号:U472.9                    文献标识码:A                  文章编号:1674-957X(2021)17-0160-03

0  引言

二手车保值率是衡量车辆价值衰减快慢的重要指标,是指车辆在使用一段时间后二手车销售价格与新车销售价格之比。作为近年来发展迅猛的新能源汽车而言,其二手车的价值评估和买卖问题也是逐渐凸显,合理确定新能源二手车的评估价格对控制二手车业务经营风险具有重要意义。

动态聚类分析方法具有预测精度高、可转化为易于理解的规则的特点[1][2],将其用于上市时间相对不长或成交数据不多的新能源二手车上,结合多元回归预测分析,可综合考虑到新能源汽车电池的能量密度、电池的容量和电池续航里程等因素对其保值率影响,预测结果可靠。

1  聚类分析基本原理

1.1 多元测度标准下多元变量的相似性计算

在多元测度标准下,多元变量结构样品集的相似性度量,通过描述样品对象之间的相似性和非相似性的特征,实际应用中广泛传播距离测度采用Minkowski测度,Minkowski测度公式如下:

r表示的是一个正的常数,如果r=1,可以得到城区距离测度(L1标准);如果r=2,则为欧几里德距离测度(L2标准)。如果两个对象之间的距离非常小,那么就称这两个对象相似;相反,两个对象之间的距离非常大,表明了这两个对象为很小的相似性;如果两个对象看起来完全相同,那么它们之间的距离为零[3][4]。

1.2 多元回归预测模型的建立

新能源二手车保值率,既受到二手车的使用寿命、报废条件等因素的影响,也受到电池、电机和控制设备性能的影响,因而,新能源二手车保值率的计算,宜采用二次曲线、对数曲线、指数曲线和复合曲线等模型进行单独计算或几种模型的组合计算。

其中y为可观测的随机变量,β0,β1,β2…βp,为回归系数,是未知参数;ε是不可观测的随机误差变量,且满足ε~N(0,δ2)。

根据历史样本(y1,xt1,xt2…xtp)(t=1,2,…n),求得的回归方程为:

2  基于聚类分析的新能源二手车保值率评估模型

新能源二手车保值率,不仅受车辆的车龄、里程、品牌、排量的影响,以及受政策因素(如限迁条件、限购条件、报废规定)、经济环境、市场因素(国家补贴政策、新车优惠、车型保有量等)等因素的影响,更受到新能源汽车电池续航里程、电池品牌、电池的寿命、电池成本、工作温度条件、充电桩设备等影响。如图1所示。

针对新能源二手车保值率的众多特征,找出特征最相似的车型;按照分层聚类进行分析,使样本实现同类分层,完成新能源二手车的聚类分析;然后再利用现有同类二手车保值率的历史数据,建立多元线性回归模型,最终作为新能源二手车保值率的预测模型。

3  实证分析

3.1 数据采集

采集国产17种典型车型的交易数据和电池配置参数,2018、2019、2020年的市场占有率,与电池能量密度、电池容量和电池续航里程,以及电池类型和电池生产厂家等数据。需要说明的是:这里仅研究纯电动汽车,不研究混合动力汽车;筛选出影响纯电动二手车保值率的参数:汽车品牌三年的平均市场占有率、电池能量密度、电池容量和电池续航里程等,构建具有特征变量的数据矩阵。

3.2 动态聚类分析

对于原始数据按照是否具有属性(1)和不具有属性(0)进行描述,得到新能源(纯电)二手车的原始数据矩阵,利用Tanimoto系数研究对象之间的相似性[3]。

通过SPSS 25软件,先对原始数据的标准化处理,再进行新能源(纯电)二手车之间的相似性或不相似性处理,得到新能源(纯电)二手车的原始数据的Tanimoto系数。

按照Tanimoto系数的大小,初步分析得到的结果:

特斯拉X与蔚来ES8的属性,具有很大的相似性,都属于高端电动汽车;奥迪A6L新能源与宝马X1新能源都是插电式混合动力车,也具有很大的相似性,都属于高档名牌汽车;小鹏P7与零跑C11的属性,也具有很大的相似性,都属于“造车新势力”的产品,都是国产中档电动汽车;哪吒N01与长安奔奔E-Star的属性,具有很大的相似性,都属于入门级小电动汽车;比亚迪纯电动秦与北汽EC5的属性,具有很大的相似性,都属于国产老字号电动汽车等等。

3.3 分层聚类分析法分析新能源(纯电)二手车各變量之间关系

采用分层聚类分析法分析新能源(纯电)二手车各变量之间关系。同样通过SPSS 25软件,先对原始数据的标准化处理,再对新能源(纯电)二手车各数据变量进行系统聚类分析与处理。

由于奥迪A6L新能源与宝马X1新能源,属于插电式混合动力车,与其他15种纯电动汽车不相一致,在数据处理前,将奥迪A6L新能源与宝马X1新能源作为单独一类,不做系统聚类分析。这里仅对其他的15种纯电动汽车进行系统聚类分析。

采用“word”法,进行分层聚类:取标准值为“5”,可以分成“9”类;标准值为“10”,可以分成“5”类;标准值为“15”,可以分成“3”类;标准值为“20”,可以分成“2”类。最终选择标准值为“10”,按“5”类进行聚类分析:其中品牌 “特斯拉X”被描述为“离群者”。

综合考虑:按照“Tanimoto”系数动态聚类分析新能源(纯电)二手车之间的相似性处理结果;根据系统聚类“Word”分析法分析新能源(纯电)二手车各变量之间的关系;再结合2020年第4季和2021年第1季的纯电动车销量、市场占有率和销售定价等因素,按照聚类分析方法,最终将15种新能源(纯电)二手车分层聚类成5类,如表1所示。

从聚类的最终结果中可以看出,第一类含有一种车型,第二类也含有一种车型,第三类含有四种车型,第四类有六种车型,第五类中有1种车型。

第一类的特斯拉汽车,是典型的“离群者”。短短几年它的销量远超其他国内传统的新能源汽车的销量,可谓“一枝独秀”!在新能源汽车市场占有率与保值率,远远也高于其他纯电动汽车,它的保值率甚至远高于普通燃油车!根据《2020年度中国汽车白皮书》数据,特斯拉model X的保值率达到90.21%。它的整体外观设计的比较大气,而且整体颜值非常高;车整体的配置高科技,内饰也漂亮,且操控性好!具有很强的竞争力,深受年轻用户的喜欢,特斯拉属于强抗跌型车型。

第二类的北汽EC5、比亚迪纯电动秦EV、吉利纯电动帝豪GSe,属于我国传统汽车公司生产的新能源汽车,车价在10万到17万左右,属于中档价格的家用汽车,具有价格便宜,品质好,维护保养成本低,电动车使用成本比较低,电池续航里程也大,市场占有率较高,但它的保值率相对较低。

第三类的宏光mini EV、哪吒N01、长安奔奔E-star、欧拉白猫。其中哪吒N01、长安奔奔E-star属于我国“造车新势力”的新能源汽车,车价在2万到12万左右,属于入门级家用汽车,这类车外观小巧、帅气、很时尚,甚至呆萌可爱,主要用于代步,短途出游,也符合年轻人的审美观和消费观。它比老年代步车安全,便宜好用,能够满足日常代步需求,在有牌照要求的城市更是占号神器,是消费者很热衷购买的一类新能源汽车。2020年7月到2021年2月,宏光mini EV新车销量超过18万辆。由于这类车的车价较低,抗跌性强,保值率较高。

第四类:有蔚来ES8、理想ONE、小鹏P7、零跑C11、威马EX5、云度π3,属于我国“造车新势力”的新能源汽车。车价在20万到50万左右,属于中高档家用汽车,也是我国纯电动汽车的主流品牌。这类车具有外观设计上非常时尚、大气、年轻化;车辆科技含量高,内饰做工考究;动力充沛,空间大;配置丰富,车辆续航能力强的。是目前消费者非常热衷的一类新能源汽车,市场占有率很高,它的保值率较高。

第五类有宝马ix3:属于BBA品牌,是传统燃油车高端品牌;作为高端品牌的纯电动汽车,消费者有个接受的过程,因而新车成交量较小,作为二手车的成交案例更是少之又少!但由于品牌优势,它的抗跌性强,保值率很高。

3.4 多元回归预测模型

根据聚类结果,这15种车型可以分为5类,以第四类车型为例,上市时间相对较长,二手车成交数据较多,因此对该类型车型进行保值率计算。

蔚来ES8这几年的保值率数据与市场占有率、电池能量密度、电池容量和电池的续航里程数据。其中保值率为变量,用Y表示;自变量有年份、市场占有率、电池能量密度、电池容量、电池的续航里程,分别X1、X2、X3、X4、X5表示。

通过SPSS软件对散点图的观察,点的分布走向类似于二次函数,进行曲线拟合。挑选出最优曲线拟合模型,而X1回归系数通过了显著性检验,保留在方程中。

最后得到的二次曲线:

根据预测模型,对第四类车型的保值率进行预测计算。计算值和二手车保值率的实际值重合度较吻合,说明此模型的拟合程度良好,可用于该类车型的二手车保值率预测。

4  结论

新能源二手车保值率的计算应当考虑新能源二手车自身的特点,如:电池续航里程、电池品牌、电池的寿命、电池的类型等条件;还得考虑电机的类型、控制系统的可靠性;整车与电池质保政策,如电池回购与免费服务次项目等。总之,对于电池性能、电机的类型、控制系统和整车与电池质保政策等对新能源二手车保值率,均存在很大的影响。

用分层聚类方法研究了新能源二手车的保值率计算方法,结果显示新能源二手车保值率的预测模型,和实际同类车辆的保值率有很好的吻合,可以为汽车流通协会制定保值率标准、二手车评估交易市场收购车辆价格和二手车从业人员评估车辆的价值作参考。

参考文献:

[1]悦慧,安然.多元回归模型在新建机场客运量预测中的应用研究—基于动态聚类分析[J].现代商贸工业,2010,20:13-15.

[2]孙晓静,高慧,陈云.基于聚类分析和决策树算法的服装销售预测模型[J].中国管理信息化,2015,18(9):64-67.

[3]Mehmed Kantardzic.多元统计分析方法[M].北京:清华大学出版社,2003:91-98.

[4](德)巴克豪斯.多元统计分析方法[M].上海:格致出版社,2009:285-330.

[5]成英.基于聚类分析的二手车保值率预测[J].数学的实践与认识,2017,24(9):14-21.

猜你喜欢
多元回归聚类分析
不同住房保障方式下住户居住满意度研究
江苏省实施税收优惠政策促进科技创新的实效性研究
我国大学生人生规划自主性的现状和影响因素
中国装备制造业阶段竞争力研究
上证综指收益率的影响因素分析
农村居民家庭人均生活消费支出分析
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
计量经济学研究
“县级供电企业生产经营统计一套”表辅助决策模式研究