基于随机森林模型的电动汽车目标客户销售策略研究

2022-06-02 12:29朱鹏飞冉延平谢璐伟栗亚琪
南通职业大学学报 2022年1期
关键词:购车意愿电动汽车

朱鹏飞,冉延平,谢璐伟,栗亚琪

(天水师范学院 数学与统计学院, 甘肃 天水 741001)

0 引 言

随着全球环境污染和资源紧缺问题日益凸显,保护环境、崇尚自然、促进可持续发展的“绿色消费” 理念更加深入人心,世界开始进入“绿色消费” 时代。[1]相比传统燃油汽车而言更加绿色、低碳的电动汽车开始迈入历史舞台,大力发展新能源汽车,成为缓解汽车产业环境资源问题的有效途径之一。[2]中国2021 年新能源车销售达到352.1 万辆,同比增长1.6 倍,不但再次打破历史纪录,而且已经连续第七年位居世界第一位。[3]新能源汽车产业已然成为战略性新兴产业。但是,与传统汽车相比,电动汽车毕竟是新兴事物,消费者对之在某些方面还心存疑虑,一定程度上影响了电动汽车的销售[4],所以对目标客户挖掘和销售决策进行研究具有重要的现实意义。本文以2021 年华数杯C 题为例[5],对电动汽车销售数据进行异常值识别、缺失值填充、客户购车意愿预测,以制定科学的销售策略,提高电动汽车的销售成交率[6]。

1 预备知识

1.1 随机森林算法

随机森林算法是一种使用分类回归树作为元分类器的有监督学习算法,算法由树的生长与投票过程两部分组成,其流程如下[7]:

Step1:通过Bootstraping 方法随机有放回采样取出样本,制造T 个有差异的训练集,记为S1,S2,…ST。

Step2:利用不同的训练集分别生长出对应的决策树 C1,C2,…CT,并对单个决策树模型,选择最好的特征进行分裂。

Step3:每棵树完整生长,分裂过程中不进行剪枝。

Step4:对测试集样本X,使用上述决策树进行测试,得到对应的C1(X),C2(X),…CT(X)。

Step5:采用少数服从多数原则,将T 个决策树中输出最多的类别作为测试样本X 所属的类别。

为保证模型精度,对所建立模型多次进行5折交叉验证[8],计算所建立模型的Area Under Curve(AUC)均值,AUC 是受试者在操作特征曲线下与坐标轴围成的面积,其取值越接近1 说明模型越精确。

1.2 改良的网格搜索法

网格搜索算法是一种调参手段,是通过遍历给定参数组合来优化模型表现的方法[9]。为减少计算量,本文对其进行改良,其算法流程如下:

Step1:以步长1 为单位,通过网格法逐步向上遍历搜索,当条件函数返回值为1 时,终止搜索,记录总提升量及各项提升量,保存为上界;

Step2:以步长2 为单位,以Step1 记录的各项提升量为初值,通过网格法逐步向下搜索,当条件函数返回值为0 时,终止搜索,记录前一次的总提升量以及各项提升量,保存为下界。

箱型图四分位法是一种简单易操作的识别方法,本文拟采用该法对异常值进行识别;考虑客户数据多达27 项,且数据间可能存在多重共线性,本文拟采用随机森林算法解决缺失值填充及客户购车意愿的预测问题;在客户购买汽车的前提下,为减少计算量,拟采用改良的网格搜索法对满意度数据进行调整,以求得最佳销售策略。

2 数据预处理

2.1 基于箱型图的异常值处理模型

本文利用箱型图对客户满意度数据的异常值进行检测,箱型图的定义如图1 所示。

图1 箱型图定义

其中,QS指上四分位数,QX指下四分位数,R是上四分位数与下四分位数的差值,其计算式为:

异常值α 的判定公式为:

综上所述,建立异常值检测模型,对A1~A8(客户满意度)进行检测,按车辆品牌分别计算客户满意度的均值,使用对应均值替换异常值,结果如图2 所示。

图2 异常值处理前后箱型图对比

2.2 缺失数据处理模型

问题一的数据包括A1~A8(客户满意度)、B1~B17(客户个人特征)、电动汽车品牌类型和客户购买意愿等,共计27 项。由于调研失误,部分客户的数据B7(目标客户子女数量)缺失。含有缺失值的客户个案共计492 个,不含缺失值的客户个案共计1 472 个,缺失率约25 %。

数据库中含有目标客户的个人信息、车型选择和满意度评分等特征因素,这些特征与目标客户的子女数量密切相关。因此,建立随机森林模型描述各量化特征与相关目标客户子女数量的关系,其模型建立过程如下:

Step1:对 A1~A8、B1~B17、电动汽车品牌类型和客户购买意愿数据进行无量纲化处理[10]。

Step2:以 A1~A8、B1~B6、B8~B17、电动汽车品牌类型和客户购买意愿数据共计26 项因素作为模型的输入,以B7(目标客户子女数量)作为模型的输出。其中,训练集为1 472 个不含缺失值的样本,随机森林树为500 棵。

Step3:对所建立随机森林模型进行5 折交叉验证运行1 000 次,得到该模型的AUC 均值为0.97,表明准确率达97 %,模型具有较高的准确性;在建模问题背景中,部分客户的子女数量缺失时,该模型可实现对缺失数据的补齐。模型中B7对各因素影响的重要程度如表1 所示。

表1 B7 对各影响因素的重要程度

Step4:根据上述模型,对492 个缺失B7的样本进行预测,得到B7的分布情况如图3 所示。

图3 B7 分布情况

3 数据建模

3.1 影响购车意愿的因素量化模型

目标客户是否购车与目标客户的个人情况、车型选择和满意度评分等因素密切相关[11]。因此,建立随机森林模型描述上述特征与客户购车意愿的关系,过程如下:

Step1:对 A1~A8、B1~B17、电动汽车品牌类型和客户购买意愿数据进行无量纲化处理。

Step2:以 A1~A8、B1~B17、电动汽车品牌类型和客户购买意愿数据共计26 个相关因素作为模型输入,以目标客户是否购买汽车作为模型输出,建立随机森林模型,随机森林树为500 棵。

Step3:为验证模型的稳定性,对所建立的模型进行5 折交叉验证运行1 000 次,得到模型的AUC 均值为0.97,准确率达97 %,说明模型具有较高的准确性,可有效预测目标客户是否购车。模型中各因素对客户购车意愿影响的重要程度如表2 所示。

表2 各因素对客户购车意愿影响的重要程度

从表2 可以看出,影响目标客户购车意愿的前3 项因素是全年房贷的支出占家庭年总收入的比例(B17)、电池耐用和充电方便性(A1)、全年车贷支出占家庭年总收入的比例(B16),全年家庭可支配收入影响着目标客户的经济实力,进而影响着目标客户是否买车;同时,对于新能源汽车,目标客户更看重的是电池的耐用性与充电方便性。

3.2 目标客户购车意愿预测模型

3.2.1 目标客户个人信息填补

问题三的数据由15 名客户的A1~A8(客户满意度)、B1~B17(客户个人特征)和电动汽车品牌类型构成,这些客户均未表露出是否购车的意愿。由于调研失误,部分客户缺失数据B7(目标客户子女数量),含缺失值的客户编号为 2、8、9、10。为填充其缺失值,根据目标客户子女数量影响的25 个相关因素,利用缺失数据处理模型中建立的随机森林模型,以问题一中1 445 位不含缺失值的客户作为训练集,填补上述4 名目标客户的缺失值,结果如表3 所示。

表3 缺失的目标客户子女数量

3.2.2 购车意愿模型预测

根据影响目标客户购车的26 个相关因素,利用影响购车意愿的因素量化模型中建立的随机森林模型,以1 937 位目标客户的数据作为训练集,对15 位目标客户购车意愿进行预测,结果如表4所示。

表4 15 位目标客户购车意愿预测

3.3 销售策略优化模型

由于服务难度与满意度期待值成正比,在保证潜在客户购车的前提下,应当尽可能降低服务难度,即降低满意度期待值。基于此建立销售策略优化模型。潜在客户的原始满意度为A=(A1,A2,…,A8),其他特征为 T,构建影响购车意愿的因素量化随机森林模型,记为f。以0.1 %为满意度提升单位,满意度总提升量Z,各项满意度提升量为 β=(β1,β2,…,β8),构造大小为 8 × 1 的全1 向量,记为α,目标函数为

其中,f 为1 表示潜在客户购买汽车,f 为0 表示潜在客户不购买汽车。

分步求解上述目标函数。

Step1:以0.5 %为单位,以潜在客户原始满意度为初值,通过网格法逐步向上搜索,当条件函数返回值为1 时,终止搜索。记录当前满意度总提升量Z 及各项满意度提升量β。

Step2:以0.1 %为单位,以Step1 记录的各项满意度提升量β 为初值,通过网格法逐步向下搜索,当条件函数返回值为0 时,终止搜索。记录前一次的满意度总提升量Z 及各项满意度提升量β。

通过求解,可得客户编号为2、7、11 的目标客户满意度总提升量分别为0.9 %、3.4 %和1 %,各项满意度提升量如表5 所示。

表5 目标客户的各项满意度提升量 %

由表5 可推出具体销售策略:以7 号客户为例,销售人员在推销时应当注意强调电池技术性能(A1)、舒适性(A2)、经济性(A3)、动力性表现(A5)、驾驶操控性表现(A6)等方面的优势,其中需要着重说明经济性(A3)、动力性表现(A5)及舒适性(A2)等特点。

4 结 语

本文针对电动汽车的销售问题,根据影响客户购车的相关因素,构建了影响购车意愿的因素量化模型,对影响客户购车意愿的相关因素的重要程度进行了分析,并对无购车记录的潜在目标客户,利用随机森林模型,对其是否购车进行预测。最后,考虑在满意度总提升量最小的情况下,对目标客户的原始满意度进行调整,促使目标客户购买汽车,为汽车销售商提供了有针对性的销售策略。

猜你喜欢
购车意愿电动汽车
健全机制增强农产品合格证开证意愿
郫都区北京现代汽车领动购车意向研究
纯电动汽车学习入门(二)——纯电动汽车概述(下)
电动汽车
充分尊重农民意愿 支持基层创新创造
现在可以入手的电动汽车
魔都购车记(二)
——选车
An Analysis on Deep—structure Language Problems in Chinese
专注:电动汽车背后的技术创新
Chatterbox—Willingness意愿