基于粒子群优化BP神经网络的汽车4S店客户流失预警

2024-07-05 13:25赵颖秦睿林翠波俸亚特
时代汽车 2024年11期
关键词:粒子群优化算法BP神经网络主成分分析

赵颖 秦睿 林翠波 俸亚特

摘 要:客户流失预警作为防止汽车4S店客户流失的重要手段,不仅为当代车企提供了有效的经济效益保证,也为车企对未来决策带来了新的研究依据。为建立汽车4S店客户流失预警分级标准,该文从客户基本信息、车龄、车辆销售价格、贷款金额、维修保养次数、维修保养时间等29个指标着手,基于粒子群优化BP神经网络算法,建立汽车4S店客户流失预警分级标准模型。该模型首先预测出客户流失概率,然后根据值为0-1之间的概率大小分为1-5共5个等级,其中1表流失可能性很小,5表示流失可能性很大。最终得到测试集客户流失预警从1到5等级的比例分别为71.39%、3.75%、3.50%、5.86%和15.50%。同时,通过训练集中有78.65%的客户未流失作为先验概率,判定预测概率小于等于先验概率为客户未流失,大于先验概率为客户流失,得到该模型总体的准确率为91.71%。

关键词:粒子群优化算法 BP神经网络 客户流失预警 分级标准 主成分分析

伴随着我国汽车拥有量的不断提高以及汽车行业经营环境的变化,国内汽车销售行业面临着巨大的竞争压力,在汽车行业中,整车销售的红利时代已经过去,“高质量的售后服务”成为消费者选择的一大要点,汽车售后服务已经成为各汽车厂家和经销商最重要的利润来源。当前,国内汽车售后服务同质化,可供选择的店家多样化且自由化,客户的忠诚度逐渐降低,客户流失问题日益凸出,售后服务成为我国汽车生产企业的软肋,客户流失成为售后服务领域共同的难题。因此,对汽车4S店客户流失预警进行研究,为汽车4S店对流失客户制定分类针对性的挽回策略提供依据,可以提高汽车4S店的管理效率,促进汽车服务行业中售后服务的管理,获得良好的口碑[1],具有巨大的理论意义和实践意义。

客户流失预测发展历程分为三个阶段[2],分别是运用传统统计学方法预测客户流失阶段、运用人工智能方法预测客户流失阶段、运用统计学习理论基础预测客户流失阶段。目前客户流失预测相关研究较多,运用神经网络、决策树、逻辑回归、聚类分析等构建针对电信客户的客户流失预测模型[3-11],运用神经网络等方法构建针对财务风险的客户流失预测模型[12-16]。但在汽车4S店客户流失预警方面的文献较少,目前有运用TFM和RFM模型对汽车4S店客户流失进行识别和预测[2,17-19],运用决策树、随机森林、Xgboost和Adaboost模型对汽车4S店客户流失进行识别[20]。

现今,神经网络是实现客户流失预警模型的有力工具,目前已经成为预测客户是否流失的重要模型,但其也存在容易陷入局部最优和在数据量较大时所需时间较长等问题。粒子群优化算法作为一种进化计算技术,简单容易实现并且没有许多参数的调节,目前已被广泛应用于解决约束优化问题、解决函数优化的问题和神经网络训练等应用领域。因此,将粒子群优化算法与BP神经网络相结合[21],可以更好实现汽车4S店客户流失预警。

针对当前汽车4S店客户流失日益凸显、售后服务亟待提升等问题,本文提出了建立汽车4S店客户流失预警分级标准模型,从客户基本信息、车龄、车辆销售价格等29个指标入手,基于粒子群优化BP神经网络算法,对汽车4S店客户是否流失进行预测。

1 模型构建

本文采用粒子群优化算法与BP神经网络相结合的模型构建汽车4S店客户流失预警标准,模型构建具体步骤如下:

(1)根据系统的复杂程度确定BP 神经网络的结构,确定依据来源于数据和实际问题。假设样本数据集有n个解释变量,1个被解释变量,那么BP神经网络的基本结构为n个输入神经元,1个输出节点,隐含层神经元个数为以及其他参数,这些参数可以根据经验值设定;

(2)将BP神经网络中的权值和阈值映射到粒子上,粒子群搜索空间的维度数为,并设置粒子群优化部分的参数,和是固定的加速度常数,取值范围在1到2.5之间;

(3)确定粒子群的适应度函数,确定判断准则,即误差精度,适应度计算公式为,

其中,N表示训练集的样本个数,为第i个样本的观测值,表示第i个样本模型输出的预测值。然后,迭代结束在适应度最低的粒子对应的位置,即问题的最优值;

(4)随机初始化粒子群,产生一定数量的粒子及其相应的速度,组成一个群体;

(5)用粒子群优化算法训练BP神经网络,计算各自粒子的适应度,与误差精度进行比较,若小于误差精度则确定每个粒子的当前最好适应值和全局最优适应值。然后,在每一次迭代过程中,粒子通过个体极值和全局极值更新自身的速度和位置;

(6)更新粒子的位置和速度后,再计算新的粒子的适应度值,由于这里是对经典BP模型进行改进,所以采用的是神经网络误差计算使用的均方误差函数,计算新粒子的适应度值;

(7)输出最好的粒子,利用该粒子反映射出神经网络的权值和阈值,即BP神经网络的初始权值和阈值;

(8)将改进的BP神经网络模型进行训练,得到最终模型;

(9)利用上述模型对汽车4S店客户的流失预警进行分级,共分为5级,具体划分标准如表1所示。

客户的流失预警分级构建流程如图1所示。

2 汽车4S店客户流失预警分级标准实证分析

2.1 数据来源

本文数据来源为全国应用统计专业学位研究生案例大赛“案例A”中的数据。

2.2 主成分分析

本文对客户年龄、客户性别和车主性质等29个指标进行数据预处理后,将其作为研究汽车经销商客户流失影响因素,运用主成分分析法对众多变量做降维处理。为保留更多信息,本文保留前15个主成分,其含有原始变量至少80.8%的信息量。

2.3 客户流失预警分级

将15个主成分带入粒子群优化BP神经网络的汽车4S店客户流失预警分级标准模型进行训练。

(1)粒子群优化BP神经网络训练过程

本文将训练集中的15个主成分作为输入样本,模型输出的汽车客户流失的概率作为粒子群优化BP神经网络的模型输出,隐含层神经元个数定为5,从而确定粒子群优化BP神经网络模型结构为15-5-1型,并设置BP神经网络最大迭代次数为500,训练结束的误差精度为0.1,激活函数使用sigmoid函数,初始权值和阈值则是粒子群优化得到的最优粒子。

并且,设置粒子群优化BP神经网络中粒子群优化算法部分的初始参数,设置和固定的加速度常数均为2,权重为0.2,最大迭代次数100。

将主成分分析后的训练集中的34329个样本数据,带入上述设定好参数的粒子群优化BP神经网络中进行训练,得到如下优化过程中最优个体适应度值的折线图2。

根据图2最优粒子适应度值折线图可以看出,整体呈现下滑趋势,在迭代次数为100次时,出现了最优粒子最小适应度值为0.128,即测试样本的误差平方和降低到了0.128。将训练集带入训练后的粒子群优化BP神经网络模型对训练集进行预测,探究该模型预测效果的好坏,得到粒子群优化BP神经网络模型对训练集进行预测的准确率达到了91.71%。

随后,利用该粒子群优化BP神经网络模型对测试集中6453个样本数据进行测试,输出测试集中每个汽车客户流失的概率,根据模型构建章节中的汽车4S店客户的流失预警分级标准表,对测试集中的汽车4S店客户的流失预警进行分级并计算各等级比例,部分结果如下表2,并得到测试集汽车4S店客户的流失预警各等级比例如下表3。

根据表3测试集汽车4S店客户的流失预警各等级比例可以看出,在6453个客户中,有71.39%的客户流失可能性很小,有3.75%客户流失可能性较小,3.50%的客户流失可能性一般,有5.86%客户流失可能性较大,而有15.50%的客户流失可能是很大,需要加强对这批客户的沟通与往来,防止客户流失。

(2)分级标准模型评判

训练集汽车4S店客户的流失预警各等级比例如下表4。

从表3与表4可以看出,模型预测没有偏离训练时的效果,模型具有良好的稳定性。

2.4 模型评价

为判断粒子群优化BP神经网络模型预测的性能,本文将使用混淆矩阵来评判,即可以根据汽车客户流失预测情况做出评判,通过设定汽车客户流失预警的阈值,判断该汽车客户在模型预测中是否为流失客户。

将训练集中汽车客户按是否流失进行分类,78.65%的客户是未流失的,21.35%的客户是流失的,得到客户未流失的先验概率为0.7865。本文使用该先验概率作为判定客户预测概率是否流失的阈值,若通过模型预测出来的客户流失概率大于0.7865,则判定该客户为流失,若预测值小于等于0.7865,则判定该客户为未流失,进而得到训练集的混淆矩阵如下表5。

27002个实际未流失客户中有26344个预测为未流失客户,有658个预测为流失客户,在7327个实际流失客户中有2190个被预测为未流失客户,有5137个预测为流失客户,整体预测正确率为91.71%,说明模型预测出的概率效果很好,达到预期目标,为后续进行汽车4S店客户的流失预警分级打好良好基础。

运用预测命中率和预测覆盖率评价。其中预测精确率(Precision)为在实际流失的客户中,模型预测出流失客户所占的比例,预测命中率可以表示预测模型的精准性。

预测召回率(Recall)表示在真实流失的客户中,被模型预测为流失客户所占的比重,这是描述预测模型适用性的评价指标。

经过训练集训练的粒子群优化BP神经网络的预测精确率为88.65%,说明客户流失预警预测模型的精准性比较良好;预测召回率为70.11%,客户流失预警预测模型适用性较强,也为后续流失预警等级划分打下良好的基础。

根据基于粒子群优化BP神经网络的汽车4S店客户的流失预警分级标准模型预测得到的结果发现,绝大部分客户在短时间内是不会流失的,而另外一小部分的客户会在短时间内流失,这也与实际的流失情况一致,先验概率展现的是有78.65%客户未流失,而流失预警等级划分中1到3等级占比为78.77%,两个占比是非常接近的,只相差0.12%,说明流失预警等级划分中,4S店需要着重关注4和5两个等级的客户,因为这部分客户有非常大的概率在较短时间内流失。综上所述,说明基于粒子群优化BP神经网络的汽车4S店客户的流失预警分级标准,整体效果非常好,具有良好的预测能力,能为4S店后续的决策提供依据。

3 结论

本文基于粒子群优化BP神经网络算法,设立汽车4S店客户流失预警分级标准,给出相应的流失得分,实现对汽车4s店客户流失预警。

在设立汽车4S店客户流失预警的分级标准时,首先,基于粒子群优化BP神经网络建立汽车4S店客户流失预测分级模型,计算出相应的概率,以此定义客户流失的分级标准,将概率p(0

基金项目:广西高校中青年教师科研基础能力提升项目《基于多模态UGC数据的游客满意度提升研究》(2023KY0850);桂林旅游学院科研项目《基于函数型数据的景区客流量预测研究》(2023C02)。

参考文献:

[1]Xuwei Qin, Lusheng Shao, Zhong Zhong Jiang. Contract Design for Equipment After-sales Service with Business Interruption Insurance[J].European Journal of Operational Research,2020,284(1):184-192.

[2]张宽.基于TFM模型的汽车4S店客户流失预警技术应用研究[D].兰州:兰州理工大学,2019.

[3]Huang B,Kecvhadi M T,Buckley B.Customer churn prediction in telecommunications[J].Expert Systems with Applications,2012,39(1):1414-1425.

[4]Farquad MAH,Ravi V,Raju S B. Churn prediction using comprehensible support vector machine:An analytical CRM application[J].Applied Soft Computing,2014,19:31-40.

[5]Rizopoulos,Dimitris. Max Kuhn and Kjell Johnson. Applied Predictive Modeling. New York, Spring[J].Biometiics,2018,74(1):383-383.

[6]Dahiya K,Bhatia S. Customer churn analysis in telecom industry[C].2015 4th International Conference on Reliability,Infocom Technologies and Optimization (ICRITO).IEEE,2015:1-6.

[7]Li M,Yan C,Liu W,et al. An early warning model for customer churn prediction in telecommunication sector based on improved bat algorithm to optimize ELM[J].International Journal of Intelligent Systems,2021.

[8]Xu NL. Research and application of prediction model of telecom customer loss based on big data technology[J].ICT,2018,12(02):66-71.

[9]Li W,Zhou C. Customer churn prediction in telecom using big data analytics[C]//IOP Conference Series:Materials Science and Engineering[J].IOP Publishing,2020,768(5):052070.

[10]Zhao M,Zeng Q,Chang M,et al. A Prediction Model of Customer Churn considering Customer Value: An Empirical Research of Telecom Industry in China[J].Discrete Dynamics in Nature and Society,2021.

[11]Toor A A,Usman M. Adaptive telecom churn prediction for concept-sensitive imbalance data streams[J].The Journal of Supercomputing,2021:1-29.

[12]Odom M,Sharda R.A neural networks model for bankruptcy prediction[R].Proceedings of the IEEE International Conference on Neural Network,1990:163-168.

[13]Tam K,Kiang M.Predicting bank failure:a neural network approach[J].Applied Artificial Intelligence,1992,8:927-947.

[14]Boritz J E,Kennedy D B.Effectiveness of neural network types for prediction of business failure[J].Expert Systems with Applications,1995,9:503-512.

[15]Back B T,Sere K.Neural network and genetic algorithm for bankruptcy prediction[J].Expert Systems and Applications,1996,11:407-413.

[16]冯珍慧.基于粒子群优化BP神经网络的上市公司财务风险预测研究[D].济南:东华大学,2017.

[17]徐宏霞.汽车4S店客户流失预警模型的研究[D].哈尔滨:黑龙江大学,2021.

[18]王玉凤,孙文秀,杜梦娇.改进RFM模型的汽车4S店客户细分研究[J].计算机时代,2021(06):44-48.

[19]杨晓利.基于互联网+的A汽车4S店客户保持策略研究[D].北京:北京理工大学,2016.

[20]任露露.基于机器学习算法的汽车4S店流失客户识别[D].兰州:兰州大学,2021.

[21]Huang J,He L.Application of improved PSO-BP neural network in customer churn warning[J].Procedia computer science,2018,131:1238-1246.

猜你喜欢
粒子群优化算法BP神经网络主成分分析
基于改进SVM的通信干扰识别
基于自适应线程束的GPU并行粒子群优化算法
基于混合粒子群算法的供热管网优化设计
基于改进支持向量机的船舶纵摇预报模型
主成分分析法在大学英语写作评价中的应用
江苏省客源市场影响因素研究
SPSS在环境地球化学中的应用
复杂背景下的手势识别方法
BP神经网络在软件质量评价中的应用研究 
BP神经网络算法在数值预报产品释用中的应用