基于支持向量机的卷烟投放决策模型的建立

2018-01-22 12:43冯喆王志刚
中国经贸导刊 2018年32期
关键词:消费者行为支持向量机

冯喆 王志刚

摘 要:随着“大数据”时代的来临,卷烟商业企业更加重视利用海量数据分析洞察消费者行为,以实现更为精准的营销模式。以T城市A区实地调查数据为样本数据,基于消费者购买动机理论,引入支持向量机分类方法,利用支持向量机在解决非线性及高维度识别问题中的优势,提出了一种基于支持向量机的卷烟投放决策模型。

关键词:支持向量机 烟草商业 购买动机 消费者行为

一、引言

卷烟消费者在选购卷烟时,往往会因循某种购买动机选择自己需要的卷烟,即使对于同一种品牌卷烟,其价格完全一致,但因消费者的购买动机与消费水平不同,也会产生因不同购买动机驱动消费的情况。如此可见,以上情况便转换成了一个分类问题,即将不同消费水平的消费者根据其购买动机匹配相应卷烟的问题。随着市场经济的繁荣发展,一名卷烟消费者往往伴随着几种购买动机进行消费,信息维度不断升高,同时利用调查问卷获取的可靠数据较少,传统的分类方法已经渐渐不再适用当下的消费环境。

本次研究以T城市A区为调查地,首先通过实地调研获取基于6种卷烟消费者购买动机的消费区间,并结合2017年度该城市预计投放新品卷烟的零售指导价位构建一个求购满意度评价函数,以此建立一个预投卷烟与消费者购买行为相匹配的数据库。而后,采用支持向量机(SVM)的多分类方法,通过归一化数据、训练样本、核函数选取、参数寻优等步骤验证其匹配的准确率。

二、卷烟消费者购买动机理论

购买动机是指为了满足一定需要而引起人们购买行为的欲望或意念。在现实生活中,每个消费者的购买行为都是由其购买动机引发的,而动机又是由人的需要而产生的。卷烟消费者的需求与刺激因素的多样性决定了消费者购买动机的复杂性。一般来说,卷烟消费者购买卷烟的动机包含求实动机、求名动机、求美动机、求新动机、求廉动机、从众购买动机等。笔者根据其中主要6种动机进行归纳总结,具体内容如表1所示:

三、投放卷烟匹配数据库的建立

(一)基于购买动机的卷烟消费者信息数据获取

本次研究采取实地调查法,以T城市A区卷烟消费者为样本总量,从A区选取日客流量较大的5个不同档位卷烟零售店,制作并发放调查问卷。问卷内容包含被调查者的求实动机消费价格区间、求名动机消费价格区间、求美动机消费价格区间、求新动机消费价格区间、求廉动机消费价格区间、从众购买动机消费价格区间等六个方面数据。截至调查结束,共发放问卷200份,回收有效问卷169份。由于数据量过大只选取了其中5名被调查者数据作为样本数据参例。数据采集情况如表2所示:

对采集数据加以整理,分别将每个购买动机消费区间的最大、最小值取平均数,数据整理情况如表3所示:

(二)新品卷烟销售价格信息获取

本次研究选取了2017年T城市A区烟草公司计划首次向市场投放的22种新品卷烟,由于计算量较大,选取其中5种不同价位卷烟作为样本数据参例。为方便后续运算,用标签a,b,c,d,e逐一代替五种品牌卷烟,并整理其对应零售指导价格,如表4所示:

因此,由表5可知:αb<αc<αa<αe<αd,证明黄金叶(小目标)卷烟与消费者A的购买行为及心理需求更为相符,消费者A更愿意选择接受并购买黄金叶(小目标)。

依照上述方法,依次对剩下的168名消费者数据进行运算,并最终形成5种新品卷烟零售指导价与169名消费者购买行为相互匹配的数据库。由于数据量较大,选取5种新品卷烟与5名被调查者(A~E)对照匹配结果作为样本参例。匹配结果如表6所示:

三、基于支持向量机(SVM)的卷烟投放决策模型

(一)归一化数据

因样本数据中的先验信息会对优化后分类器性能产生直接的影响。因此,在训练样本前需要對样本数据进行预处理。其目的为解决因不同的输入或输出参数在数值上的数量级差别,或者出现在函数的饱和(不敏感)区域,造成的数值困难问题。另一方面,归一化之后的数据矩阵可以提高模型运算的速率与准确率。综上所述,本文采取了线性极差变换对样本数据进行预处理。

(二)训练样本和测试样本确定

数据预处理完成后,将归一化后的新矩阵作为支持向量机(SVM)模型的维度数据(即,输入数据),将准备投放的22种新品卷烟作为支持向量机(SVM)模型的输出数据,用标签方法进行代替,即形成a,b,c,d,e…共计22个类别,本文采用一对一的分类方法,形成了一个二分类问题(即,如果存在n类,则需要训练n*(n-1)/2个分类器,用每个分类器进行样本验证,得到n*(n-1)/2个预测结果)。最后根据结果进行投票,得到票数最多的即为验证样本所属类别。

本次研究将数据库样本平均分为两部分,分别作为训练集和验证集。选取新品卷烟标签作为行向量,选取被调查者6种购买行为的数值作为列向量,从而形成一个训练样本矩阵,并以同样方法将剩下的数据形成一个验证样本矩阵。

(三)核函数的选取

在解决卷烟消费者购买动机分析的案例中,对于核函数的选取变得尤为关键。由于消费者行为受到不同购买动机驱使,不同的购买动机又因循消费者个人习惯、社会阶层、年龄等各个方面因素而产生,造成了整个系统呈现了高维度、高噪音以及不确定性。

一方面,选择适用的核函数可实现样例特征映射到高维空间,从而使线性不可分情况得以转化;另一方面,核函数的价值更体现在首先在低维进行计算,将实质上的分类效果表现在了高维上,从而避免了直接在高维空间进行复杂计算导致维度过高的情况。常用核函数类型如表7所示:

最常见的核函数选取方法包括:根据特性进行选取、进行多次实验进行对比寻优或将多个核函数结合形成混合函数。本文采用libsvm软件作为实验工具,选取四种常用核函数分别进行对比试验,将参数C(惩罚因子)设置为10,其他参数为默认值,选取分类准确率e最高的常用核函数作为本文SVM模型的核函数。

如表8所示,高斯(RBF)核函数分类准确率为84.58%,高于其他三个函数的准确率。此外,高斯(RBF)核函数还具有对于大、小样本性能表现较强、参数调整迅速等特性。综合考虑,最终选取高斯(RBF)核函数为本文SVM模型的核函数。

(四)参数寻优

由于惩罚因子C和参数系数g对RBF核函数的性能产生较大影响,从而影响回归精度。本文采取交叉检验(Cross Validation.CV)方法来验证分类器性能,从而进行参数的寻优。其基本思想是将原始数据进行分组,形成训练集(Train set)和验证集(Validation set),用训练集进行分类器训练,再用验证集测试训练得到的模型,以此作为评价分类器的性能指标。通过交叉检验,最终将最优参数确定为C(惩罚因子)=10,g(参数系数)=0.04。选择此参数的情况下,分类准确率e达到了88.7%。为方便展示,图1为训练集84名消费者与A、B、C、D、E五种卷烟的匹配结果:

四、结语

本文以卷烟消费者购买行为理论为理论基础,利用支持向量機(SVM)在分类统计上的优势,将不同价位品牌卷烟与不同消费者心理需求相匹配,主要解决在“大数据”市场环境下卷烟投放过程中“怎么投、投多少”的问题,为区域范围内的烟草公司精准投放工作做出决策支持。本次研究在以下两个方面仍需更深度的挖掘:

1.随着大多数学者对消费者行为的研究深入,现代消费者行为理论不仅仅聚焦于购买行为,还应包含:需求获取、购买动机、使用体验、售后评价等多方面,进一步全面并完善的采集影响因素,从而更好地将影响消费者行为的因素定性化、定量化,是确保后续统计分析工作精准化的重要前提。

2.目前,用户消费者行为分析的主要方法包含层次分析法、BP神经网络、贝叶斯网络等。部分研究学者在其他研究领域已完成以上部分分析法的试验对比(徐晟皓,杨楠堃,易梦乔,2015),但在以消费者6种购买行为为基础理论的研究方面仍属空白,利用BP神经网络、贝叶斯网络、支持向量机等不同方法分别进行试验,择优选取适合当下卷烟市场环境的分析方法,成为了需要进一步研究的方向。

参考文献:

[1]毛连忠,郝矿荣,丁永生.基于支持向量机的服装号推荐模型建立[J].微型电脑应用,2016(3):1—4.

[2]徐晟皓,杨楠堃,易梦乔.基于支持向量机的消费者行为分类方法[J].价值工程,2015(4):19—21.

[3]柯圣.基于样本先验信息的正则化型分类器设计研究[D].华东理工大学,2014.

[4]汪晨雪.消费者卷烟品牌选购动机因素研究[D].江西师范大学,2013.

[5]Solomon,MichaelR.Consumer Behavior[M].Pearson Education,2011:12—27.

[6]胡海青,张琅,张道宏,陈亮.基于支持向量机的供应链金融信用风险评估研究[J].软科学,2011(5):26—30.

[7]宋晖,薛云,张良均.基于SVM分类问题的核函数选择仿真研究[J].计算机与现代化,2011(8):133—136.

[8]万莉.基于支持向量机的非线性系统建模与预测控制[D].中国石油大学(华东),2006.

[9]Hsu C.W, Lin C J.A comparison of Methods for muti-class support vector machines[J].IEEE Transactions on Neural Networks,2002,13(2):415—425.

[10]Vladimir N,Vapnik.Statistical training Theory[M].Wiley—Inter Science,1998:9—16.

(冯喆、王志刚,天津市烟草专卖局。)

猜你喜欢
消费者行为支持向量机
基于改进支持向量机的船舶纵摇预报模型
网络购物的消费者行为研究及应对策略
部落电商背景下消费者购买行为模式研究
基于SVM的烟草销售量预测
动态场景中的视觉目标识别方法分析
论提高装备故障预测准确度的方法途径
电子商务环境下的消费者行为分析
电子商务环境下的消费者行为分析
天府可乐品牌营销策略研究
基于熵技术的公共事业费最优组合预测