高旭 王联国 代永强
摘 要:以神经网络组合模型和K-means的应用对客户分类和潜在性价值等问题的解决为目的,以CRM理论为前提,对客户潜在价值指标中更具有针对性的指标进行选择,行为习惯和属性两个方面的指标都涵盖在内。完成组合模型的建立,对某个数码网点客户信息及数据进行研究,对于客观属性的分析通过k-means法完成最初的聚类,得到的初类在其内部完成自组织竞争神经网络预测及训练,这样细分聚类就得以完成,然后对聚类结果的特点进行评价,结合具体情况为数码电子商务客户关系管理提出更高效合理的措施与建议。
关键词:“互联网+”;农村电商;客户价值;k-means;神经网络
中图分类号:TP391. 41 文献标识码:A DOI:10.3969/j.issn.1003-6970.2021.02.002
本文著录格式:高旭,王联国,代永强.“互联网+”环境下洛阳市农村电商客户潜在价值研究[J].软件,2021,42(02):006-010
Research on the Potential Value of Rural E-commerce Customers in Luoyang under the Internet + Environment
GAO Xu, WANG Lianguo, DAI Yongqiang
(College of Information Science and Technology, Gansu Agricultural University, Lanzhou Gansu 730070)
【Abstract】:Aiming to use the combination model of k-means and neural network to solve the problem of potential customer value and customer classification. On the basis of the existing CRM theory, select targeted customer potential value indicators, including objective attribute indicators and behavioral habits indicators. Constructing a combined model to analyze the customer data of a digital online store, using the k-means method to perform preliminary clustering of objective attributes, and conducting self-organizing competitive neural network training and prediction within each primary category to subdivide the clustering results. Finally, the characteristics of the clustering results are evaluated and suggestions are made for digital e-commerce customer relationship management.
【Key words】:Internet+;rural e-commerce;value of customer;k-means;Neural Networks
0 引言
2008年起,“互聯网+”成为各行各业的关注焦点和重要发展趋势。利用互联网带来的信息化、现代化特征,传统行业趁势谋求打破地域和空间域限制,扩大市场和用户规模,进一步发展[1]。在传统农村商贸环境中,农村电子商务在“互联网+”的背景下孕育发展,成为改善“三农”问题,加快推进城镇化进程新的解决方案,是农村经济发展的必然趋势。
农村电子商务发展对促进乡村振兴,帮助农村脱贫脱困具有重要意义。与其他电子商务领域一样,在农村电子商务的发展中,电子商务客户管理是企业发展、获客和盈利的重要基础。从商家的角度来分析,为了对价值高的客户进行辨别、筛选、获得与维护,保持良好的客户关系,实现客户差异性管理,最基础的工作就是对客户潜在价值的有效量化。
在电子商务客户关系管理过程中,数据挖掘通常是以机器学习和计算应用来实现的,不同类型的聚类算法以及神经网络组合都被引入数据分析模型的提速优化[2]。不过,聚类-神经网络组织模型在客户分类以及潜在价值方面的应用并未进行深入和全面的探究。本课题以洛阳市数码产品电子商务产业为研究对象,对于客户分类及潜在价值对应的组合模型的建立是通过K-means聚类和自组织竞争人工神经网络来实现的,同时展开客户分类和价值分析等深入研究,完成客户分类与价值分析组合模型的建立,使客户分类与价值探究能够有效开展。
1洛阳农村电子商务发展现状
在网络信息技术迅速发展和普及的大背景下,电子商务迅速发展,电商规模迅速扩大。但由于通讯覆盖时间早晚差异、电子产品消费能力、管理能力和信息鸿沟等因素,农村电商尚处于相对落后的状态。为促进领域发展,国家各部委接连出台多项政策,鼓励和扶持农村地区发展电子商务产业[3]。洛阳市也积极响应,大力支持电商发展,撬动当地非城镇地区经济发展。
1.1农村电商发展迅速
自2014年起,洛阳市农村电商发展取得卓越成效,洛阳市新安县、汝阳县、洛宁县、嵩县等四县在2014-2017年间先后被评为国家级电子商务进农村综合示范县。洛阳市电子商务交易总额在2016年高达1710亿元,增长幅度很大,具体如图1所示。洛阳市嵩县、洛宁县、汝阳县和新安县在2014-2017年间也成为国家级电商走进农村的示范县。洛阳市在2017年7月前供销系统完成6个县级电商运营中心的建立,其中“聚客隆商超”和“洛阳农超”2个电子商务平台会员数量就已经有14.1万人,销售总额共计2.6亿元,商品种类超过八千种。栾川县也完成电商服务平台,同时建立配套的仓储物流中心,乡镇级和村级电商信息服务中心分别为15个和150个,主要负责宣传和推广农村手工艺品、加工品和农副产品等。
1.2农村电商致富效应增强
传统农村产业面临“酒香也怕巷子深”的困局,市场和受众规模有限,传播、运输不便,小作坊式生产难以形成品牌化、规模化效应。电子商务渠道一方面为村民带来更多创业机会和就业岗位,另一方面,也结合区位优势和当地农业发展形成的特色,给村民带来了新的致富机会。比如伊滨区庞村镇在钢制家具制作方面独具特色,与知名电商合作以实现伊滨区电商销售中心的建立,为当地农民提供更多就业机会。宜阳地区农产品别具一格,与阿里巴巴合作建立农村淘宝中心,借助这一电商平台进行线上销售农产品;嵩县地处山区,旅游资源丰富,因此与旅游业网站进行合作实现更好的宣传,使当地经济发展速度不断加快,农民生活水平也随之提升。
2电子商务客户价值
2.1客户价值理论
关于企业战略决策理论有很多,其中被大部分企业都高度认可的理论之一就是客户价值理论,该理论具有指导性意义,是客户关系管理理论的关键构成。2016年詹姆斯指出,客户价值分成期望价值和实际价值两类,前者是站在客户角度分析,后者是以企业盈利角度分析。企业辨别这两个价值能够对客户在服务和产品方面的潜在性需求进行更好的挖掘,以便于为客户提供更有针对性的服务和产品。这两种价值实际上反映了客户期望和实际消费之间的差距,对比这两种价值,可以对客户满意度情况进行映射:当期望价值大于所获实际价值,客户需求没有被完全满足,客户满意度较低;反之,实际价值与期望价值之间平衡,甚至大于期望价值,客户满意度较高,复购和转介绍的几率增大。
2.2客户潜在价值评价指标选取
以客户生命周期理论、利润和RFM分析模型探究为前提,本课题以数码产品电商特征为核心,对有关数据从行为习惯和客观属性两个方面的指标展开分析。
其中,客观属性指标包括年龄、性别、收入等客户实际信息数据。
行为习惯指标主要由一次消费总额、一次消费产品类型、一次消费时间、客户喜好、客户评价、最后消费时间和历史交易次数等构成。
具体指标和取值说明如表1。
根据数码产品的特性和电商消费者网上购物的实际特点,在一定范围内,客户可以被进行广泛分类。其中,客户评分反映客户对当次购买产品的满意度;买家等级数据反映客户对电商消费渠道的熟悉和偏好程度,并间接体现客户的购买潜力和消费习惯;客户偏好(爱好)直接反映客户的消费倾向;一次消费宝贝体现用户需求的跨度范围,即其需求是否多样。此外,历史购买总次数能够反映客户对品牌或商家的忠诚度;一次消费总金额与客户的消费能力和消费意愿相关性较强;最后一次消费时间则可以作为对客户再次购买可能性的判断依据之一。在快消、零售等行业,客户最后一次消费时间越近,通过针对性营销手段促使其复购的几率越高,而由于数码产品单价高,较为耐耗,更换频率较低的特点,在一定时间范围内,最近一次消费时间越近,其对同类产品发生复购的可能性越低。
3基于客户潜在价值的客户分类模型构建
3.1建模方法
3.1.1 k-means聚类
k-means聚类算法是圆形额目标函数聚类方法中的典型算法,是数据点到类别中心的特定距离和实现优化的目标函数,通过极值求解获取到迭代运算调整规则[4]。该算法相似度测度为欧式距离,它是求对应某一初始聚类中心向量V=(v1,v2,…,vk)T最优分类,使得评价指标JC值最小。聚类准则函数一般会选择误差平方和准则函数,即:。其中,Mi是类Ci中数据对象的均值,p是Ci中的空间点。
对以上函数分析可知:该算法实际上是最优求解过程,目标函数具有很多局部极小点,其中仅有一个为全局最小点。目标函数顺着误差平方和准则函数降低的方向进行搜索。初始值的差异性确定V(聚类中心向量)因路径差异性而使目标函数减少。如图2所示目标函数顺着VA,VB,VC三个初始值向量路径逐渐边小,并得到与之对应的极小值,局部最小值对应A、C点,全局最小值对应B点。该算法属于爬山算法的一种,基本上都是在局部最小值处算法结束。
k-means算法采用迭代更新的方法:所有迭代过程以k个聚类中心将附近点形成k个簇,对所有簇质心再次计算就作为后面一轮迭代参照点,经过迭代实现参照点与簇真正的质心相距不断拉近,因此目标函数不断减小,聚类效果提升。如图3为该算法的流程图。
速度快和方便简单是该算法最显著的优势,所以本课题对于客户年纪、性别和每月收入等客观属性分类通过该算法实现;不过该算法也有其缺陷所在,即聚类中心对算法造成较为严重的影响[5]。
3.1.2自组织竞争人工神经网络
客户行为习惯属性具有多边性和复杂性等特征,对其分类时若采用线性或非线性模型显然不够精准,所以本课题对其分类确定为神经网络方法,这种分类方式的优势在于反映快捷、结构简单,对于大量数据的分类也能保证精准性,对客户分类尤为适用[6]。自组织竞争人工神经网络属于网络训练的一种,且没有教师示教,这类神经网络可以独立完成训练,完成输入模式自行分类。如果输入层和竞争层神经元分别为N个和M个,则算法流程图如图3所示,自组织竞争人工神经网络基本结构如图4所示。
网络的连接权值为wij=(i=1,2,…,N,j=1,2,…,M)且满足约束条件。竞争层神经元互相竞争,取胜神经元数量仅有一个并与当下输入样本对应,这个神经元就是当前样本分类模式。根据以下方法可计算得到竞争层神经元j的状态。
(1)
式中,xi为输入样本向量的第i個元素。以竞争机制为前提,神经元k在竞争层内加权值最高,k取胜且对应输出是
(2)
竞争后的权值按照下式进行修正,对于所有的输入层神经元i,有
(3)