电商数据的挖掘分析及应用

2022-11-03 03:15曹安林
无线互联科技 2022年15期
关键词:数据挖掘规则电商

曹安林

(南京机电职业技术学院,江苏 南京 211135)

0 引言

在电商行业发展过程中,电商平台用户的操作行为会产生大量的网络数据信息,面对海量的数据信息如何应用先进的技术对其进行分析、支持,如何辨别信息的真假保证数据的质量就成为摆在人们面前的现实问题。

1 数据挖掘的方法

目前,网络中的数据信息可以分为两大类,一类是结构化数据,即主要形式包括字符、文本及数字的数据;另一类则是非结构化数据,即主要形式包括图片、视频、音频的数据[1]。 人们在网络中产生的互动行为越来越多,故网络信息数据的格式也越来越复杂。 数据挖掘技术应是对越来越庞大、越来越复杂的网络数据进行分析、挖掘,以快速、准确地获取有价值的信息,探究隐含于不完整的、有杂音的、随机的数据中不为人所知的知识与信息[2]。 对于电商企业而言,所挖掘的就是电商用户的购买模式与行为特点。

目前常用的数据挖掘方法包括以下几种:

一是类/概念描述,其对数据进行分类、特征化描述后,对数据进行对比、总结,将数据之间的类或概念通过对比及汇总等方式描述出来[3]。 二是关联分析。该方法是目前数据挖掘技术常用的方法之一,其利用挖掘探测规则发现数据间互相依赖的、能够满足一定条件的关系。 三是分类和预测,该方法可对某些未知的数据做出预测,其应用特定的技术研究类标号未知的数据类型,辨别数据类/概念的模型。 四是聚类分析,该方法利用最大化类内相似性与最小化类之间的相似性原理对数据进行分组,其主要分析数据对象不考虑类标号,而是针对无标记类的数据进行聚类分析,再产生数据组群的类标号,将高相似性对象簇聚类与其他簇中的对象区分开来[4]。 五是离群点分析,该方法可以发现一些数据对象和数据的一般行为或模型异常,其主要对数据集进行分析。 六是演变分析与预测分析,比如时间序列分类、周期或序列模式匹配、基于类似性的数据分析等,主要分析随时间变化而变化的数据的发展规律或趋势。

上述方法中关联分析是目前数据挖掘应用最广泛的方法之一,通过关联规则分析可以发现事务之间的内在关系,分析各个要素之间的潜在规律,比如消费者在电商平台购买了衣服,是否会再购买鞋子,或者购买手机的消费者是否会配套购买手机壳等,这种方法也称为购物篮分析。 关联规则的处理对象是可理解为一种业务行为的事务,关联规则可通过有效的规则支持度与有效的规则置信度两个基本标准来衡量[5]。 其中规则置信度表示两个包含的事务发生的概率,可评价关联规则是否准确,其表示X出现的条件下Y出机的概率,即某个事务中包含有X的同时有多大概率会包含Y,可用下式表示:

上式中,T(x):项目X的事务数;T(X⌒Y):同时包含项目X和项目Y事务数。 置信度越高,X出现的条件下Y出现的概率越大。

规则支持度表示项目X和项目Y同时发生的概率,是测量关联规则广泛性的标准,用下式表示:

上式中,|T|表示总事务数,支持度过低表示规则不具一般性。

规则支持度与规则置信度的内在联系可以用前项支持度、后项支持度来表示,前项支持度数学表达式如下:

关联规则的开展必须设置合理的阈值,支持度阈值设置过小可能会导致生成的规则落空,分析结果缺乏代表性,反之支持度阈值设置过大可能会找不到相关规则[6]。 除上述两项基本标准外,关联规则还包括增益、提升度、事物及项集等其他指标。

2 电商数据挖掘的需求

在电商运营管理过程中数据挖掘的应用主要包括两个方面,即消费者信息分析与消费者交易数据分析。

2.1 利用数据挖掘分析消费者信息

电商平台分析消费者信息主要从访问数据、消费者浏览行为、访问渠道及访问模式等方面进行了解,从中挖掘关于消费者的、具有价值的数据信息。 通过数据挖掘技术电商平台可以对消费者进行分类,并进行客户保持、交叉销售等,再根据这些信息分析消费者的消费能力,有针对性地调整营销策略[7]。 比如利用数据挖掘技术构建消费者行为反应预测模式,评估消费者未来可能发生的消费行为,能够为电商企业挖掘潜在目标客户提供有价值的参考。 或者利用相关技术进行一对一营销,通过数据挖掘的聚类方法对海量消费者进行分类,分析消费者的群体行为规律,掌握群体共性,采取精准营销或差异化营销。

2.2 利用数据挖掘分析消费者交易数据

交易数据分析可以将产品之间隐含的内在固有关系挖掘出来。 对于电商企业而言,收集客户信息是数据挖掘中最关键的一环,消费者进入店铺后会产生一系列信息,对其行为进行跟踪有助于了解消费者的喜好,扩大消费者规模。 在流量为王的信息社会中,电商企业并非免费获得客户信息,需要付出推广成本、客户维护成本等,而客户的价值也并非同等重要,通过消费者交易数据的挖掘可以有效甄别客户的价值,满足消费者的个性化需求,制定差异化营销策略,挖掘消费者潜在需求点,分析产品之间的关联关系,进行捆绑销售等。

3 电商数据挖掘的具体应用

3.1 以电商平台运营目标为导向搭建指标体系

要针对电商平台进行数据挖掘,就必须从海量的运营数据中确定关键的信息数据,针对这些数据进行分析才能帮助电商企业决策者找准运营管理的关键点,提高解决问题的针对性及运营管理的科学性。 对于电商平台而言,数据挖掘的关键指标体系主要围绕消费者、销售的产品、电子商务店销及店铺的销售数据4 个方面来展开。 实际运营过程中,电商企业有着不同的生命周期,生命周期不同,电商企业的主要指标也有所不同,具体如下:

首先,电商企业创业初期主要的经营目标是获得最大化的流量,培养领袖客户群体及固化商业模式,因此该阶段需要分析客户数量、销售额两项指标,主要目的是通过转化率、利润额检测商业模式是否可行,以降低投资风险。 其次,在电商企业成长期主要运营目标是扩大客户群体,对产品及产品的呈现进行完善,改善客户体验,该阶段主要分析客户增长率及销售额增长率两项指标,主要评估消费者的回头购买率,分析消费者对产品及产品的呈现、客户服务等内容的反馈,以维护更加健康的客户关系。 再次,电商企业成熟期的主要运营目标是保持市场占有率,提高投资回报率,提高客户需求响应率,该阶段需要分析市场占有率及利润额,计算投资回报率,不断提高经营利润,分析日活跃用户量能够对消费者的黏度、品牌影响力进行检测。最后,电商企业经营衰退期主要运营目标是保持资金流,并寻找新的、可持续发展的增长点,该阶段主要分析客户生命周期价值,通过销售额检测维持运营的资金流,分析客户流失率,在留住领袖客户群体的基础上寻找商业转型升级的机会[8]。

3.2 数据分析挖掘

确定好各项关键指标后即开始针对指标所对应的数据进行分析、挖掘,电商数据挖掘包括以下几个方面。

3.2.1 客户数据分析挖掘

针对不同的数据类型选择不同的数据挖掘方法,比如从消费者数据库中分析出不同的消费群体可以采用聚类分析,该方法还可以概括出每个消费群体的消费习惯、消费模式等信息;根据消费者的性别、年龄、区域、兴趣等人口统计要素将其细分为不同的群组,针对不同区域确定不同的产品价格,或者针对不同性别、不同年龄段的消费者制定个性化的营销策略等。 还可以针对不同的客户来源对客户进行细分,比如直接访问者、通过搜索引擎登录平台者,或者通过网络广告访问平台者,就可以分为不同的群组。 此外,还可以进一步分析客户的浏览路径、停留时间等,通过用户的访问信息分析确定电商企业产品的优化策略、广告投放策略等。 除聚类分析外,还可应用关联分析方法对消费者的购买习惯进行分析,比如分析消费者的购物车,就可以得出消费者的消费倾向,分析各商品之间的联系,就可以提高捆绑营销策略的针对性等。

3.2.2 产品数据分析挖掘

针对产品进行数据挖掘主要分析产品的动览率、动销率、售罄率、退货率及货龄等指标,并根据产品被浏览点击的次数分析潜在的销售机会。 此外,针对产品还可以分析其被添加到购物车的次数、被购买的次数、产品销售额,这些可以分析产品的被购买意向及消费者对产品的接受程度;而分析产品的退货率及退货原因,则可以作为优化产品的重要参考等。 对产品进行数据挖掘可以明确电商企业当下的产品情况,有助于企业根据明星产品、畅销产品及滞销产品而调整营销策略。 此外,通过数据挖掘还可以进一步分析产品之间的关联因素,比如明星产品是否因为价格促销,或者滞销产品是否因为物流环节存在问题等,通过分析产品可以提高产品推广的针对性,并针对滞销产品调整产品线。

3.2.3 店铺数据挖掘

电商平台上入驻的各个电商企业是促进电商商品与消费者产生交易的最终场所,针对店铺的数据挖掘可以按照常规的销售逻辑进行分析:首先流量分析,即通过数据分析进行科学引流,采用方差分析法可以分析不同客户群组进店方式对店铺流量的影响,再针对不同的客户群组制定更具针对性的广告策略;其次点击率分析,消费者进入店铺后多种因素均会对其购物体验产生影响,比如店铺的界面、氛围、触及商品的便捷性等,采用聚类分析法可以挖掘消费者进店后在某个产品的停留时间及浏览路径;最后进行转化率分析,即消费者最终购买了何种商品,分析转化率可以为后续产品的打磨、服务的优化提供有效参考。

3.2.4 销售数据挖掘及运营预测分析

针对销售数据的挖掘可以综合应用聚类分析、关联分析、对比分析等多种方法,对产品的销售量、销售额、销售增长率等指标进行分析,对产品进行优化,根据分析结果调整销售策略;分析客单价、客单活跃度、回头率等,可以为客户量化模型及投资回报率计算提供参考。 运营预测可以采用方差分析、逻辑回归分析等多种挖掘方法分析消费者的购买行为、客户成长规律、行业发展趋势等信息,对电商企业的运营管理情况有个宏观的把握及预测,对营销战略的有效性做出评估,并作为下阶段运营管理战略部署的参考,进一步提高电商企业的市场竞争力[9]。

3.3 运营优化及效果跟踪

针对上述指标进行数据挖掘后,根据分析结果对运营策略做进一步优化,根据消费者来源选择更好的引流方式来扩大消费群体;分析消费者购买心理、购买行为,优化电商平台界面及服务,增加消费者黏性,提高消费者满意度及忠诚度。 通过产品数据分析针对不同群组的客户定制不同的包装、价格及营销策略;基于运营管理的角度针对行业及市场变化规律不断优化电商运营策略,做出科学决策。 最后要针对电商运营优化效果进行持续性追踪,比如促销活动对店铺流量变化的影响及规律,分析其订单数、成交额、转化率等,对促销活动的实施效果进行综合分析。

4 结语

总之,电商企业决策者希望从数据中获取更精确的有效信息,除了简单的网络营销列表外,还需更深入地了解消费者购买商品的细节性信息,以总结消费者的消费偏好、预测其后续的购买倾向,传统的结构化语言查询已无法满足越来越高的电商营销需求。 大数据时代促进了数据挖掘技术的进步,数据挖掘技术能够从海量的网络数据中快速、准确地获得更有价值的信息,理解已有的历史数据,并对消费者未来的行为进行预测。 相信随着大数据技术的不断发展,数据挖掘在电商领域的应用范围会越来越广泛。

猜你喜欢
数据挖掘规则电商
电商助力“种得好”也“卖得火”
数独的规则和演变
电商鄙视链中的拼多多
让规则不规则
基于并行计算的大数据挖掘在电网中的应用
TPP反腐败规则对我国的启示
一种基于Hadoop的大数据挖掘云服务及应用
电商下乡潮
基于GPGPU的离散数据挖掘研究