祛痘类产品市场需求与挖掘分析
——以郑州市为例

2024-01-04 08:28管梦妮
北方经贸 2023年12期
关键词:潜在用户祛痘群体

管梦妮

(安阳师范学院数学与统计学院,河南 安阳 455000)

随着社会的发展,人们的消费理念发生了较大变化,“颜值”经济时代,人们更加重视仪容仪表。调查显示,中国约83%的居民曾存在不同程度的青春痘,95%的年轻居民存在粉刺、痤疮、毛孔粗大等肌肤问题,痘肌问题位于消费者皮肤问题的榜首,祛痘类护肤产品顺势成为近年来药妆销售前列。因此,研究消费者在购买祛痘类护肤产品时的行为特征,包括对产品价格、成分、功效、安全性、知名度等因素的关注程度,对于拓展市场份额具有重要的现实意义。

一、基于文本挖掘的问卷设计

互联网经济大发展的条件得天独厚,网购成为人们购物的主流方式之一,所占比重迅速增长,网购的快速发展与全民网上消费习惯形成正反馈制。数字化时代,网络上留下的文本评论成为研究的重要数据资源。网购时,消费者购买并使用产品后在卖家商品评论区的反馈构成了对于产品使用的真实感受及效果评价。淘宝和京东作为两大互联网电商巨头,其内含的海量评论数据具有一定的代表性。本文利用Python 软件爬取淘宝、京东平台上有关祛痘产品价格及评论的原始数据,并对原始数据进行清洗。中文分词工作通过Rstudio 软件进行,使用词云图等文本挖掘方法,实现对文本评论数据隐藏信息的挖掘与分析,提取出高频词并画出词云图,从而对样本人群购买祛痘类产品的现状和主要重视因素进行初步探讨。在图1 中,词频越高,词的字号就越大。根据词云图分析发现,真正吸引用户的是产品自身的品质效果,由此为设计问卷提供思路。

图1 词云图

图2 随机森林示意图

基于文本挖掘结果,设计调查问卷包括六个维度,分别为:被调查者的基本情况、是否存在长痘困扰、产品购买意愿、了解渠道(多选题)、影响购买的因素(矩阵量表题)、市场满意度及发展建议。

为了验证整个问卷的信度和效度,经过计算得到问卷整体值为0.92,说明问卷通过了信度检验,具有较强的可靠性、一致性。检验和球形检验结果显示,值为0.88,球形检验显著性为0.00,说明问卷通过了效度检验。

二、基于随机森林模型的影响因素分析

一款祛痘产品的推出要有后续的销量和盈利,最主要的是它能够持续地满足消费者的某些特征需求。但特征需求因不同消费者身份等自身因素的不同而异,根据不同消费者的关注点,进一步探究祛痘产品的持续发展因素。

本部分依赖于矩阵量表问题:“如果您购买祛痘护肤品,请您根据自身的重视程度对以下因素进行选择”,影响因素包括基本特征(品牌、价格、包装、气味)、使用效果(安全性、产品效果)、相关合作(明星代言、是否与医疗合作)三个维度八项子指标,对于每一个陈述性描述,参考李克特五级分类量表,设置答项为“不重视、不太重视、一般重视、比较重视、十分重视”。根据样本群体对祛痘类产品影响因素的重视程度,研究消费者的特征需求。

(一)模型构建

随机森林算法是通过从原始数据集N中不断有放回地、重复随机地抽取k个样本,以生成新的训练样本集合。因为是有放回抽样,所以有些样本会被重复抽取,同时随机漏掉一部分样本,经过采样后的训练集样本大小通常为原始样本大小的三分之二。在此基础上,每个训练集分别建立决策树,新数据的分类结果根据分类树上的票数决定。

随机森林算法本质上是一种改进的决策树算法,包含多棵决策树并将它们结合起来,每棵决策树都是建立在一个独立样本上的,且森林中每棵树的分布相同。其类误差依赖于每棵树的分类性能以及树与树之间的相互关系,并对各种情形下产生的误差进行对比,识别内在估计的误差、分类效果和相关性等,克服决策树容易过拟合的问题,减小预测方差,使得预测值不会因训练数据的小变化而剧烈变化。随机森林的特征选择是根据随机原则来分裂各个节点。具体实现过程如下:

输入:训练集

S={(xi,yi),i=1,2,...n},(X,Y)∈Rd×R;

待测样本xt∈Rd;

For i=1,2,3,...,Ntree;

Step1:对原始训练集S使用bootstrap抽样,生成训练集Si;

Step2:使用Si生成一棵不剪枝的树,在树的每个节点处从总体的M个特征变量中随机抽取m个特征(m<M),依据Gini指标从各节点选择分类能力最好的特征;节点分裂直到达到生长上限。

End

输出:树的集合{Hi,1,2,3,...,Ntree};

对待测样本xt,决策树Hi输出Hi(xt)

(二)模型结果

模型的因变量为被调查者是否使用祛痘类产品,自变量为购买祛痘产品的影响因素。进入模型的自变量共有八个,分别为品牌、价格、包装、气味、安全性、产品效果、明星代言、是否与医疗机构合作。本文将数据集以7:3 的比例进行随机抽样,将原始数据集划分成训练集和测试集,利用训练集来对模型进行训练。

针对模型,利用Python 软件绘制变量重要性排名(如图3 所示)。

图3 变量重要性排名

图的索引值对应变量如表1 所示。

表1 索引值对应变量表

根据随机森林模型结果可知,人们在选择是否购买祛痘产品时考虑的因素按照重要性排序依次为:安全性、产品效果、明星代言、是否与医疗机构合作、价格、品牌、包装、气味。

安全性作为消费者第一重要因素,产品所包含成分的安全性、是否会引起皮肤二次过敏或者其他不良反应,直接影响消费者的购买选择,因此确保安全性是一款产品在市场中打下根基的前提。产品效果是检验一款产品质量优劣的标准,尤其对于功效类护肤品,能产生显著效果的往往更受青睐。明星代言在流量为王的时代能够制造话题引流,提高产品知名度。与医疗机构合作,能够提高品牌的权威性、专业性,一定程度上能够提高产品的安全性。价格作为影响因素,反映了经济学中的“需求定律”,对于正常品而言价格过高,那么市场的需求量不会高。品牌方面体现了经济学原理中的“替代效应”,当产品几乎完全同质的情况下,那么选择任意一种都能够达到相同的效果,而并不局限于某一特定的品牌。包装、气味是消费者在进行决策时最不看重的因素,只要产品效果好,可以弥补包装、气味方面的不足。

(三)模型检验

利用训练集得到分类模型后,将测试集数据代入模型,以检验随机森林模型预测的准确性,利用Python 软件绘制出ROC 曲线(如图4 所示)。

图4 ROC 曲线

图5 潜在客户特征分析图

一般情况下,AUC 的值越高,分类器越好,预测效果越好。最终计算出随机森林模型的准确率为94%,效果较好,进一步证明结果的准确性,说明研究结果具有较高的可靠性。

三、基于聚类的潜在用户挖掘

(一)模型建立

1.潜在用户定义

为提出更有针对性的建议,以便为企业提供参考,需要对潜在客户进行挖掘。本文对于潜在用户的定义为:“有购买某种产品或服务的需要并且具有一定的购买能力,对产品在当下或者未来的某一段时间所提供的功能有需求的用户。”调查问卷显示,有一部分被调查者存在长痘困扰但暂未使用过祛痘产品或不了解相关类型产品,将这一部分群体视为目前最有可能挖掘到的潜在客户群体。通过建立潜在客户价值模型,利用聚类分析识别并挖掘有价值的潜在客户。

2.聚类因子的选取

针对潜在用户进行聚类分析,因此先选取问卷中针对非用户的问题。理论上,所有非用户群体均应被视为潜在用户,但为了挖掘出更有可能购买产品的用户群体,针对问卷问题:“您没有使用祛痘护肤品的原因”进行潜在客户的筛选。

选取六个因子进行聚类分析,分别为:行业(business)、肤质类型(skin type)、饮食习惯(dietary habit)、熬夜频率(frequency of staying up late)、化妆频率(makeup frequency)、特征重视度(feature value),并分别记为:B、S、D、L、M、F。

表2 潜在客户任务指标含义表

其中B、S、D、L、M对应问卷中被调查者基本情况部分的题目,F 为问卷中矩阵量表问题(此部分与第二部分随机森林模型分析所用的为同一量表),通过将问题答项依次赋值为1、2、3、4、5,计算得到特征重视度,并假设特征重视度值越高,购买意愿越强,成为潜在用户的可能性越大。

(二)模型结果

模型结果包括两部分:第一部分根据上述六个指标的数据,对客户做聚类分群;第二部分结合具体项目对客户群进行特征分析,分析客户价值,并对每个客户群进行排名。

1.潜在客户聚类

借助SPSS 软件进行聚类分析,将潜在客户分为三类(具体划分如表3 所示)。

表3 潜在客户类型聚类中心表

2.潜在客户价值分析

针对聚类结果进行特征分析,如图4 所示,分别分析三个客户群在各个属性上的情况,从而总结出每个客户群的特征。

根据潜在客户类型聚类中心表和特征分析图,发现每个客户群都有显著不同的表现特征,基于该特征描述,将潜在用户分成三类:重要潜在客户、重要发展客户、次要潜在客户。对每类潜在客户所具备的特征进行如下分析:

重要潜在客户。这类潜在客户是第Ⅰ类潜在客户,该群体主要是学生,油性肤质且饮食习惯非常不健康,偏好油炸、辛辣食物,并且总是熬夜,总是化妆。通过分析,这类客户是非常重要的潜在客户,在未来存在很大可能性会成为购买祛痘类产品的群体。学生群体在产品选择方面也许会存在更挑剔的要求,对产品的效果、安全性要求较高。针对此类学生群体,企业需从产品质量方面着手,重视产品效果,同时降低价格,生产具有高性价比的产品,扩大学生消费群体总量,实现整个市场份额的增量扩容。

重要发展客户。这类客户是第Ⅱ类客户,该类客户针对金融信息行业,混合肤质且饮食习惯较不健康,经常熬夜,经常化妆。这类客户是比较重要的潜在客户,且对产品效果也有所要求。与第一类客户不同的是,该客户类群主要包含上班族,具有一定的消费和购买能力,对于产品品质追求更高。因此针对该类客户,需要研发特色产品,达到效果的同时提高产品辨识度,只有更加专门化、细分化的品牌才能稳稳抓住产品变革的新机会,成为激烈竞争中脱颖而出的赢家。另外,有针对性的营销宣传对于增加品牌认知具有一定的促进作用。

次要潜在客户。这类客户是第Ⅲ类客户,主要是除了学生和金融信息群体之外的其他行业群体。该类用户主要是干性混合肤质且饮食习惯比较健康,偶尔熬夜,偶尔化妆。这类客户群对祛痘类产品的购买意愿比较一般,生活习惯相对较好,针对该类客户,企业可以考虑适当增加产品在其他方面的功效,比如美白、抗衰等,进而达到刺激消费的目的。

四、结论与建议

本文通过对祛痘类产品市场需求调研及潜在用户挖掘分析得出如下结论:第一,长痘人群较为年轻化,年轻群体祛痘需求更多,初次长痘年龄为10~18 岁的占比为71%,19~25 岁的占比17%。第二,产品了解渠道多样化,其中线上平台小红书、抖音占比分别达到76%、53%。第三,基于随机森林模型的购买影响因素重要性排名发现,安全性和产品效果排名前两位。第四,学生群体、油性肤质人群、化妆频率较高的群体对于祛痘产品的需求更多。第五,祛痘产品市场整体满意度不高,主要表现为产品效果不明显、虚假宣传、价格过高。基于以上结论,提出以下建议:

(一)重视产品安全性和产品效果,形成用户忠诚度

问卷显示,存在长痘困扰的被调查者占比达70%,痘肌群体中,选择购买祛痘产品的占比为70%,且其中又有80%会根据产品体验情况选择复购。因此,市场需求空间广阔,企业在保证产品自身核心配方的同时需要不断适应时代变化,研制更加安全、高效、值得信赖的产品,提高用户忠诚度,延长产品生命周期。

(二)产品主要功效标识更加直观,提高用户及潜在用户购买欲望

痘肌群体中,还存在40%比例的人群态度为顺其自然、放任不管,那么这部分群体可能成为潜在用户。由于对长痘的了解程度会影响消费者的购买欲望,因此企业在广告中可适当提及产品主要功效及适合的人群特征,可以增加有相应特征的人群和潜在用户联系自身情况,考虑祛痘产品的使用效果选择有针对性购买。

(三)加大线上平台宣传力度,通过明星代言、直播带货等提升品牌知名度

问卷显示,76%的被调查者表示通过新媒体社交平台了解祛痘产品相关讯息,因此,建议该类产品的广告营销多从新型网络平台进行宣传。另外,随机森林模型结果发现,明星代言对于消费者是否购买一款祛痘产品的重要性排名第三,因此,可以适当邀请流量明星、知名演员等公众人物代言或者通过网络短视频平台直播带货,增加产品在新媒体社交平台的宣传力度,通过直播环节与消费者互动,促进消费者对产品功效的了解,利用“名人效应”实现精准营销。

(四)推出差异化及多功效产品,同时严控产品价格

本次调查发现,针对不同的用户群体及可能成为用户的潜在群体,企业需要充分挖掘需求特征,研发面向特定需求的差异化产品,提高品牌辨识度,扩大品牌影响力。另外,除了祛痘需求之外,消费者可能存在的其他的护肤需求为补水保湿、祛除痘坑痘印、修复敏感肌、美白等。其中补水保湿、祛除痘坑痘印需求处于第一梯队,占比分别为62%和61%;修复敏感肌、美白需求处于第二梯队,占比分别为51%、50%。最后,在产品价格上,选择价格200元以内、200~500 元、500 元以上的被调查者占比分别为70%、25%、5%,说明价格接受度普遍较低。在功效为王的消费特征需求下,企业需研发差异化及多功效产品,探索新兴商业应用模式,在保证产品效果的同时严控产品价格,以提升市场份额,开启新增长蓝海。

猜你喜欢
潜在用户祛痘群体
红蓝光祛痘仪联合复合酸焕肤凝露治疗痤疮的临床效果
UPLC-MS/MS法检测祛痘类化妆品中喹诺酮类成分
基于4C理论的档案潜在用户转化策略研究
通过自然感染获得群体免疫有多可怕
社交媒体环境下档案潜在用户转化研究
基于客户关系管理的档案潜在用户转化探析
“群体失语”需要警惕——“为官不言”也是腐败
春季“危”肌严重,祛痘产品市场潜力巨大
几种中药挥发油对祛痘凝胶中连翘苷的促渗作用比较研究
谈谈档案潜在用户