大数据视角下欧莱雅(中国)的用户画像分析

2018-10-19 07:34秦仲篪庄穆妮
长沙大学学报 2018年5期
关键词:影视节目中端欧莱雅

秦仲篪,庄穆妮,管 慧,李 勇

(长沙学院经济与管理学院,湖南 长沙 410022)

我国化妆品行业的销售量在过去十年内以平均每年7.2%的速度增长.2017年市场销售额达到3581亿元,增幅达到了12%.同时,人均化妆品的消费支出更是从2011年的27.81美元逐渐增长到2017年的74.6美元.法国欧莱雅、日本资生堂、美国宝洁和英国联合利华等知名化妆品企业竞相追逐中国高利润的化妆品市场.欧莱雅(中国)集团既需把握中国市场的巨大机遇,又要应对各世界级的品牌挑战,怎样合理利用互联网的营销手段、深度挖掘产品的用户需求,成为提升品牌价值、增强市场竞争力的有效手段.

大数据环境下的用户画像分析是近年来深度挖掘用户需求的重要方法.国内外学者不断关注用户画像方面的研究,其中用户画像精准营销是当前研究的热点.Zoratti S等[1]提出了如何利用数据挖掘事物间的关联性并应用到精准营销的过程中; Kennedy D S[2]从移动互联网的角度提出精准营销的具体实施方法;Zhen Y等[3]提出了精准营销的决策框架,通过识别不同类别客户之间的潜在特征,提出适当的精准营销策略.用户画像技术还逐步涉及个性化搜索[4]、城市计算[5]、预测用户年龄[6]、兴趣爱好[7]、性别[8,9]、地理位置[10-12]等.

本文将对欧莱雅(中国)集团不同品牌的化妆品,根据目标市场不同的需求特征,进行用户画像分析.为制定精准的营销方式,迎合不同消费者的需求提供依据.

1 欧莱雅(中国)用户画像构建的数据处理

用户画像是根据用户社会属性、消费行为和生活习惯等信息抽象出的标签化的用户模型.所谓标签,是最能代表或者表达一段信息核心和标识.构建用户画像主要包括准备和成型两个阶段.

1.1 欧莱雅(中国)用户画像构建的数据准备阶段

构建用户画像首先要获取用户的行为数据,例如互联网中各大网站的用户访问日志,记录了用户在网站上一系列的浏览、跳转、搜索、点击等行为轨迹;还可以利用网络爬虫技术,爬取用户在全网的信息轨迹,再根据关联规则,联系到用户的行为偏好,完善用户画像模型,提高预测用户潜在需求的概率.除此之外,还需要用户的个人信息,例如姓名、性别、年龄、职业、收入、ID地址、用户所在地、个人描述、头像等基本信息.再对以上用户画像数据进行训练,利用数据挖掘算法模型抽取用户标签,构建用户画像标签体系.

据公开资料显示,新浪微博用户有5亿多注册用户,在用户注册的过程中,新浪微博对用户的基础信息进行了收集,例如昵称、性别、年龄、职业、关注类别、兴趣标签等等,但这些弱关系数据还不足以构建一类人或一群人的用户画像,因此,本文的数据来源除了新浪注册用户的基本信息,还包括新浪微博热门话题数据,通过数据爬虫技术和微博指数进行数据收集、统计和分析.

据此,本文以新浪微博为数据采集对象,主要通过八爪鱼工具对微博有关欧莱雅旗下主要化妆品的博文进行数据爬取,由于欧莱雅旗下品牌众多且产品线复杂,不利于后期数据分析工作,因此本文分别提取欧莱雅旗下高端、中端和大众品牌的相关数据,选取“赫莲娜”和“兰蔻”作为高端产品线样本,选取“碧欧泉”和“理肤泉”作为中端产品线样本,选取“巴黎欧莱雅”和“美宝莲”作为大众产品线样本.

以“赫莲娜”、“兰蔻”、“碧欧泉”、“理肤泉”、“巴黎欧莱雅”、“美宝莲”作为搜索关键词,采集2017年3月1日0时至2017年3月31日24时这一时间段的微博数据,并将数据采集结果保存至Excel表格中.本文共采集了14个字段,主要涉及微博用户发布的信息及内容等,数据采集结果如下图1所示.

图1 微博数据存储界面

1.2 欧莱雅(中国)用户画像构建的数据成型阶段

承接上一阶段,最终采集到微博数据共43751条.首先删除无效微博数据,例如空数据或残缺数据;其次,删除无效的广告数据,即删除借由“赫莲娜”、“兰蔻”、“碧欧泉”、“理肤泉”、“巴黎欧莱雅”、“美宝莲”品牌热度而发布的广告微博.对以上这些不相关的数据进行筛选和清洗,最终得到有效微博数据42468条.

通过数据预处理,集成数据仓库,对数据进行描述性统计分析和分类数据统计,再进行可视化,本文的用户画像可视化主从要以下几个操作流程来实现,具体流程如下图2所示.

图2 数据可视化模型实现流程

首先根据预处理的数据,分析用户语义画像,分析移动端用户的网络业务类型,再根据流量业务跳转规律和用户上网偏好分析,用特定的数据结构将用户画像数据存储在数据库中,然后选择相应的数据可视化工具,将可视化数据转化成JSON格式并存储.

2 大数据视角下欧莱雅(中国)用户画像构建

2.1 欧莱雅(中国)高端化妆品用户画像构建可视化

将采集到的与“赫莲娜”、“兰蔻”、“碧欧泉”、“理肤泉”、“巴黎欧莱雅”、“美宝莲”相关的42468条微博数据、40397位微博用户进行分类统计,其中与“赫莲娜”和“兰蔻”有关的微博数据有14382条,相关用户13679位.

2.1.1 关注欧莱雅(中国)高端化妆品的用户年龄可视化

关注“赫莲娜”和“兰蔻”品牌的13679位用户中,95后占比达到了26.2%,TGI指数达到了1.2;90后次之,占比为24.9%,TGI指数为0.96;85后占比为15.6%,TGI指数为1.08;80后和00后占比分别为9.3%和15.5%,TGI指数分别为1.03和0.9.

图3 高端化妆品用户年龄分布

2.1.2 关注欧莱雅(中国)高端化妆品的用户诉求可视化

通过功能词的挖掘与分析,可以发现目标用户中,除了“美白”、“保湿”、“补水”、“护肤”等基础性的关键词之外,还出现了“除皱”、“抗初老”、“抗氧化”、“祛黄”等关键词.对这类用户诉求的关键词进行统计后,利用Tagxedo可视化工具进行处理,得到高频功能词(频次50以上)可视化如图4所示.

图4 高端化妆品用户需求可视化图

2.1.3 关注欧莱雅(中国)高端化妆品的用户兴趣可视化

根据该类型用户的兴趣标签,对美容类感兴趣的用户占大多数,达到了76.5%;其次是医疗和服饰,分别占比48.6%和54.2%;时尚占比为40.8%;美食、教育和科技不相上下,平均占比为35%.

图5 高端化妆品用户兴趣标签可视化图

2.1.4 关注欧莱雅(中国)高端化妆品的用户购买渠道可视化

根据该类用户所提及的购买渠道关键词,该类用户在商场专柜和丝芙兰店铺购买的比例为46%;紧接着是天猫淘宝等电商平台,购买比例为43.8%;海外代购和免税店的购买比例也较高,达到了34.2%;通过屈臣氏、娇兰佳人和万宁等连锁店的购买比例为9%;占比最低的是超市开架和网红店铺,分别为4.1%和2.9%.

图6 高端化妆品用户主要购买渠道可视化图

2.1.5 关注欧莱雅(中国)高端化妆品的用户关注的影视节目可视化

在爬取数据的过程中,本文发现,大部分的用户喜欢提及正在热播的影视节目,虽然话题有一定的时效性,但是可以通过数据分析发现不同类别的用户喜欢的影视类型.据统计,该类用户提及前十的影视节目如下:《我是歌手》提及465次;《快乐大本营》提及274次;《欢乐喜剧人》提及132次;《一条狗的使命》提及112次;《跨界歌王》80次;《鸡毛飞上天》提及73次;《天天向上》提及71次;《人民的名义》提及51次;《奇葩说》提及46次;《朗读者》提及8次.

图7 高端化妆品用户主要关注度最高的影视节目可视化图

2.2 欧莱雅(中国)中端化妆品用户画像构建可视化

与“碧欧泉”和“理肤泉”有关的微博数据有9562条,有关微博用户9046位.

2.2.1 关注欧莱雅(中国)中端化妆品的用户年龄可视化

9046位目标用户中,90后占比达到了27.9%,TGI指数达到了1.28;95后次之,占比为24.4%,TGI指数为0.84;80后和85后的比例分别为10.6%和16.5%,TGI指数分别为0.75和1.09;00后占比位13.6%,TGI指数为0.97.

图8 中端化妆品用户年龄分布

2.2.2 关注欧莱雅(中国)中端化妆品的用户诉求可视化

通过功能词的挖掘与分析,可以发现目标用户中,对化妆品的需求除了基础性功能之外,“祛痘”、“粉刺”、“敏感”、“药妆”等这类关键词的比例在升高,利用Tagxedo可视化工具进行处理,得到高频功能词(频次50以上)可视化如下图9所示.

图9 中端化妆品用户需求可视化图

2.2.3 关注欧莱雅(中国)中端化妆品的用户兴趣可视化

根据该类型用户的兴趣标签,对美容类感兴趣的用户依然占大多数,达到了56.5%;其次是影视和时尚,分别占比为45.7%和41.3%;美食占比为40.5%.

图10 中端化妆品用户兴趣标签可视化图

2.2.4 关注欧莱雅(中国)中端化妆品的用户购买渠道可视化

根据该类用户所提及的购买渠道关键词,可以发现,该类用户最喜欢在天猫淘宝等电商平台购买欧莱雅产品,提及的比例是43.7%;海外代购和免税店的提及率也比上一类人群高,增幅为6.4%,总体达到了40.6%;专柜购买率较上一类人群有所降低,比例为36.2%;通过屈臣氏、娇兰佳人和万宁等连锁店的购买比例为25%;超市开架和网红店铺依然不受欢迎,分别为3.9%和6.4%.

图11 中端化妆品用户主要购买渠道可视化图

2.2.5 关注欧莱雅(中国)中端化妆品的用户关注的影视节目可视化

图12 中端化妆品用户主要关注度最高的影视节目可视化图

经统计该类用户提及前十的影视节目如下:《我是歌手》提及362次;“东七门”及《奇葩说》提及212次;《天天向上》提及97次;《向往的生活》提及78次;《快乐大本营》提及63次;《爱乐之城》提及45次;《王牌对王牌》提及38次;《人民的名义》提及31次;《最强大脑》提及21次;《盗墓笔记》提及14次.

2.3 欧莱雅(中国)大众品牌化妆品用户画像构建可视化

与“巴黎欧莱雅”和“美宝莲”有关的微博数据有18524条,有关微博用户17672位.

2.3.1 关注欧莱雅(中国)大众品牌化妆品的用户年龄可视化

17672位目标用户中,95后占比达到了34.2%,TGI指数达到了1.6;90后次之,占比为25.8%,TGI指数为0.94;00后的比例为19.3%,TGI指数为1.49;85后和80后的关注用户明显减少.

图13 大众品牌化妆品用户年龄分布

2.3.2 关注欧莱雅(中国)大众品牌化妆品的用户诉求可视化

通过功能词的挖掘与分析,可以发现目标用户中,对化妆品的诉求主要是“包装”、“控油”、“持久”和“平价”等.对这类用户诉求的关键词进行统计后,利用Tagxedo可视化工具进行处理,得到高频功能词(频次50以上)可视化如图14所示.

图14 大众品牌化妆品用户需求可视化图

2.3.3 关注欧莱雅(中国)大众品牌化妆品的用户兴趣可视化

根据该类型用户的兴趣标签,和前两类一样对美容类最感兴趣,达到了64.3%;其次是网红和二次元,分别占比为56.5%和49.2%;服装和文学紧随其后.和前两类用户兴趣可视化图相比,美容和服饰依然是主要兴趣,同时该类用户更加关注网红和二次元;其次该类用户出现了对文学和摄影方面的兴趣.

图15 大众品牌化妆品用户兴趣标签可视化图

2.3.4 关注欧莱雅(中国)大众品牌化妆品的用户购买渠道可视化

根据该类用户所提及的购买渠道关键词,可以发现,该类用户最喜欢在天猫淘宝等电商平台购买欧莱雅产品,提及的比例是53.7%;其次是屈臣氏、娇兰佳人和万宁等连锁店,提及率较前两类人群大为提升,比例为42.8%;专柜购买比例为34.2%;海外代购和免税店的提及率有所下降,比例为28.6%;超市开架的比例为26.9%;网红店铺也有所提升,比例为13.7%.

图16 大众品牌化妆品用户主要购买渠道可视化图

2.3.5 关注欧莱雅(中国)大众品牌化妆品的用户关注的影视节目可视化

图17 大众品牌化妆品用户主要关注度最高的影视节目可视化图

经统计该类用户提及前十的影视节目如下:《快乐大本营》提及427次;《向往的生活》共提及368次;《天天向上》提及261次;《我是歌手》提及123次;《银魂》提及117次;《奇葩说》提及89次;《鸡毛飞上天》提及78次;《人民的名义》提及47次;《盗墓笔记》提及42次;《朗读者》提及36次.

3 欧莱雅(中国)用户画像特征分析

3.1 欧莱雅(中国)高端化妆品用户画像特征分析

欧莱雅(中国)的高端、中端、大众品牌化妆品的用户有较为明显的年龄分布特点.在高端化妆品用户中,主要为80后和85后人群,这类用户已有一定的物质基础,且随着年龄的增长对化妆品的品质和功能提出了更高的要求,因此80后和85后是高端化妆品的忠实顾客;在用户诉求方面,不同层次的化妆品用户对功能的要求也有所区别.高端化妆品用户除了看重产品的基础功能外,更看重产品的“除皱”、“抗初老”、“抗氧化”、“去黄”等特点,且愿意付出更多的资金来追求“抗衰老”和“逆龄”的效果,这与用户的年龄层次和消费能力基本匹配;关注欧莱雅(中国)三个层次的化妆品用户中,无一例外地对美容方面最感兴趣,在高端用户中,除了美容外,最感兴趣的话题是医疗和服饰,其中,医疗方面的兴趣更加体现了用户层次的特点,可以推断出该类用户更加关注医疗健康和医疗美容,尤其是美容院和整形院是该类用户常去的场所之一;其次,高端化妆品消费者在购买渠道方面的选择上也有较为明显的区别,高端化妆品用户最喜欢到商场专柜和丝芙兰店铺购买,网购和免税店的比例也较高,但对于屈臣氏、娇兰佳人等连锁超市而言,该类人群购买的比例大大降低,且一般不会去超市开架和网红店铺购买;在影视节目的选择上,高端化妆品用户最喜欢看综艺类节目,其中湖南卫视歌唱类综艺节目最受欢迎,例如“我是歌手”,其次,都市类电视剧和文化情感类综艺也深受此类用户的追捧.

3.2 欧莱雅(中国)中端化妆品用户画像特征分析

在中端化妆品的用户中,85后和90后是主要人群,这类消费者刚步入社会不久,对化妆品有一定的要求,因此中端产品是他们的不二选择;该类用户更关注产品的“祛痘”、“祛粉刺”、“抗敏”、“药妆”等特点,这与理肤泉品牌主打的药妆功能相匹配;在用户兴趣方面,中端用户除了美容外,对影视和时尚最感兴趣,根据该类用户的年龄层次特点,该类用户大都受过高等教育且受过一些欧美文化的熏染,喜欢电影、咖啡、时装周等有品味、情趣和格调的小资生活,除此之外,该类用户对医疗方面的兴趣也较大,是美容院和整形院的主要消费人群之一;在购买渠道方面,中端化妆品用户的主要购买渠道是网购和代购及免税店,专柜购买比例有所下降,屈臣氏、娇兰佳人等连锁超市的购买人群虽然比高端化妆品消费人群有所增加但总体比例不高,依然不会选择去超市开架和网红店铺购买;在影视节目的选择上,中端化妆品用户最喜欢综艺类节目,在最受欢迎的前十个影视节目中综艺类节目占了七项;其次,该类用户对音乐剧爱情电影和悬疑惊悚类电影比较感兴趣,符合该类用户喜欢去电影院的特征.

3.3 欧莱雅(中国)大众品牌化妆品用户画像特征分析

在大众品牌化妆品用户中,主要为95后和00后人群,这类用户大部分为学生群体,消费不起中高端的化妆品,加上没有太大的皮肤问题,因此是大众品牌化妆品的主要消费人群,同时,在用户画像构建中发现一个很有意思的现象,最关注高端化妆品的用户不是80后和85后这类忠实用户,而是95后和00后这类大众品牌的化妆品用户,可以发现,虽然95后和00后尚未有较高的消费能力,但随着消费观念的升级和网络营销号的鼓吹,95后和00后极有可能在步入社会后成为高端化妆品的忠实粉丝;在诉求方面,大众品牌化妆品用户更加关注产品的“包装”、“控油”、“持久”和“平价”等特点,基本符合95后和00后人群的消费特征;在用户兴趣方面,除了美容外,对网红和二次元最感兴趣,随着网红经济的发展,推动了“小咖秀”、“快手”、“抖音”等搞怪作秀的视频软件的兴起,这类学生群体最容易受新事物的影响,且是这类视频软件的主要用户,正由于95后和00后是互联网时代成长起来的一代,对“虚拟世界”衍生出的动画、动漫、游戏、小说、虚拟偶像、网游等二次元文化十分热爱,且其他年龄层次的用户无法轻易融入这一类小众文化当中,因此十分符合该类用户的特点.在购买渠道上,该类用户的主要购买渠道是网购和屈臣氏等连锁超市,超市开架的比例也较高;专柜购买的比例有所下降,该类用户比较愿意去网红店铺购买化妆品,在影视节目的选择上,依然最喜爱综艺类节目,最受欢迎的前四个影视节目都来自湖南卫视;其次,该类用户对网络连载动漫比较感兴趣.

4 结论

本文以大数据背景下欧莱雅的用户画像为研究对象,通过八爪鱼工具对新浪微博进行数据采集,对有关欧莱雅旗下不同档次的化妆品用户进行数据挖掘与分析,再通过构建用户画像对不同的消费者进行消费行为可视化,在此基础上进行用户画像分析.对用户的潜在需求更多维度地进行精准画像,不断提升营销、客户维系和售前、售后服务的精准性,不断为欧莱雅业务发展和公司品牌形象的改善添砖加瓦,不断为大数据时代化妆品企业的发展降本增收.

猜你喜欢
影视节目中端欧莱雅
秘书、文书、档案基本任务与网络化管理
影视节目对大学生旅游动机的影响
——以黑龙江工程学院
以《中国诗词大会》为例浅析中国电视节目创作模式的变化
同质化严重 寿险中端市场几乎空白
中端酒店迎来了春天?
影视节目“东北方言热”现象探析
中端单反搅局者 佳能77D
新生代独立女性张天爱正式加入巴黎欧莱雅明星梦之队
气象影视节目的现状和未来发展方向
全球超模超新星成为巴黎欧莱雅全新代言人