后疫情时代“直播营销”主题下网民热议焦点分析研究

2023-07-10 13:35常尚鹏
中国市场 2023年18期
关键词:后疫情时代

常尚鹏

摘 要:直播营销以视频传播为媒介,以展现产品效果为核心,基于此达到更高效的产品销售能力。后疫情时代基于互联网的直播营销模式的出现不仅丰富了互联网的内容表现形式,还拓展了传统的商业营销模式,推动国民经济高质量发展。文章以微博平台关于直播营销热议的内容作为主要分析内容,爬取了从2023年1月7日至1月11日的数据,综合利用知网停用词词库对数据进行了预处理,然后采用聚类算法建立了基聚类器,最后再对基聚类器的数据进行了综合分析。实验结果表明,在后疫情时代,群众有很多热议焦点讨论,这些讨论也会随着时间的推移影响着热点话题和舆情的发展与演变。因此,准确判断网民对热点话题的态度倾向,有助于相关部门进行相应的舆论引导。

关键词:直播营销;后疫情时代;热议焦点;

中图分类号:F713.3 文献标识码:A 文章编号:1005-6432(2023)18-0000-00

1 引言

微博作为中国热门的网络社交软件及信息甲流平台,自创建以来积累了大量用户,根据《2020微博用户发展报告》显示,在活跃用户数方面,新浪网微博月活跃用户5.11亿,日活跃用户2.24亿[1]。随着淘宝、京东、拼多多等以现场直播的方法进行销售的电商平台日益兴起,“直播营销”进入了大众视线。其中一位新疆的带货主播阿里木因为“你这背景太假了”这一话题冲上微博热搜,其账号“疆域阿力木”也彻底火出了圈,并且在一夜之间涨粉40余万,其直播间中新疆特产的带货量也直线上升。由此可知,直播营销充分显示了其打破地域空间限制的优势,对各行各业在疫情后的复业复工起到了积极作用。除此之外在政策层面上“直播营销”完美契合扶贫政策,促进了国家有针对性的扶贫战略的实施,对电商发展有着重要的战略支撑作用。

我国在线营销已成为继广告之后又一重要经济增长点。近年来,直播平台呈现爆发式增长态势,直播带货行业体量增速迅猛。疫情爆发后的隔离居家举措,促进直播行业成为了给人民群众带来生活文娱的主要平台与工具,不论是政府官方信息的宣发或是粉丝线上的直播带货活动,都使得直播行业受众群体急剧增长,以电商直播为代表的“直播+”行业也迎来了爆发。2022年12月以来,国家疫情政策进一步调整,将于2023年1月8日将新型冠状病毒感染从“乙类甲管”调整为“乙类乙管”,这是自2020年1月20日我国开始实施严格的流行症甲类防控措施后,疫情防控政策的又一次重大调整,后疫情时代开始到来[2]。在后疫情时期,电商与直播趋势不减,直播-体育,直播-文化的服务方式也日益被催生发展,而5G时代也将以更高的数据传输速率,催生出更多的直播服务方式。

综上所述,研究后疫情时代网民对“直播营销”热议焦点是十分必要的。文章采用机器学习方法对微博评论内容进行数据分析,形成数据化、语义化的特征词,同时生成词向量矩阵,并对拥有共同特征的群体进行聚类划分,不仅了解网民对热点话题的态度倾向,而且紧密跟踪、精准分析不同类别网民的情感特征,从而进行相应的舆论引导。分析热点话题的演化趋势对研究相似事件有很强的借鉴意义,比如在同类事件发生时,可以快速预测话题的情感发展趋势。

2 文献综述

当前,学术界较多学者以电子商务视频推广方式对网民的热议焦点进行了研究。在视频营销概念方面,许一婷、林颖等(2021)[3]对网络直播销售推动网民消费的内在机制展开分析,认为网络直播销售可有效地引导消费者注意力,进而推动消费。陶安等(2021)[4]则通过双渠道视角实证剖析了直播电子商务用户行为的形成机理,认为场景氛围、主播专业技术以及消费者信任感知对用户的信赖感和消费都有明显积极作用。这些专家还针对感知价值在电子商务直播活动与顾客购物意愿之间存在何种关系展开讨论。闫秀霞等人(2021)[5]就直播活动中带货对顾客购物行为产生的作用进行研究,认为顾客的购物行为主要受直播特性的影响,个性化服务是关键因素,而感知价值则在二者之间具有了桥梁功能。贾晓峰(2019)[6]通过实证研究,发现主播社会的存在与其他买家社会存在对顾客购物意愿具有间接正向作用,且对娱乐价值、功利价值以及融入意愿具有部分重要意义。

3 研究模型与框架

该方法主要包含了两个方面,首先利用中文分词第三方数据库对微博采集的信息加以预处理;然后将和方法结合,构建词向量,统计每个词语的权值,将文本转为词频矩阵[7],获取特征词和向量矩阵;最后利用机器学习聚类算法获得聚类结果。具体用到的模型如下所示。

3.1

类主要统计每一段文本中每个单词出现的频率[8],然后把文本中的词转化为的矩阵,每一行表示一段文本的词频统计结果。与词袋模型类似,其基本原理是将所有单词在不考虑语义和单词出现的顺序的情况下先将文本中每个出现过的词汇单独视为一列特征装进一个袋子里,构成一个词汇表[8],并且认为每个单词都是独立的部分。

如果只想要特定的词汇,而忽略其他的词汇,则可以在()指定词汇,产生的结果是少了该词的频率和的数值。

3.2

是一种统计方法,用来评估某个字词对某种文字语言集或文章语句库中的另一类文章的重要性水平[9]。字词的重要性将随着其在数据库中出现的频率呈反比例上升,也将会随着其在数据库中出现的次数呈反相关减少。加权的各种方式也作为对文章和用户之间检索结果的相关性水平的衡量或评估。的主要观点是:假设某個单词或者短语在某个篇章中出现的频次高,而且在其他篇章中也极少出现[10],即为该单词或短语具备了很高的级别划分功能,因此可以用来排序。实际上是:。

3.3  聚类算法

算法是聚类算法的一种代表形式,在实际聚类算法中十分普遍。一般情况下,算法首先对原型进行初始化,进而再对原型进行迭代优化计算。在计算中,簇的数量通常用表示,是一个超参数,需要人为输入来确定。的核心工作便是按照一个已经确定了的,寻找出个最优的质心,并把距离这个质心最近的数据分别配置到由这个质心代表的簇中去[11]。

给定样本集,算法针对聚类所得簇划分最小化平方误差

其中是簇的均值向量。E值在一定程度上刻画了簇内样本围绕簇均值向量的紧密程度,其值越小则簇内样本相似度越高。

3.4  肘部法则

肘部法则对于算法的值确定起到指导作用。

简要介紹一下肘部法则:轴为(误差平方和),轴为的取值。随着的增加,会随之降低,当下降幅度明显趋于平缓时[12],取该值为值。

算法将最小样本的质点间距平方误差作为目标函数,亦即各个簇的质点和簇内样本点之间的平方间距误差之和称为畸变程度。对于每一个簇而言,它的畸变程度越低,就意味着簇内成员更密集;畸变程度越高,就意味着簇内组织结构越疏松。虽然畸变程度通常都会随类别的增加而降低,但是针对具有一些区分度的资料来说[13],当超过某个临界点时畸变程度就会获得很大提高[14],随后慢慢减少,而这些临界点也可考虑用作聚集性能比较好的起点。

网民热议焦点分析的研究框架主要包括数据采集与预处理、获取热议焦点特征词与向量矩阵、聚类算法实现、热议焦点主题聚类、结果分析5个部分。

4  实验分析

4.1  数据预处理

文本数据预处理通常都要进行分词方法,分词之后就会进行双向量化的方法。在启动以前就必须要完成对中文文本的预处理过程,包含了文字清除、分词并且去掉停用词等的步骤。文字清除就是过滤掉所有中文文本中的无用文字。停用词是指文本中没有太大的实际意义但存在数量较多的功能词。文章利用知网自然语言停用词表作为停用词库,将微博文本与停用词库中的词一一对应,删除文本中与词库相匹配的词。

分词也影响着热议焦点分析的结果,本文实验中采用进行分词。分词是一个基于统计方法的分词模式,库的分词原理是:首先通过对前缀字典中的词图扫描方法研究,得到句子中汉字所有可能成词情况的全向无环图,之后再利用动态分析寻找最大概率路径,进而找到基于词频的最佳切分组合,而针对未注册词,则选择基于汉字成词方法的模式[15],最后再利用方法把关联性大的汉字组合成词组,实现分词方法。

4.2  获取特征词与向量矩阵

文本分析数据通常为以词为单元的信息。利用文本模型将文字表示成矢量,就能够把文本处理过程简化为在矢量空间中的矢量操作了。将文字转换成矢量空间后,文本的所有词汇都对应着矢量的各个属性项维度,所以各个文本中的词汇所对应的维度构成了一个空间结构,而特征权值项就是指所有词汇的每一维的取值。此外,由于文本中作为特征项的词没有重复,即因特征项互异,对文本的内部结构也无需考虑,所以特征项没有先后顺序。

计算机无法直接辨别中文文本,需将它转化为机器可识别的结构化形态,词向量训练就是以向量描述中文文本的分词结果。用高维向量表示词,并将相似意义的词置于相邻的地方,而且所使用的都是实值矢量(不局限于整数)。

4.3  聚类算法实现

聚类算法通常采用欧氏距离作为衡量数据间相似性的指标,相似性越大,距离越小。其核心思想是随机设置个初始聚类中心,依据每个数据对象与聚类中心之间的相似程度,不断地更新聚类结果,直至收敛。误差平方和是衡量聚类算法中聚类划分结果的精确度指标[16],计算公式为:

其中:为样本点,为第个聚类中心,为样本点到类的欧氏距离。误差平方和越小,表明精确度越高,聚类效果越好[16]。根据这一评价指标,本文首先构造了从循环的聚类器,同时估计特征词在该类文本中的拟合权重,计算出,同时绘制出以为轴,为轴的聚类曲线。如图2所示,曲线有3个拐点,分别为时。当小于拐点值的时候,曲线下降较快;越过拐点值后,下降趋于平缓。结合聚类算法的应用场景,聚类结果应与曲线波动率呈正相关。

4.4  获取聚类结果

执行结果如上图所示。文章依据肘部法则,发现曲线在处下降幅度较大,可以视为“肘部”。所以指定参数为10,创建分类器对象,用训练器数据weight拟合分类器模型。

5 结果分析

根据上面得出的结果可以看出,随着时间的推移,人们对于热点话题的讨论会出现明显的起伏变化。结果较大的类别,其对应的特征词大多都是当下热度最高的,比如“直播带货”“品牌营销”“互联网经济”等等。可以看出,网民热议的焦点影响着热点话题的发展和演变。跨境电商平台正作为全球电子消费市场的主要商业活动途径,同时互联网直播媒体也越来越被关注,作为企业品牌推广宣传的重要阵脚。直播营销的主要表现形式是直播,核心内容仍然是营销,直播内容质量的高低往往决定着直播营销的成功与否。品牌应坚持输出优质内容,创新直播形式,策划创新直播流程和直播环节,提高内容质量,积极探索新的营销策略,开发多元化和有深度的产品。品牌直播营销内容的策划要遵循平台规则和国家政策,避免出现违禁词和有争议的产品,做到科学绿色直播。同时,要充分了解目标销售国家或地区的文化和最新流行趋势,打造相应的直播内容。

6 结论

微博热门话题表示了网民们对现实生活问题的看法,通过识别微博热门话题可以便于网络舆情监控。对个人而言,为网络热点话题的有效监管提供了科学的分析研究方法和思路;对于国家,监管部门可以准确把握互联网变化趋势,正确引导网民态度倾向,实现精准预测、监控、引导微博舆情的目标。同时,通过跨境电商模式进行直播营销,我国的许多品牌开始走出中国、走向世界。目前,国内外各大跨境电商平台纷纷大力支持和发展直播营销业务,我国也将借此契机,创新跨境电商直播营销新模式,不断扩大影响范围。

参考文献:

[1]郭越. 融合情感的微博热点话题发现与演化分析[D].大连:大连理工大学,2021.

[2]陈芳,董瑞丰.新冠疫情防控近三年后为何回归乙类管理[N].新华每日电讯,2022-12-27(003).

[3]许一婷,林颖.网络直播营销驱动消费行为的内在机理——沉浸传播、身体媒介化与情感注入新视点[J].福建论坛(人文社会科学版),2021(12):111-117.

[4]陶安,王江涛,王京安.直播电商消费者消费行为产生机制研究——基于双渠道影响视角[J].企业经济,2021,40(11):64-71.

[5]闫秀霞,董友衡,张萌萌,乔静.直播带货对消费者购买行为的影响研究——以感知价值为中介[J].价格理论与实践,2021(6):137-140.

[6]贾晓锋.电商直播平台消费者购买及融入意愿研究[D].北京:北京邮电大学,2019.

[7]彭争,唐东明.基于文本分类的农业种植信息集成推荐方法研究[J].西南民族大学学报(自然科学版),2018,44(1):69-74.

[8]黄琨,李建敦,何超,等.商品虚假评论的检测及可视化研究[J].福建电脑,2021,37(9):15-18.

[9]李楚.基于TF-IDF算法的文本量化方法及作者识别应用[J].现代信息科技,2022,6(19).

[10]王心仪,程剑锋,刘育君.基于TF-IDF加权朴素贝叶斯算法的ATP车载设备测试案例分类研究[J].铁路计算机应用,2022,31(12).

[11]孙颖,张毅,丁卫平,等.基于近似骨架和混合蛙跳算法的方法及其在眼底病历图像中的应用[J].南通大学学报(自然科学版),2020,19(2):36-42.

[12]李贺,谷莹,刘嘉宇.数据驱动下基于语义相似性的产品需求识别研究[J].情報理论与实践,2022,45(5):99-106.

[13]张娟.基于聚类算法的5G终端客户价值分析[J].电信快报,2020(9):29-33.

[14]蔡军,谢航,谢涛,等.基于改进K-Means++分时电量聚类与行业用电行为分析[J].科学技术与工程,2021,21(27).

[15]刘为怀,才华,何东杰.一种基于中文分词和数据聚合的餐饮行为特征挖掘方法[J].软件产业与工程,2015(4).

[16]王惠惠,董永权,和文斌,等.基于聚类集成的学生群体画像构建[J].江苏师范大学学报(自然科学版),2022,40(3):46-50.

猜你喜欢
后疫情时代
论后疫情时代电视剧的创作生产
文艺界委员建言“后疫情时代”创作(关注两会)
下好“后疫情时代”的“先手棋”(观察家)
“后疫情时代”湖南乡村旅游发展创新及金融支持
后疫情时代,教育应如何转型?