杨佳明 张甜
摘要:随着互联网的飞速发展,电商带货逐渐兴起,但亿万销售额的背后商品质量不能得到有效保障。本文利用机器学习的相关算法和基于词典的文本情感分析模型,对电商直播销售产品过程进行分析,通过合理的可视化分析结果来给消费者更加透明的消费选择,从而选择性价比更高的产品。
关键词:电商直播带货;弹幕;评论;机器学习;情感分析
0引言
在互联网时代的今天,电商带货逐渐兴起,其销售额常一夜亿万,商品质量却不能得到有效保障。据统计[1],截止2020年12月,我国电商直播用户规模达到3.88亿,占网民总体的39.2%。为保证电商产品的质量问题,急需对直播产品进行合理性分析。本研究基于支持向量机算法(SVM)和词典的文本情感分析模型,对用户评价进行展示和分析,给消费者更加透明直观的消费选择。
1支持向量机算法(SVM)介绍[2]
2系统的总体结构(图2.1)
3基于支持向量机的文本弹幕处理步骤
3.1训练集和测试集划分
按照正类负类分层采样,正:负=3:1;
3.2模型训练和结果
基于python语言和sklearn的svm库,运用机器学习的支持向量机算法进行训练;并运用模型进行预测,正类为1,负类为0。
4基于词典的文本情感分析模型
4.1词典类型
正/负类词典、程度副词词典、停用词词典、否定词词典。
4.2基于词典的情感值计算规则
先判断分词结果;再看否定词;随后看程度副词,根据程度高低依次分配权重1.75、1.5、0.75、0.5;感叹号给1.5权重。
5系统分析结果
5.1主界面展示:
5.2单文本情感分析展示:
单文本情感分析主要是使用户输入评论文本来判断文本的情感倾向是正面、中性、还是负面,了解情感计算模型的标准,增强系统的交互性和趣味性。
5.3情感片段分析展示
情感片段分析展示主要是利用echarts技术,对机器学习模型和基于词典的情感值计算模型结果进行分析展示,给观众更直观的结果展示。
6研究创新特色概述
(1)基于网络爬虫技术,爬取有效的弹幕、评价、评论、评分等相关信息,进行数据分析、数据挖掘,将商品质量可视化呈现,实时给予用户优质的购物体验。
(2)运用机器学习算法和基于词典模型相结合的分析模式,能够更加准确合理地进行情感挖掘。
(3)运用echarts技术进行可视化展示,更形象具体,给消费者更直观的购物选择。
(4)项目致力于优化直播电商的营商环境和消费者的消费体验,进而实现双赢,带动经济的发展。
7结语
本研究采用支持向量机算法(SVM)对文本数据进行二分类,基于词典的情感值计算模型对每个时间段的观众情感值进行计算,并进行可视化分析,给消费者更加透明的购物选择,对推动电商行业的健康持续发展具有重要意义。
参考文献
[1]张佰尚,陈伟.直播电商监管的挑战与对策研究,市场监管总局发展研究中心,2021
[2]周云峰,刘关宇.基于支持向量机算法的光伏阵列故障智能检测方法,杭州电子科技大学,2021
[3]陆霞,武善锋.基于神经网络的在线课堂弹幕评论的情感分析与研究,南京師范大学泰州学院,2021