文本情感分析在电子商务中的应用探讨

2019-01-28 08:04:42陈纪元北京市丰台区丰台第二中学
消费导刊 2019年3期
关键词:电子商务客户文本

陈纪元 北京市丰台区丰台第二中学

一、引言

电子商务是以信息、网络技术为手段,以商品交换为中心的商务活动,可以理解为电子商务是对传统商业活动的电子化、信息化。近年来,随着国民经济的不断增长,电子商务的规模、覆盖领域都有了质的飞跃。经过近20年积极推进和创新发展,“十二五”期间,我国电子商务交易规模从2011年的6万亿元增至2015年的21.8万亿元,已经成为全球规模最大、发展速度最快的电子商务市场。2016年12月,商务部、中央网信办、发展改革委三部门联合印发了《电子商务“十三五”发展规划》,确立了“2020年电子商务交易额40万亿元、网上零售总额10万亿元、相关从业者5000万人”三大发展指标[1]。电子商务的发展一方面促进了社会经济的增长,同时也带来了海量的就业机会,其未来将有着广阔的发展前景。

在电子商务中,用户在购买商品后会对商品的使用效果进行反馈,常常以评论的形式展示出来,这些评论在较大程度上反映了用户对商品的情感状态,对于潜在用户的购买行为有着十分明显的影响。同时,评论中不仅包含用户对商品使用后的满意情况,也包含其购物的偏好信息,如果能对评论进行深入挖掘,就可以帮助用户推荐商品,提升购物体验,也能帮助商家对商品的属性进行分析,据此优化后续产品更新方案[2]。用户购买商品后也会在各种社交媒体上进行分享,表达自己的使用感受,分析同类商品的优缺点;此外,一些专门的商品评测机构也会在网络上发布其评测结果,对社交媒体以及网络上相关的信息进行分析有助于商品生产者了解用户对商品的使用感受,进而对商品进行改进。本文将介绍文本情感分析的原理,以及在电子商务中的应用情况,讨论其存在的不足,以期为其未来发展提供参考。

二、文本情感分析概述

文本情感分析是指对包含用户情感态度的文本数据进行识别与分析,可以在在词语、语句及语段三个粒度上进行分析,而在电子商务里主要是针对语句层面的数据进行分析。文本情感分析的主要流程为文本采集与筛选、文本情感信息的抽取、文本情感信息的分析以及文本情感信息的归纳[3]。

一般而言,商品相关的文本如评论、用户发布的状态等数据可以利用爬虫技术从淘宝、京东、微博等平台进行采集,之后对这些文本进行筛选,选取满足设定阈值(文本长度,非表情符合数量)的部分进行下一步分析。文本信息抽取是将自然语言形式的评论性文本转化为一定的信息单元,并将其转化为计算机能够识别处理的文本模型,这部分充当了用户语言与情感分析的桥梁。而情感信息分类是将通过计算机处理后的文本模型根据评论人、被评价的商品,以及情感的倾向性和强度等标准进行识别、分类,以此提取出文本中所蕴含的核心信息。例如在对用户对产品的褒贬进行分类时,“宝贝很好”与“真垃圾”的文本会被识别为倾向褒义与贬义。情感信息的归纳则是将以上分析的结果进行综合汇总,生成最终对全部文本信息的报告,以便商家了解用户对商品的总结评价。

三、文本情感分析在电子商务中的应用

(一)客户流失预测

在电子商务中,用户对产品发生的情感变化或外界因素导致用户放弃继续购买使用产品的现象称为客户流失。而客户流失预测则是根据客户的历史信息,判断客户对产品的情感态度,识别客户流失的影响因素,预测出潜在流失客户并制定挽留策略的过程。在一些研究中发现,新用户的拓展成本远大于对已有客户的挽留成本,因此对客户的流失预测在电子商务中具有重要的应用价值。近年来,许多研究者开始利用文本情感分析技术进行客户流失预测[4]。

在判断客户情感倾向方面,首先借助情感词典(如知网的HowNet词典)对文本进行分词,之后进行文本特征的选择,提取文本中的情感特征,之后进行情感倾向的识别,可以采用机器学习模型完成。在获得用户的情感分析报告之后,商家可以据此分析用户的使用感受,进而预测客户的流失情况,并分析客户流失的原因,进而作出针对性的挽留策略。

(二)用户偏好识别

根据文本情感分析技术对单个用户进行追踪,通过分析用户所购买的产品以及使用感受,就可以推测用户的购买偏好即为用户偏好识别。根据用户的偏好,可以个性化地为其推荐商品。在得知用户的购买偏好之后,对其推荐商品不但可以有效增加商品的销售量,同时也迎合了客户的使用感受,提高了用户对平台的忠诚度与好感度。而利用文本情感分析技术对用户的偏好识别是目前电子商务领域最热门的研究领域[5]。

阿里巴巴旗下淘宝购物平台的用户、商品数量都数以亿计,平台需要对用户的检索请求做出毫秒级处理、响应,其检索结果的准确性将直接影响用户的购物体验,因此,如何提高搜索体验是淘宝网面临的难题。近年来,利用用户对商品的偏好提高电子商务平台用户的搜索体验越来越受到重视。淘宝网对用户进行偏好识别的重要方法就是利用文本情感分析技术,数据主要采用用户的评论文本。其分析步骤为:首先对用户所评价的商品进行分类,例如“服饰”“日用品”,这是为了获得用户在网站上对不同品类商品的购买倾向,同时不同品类对应的关键情感词也有所不同;其次是对评论文本进行处理,要从价格、质量、服务、物流等方面逐一获取用户的态度,例如在分析一款商品的评价时,抓取的情感词有“物美价廉”、“出水流畅”、“到货快”等,这分别对应这款商品的价格、质量和物流;最后则是根据用户的情感态度判断其购买偏好,例如用户评价商品为“小贵”,则代表这款商品的价位高于用户期望值,那么在为用户推荐同款商品时则选取价格区间更低的进行推荐。又如某位客户评价中含有物流的情感词更多,则说明他购买时更注重物流,那么推荐的商品的物流应该更快。

(三)商品使用调查

商品使用调查是通过统计学手段来获取用户对商品的态度、意见等信息的过程。商品使用调查的覆盖面广泛,调查问题可以多样,结果的可信性越高,获得的用户群体对商品的使用感受数据以及建议就越准确,根据这些反馈对商品的生产和销售可以改进,对于电商企业和商品厂家都具有重要的意义。但传统的问卷等调查方式在对调查数据的收集、清洗、分析等阶段均需要投入大量的人力与时间,成本较高,特别是对于访谈获取的含有长段落文本的调查数据的分析处理则更加费时费力。为此,越来越多的研究者开始通过文本情感分析技术进行商品调查方面的研究,不但可以更快捷地获取调查数据,同时对于主观性文字也具有良好的分析能力,从而节省大量人力物力。

商品使用调查的方式多样,可分为访谈类及问卷类两种。对于定性的开放性问题,基于文本情感分析技术的访谈类与问卷类调查其流程基本相同,只是在数据的获取方面有所差异:对于访谈类,调查结果是语音,需通过语音识别技术将其转为可识别的文本后进行分析;对于问卷类则需要使用文本识别技术获取原始的调查数据。后续的分析过程与3.1和3.2节的过程相似,但需要注意的是调查问卷中不仅仅含有用户的使用态度,有些问卷中还含有用户对产品的意见和建议,需要通过提取文本中的关键词来获取。

四、讨论

尽管情感分析适用于诸多领域,但现阶段这项技术还面临许多挑战。

首先是用户隐私问题。由于电商评论数据是用户对商品情况的主观表达,其中难免会包含用户的隐私信息,如用户的地址、兴趣爱好等,这些信息目前是公开的,所有用户都可以看到,但如果被不法分子获取,通过综合分析也会窃取用户的敏感信息,因此,电子商务企业在利用这些数据时也应注重对用户隐私的保护。

其次是算法性能问题。现有的文本情感分析技术是建立在自然语言处理技术的基础上,而对自然语言的理解一直是研究者有待攻克的难题。例如,同一段文字在不同的语境下可能意思不同,选取的情感词不应仅局限于副词与形容词,一些名词、新词等也会是用户态度的表达。因此,在文本情感分析技术的发展过程中应注重对自然语言处理技术本身的研发,提高对文本信息分析的准确性。

五、结语

本文介绍了文本情感分析的原理,分析了其在电子商务中客户流失预测、用户偏好识别与商品推荐以及商品使用调查三个方面的应用情况。文本情感分析是针对自然语言的研究,我国在这方面研究的起步较晚,其原因主要在于汉语表达的多样性与复杂性,以及国内网络用语的随意和多样性。随着情感词典和算法的完善,文本情感分析技术将会有越来越多的应用,不仅仅局限在电子商务领域。

猜你喜欢
电子商务客户文本
在808DA上文本显示的改善
基于doc2vec和TF-IDF的相似文本识别
电子制作(2018年18期)2018-11-14 01:48:06
《电子商务法》如何助力直销
为什么你总是被客户拒绝?
电子商务
如何有效跟进客户?
关于加快制定电子商务法的议案
跨境电子商务中的跨文化思考
做个不打扰客户的保镖
山东青年(2016年2期)2016-02-28 14:25:41
文本之中·文本之外·文本之上——童话故事《坐井观天》的教学隐喻