网络购票平台个性化评分推荐系统综述研究

2020-01-19 15:15华南理工大学
环球市场 2020年25期
关键词:购票文本情感

华南理工大学

随着人们生活水平的提高,电影作为一种娱乐方式被越来越多的人喜爱。国产电影产量也保持增长趋势,仅2018年一年中国就有将近千计的电影上映[1];同时随着互联网产业的快速发展,网络购票平台成为人们购票和观影决策的重要途径,但是,通过互联网购票也同样存在着一些弊端:1.以淘票票为代表的互联网购票平台的评分系统为综合评分,而综合评分是不同年龄段不同喜好的庞大用户群体给予的评分,对于小众喜好的用户群体或是不同年龄细分的用户群体难以作为准确的决策标准。2.用户需要通过浏览大量的评论文本数据来甄别自己的兴趣点与这部电影的匹配程度,从而决策是否值得观影,而这一点是很难通过综合评分来判断的,用户在此过程中浪费了大量的精力和时间,导致信息获取效率低下。3.评论数据中经常掺杂着大量无效评论,包括无效内容以及用户兴趣点之外的评论,对用户筛选有效评论造成了很大的干扰和障碍。如何让用户在较短的时间内完成购票决策,从繁多的影视节目中找到适合自己的电影,关乎着购票平台APP的竞争力乃至生死存亡。本研究从这几点弊端出发,进行文献综述,分析得出未来研究的发展方向。

一、网络电影评论的研究现状

对于网络影评的研究现状如下,Yang Liu[2]等开发了一套预测评论有用性的模型和算法,为发现特定产品最有用的评论提供依据。认为一篇有用的评论主要从三方面展示:评论者的专业知识、评论的写作风格和评论的及时性。同时,在分析这些因素的基础上,提出了一个非线性回归预测模型,并通过对IMDB电影评论数据集的实证研究表明了该方法的有效性。基于文本挖掘理论和信息质量的评估,Ghose A,Ipeirotis PG提出了两种产品评论排名机制。消费者导向的排名机制:根据评论的预期效用进行排名;以及制造商导向的排名机制:根据评论对销售的预期效果进行排名。杨铭等认为对于在线商品评论的效用研究应该将消费者的购买决策过程进行重点研究,同时为研究结果可以为营销策略提供决策支持。Jindal,N.和Bing Liu通过对亚马逊网站580万条评论和214万条评论的分析,发现评论垃圾邮件传播非常广泛的事实并提出了几种过滤垃圾商品评论的方法:集中在用户识别,基于评论内容的语义分析和基于评分行为的聚类分类。

综上,现在对于网络评论的研究主要是通过算法实现对于垃圾信息的过滤筛选以及有效信息的甄别,然后将有价值的信息推荐给用户,这种方式节省了用户浏览垃圾信息的时间,可以让用户在最开始浏览时看到更有价值的信息,但是这种方式依赖于算法的性能,只从文本数据的角度进行过滤筛选,基于普世的角度对于评论信息进行价值排序,对于用户来说,普世的价值不一定适用于自己,用户还是需要进行大量的浏览文本信息才能衡量商品对于自己来说的价值,仍然会给用户带来信息过载的困扰。每个用户的评价标准是不同的,若能建立用户模型,对大群体用户进行细分归纳,获取用户大量的数据信息来对用户进行建模分析。

二、自然语言处理领域的研究现状

在自然语言处理领域,学界多围绕情感分析展开研究,情感分析是指对文本数据中存在的情感倾向的分析,属于一个跨学科的研究领域。情感阐发成果可分为三类:积极情感、消极情感和中性情感。机器学习法和字典法是情感分析法的两大组成部分。易顺明以Twitter的评论内容为例,提出了一种用情感特征向量代替词频特征向量的情感分类方法。语料库中的每一个词都通过情感词典用情感值来标记,然后将这些情感值作为特征数据输入模型,采用监督学习模型训练和预测结果。杨超等介绍了《知网词典》和《新台币词典》,采用相似法和频率计算法计算情感词的情感倾向,并把词放置在文中通过上下文分析的方式提高分析结果的准确性。

由此我们可以发现,用户所产生的网络评论信息,是对客观现象的主观表述,针对用户产生的不同类型网络评论文本数据,有着不同的算法以及目标。当前的研究主要是通过提取用户产生的文本数据中的特征词来感知用户情感的,如能将用户对于电影评价的情感倾向特征词进行总结归纳,整理出一套针对电影评价的情感关键词词典将会对用户评价数据的情感倾向判断起到巨大的帮助,这也将成为后续研究的方向之一。

三、总结展望

综合以上分析,后续研究可以就构建个性化网络购票平台评分推荐系统并通过数据信息的可视化及界面交互的设计来解决用户获取影评反馈数据过程中遇到的障碍。对于一个推荐系统来说,如何通过用户产生的数据建立细分用户群体的用户画像,并能够预测或者识别这个细分用户群体感兴趣的物品将是后续研究的重点;而对于文本信息的可视化处理以及APP界面交互设计来说,将冗余信息进行合理过滤,清晰易读的呈现出来并给予用户流畅的操作体验从而达到短时间内快速决策的目标是今后研究的方向所在。

猜你喜欢
购票文本情感
文本联读学概括 细致观察促写作
如何在情感中自我成长,保持独立
作为“文本链”的元电影
情感
直击痛点的“候补购票”可多来一些
抢不到票?铁路候补购票服务扩大到全部旅客列车
诗歌与情感的断想
铁路候补购票服务扩大到全部列车
基于doc2vec和TF-IDF的相似文本识别
如何在情感中自我成长,保持独立