郝雨晴 陈奇
摘 要:在亚马逊的运营中,一项非常重要的工作是分析客户对产品的星级评级和评价。这样的分析有助于我们了解产品的优缺点,同时掌握客户对这些产品的关注,扬长避短。通过建立层次分析模型,得到星级评定评分的权重,进而得到销售成功率。首先剔除数据集数据,并筛选出原始数据中包含的无效数据。我们对数据集中的变量进行分类后,建立层次分析模型。通过验证他们是否符合一致性指数,并计算出他们在数据集中的权重。研究结果表明:吹风机产品上市后成功率为68.3%,微波炉产品上市后成功率为65%,奶嘴产品上市后成功率为82.15%。该研究不仅可以帮助公司的产品取得成功,还可以帮助产品不断更新和改进,促进产品的升级换代,取得更好的销售效果。
关键词:层次分析模型;权重;市场销售评估
1 研究背景
近年来,随着互联网的普及,网上购物方兴未艾,购物网站上的用户评论也开始引起更多的关注[1]。目前,越来越多的网站运营商、投资者和用户已经意识到网站评价的重要性,很多企业也开始建立自己的网站评价指标。正确的评估可能会导致较高的转换率,这是每个电子商务商店的关键性能指标。它还可以影响您的性能的许多其他方面,进而影响业务的总体增长。
2 基于层次分析的的市场销售评估模型
2.1 问题分析
分析问题提供的三个产品数据集,并使用数学方法对提供的数据信息进行识别和描述。提取出最有价值的信息,总结归纳出形成有效结论和挖掘数据最大价值的过程。观察数据是否有异常值、空值等,如果存在,可以剔除或替换为合理值。如果上面的值都没有出现,可以使用数学运算对它们进行拟合,得到星级、评论和帮助评级中三个产品之间的关系,为三个产品推向市场提供参考。
2.2数据处理
在数据分析过程中,往往需要对数据进行有针对性的清理,即对无关数据和不重要数据进行处理。虽然标题提供了大量的数据,但是要想对这些海量数据进行有效的分析,仍然需要从前端对数据进行分类,并且可以在导入的基础上做一些简单的清理和预处理。为了有效利用问题提供的数据,我们执行了以下操作来清理数据集,提高数据的可靠性,避免不必要的计算。删除所有数据具有的相同列(市场、产品类别)。这样可以减少数据样本的大小并删除数据样本中的冗余数据。
2.3模型建立
步骤1:对提供的数据进行数据剔除,对部分数据项进行分析处理。只保留有用的信息和数据处理。因此,该问题提供的数据可以有效地用于提高数据的可靠性,避免不必要的计算。
步骤2:剔除数据后,仍有许多变量。变量过多无疑会增加分析问题的难度和复杂性。考虑到多个变量之间存在一定的相关性。因此,我们用更多的新变量替换更少的旧变量,并使这些更少的新变量尽可能多地保留原始变量中的信息。
步骤3:根据结果反映的信息,在查阅相关信息后,对变量进行分类讨论。用总票数讨论有用票数。
步骤4:更好地显示帮助投票与总投票之间的关系。我们引入帮助系数来表示两者之间的关系。在过去,这种关系通常用有帮助的选票与总选票的比率来表示。在这种关系表示模式下,当有助票数和总票数仅与比率有关,且有助票数和总票数均为0时,无法进行计算。具体投票对这种关系的影响无法反映出来。
这是这种表述的两个缺点。为了改善这一缺点,我们对表示方法进行了优化。在我们建立的关系模型中,我们希望客观地反映投票对这种关系的影響。当帮助投票数和总投票数为0时,此时的帮助系数可以判断为0。当有助票数为1时,此时可直接用二者之比表示。在其他情况下,我们使用比率和投票数的乘积。在数据集中,不同客户之间的投票差距较大,最终的差距会更大。所以我们引入了表示投票数的方法来减小帮助系数之间的差距。
步骤5:我们对帮助系数进行分类,得到以下公式:
步骤6:对评论内容进行情绪分析。我们使用同步数据并行化在Amazon评论数据集上进行语料库训练。情绪分析通过一个Python库(TextBlob)执行,用于处理文本数据。继续句子中隐藏的想法。极性定义了句子中的否定或肯定,主观性意味着句子的表达是模糊和肯定的。它是通过分析主观顾客的情感色彩(即消极和积极/消极)来确定文本的观点、偏好和情感倾向。通过计算得到情感系数。情绪系数的取值范围是[-1,1],我们在一定程度上处理了这个问题。
步骤7:对星级进行分层分析,建立一个层次模型。通过相互比较确定三个目标的权重,并根据矩阵判断标准进行判断。定量地显示各元素的重要性,并构造各方案层的判断矩阵,得到三个判断矩阵。在矩阵的i行和j列的位置填充两个因子比较得到的值,然后构造一个所谓的比较矩阵。比较矩阵的对角线为1,因为它与自身进行比较。然后对所得结果进行一致性分析。首先,计算一致性指数。
为其最具信息性的评级和评论确定数据指标。因此,需要建立一个多目标线性回归方程系统来确定情绪系数、帮助系数和星级评定的最佳值。多目标线性回归方程可以表示为:
对成功因素进行分类。分类结果如下:[0,2],[2,4],[4,6],[6,8],对清理后的数据进行分类,并统计每个类别的数量。经统计,成功系数大于4。得到的比值为68.3%。产品上市后,获得好评的概率为68.3%。同样,电磁炉产品上市后,获得好评的概率为65%。奶嘴产品上市后,获得好评的概率为82.15%。
3 小结
计算结果表明,吹风机产品上市后正反馈的概率为68.3%,可以预测产品上市后的效果。我们可以得出结论,该产品可以成功地销售。奶嘴产品上市后受欢迎的概率为82.15%,可以预测产品上市后的效果。我们可以得出结论,该产品可以成功地销售。电磁炉产品上市后受欢迎的概率为65%,可以预测产品上市后的效果。我们可以得出结论,该产品可以成功地销售。
参考文献
[1] Susan(Si Xue)Jia. Motivation and satisfaction of Chinese and U.S. tourists in restaurants:A cross-cultural text mining of online reviews[J]. Tourism Management
[2] Cai,C. J.(2013)Shangpin pinpai DUI zaixian pinglun youyong xing yingxiang de shi zheng yanjiu(Empirical study on the influence of brand to online reviews' helpfulness). MA thesis,Chongqing University.