一种基于混合词特征表示的在线评论情感分析方法及应用

2023-05-11 08:58杨成伟李希茹祝翠玲

软件导刊 2023年4期

杨成伟，李希茹，祝翠玲

（1.山东财经大学管理科学与工程学院；2.山东财经大学大数据与人工智能研究院；3.山东省智慧养老与大数据工程实验室；4.山东省应急管理与社会治理大数据发展创新实验室，山东济南 250014；5.中国联合网络通信有限公司济南软件研究院，山东济南 250100）

0 引言

随着Web2.0 的应用和普及，企业在线口碑对企业的运营管理产生了巨大影响，用户可以方便地将包含大量对企业服务主观感受的评论信息以非结构化文本形式发表到微博、论坛、贴吧等网络媒体上。这些用户在线评论数据中蕴含着巨大价值：一方面，这些数据能帮助企业了解用户的真实感受和期望，及时掌握其产品或服务质量情况，有利于改进自身服务；另一方面，评论中所持的观点和态度对进一步调整企业营销策略、优化产品性能，建立完善的顾客满意度评价体系有着十分重要的作用。然而，由于网络环境的复杂性与不确性使得在线评论信息质量良莠不齐。如何从这些在线评论数据中得到对企业运营管理优化有价值的信息变得至关重要。文本情感分析技术能够对文本数据中所蕴涵的情感倾向进行挖掘，并提取出其中所持的态度、观点和感情，已经成为自然语言处理中的一个重要研究分支。文本情感分析为企业运营管理决策提供了一种行之有效的大数据技术支撑。

目前，用户在线评论数据的情感分类问题受到国内外学者们的高度重视，已涌现出大量有价值的研究成果。基于情感词典的情感分类方法按照情感词典中情感词的极性划分情感粒度，并将不同类型和程度的词语放入模型中进行训练，再根据情感判别规则输出情感类型。这种方法依赖于情感词典构建，典型的情感词典如SentiWordNet［1］、How Net［2］、情感词汇本体库［3］等。这些情感词典大都通过人工构造，需要阅读大量的相关资料和现有的词典总结概括情感倾向词，还要对这些词语的情感极性和强度进行标注，代价极大。例如，Cai 等［4］通过Apriori 算法构造情感歧义词词典实现细粒度的情感分类。Wu 等［5］利用网络资源建立了第一个俚语情感词典，获得了社交媒体中俚语内容的情感极性。为获得更好的分类效果，还有些学者尝试在情感词典上构建新的情感词典。姬思阳等［6］提出了基于句子的情感分类方法。Asghar 等［7］在原词典基础上又集成了领域术语、表情符号、否定词和修饰语等规则，提升了情感分类准确性。Xu 等［8］构造了一个包含基本情感词、领域情感词和多义情感词的扩展情感词典，利用扩展情感词典和情感评分规则进行情感分类。

近几年，基于机器学习的文本情感分类开始流行起来。该方法将已标注类别的情感词作为训练数据集，然后进行特征提取和特征选择，再用机器学习分类模型进行训练，最后用训练好的分类模型进行情感分类。不同的文本表示方法、特征选择方法和分类器的选择等都对情感分类结果影响极大。例如，唐慧丰等［9］使用SVM、KNN 等机器学习模型对中文文本进行情感分类，发现采用BiGrams 方法进行特征表示，再利用SVM 模型在足够大训练集上进行的情感分类效果最优。在短文本和多级情感分类问题中，学者们发现有监督机器学习方法表现良好。杨爽等［10］研究基于SVM 的多级情感分类，提出词性、语义等特征上情感的五级分类，将情感分类准确率提升到82.4%。Xue等［11］用LDA 主题模型对与COVID-19 相关的2 200 万条Twitter 信息中的主题情感进行识别，并通过实验验证了该方法的有效性。近年来，深度学习方法被应用于情感分类。王继东等［12］采用情感深度迁移识别算法对情感数据进行分类，提升了分类准确率；严鹏等［13］提出一种新的基于自注意深度学习的商品评论情感分类算法；卢昱波等［14］将cw2vec 与CNN-BiLSTM 注意力模型用于中文微博情感分类；陈景霞等［15］提出基于混合神经网络的脑电时空特征学习与情感分类方法；张合桥等［16］提出基于图神经网络的方面级情感分析方法。其他相关研究将半监督、弱监督等方法引入情感分类，如卢绍帅［17］提出基于弱监督对比学习的小样本情感分类方法，李卫疆［18］提出基于多通道特征和自注意力的情感分类方法。

综上，本文利用数据科学、设计科学的方法，研究基于企业数字化运营管理的用户在线评论情感分类，主要贡献有：①探索文本特征表示、特征选择方法和机器学习模型对情感分类效果的影响，提出了一种新的混合词情感特征表示（UBG）的在线评论数据情感分类方法方法；②对酒店用户评论数据集进行分类预测，比较了多种特征表示方法、特征选择方法和分类算法，其分类指标值达到了0.88以上，优于多数已有情感分类方法；③研发了基于在线评论数据驱动的酒店竞争力运营管理原型系统，为企业运营管理决策提供了一种新方法和思路。

1 在线评论数据驱动的企业数字化运营优化方法

通过对企业运营过程中顾客发布的在线评论数据进行情感分析，可获得顾客对企业运营过程中所提供的各类服务态度，并根据顾客的积极和消极倾向，抓住顾客的关注点，从而建立用户体验模型，形成客户对企业运营中所提供的各项服务的管理决策权重。

如图1 所示，基于在线评论情感分类的企业数字化运营优化过程如下：

（1）文本情感特征提取。对获取的有关企业运营的在线评论样本数据分别利用单词特征表示（Unigram）方法、双词特征表示（Bigram）方法和混合词特征表示（UBG）方法进行文本情感特征提取，统计出词频，形成统一的情感特征集合。

（2）情感特征预处理。由于在线评论数据中有些评论数据不规范，经常存在一些网络词及表情符号等。因此，需要对情感特征集合进行预处理。如删除情感特征集合中的标点符号数据和网络词，利用停用词表删除情感特征集合中的停用词以及情感特征集合中无意义的高频词，如“的”“地”等。

Fig.1 Enterprise digital operation optimization method based on online comment sentiment classification图1 基于在线评论情感分类的企业数字化运营优化方法

（3）阈值设定。人工设定情感特征选择过程中对情感词的阈值，该阈值设定情感特征数量或特征选择方法计算出的特征信息量所需要的范围值。

（4）情感特征选择。根据情感特征选择方法，如卡方检验（CHI）、Jaccard 相似系数、互信息（MI）、似然比（Likelihood Ratio）等方法，计算情感特征集合中每个情感特征所携带的信息量，再根据设定的阈值及应用向量空间模型对在线评论进行情感特征选择。

（5）数据集划分。将所有有关企业运营的顾客评论样本按照某指定比例（如5∶2∶3）划分得到训练集、验证集和测试集。

（6）情感分类模型训练。利用样本训练集对逻辑回归（LR）、支持向量机（SVM）、朴素贝叶斯（NB）等情感分类模型进行训练，得到训练好的情感分类模型。

（7）情感分类模型评估及参数寻优。利用训练好的情感分类模型对验证集中的样本进行情感分类，并利用准确率（Accuracy）、精确率（Precision）、召回率（Recall）和F1值等评价指标对分类器进行评估，根据评估结果进行参数寻优，调整阈值，以获取更好的分类结果。

（8）文本评论情感分类。根据情感分类性能指标数据从情感分类器中选择综合性能最好的对测试集中的在线评论进行情感分类。

（9）将情感分类结果用于企业运营管理决策。利用大数据可视化技术将情感分类内容可视化，提供给企业运营管理者作为决策依据。

2 实例研究与分析

2.1 数据来源与标准化

本文以酒店运营管理竞争力提升为例，借助数据科学、设计科学的方法，对酒店评论情感数据进行分析挖掘，为酒店市场定位、营销管理提供科学决策方法及依据。原始数据集来自谭松波中文文本分类语料库酒店评论内容数据集（https：//download.csdn.net），该数据集从携程网爬取并经过整理而成，积极、消极评论数据的数量之比为1：1。为了提升分类准确性，首先对原始数据集进行规范化处理，通过删除停用词、jieba 分词、清除文本中无关字符（如“，、：”等），得到实验数据集，并按照5∶2∶3 比例将实验数据集划分为训练集、验证集和测试集3部分。

2.2 情感特征表示

不同的情感特征表示方法和分类算法会对分类器的性能产生影响，分别使用Unigram、Bigram 和UBG 3 种特征选择方法提取单个词、双词以及混合词作为特征，对3 种特征表示方法在不同分类算法中的分类效果进行比较实验，分类算法采用scikit-learn 学习库中情感分析研究人员常用的线性和非线性分类模型，包括最广泛采用的逻辑回归（Logistic_Reg）分类器、机器学习领域较为成熟的支持向量机（SVM［19］）分类器以及具有较强可操作性的朴素贝叶斯（NB）分类器［20］，主要包括伯努利朴素贝叶斯（Bemoulli_NB）和多项式朴素贝叶斯（Polynomia_NB），分类算法的超参数均为默认，所用Accuracy、Precision、Recall、F1值作为情感分类的评估指标，计算公式如式（1）—式（4），默认使用卡方统计（CHI）特征选择方法，情感分类结果如表1所示。

其中，Accuracy 为预测正确的样本与总样本的比例；Precision 为预测为正向样本中预测正确的比例；Recall 为预测正确的正样本与原本总正样本的比例；F1为Precision和Recall 的调和平均指标；TP 为正确预测的正例，TN 为正确预测的负例，FP 为错误预测的负例，FN 为正确预测的负例。

分别采用Unigram、Bigram、UBG 方法进行特征表示的情感分类效果如图2所示。

Table 1 Sentiment classification results of three feature representation methods表1 3种特征表示方法的情感分类结果

Fig.2 Results of three feature representation methods for sentiment classification图2 3种特征表示方法的情感分类结果

实验结果显示，采用Unigram 方法进行特征表示，NB分类器的Accuracy 明显优于其他分类器。其中，Polynomia_NB 和Bemoulli_NB 分类器的Accuracy 差别不大，分别是0.815 和0.81。而Polynomia_NB 和Logistic_Reg 分类器的Precision 上优于其他分类器，分别是0.888 和0.867，且非常接近。SVM 和Bemoulli_NB 分类器的Recall 达到0.9以上，但Polynomia_NB 和Logistic_Reg 分类器也都接近0.9。Polynomia_NB 和Logistic_Reg 分类器的F1值分别是0.882 和0.873，两种分类器预测性能都较好。然而，采用Bigram 方法进行特征表示，使用Polynomia_NB 分类器的综合性能较好，其Accuracy 达到0.858，F1值达到0.861，而SVM 分类器的综合性能指标较差。采用UBG 方法进行特征表示，在4 种分类器上的情感分类对比实验中，Accuracy均较高，其中Polynomia_NB 分类器的综合性能（F1值）达到0.886，在3种特征表示方法测试中最好。

进一步比较Polynomia_NB 分类器对UBG 特征选择方法进行情感分类的效果，性能指标比较结果如图3 所示。可以看出，UBG 特征选择方法在Accuracy、Precision、Recall和F1值的性能指标上有稳定的性能表现，指标值均高于0.88，明显优于其他两种特征表示方法。

Fig.3 Results of polynomial naive Bayes classifier for sentiment classification图3 多项式朴素贝叶斯分类器的情感分类结果

2.3 情感特征选择

情感分类不仅受到文本情感特征表示方法的影响，情感特征选择方法也是影响情感分类的重要因素，但目前对特征选择方法的情感分类效果影响的研究仍很少见。为了得到不同特征选择方法对情感分类的影响，分别选择MI、Jaccard、CHI 和Likelihood_Ratio 4 种特征选择方法。情感分类模型仍然采用有代表性的线性和非线性模型LR、SVM、NB（Bemoulli_NB 和Polynomia_NB）分类器进行实验，并使用Accuracy、Precision、Recall 和F1作为分类评估指标，实验结果如表2所示。

可以看出，在任何一种特征选择方法下，Polynomia_NB 分类算法都有较稳定且相对优越的分类性能，且特征选择方法为Likelihood_Ratio 时，4 个性能指标值最高，都大于0.86。同时，利用UBG 方法进行特征表示时，不同特征选择方法对其分类结果的影响都不大。

Table 2 Sentiment classification results of four feature selection methods表2 4种特征选择方法的情感分类结果

2.4 参数调优及可视化

参数的选择对情感分类的准确度也可能产生一定影响。在前面实验中，Polynomia_NB分类器的表现较好，因此，本实验采用UBG特征选择方法，并仍采用Polynomia_NB分类器、和MI、CHI、Jaccard和Likelihood_Ratio 4种特征选择方法，测试不同特征数量参数对情感分类结果造成的影响，实验结果如表3所示。当特征数量为500时，Polynomia_NB分类效果整体较好，虽然当t=1 000或1 500时，分类效果有一定提升，但是提升幅度不大，而特征数量的增大，使得情感分类的复杂度和所用时间都大幅度增加。采用Likelihood_Ratio特征选择方法时，当选择的特征数量为100，Polynomia_NB的分类效果已经非常好，Accuracy、Precision、Recall和F1值都在0.8以上，当选择的特征数量太多时，分类器的分类指标Precision略有降低，说明特征数量参数对情感分类产生一些影响，但影响不大。

Table 3 Result of different reference value for sentiment classification表3 不同特征参数值的情感分类结果

实验中情感分类性能值随特征数量参数变化情况如图4所示。

Fig.4 Result of different reference value for sentiment classification图4 不同特征参数值的情感分类结果

从实验结果可见，利用UBG 特征提取方法的情感分类降低了情感分类的复杂性，提高了情感分类效率，实验中获得了较好的分类结果。

为使企业运营管理工作人员更敏捷地感知情感分类的分析结果，可以利用数据可视化技术进行更加直观的展现。对酒店评论进行情感分类后，将分类后的评论用词云形式展示，词云图中按照消极评论、积极评论分解词语的词频确定在途中的重要度，便于管理人员洞察消极、积极评论中蕴藏的问题以便作出正确决策，效果如图5、图6所示。

从词云图中可以清晰感知到用户对R 酒店的在线评论情感分类结果进行词云展示的结果。积极评论分解成词云后可见，R 酒店能以客人为中心，客户对酒店的客房服务、环境、设施、价格等都较为满意；而从消极评论分解成词云后可见，酒店的前台服务员服务质量较差，服务员的素质有待提升等。部分词在积极、消极评论句子有重复，因而也会在积极、消极的词云图统计中出现。因此，通过在线评论数据的情感分类为酒店科学管理和竞争力提高提供了更智能的手段。

Fig.5 Word cloud of positive reviews图5 积极评论的词云

Fig.6 Word cloud of negative reviews图6 消极评论的词云

3 原型系统

为了将文本情感分类的特征表示方法、特征选择方法与多种情感分类模型更好地与企业智能运营管理优化结合，利用数据驱动的分析方法帮助企业管理者洞察商机并实施科学决策。课题组研发了基于情感分析的酒店竞争力智能运营优化虚拟仿真系统。该系统采用微服务架构，各模块之间实现了功能上的高内聚与模块间的低耦合。系统主要包括：环境部署、数据准备、数据预处理、数据探索、数据建模、决策报告生成6 个模块。系统环境部署模块提供了云虚拟化环境创建以及工具在线部署；数据准备模块提供了网络数据采集方式和本地上传数据文件功能；数据预处理模块提供了空值、重复值的查询处理以及添加派生数据等多种预处理方法；数据探索模块通过可视化插件以箱图、折线图、词云图等形式对对预处理后的数据进行可视化分析；数据建模模块提供了包括CART 回归分析、一元线性回归分析、情感分析等多种模型和方法；本文在线评论数据的情感分类方法也被封装成一个案例，以方便运营管理人员在决策过程中使用。

4 结语

基于UBG 混合词特征表示的在线评论情感分类方法，通过提取在线商品和服务的在线评论数据，通过数据预处理、数据探索、情感建模与可视化过程帮助管理者洞察自身存在的问题，制定相应的解决方案。以酒店运营管理决策为例，收集R 酒店评论数据实施所提方法，比较了不同特征表示、特征选择和特征数量参数对情感分类模型的影响，建立了基于UBG 的多项式朴素贝叶斯情感分类器，完成了在线评论数据的最优分类。为了更好地将提出的方法与企业管理相结合，研发了相应的原型系统，目前已投入运行。本文研究对于克服传统“拍脑袋”决策的武断性，以及加速企业运营数字化转型提供了一种新思路和方法。