王瑶菡 曾利红 王 颖 唐 琴 秦春香△
①中南大学湘雅护理学院(湖南) 410013 E-mail:yaohanwang@csu.edu.cn ②中南大学湘雅三医院 △通信作者 E-mail:Chunxiangqin@csu.edu.cn
抑郁障碍是全球最常见的精神障碍之一[1],目前,全球抑郁患者高达3.5亿,我国超过2600万[2],抑郁障碍不仅对患者的生活质量产生严重影响,还会对医疗服务及社会经济造成沉重负担[3]。抑郁的早期识别与筛查是诊断和管理的基石,目前筛查方式主要是基于心理量表测评[4],但存在效率低下、识别结果滞后且主观性强的缺点[5-6],无法实现客观且实时的大规模监测。因此实现抑郁障碍的高效、客观、实时、大规模监测,已经成为了当前临床医务工作者和心理卫生科研人员亟待解决的重要议题。而大数据时代的到来以及人工智能技术的发展,为解决这一问题提供了契机。研究表明用户逐渐倾向于在网络中分享日常生活,表达观点和情绪[7],这些内容能实时、真实反映用户当下的情绪状态,且隐私性更强,同时有效减少部分患者就医病耻感[8]。随着互联网技术的快速发展和智能手机的普及应用,社交媒体中反映用户兴趣、观点及心理动态等方面的数据海量扩增,因此,社交媒体逐渐成为挖掘用户心理动态的重要资源[9],其在社交媒体中会有意或无意的暴露情绪,通过获取用户在社交媒体中发布的文本构建情感词典,进行情感分析,能够判断用户是否有抑郁倾向[10-11],该方法具有规模广、准确率高、客观性强、资源消耗少的优势。本文围绕基于情感词典的情感分析方法以及其在抑郁领域的应用进行综述,旨在为早期预测与筛查抑郁个体提供参考,以便尽早实施干预促进患者康复。
情感分析(Sentiment Analysis),又称意见挖掘,是通过提取文本信息,对其情感倾向进行分析,以获得人们的观点、看法、态度等[12]。情感分析被广泛应用于各类领域的情绪识别,在早期的工作中,通过网络文本信息进行情感分析的研究主要应用于舆情分析、推荐系统、用户画像等领域[13],如利用社交平台网民发帖来分析群众意见及舆情趋势[14],利用电子商务平台用户评论来评估用户对产品的满意程度[15]。
情感词典(Sentiment Lexicon)是已标注情感倾向的名词、副词、动词等词语的集合[16]。词语是体现文本情感的基本单位[17],在一定语境中表现出正负情感极性,如 “好”的情感倾向是正向的,而“糟糕”则是负向的。通过提取这类情感词语,标注情感倾向,整理形成情感词典。
基于情感词典的方法是进行情感分析的方式之一,将待分析文本中的词汇与情感词典中的词汇进行匹配,累积各词语的分值计算出文本的情感得分,或根据文本中不同情感词的比例评估出文本的情感倾向。社交媒体中的发帖及评论大多较短、具有非正式的语言风格,针对此类文本,基于情感词典的方法具有粒度精细、操作简便、可解释性高、结果稳定等优势[17-18]。因此,本文将重点聚焦于基于情感词典的情感分析。
构建情感词典是情感分析的核心[19],情感分析的正确率主要取决于情感词典的准确率和覆盖率[20]。情感词典的构建包括获取原始数据、文本预处理和形成词典。原始数据主要来源于社交媒体和网络论坛的发文,其获取途径主要通过开放的应用程序编程接口和网络爬虫两种方式。原始数据书写随意且包括很多噪声因此需要预处理,通过数据清理、分词、停用词删除、词性标注等,使其转换成能被计算机识别的结构化数据[21]。预处理后,人工标注出情感极性或强度集成情感词典。在此基础上,通过种子词延伸[22]、词语共现[23]等方法挖掘更多情感词,或引入机器学习算法[24]、神经网络[25]等来扩展词典,以达到减少人工成本、增大词典覆盖面的目的。
目前研究构建的情感词典可以分为通用性情感词典和领域依赖性情感词典[20]。对于通用情感词典的构建,国外先于国内,使用较多的有SentiWordNet[26]、OpinionFinder词典、GI(General Inquirer)词典[20],中文词典主要有台湾大学的NTUSD[27]、知网的HowNet、大连理工大学的情感词汇本体库[28]。这类词典通用性广,但对垂直领域中的专有情感词含量较少,如常能反映抑郁的词“失眠”,但情感倾向属于中性,没有列入HowNet词典[29]。而领域情感词典则相反,是指在特定领域常用到的词汇集合,通用性弱,但对垂直领域中的专有情感词含量较多。随着各领域数据极速增长和应用要求增加,领域依赖情感词典也逐渐获得关注,搭建了产品、电影、旅游、抑郁等领域词典,如含有抑郁情感网络流行词语和表情符号的抑郁词典[30],结合通用词典与表情符号的多模态词典[31]。
情感词典构建后,建立用于计算情感得分或分类情感倾向的模型,常见的可分3类:基于正负词数量的非监督模型、基于文本情感得分的非监督模型和基于情感词典提取特征的监督模型[16]。首先,待分析文本为整个模型的输入,文本与情感词典逐一匹配。基于正负词数量的非监督模型的构建是利用Python语言设定统计函数,直接统计文本中正负情感词数量[16,32],或根据语义相似度、同义词关系对未收录的词语计算极性后运行统计函数。基于文本情感得分的非监督模型构建的主要任务是用程序语言设定运算规则。当文本出现情感词典中的词语时,读取该词权值,再排查当前窗口范围内是否有否定词和程度副词,编写运算规则进行权重处理:否定词使权值反号,程度副词使权值加倍[33],直至遍历全文,对全部情感词加权运算,其总分值作为模型输出,以上模型具有简单实用、易于分析理解的优势,但其情感分类精度相对较低[21]。为提高情感分析准确性,研究者构建基于情感词典特征的监督模型,这一模型的主要思想是根据情感词典提取文本特征,基于这些特征通过机器学习算法构造分类器,即把用户的情感分析任务转化成用户文本的分类任务,其分类结果作为模型的输出。这类模型的构建分训练与测试两步。将已经人工标注倾向的文本分成训练数据和测试数据,用词频-逆文档频率(TF-IDF)、卡方(CHI)[30]、互信息(MI)[32]、信息增益(IG)[34]等方法提取训练数据的语言特征,包括词汇、句法或语义等[35],用于调整分类器的参数[34],再用分类器对测试数据模拟分类以检验分类器效能。模型的性能评估常使用的指标包括准确率(Accuracy)、精确率(Precision)、召回率(Recall)以及综合考虑精确率与召回率的调和平均数F1值[36]。
用获得的最佳模型进行情感分析,基本流程如下:步骤一:获取文本,从社交媒体爬取未知文本保存到本地数据库,作为模型的输入;步骤二:预处理,添加开源停用词表清理掉“#”所带话题、超链接信息、乱码字符等冗余数据,利用中科院分词系统ICTCLAS,THULAC或Jieba分词库[37]进行分词;步骤三:特征提取,根据已设定的算法提取文本特征,包括正负词语数量、情感词、程度副词和否定词特征、句法语义特征等;步骤四:得出情感类型,基于正负词数量非监督模型中,文本正负情感词数量分别表示为#PW和#NW,若#PW>#NW,则文本为正向,反之为负向[16]。基于文本情感得分非监督模型中,根据运算的整个文本的情感得分Od,若Od>0,则文本视为正向,反之为负向[33]。基于情感词典特征模型可直接根据分类结果得到情感倾向,如支持向量机的学习目标分为正负类,则输出结果对应情感倾向的正面和负面[38]。
通过获取用户发布的帖子,构建情感词典及模型来分析文本情感,能够识别用户的抑郁倾向。Yusof等[39]将ANEW、MPQA和SentiWordNet 3种通用词典分别嵌入多项式朴素贝叶斯分类器,对LiveJournal平台收集的117,516个帖子的特征向量进行二分类,实验发现基于3种词典构建的监督分类器均有效分类出从抑郁论坛收集的帖子,其中SentiWordNet分类准确率最高,达84.4%。方振宇等[29]在通用情感词典基础上构建基于抑郁躯体症状、抑郁行为特征及抗抑郁药物名称的词典,爬取443位鉴定为心理障碍的用户和477位正常用户的微博,利用支持向量机算法构建模型,统计词典内的词在微博中出现的次数,将词频作为用户的语言特征进行二分类,若结果为消极则表示用户可能存在抑郁倾向,将算法的分类结果与用户的诊断进行比对,评估模型性能,结果显示基于扩展词典方法的准确率(88.6%)、召回率(77.8%)、F1值(82.7%)均高于其他特征分类方法,正确分类出抑郁用户微博,有利于识别潜在的抑郁用户,进而联系该用户进行专业医学检测,尽早接受干预。
情感词典中词语的情感倾向程度可能不同,使用情感词的不同倾向程度判断整条文本的情感强度,帮助医护人员判断用户的抑郁严重程度,便于实施管理或诊疗时选择不同方案。Fatima等[40]基于包含情绪标签的帖子效价的高低来判断用户抑郁程度的轻重,研究使用ANEW词典中词语的不同效价,将文本的情绪标签与抑郁程度对应(1.0~3.5对应重度抑郁,3.6~5.5对应中度抑郁,5.6~9.0对应轻度抑郁),使用隐马尔可夫模型和随机森林分类器实现利用词语的不同效价值识别帖子抑郁程度,精确率为92.3%。尹畅等[22]爬取轻、中、重度抑郁用户的评论,运用双向最大匹配和词频-极性强度值方法发掘情感词以构建词典,以极性强度0、1、3、5,分别代表存在抑郁、轻度、中度、重度抑郁四等,通过累加和统计,按最终计算的极性强度初步判断用户抑郁程度,结合用户实际情况验证方法性能,准确率为78.65%,F1值为81.55%,实现帮助医护人员初步辨别抑郁患者病重程度,跟踪抑郁患者情况。基于情感词典的情感分析虽然能有效分析判断抑郁程度,但由于中度抑郁描述与轻、重度有所重叠,导致模型错误地将部分中度抑郁帖子分类为轻度或重度[40],成为准确区分不同抑郁程度的障碍之一,抑郁程度的强鉴别仍有待于进一步开发。
利用用户一段时间内发布的文本分析抑郁情绪变化,加强对抑郁患者情绪波动的动态监测。施志伟等[30]通过获取微博文本构建抑郁词典,用支持向量机构造函数形成抑郁情感倾向分类器,计算分类结果中抑郁文本数量与总文本数量的比值DI,以各月DI值的变化趋势反映个体在某段时间内的抑郁倾向的波动趋势,避免单条微博不能刻画用户一段时间内的整体抑郁倾向及变化情况,为医护人员分析抑郁患者提供辅助手段。Kalyani等[41]将基于词典和基于机器学习的方法结合建立情绪波动分析器,通过无监督机器学习来自动检测情绪极性,生成用户情绪偏差和相似性的报告,形成动态分析方法,确定用户情绪波动,可用于预防因抑郁而导致的自杀企图。Kang等[42]开发多模态情感分析方法,构建了含有Visual Sentiment Ontology和SentiStrength的文本词典、含有负面和正面表情符号的表情词典以及图像分类器,通过汇总每日或每条文本各模态隐藏的情绪,连续监控用户的情绪趋势,准确率提高4.4%至28.0%。Wu等[31]提出的自动生成网络用户情绪波动系统更加完善,该系统进一步扩展词典,包含NTUSD、HowNet、TCCE 3种文本词典和两种表情词典,生成负面情绪曲线,当曲线突然上升时触发事件检测,根据帖子内容、新闻、天气数据来分析情绪变化可能的原因,不仅为抑郁患者提供自我检查工具,也为医护人员评估抑郁情绪波动和发生原因提供参考。
情感分析效果依赖于情感词典的准确度,目前限制情感词典构建的主要因素包含两方面,一是获取的原始数据量不足,有限的爬取量和不断迭代的网络新词导致获取的情感词不全、词典覆盖面小,二是文本预处理的效果不佳,网络文本内容丰富,为数据清洗及训练高质量词典带来难度。未来需持续跟踪用户评论,编组更高效的爬虫程序以增大爬取用户数量[21],调整文本预处理的策略,及时更新并合理延伸词典,建立更完备、更精准的情感词典。
社交媒体的信息包罗万象,利用表情符号等多模态数据、结合用户行为或语言特征、引入其他机器算法均为情感分析方法打开新思路。未来可深入对图像、音频、视频等数据的研究[43],甚至可采集周边信息如粉丝圈、转发量、在线时间等,结合更多有利于分析抑郁倾向的多模态信息,同时考虑当多模态呈现的情感倾向不同时,如何衡量权重以提升分析的准确率。
基于情感词典对抑郁个体情感分析的方法跨越数据挖掘、计算机技术、心理学等多个领域,医疗卫生人员在分析个体抑郁情绪、尽早实施干预中起到重要作用,然而目前情感分析的研究多由计算机工程领域人员完成,医疗卫生等领域未充分发挥作用,未来应发挥多学科交叉融合的优势,一方面计算机领域研究者需进一步利用新兴技术,调整程序代码以推寻更稳定可靠的模型配置;另一方面,医疗、心理等领域人员可以充分利用专业知识,结合科技成果,有效解决心理障碍高发生低筛查的问题。在医疗卫生与人工智能相结合的研究热潮及“健康中国2030”规划不断推进的背景下,共同推动基于情感词典的情感分析在抑郁领域的应用,促进心理健康状态智能监测服务的全民覆盖。
早期筛查并实施有效干预对抑郁患者的健康管理和降低医疗成本具有重要作用[44],基于情感词典的情感分析方法通过利用社交媒体文本构建词典分析用户情感倾向,在识别与动态监测抑郁个体中展现出巨大潜力,但目前针对抑郁的开源情感词典不足,应用于医疗、心理领域的研究有限。因此,未来可将该方法与心理等领域相结合,以帮助临床人员早期识别筛查抑郁用户或检测抑郁情绪波动,应用智能化方式改善公众心理健康。