肖 超, 施 骞, 林沛昕
(1. 同济大学 经济与管理学院,上海 200092; 2. 达特茅斯学院 塞尔工程学院,汉诺威 03755)
突发公共卫生事件是指突然发生,造成或者可能造成社会公众健康严重损害的重大传染病疫情、群体性不明原因疾病、重大食物和职业中毒以及其他严重影响公众健康的事件。[1]由于突发公共卫生事件具有危害严重、难以预测、突然发生、蔓延迅速、影响广泛、起因多样等特点,极易引发社会各行各业的不良连锁反应,对人民生命财产安全、社会经济和谐发展等构成严重威胁。[2-3]因此,及时启动相应的应急管理项目,有效优化整合各类社会资源,实现不同职能管理部门之间的有效协作,才能确保将突发公共卫生事件造成的损失降到最低。突发公共卫生事件应急管理项目需要完整的系统网络,任一环节出现问题都将扩大事件的危害。我国采用“国家—省—市—县”四级组织体制作为纵向系统,以县级疾病预防控制中心作为突发公共卫生事件应急网络的“网底”。[4]然而发生突发公共卫生事件时,社区往往才是疫情防控最直接的场所,尤其在本次新冠病毒疫情中,武汉乃至全国许多社区在疫情防控中均发挥了关键作用。以往经验与研究表明:政府在突发公共卫生事件来临时独自应对的压力较大,应积极实施基层措施,与基层共同应对突发事件。例如,社区物业可以发挥基层组织动员和沟通作用,缓解生活保障物资的暂时性短缺,或通过医疗资源下沉,强化基层在医疗基础环节的能力,实现社区分散诊断与医院集中治疗,避免人群在医院盲目汇集造成交叉感染。[5]
2020年2月7日,民政部印发的《致全国城乡社区工作者的一封信》中指出“社区防控是疫情防控的基础环节,是打赢疫情防控阻击战的决定因素”。随着突发公共卫生事件应急管理水平的不断提高,应急网络的“网底”应不再仅是县级行政单位,而应包括以社区为最基础的空间单元,需要充分发挥社区应急管理项目在整个应急管理体系中的作用,有效防控突发公共卫生事件。然而,目前鲜有对社区级应急管理项目的深入研究。因此,本文采用社交媒体舆情分析的手段,从社区居民在应急管理期间真实需求的角度出发,将应急管理需求与社区应急项目规划实施相结合,对突发公共卫生事件的社区应急管理项目进行系统研究,以期有效提升应急管理的效率与精细度,同时提升社区治理能力。
2003年非典型肺炎(SARS)疫情之后,突发公共卫生事件成为应急管理与公共管理的主要议题,针对公共卫生体系存在问题的系统分析与解决的研究相继涌现。如:有关研究指出在SARS疫情期间存在应对机制不健全、政府投入不足、疾病控制体系应对能力差、农村卫生工作不到位等主要问题。[6-7]为了应对上述问题,现有研究聚焦突发公共卫生事件应急管理体系及其运行机制的建立与优化[8-9],以及相关法律的完善、应急预警体系建设、疾控机构与卫生监督机构的应急能力评价等方面[10-11]。另外,也有众多学者提出要加强基层与社区应急管理,如:梁囡囡指出我国突发公共卫生事件管理中存在岗位繁杂与管理权限模糊化、忽视基层应急管理的问题,应积极引导基层社会大众参与到突发公共卫生事件处理与监督中。[12]杨保军提出要以“15分钟生活圈”建设为契机,将社区拓展为疫情防控的基础空间单元。[5]李宏伟等提出应急管理除了要以政府为主导,还要充分发挥社会组织的作用,及时向疫区群众提供援助,增强对捐赠物资的有效管理,完善社会信任体系。[13]
社区作为疫情防控链条的最基本单元,不仅是疫情联防联控的第一道防线,更是疫情防控的最后一道承压阀门,是外防病例输入、内防病例扩散最有效的防线。在基层防控能力建设方面,徐磊青提出社区阻击战有加强社区建设、发动志愿者行动、构建社区防疫合作关系、有效利用社区资源四个方面的作用。[14]唐文波指出基层社区的防控能力建设应着重考虑“责”“严”“实”“准”四个方面。[15]在社区防疫措施方面,李多灵等将社区防疫工作分为外部防控与内部防控两类:外部防控措施有入口登记、体温测量、建设消毒通道、外来人员管理与发放出入通行证等;内部防控措施包括社区内消毒、物资采购、口罩发放、防疫宣传等。[16]任江媛从摸底排查、防疫宣传、物资采购与数字化技术等角度对如何化社区治理优势为社区防疫效能进行了系统分析。[17]在社区智慧防疫技术方面,梁浩等指出:绿色数字人居技术在社区防疫中具有较强的风险预测能力与管控能力、能减少人力资源与人员接触、提高管理的即时性与效率等优势。[18]
除上述绿色信息技术外,媒体也是应急管理风险沟通的重要途径,各种社交平台例如美国的Twitter和中国的新浪微博已成为公众获取和发布突发公共卫生事件在内的各种重大事件相关信息与观点的重要渠道。因此,探究如何有效利用社交媒体进行风险沟通与舆情分析对于解决突发公共卫生事件具有重大意义。近年来,学者们采用机器学习与大数据的手段进行社交媒体网络舆情分析,为突发事件应急管理提供决策支持,主要用到的分析方法有文本情感分析、可视化分析、主题建模、主题演化和时序分析等[19-20]。在新冠疫情中,新浪微博热搜榜信息被用来分析公众对于COVID-19相关事件的关注情况[21];微博转发关系被用来构建突发公共卫生事件利益相关者的社会网络情感网络图谱等[22]。
国内外学者在突发公共卫生事件应急管理研究上已取得了丰富的成果,但仍有待提升。例如,在研究对象方面,目前仍缺少关于如何开展社区应急管理项目的系统研究。关于应急管理现存问题,现有研究少有从民众诉求这个视角进行研究,忽视了应急风险沟通的双向性,限制了基层应急管理项目的有效实施。因此,本研究通过收集与分析新冠疫情期间新浪微博发布的有关社区应急管理项目措施与实施成效的看法,对社区应急管理项目进行实证分析。研究采用基于朴素贝叶斯分类与情感词典的情感分析模型,探究公众对突发公共卫生事件社区应急管理项目的关注度与情感态度倾向,并对社区应急管理项目进行时空比较研究;从民众需求的角度出发,探讨我国目前突发公共卫生事件社区应急管理项目规划与实施中的不足,为未来社区应急项目的开展提供策略支持。
本研究的原始数据采集自中国最大社交媒体平台之一的新浪微博,单条微博可采集的属性主要包括内容属性、评论属性、用户属性和关注度属性,其中用户属性分为认证用户与非认证用户两类。认证用户发布的微博多为新闻,新闻微博多为态度中立、没有强烈感情色彩的文本,此类微博下的评论是公众对该条新闻的看法态度,因此本研究在分析新闻微博内容的关键词并提取主要信息的同时,还对评论内容进行情感态度分析。而非认证用户则通过发布原创微博表达对某个特定话题的情感态度与个人观点,本研究对此类微博提取其内容的核心关键词,并对文本进行情感分析,同时提取其发布时间,然后结合各个疫情事件节点及政策、规定发布的时间节点,分析舆情演化时序。基于上述分析,本研究针对不同微博用户属性提取不同的微博舆情属性,见表1。
本研究结合李多灵、徐磊青等人对社区防疫与应急管理项目措施的研究[14][16-17],将社区应急管理项目中的关键措施概括为封闭管理、体温测量、入口登记、人员排查、清洁消毒、通行证发放、防疫宣传、物资采购、口罩发放共九种,对每类措施均选取一到三种常见相关词语进行搜索。将应急管理项目实施措施相关词与“小区”和“社区”这两种代表社区的词语组合形成36组搜索关键词组,以确保数据爬取结果的全面性。本研究的微博搜索时间跨度为2020年1月1日至2020年4月30日(共计120天),此为国内新冠疫情暴发的高峰期与防控的关键时期;以6小时作为单条URL时间跨度,共创建34560条URL链接用于爬取微博舆情信息;按照图1流程对原始微博数据文本进行去除噪声、中文分词、去除停用词等预处理,获取规范且不含无用信息的文本进行后续分析。
图1 原始微博数据清洗与预处理过程
SnowNLP是一种通过朴素贝叶斯分类算法对文本进行“积极”与“消极”分类的情感分析方法。对于一个文本x,该模型在对其进行分词后,筛选出x中包含的有义词语w1,w2,w3,……,wn,预测模型的目标是将x分类至积极(p)或消极(n)两类中的一类。依据朴素贝叶斯原理,这个二分类问题可以被简化为一个简单的概率比较的问题:
output=max{P(p|w1,w2,w3,……,wn),
P(n|w1,w2,w3,……,wn)}
(1)
即辨别输入文本属于积极的概率和属于消极的概率的大小关系,若属于积极的概率更大,则预测判断为积极,否则判断为消极。
由于基于SnowNLP的情感分类模型仅将文本分为“积极”与“消极”两类,并不能很好地判断公众在该文本中表达出某类情绪的原因有哪些。因此,在上文构建模型的基础上,研究参考大连理工大学林鸿飞团队整理的中文情感词汇本体库作为模型采用的情感词典,将词语分为“乐”“好”“怒”“哀”“惧”“恶”“惊”七大类[23]。本研究采用基于情感词典的七分类模型计算每一条微博文本中七大情感分类的分值,以便对公众对于社区应急管理项目实施情况的情感与判断进行更细致的分析。对情感分类分值的计算逻辑为:
Scoreclassi=count (W∈classi)*(-1)N
(2)
其中,Score(classi)为情感分类i的分值,为i分类情感词语在该文本中出现的次数;N为i分类情感词语前的否定词数量。至此,可以得到每个文本中七大情感分类的分值,模型结果中分值最大的情感分类即为该微博文本所表达的主要情感。这一模型的结果能为后续社区应急管理项目的评价带来更细节的数据支撑。
研究使用随机筛选出的1000条评论数据作为测试数据集进行模型验证,根据准确率(Accuracy)、召回率(Recall)、精确率(Precision)和F1分数来验证采用情感分析模型的可靠性和有效性。SnowNLP情感分类模型的准确率、召回率、精确率和F1分数分别为0.86、0.90、0.78和0.84,表明在评论数据的情感属于积极还是消极这个二分类问题上,SnowNLP算法模型的预测结果有着较好的表现。在1000条测试评论数据中,443条评论数据由于语句短、词汇少且没有明确语义被情感词典算法判断为“无法预测情感分类”。进一步关注剩余557条能给出情感细分结果的数据,测试结果表明410条数据的真实情感分类与情感词典模型预测结果是一致的,准确率达到74%,借此验证了使用此方法分析评论数据情感分类的有效性和可靠性。
本研究结合上文构建的情感分析模型对九类社区应急管理项目措施的公众感情态度进行统计分析,进而对各类社区应急管理项目的开展情况进行评价。本研究还通过结合微博舆情数据中的“时间属性”与“地区属性”对模型结果进行进一步的时空演化分析,以总结社区应急管理项目各类措施实施中存在的问题与提升策略。
应用SnowNLP情感分类模型,对九类社区应急管理项目关键措施相关新闻下的评论与个人原创微博进行情感分类,并将各类措施情感分数(剔除等于0.5的中性评论)按极端积极(大于0.9)、一般积极(大于0.5且小于等于0.9)、一般消极(大于等于0.1且小于0.5)和极端消极(小于0.1)分为四类,模型情感分类描述性统计结果和情感分数统计结果见表2与表3。
表2 九类社区应急管理项目关键措施新闻评论情感分类结果描述统计
表3 社区应急管理项目关键措施情感分数四种类型占比 单位:%
从统计结果可见,新闻下的评论文本情感分值分布结果更为分散,而个人发布原创微博通常是用户个人对某一类事件有强烈情感或明显态度倾向的主动发布,因此其情感分值呈现极端值集中,且在新冠疫情中个人微博情感态度更偏向消极。
公众对“口罩发放”这一措施较少存在负面情绪,在疫情初期防疫物资短缺时,这一措施最直接地为居民提供了防护物资,因此公众情感态度较为积极。此外,新闻评论内容数据显示,公众对“封闭管理”“入口登记”“通行证发放”以及“体温测量”四类措施具有较强的负面情绪,且极端消极分值的个数大于极端积极分值。个人原创微博情感分析则显示,除去“口罩发放”外的八种措施,用户情感分析数据大多集中在极端值位置,且极端消极的频率显著大于极端积极的频率。
基于情感词典的七种情感分类,将“乐”“好”“惊”定义为积极情感,将“怒”“哀”“惧”“惊”定义为消极情绪。进而,研究采用情感词典模型分析了新闻评论与原创微博中公众对九类社区应急管理项目关键措施的情感类型细分,结果见表4。对于不同社区应急管理项目关键措施的积极情感主要表现为“好”,消极情感则主要表现为“恶”,在消极情绪中“怒”占比最少。根据前文,公众对“封闭管理”“入口登记”“通行证发放”和“体温测量”这四类措施的消极情绪居多, 因此结合情感词典,本研究将对这四类措施的消极情绪进行重点分析。公众对这四类措施的负面情绪均以 “厌恶”为主要特征情绪,这一情绪主要来自:小区封闭带来的生活不便,如生活物资采购、快递收发、停车位不足等问题;对于小区并未严格实行凭通行证出入或渴望出行自由而产生的厌恶情绪;以及对测体温这类措施过于形式主义的负面情绪等。
表4 社区应急管理项目关键措施七分法情绪类型占比总结 单位:%
结合上述两个模型的分析结果可见,公众对于新冠疫情暴发集中期应急管理项目所采取的各类措施普遍持消极态度,为了进一步分析消极情绪的产生原因与改进措施,研究进一步结合微博数据的地理和时间标签,进行相关性与回归分析,对公众情感态度倾向进行时空演化并探讨其原因,为社区应急管理项目的实施提供有针对性的提升建议。
新闻微博具有特定地理位置,在研究收集到的95004条个人数据中,获得有效用户地理信息共计76776条数据,结合每条数据的地理属性与新冠疫情的分布地图,对社区应急管理项目在全国各地区的情感分值与话题热度分布进行地理统计分析。研究以疫情累计确诊人数占该省人口比重来衡量各省新冠疫情的严重程度,以每个省份发布社区应急管理项目相关话题的原创微博数量作为该地区的话题热度。将微博内容的情感打分结果与微博地区属性结合,并以各省区市所有微博的情感均值作为该省情感分值,使用K-均值聚类算法对34个地区分别进行聚类分析,按照情感由消极到积极分成五类区域。结果显示:消极区域为湖北、重庆、香港,较消极区域为湖南、山西、吉林、江苏、广东、海南、云南、澳门,中性区域为北京、上海、天津、山东、安徽、广西、陕西、宁夏,较积极区域为河北、内蒙古、辽宁、河南、浙江、江西、贵州、西藏、台湾,积极区域为黑龙江、甘肃、青海、新疆、福建、四川。运用方差分析和事后比较的方法对聚类分析结果进行显著性检验,方差分析显示F值为361.361,显著性小于0.05,五类区域对社区应急管理项目的情感分值存在显著差异,表5中事后比较结果也验证了五类区域彼此间的显著性差异。
对于社区应急管理项目话题关注度、情感分值与疫情严重情况进行相关性分析,结果见表6,可得两条一般规律:疫情严重程度与情感分值呈负相关,疫情严重程度与话题热度呈正相关。而不符合上述两条一般规律的省区市则应成为研究社区应急管理项目实施情况需要重点考察的对象,具体分为以下四类:(1)疫情较为严重,但却具有较高的情感分值,即社区防疫项目实施情况较好的地区,如浙江、黑龙江与台湾等地。(2)疫情严重程度值低,但却具备较低的情感分值,在社区应急管理项目实施上还有待改进提高,如山西、吉林、云南等地。(3)疫情较为严重,但其话题热度较低的省份,民众对社区层面的防控意识较为欠缺,如香港、澳门、海南、台湾等地。但考虑到香港、台湾、澳门等地的居民并不是以新浪微博平台作为主要的社交平台,因此可排除考虑。(4)疫情严重程度值低,但话题关注度高,民众对社区应急管理项目较为关注,如广东、江苏、四川、河北等地。
针对研究选取的95004条个人原创微博与46656条新闻微博评论,以每周内所有微博的情感分数均值作为该周情感值,分析微博文本情感态度的时间演化趋势,微博文本的情感分值变化与疫情持续时间的回归分析见图2。
表6 社区应急管理项目情感分值相关性分析
图2 微博文本的情感分值变化与疫情发展的回归分析
结合线性回归ANOVA分析,可见公众对于社区应急管理项目的情感分值与疫情的持续时间呈显著正相关,随着疫情的持续,公众情感分值总体呈现上升趋势。结合公众情感变化曲线的走势与国内疫情确诊人数的数据,公众的情感分值变化分为三个阶段。
(1)情感分值稳步上升阶段:2020年1月20日至3月9日,该阶段新闻下评论的情感分值由负面转向正面;个人主动发布微博的情感分值在这一阶段呈现出略微下降后快速上升的趋势,并在3月9日达到最高值。该阶段为国内疫情暴发期,现存确诊与新增确诊人数变化的拐点都出现在这一阶段,即在该阶段内国内疫情分别经过了严峻期与逐步恢复期,这为个人原创微博在疫情严峻期出现情感分值略微下降趋势提供了解释。
(2)情感分值波动阶段:2020年3月9日至4月6日,该阶段的微博数量只占本次研究数据集的17.3%,且微博话题数量相较上一阶段明显减少,因此情感分值易受到特殊事件与个别话题的影响。该阶段情感分值发生波动,但总体仍呈上升趋势,原因主要为境内疫情已大体稳定时,境外输入病例让公众情绪出现焦急反复。
(3)情感分值稳定阶段:2020年4月6日至4月30日,该阶段民众的情感态度保持基本稳定。该阶段境外输入病例基本得到控制,此外未出现其他影响民众对社区防疫情感态度发生变化的重大事件,因此公众情感态度基本平稳。
从上一章分析结果可见公众对社区应急管理项目的部分关键措施的情感态度在疫情发展各个阶段呈现显著不一致性。公众对于“封闭管理”措施,在情感分值变化的三个阶段分别经历了“惧怕”到“厌恶”再到“惧怕”的过程,关键词提取的分析结果显示:在疫情发生期间,社区采取封闭管理过程中仍存在如居民生活物资短缺等问题。在疫情严峻期,由于公众的“惧怕”情绪占主导,实施社区应急管理项目的同时也应考虑安抚居民的担忧与惧怕情绪,如开通疫情心理守护电话,为居民提供心理疏导、情感支持、认知调整等服务。在封闭管理的全过程中,因封闭带来的生活不便始终存在,因此还应将保证居民基本生活物资的供应作为工作重点,如在社区的超市内搭建生鲜便利服务站,或由社区工作人员统一进行物资采购并提供送菜上门等服务。此外,还应特别关照如老年人等不熟悉互联网使用的人群,对其提供送餐送药、提供生活用品等服务。
公众对于“通行证发放”措施的主导情感态度经历了从“惧怕”到“哀伤”再到“厌恶”的过程。在疫情严峻期,公众的“惧怕”特征情绪主要来自对社区应急管理项目实施监管不力、把控不到位的担忧。此时各社区管理主体应严格遵循相关规定,制定应急管理项目策略并严格把控实施过程,对存在出行需求的人员,如医疗、交通等行业的从业人员,在确保其符合要求后应及时发放通行证。在疫情恢复期,居民都已复工,对于居民的通行证发放与审核应在保证严格的前提下灵活变通。在疫情平稳期,公众的“厌恶”情绪成为主导情绪,尤其是在疫情低风险区域,这种情绪主要来自该措施造成的日常生活不便。对此,在疫情稳定阶段也应及时调整应急管理项目的实施策略,如在疫情低风险地区可考虑对出入通行证的审核进行适当放宽。
社区因其空间属性及社会属性的不同而存在异质性,不同特性的公众在同一时间阶段、对于同一应急管理措施可能具有完全不同的态度。例如,有用户反映小区采用横幅等传统宣传模式过于老旧,应充分利用微信公众号进行推送;但同时也有住户反映,小区完全不张贴横幅或告示,使得家中老人难以及时了解疫情发展情况,忽视疫情防控的重要性。为应对此类现象,不同类型的社区在应急管理项目实施上也应有不同的工作重心。年龄结构、户籍结构、人口密度是影响社区应急管理项目实施的主要因素,应根据社区异质性合理规划有限人力物力,实现社区应急管理项目实施效率的最大化。
老年群体免疫力差且常伴慢性基础疾病,在社区应急管理项目实施中应被视作重点关注对象。同时,老年群体的信息来源渠道主要为时效性较低的传统媒体,难以及时获得有关疫情的最新消息,在疫情发展初期,他们警惕性较低,且难以通过互联网手段在封闭管理期间获取生活和防疫物资。老年群体中又常存在独居老人和生活难以自理的群体,在疫情期间需要获得特殊照顾。因此,老龄化社区应将应急管理项目实施重心放在老年群体的需求上。在医疗资源上,可考虑引导医疗资源向社区医疗服务机构流动;在防疫宣传方面,社区工作人员可同时使用普通话与方言进行宣传,重点注意向老年群体普及防疫知识;在物资提供上,社区应对获取物资存在困难的群体提供特殊帮助,如登记存在慢性疾病的老年群体的健康情况与用药需求,保障其医疗物资;在疏导慰问方面,应保障老年群体的心态健康,在疫情严峻期间应注意缓解老年人群体的紧张情绪。此外,对于独居或生活不能自理的老人,可考虑动员居委会、物业公司、志愿者组织等实行上门帮扶。而对于非老龄化社区,可考虑将服务更多地转向采用线上及数字化手段,将节省的人力分配在老年群体身上或是调配至老龄化社区以保障应急管理项目的顺利实施。
新冠疫情发生在春节期间,伴随着春运与返工大潮,以外来常住人口为主的社区应将应急管理项目实施重心放在社区大面积排查与流动居民的信息登记上。对于接受返乡返城人员的社区,更需要对住户的历史行程、接触者、健康状况等信息进行收集,以便后续的重点监测。对于两类人群混住的社区,应对不同风险类型的住户进行精细化管理,对高风险人群进行重点管控的同时也应呼吁居民不应排斥高风险人群。疫情期间,社区应注重防止人员聚集,对于高密度社区,应提高对公共区域的消毒频率并管控公用设备的使用人数,如可通过使用电梯摄像头智能识别乘坐人数,若超出限制人数则自动跳层,实现“人防”与“智控”的有效联动。对于低密度社区,物业人员可将重心放在生活物资的采购、发放、防疫知识宣传等方面,有效利用有限的人力资源。
由于部分应急管理项目措施实施过程中会对公众造成不便,公众会产生消极情绪,尤其是在后疫情时代,对某些措施的消极情绪会更明显。因此,在社区应急管理项目的实施过程中应重点考虑实施过程中尽可能减少对公众正常生产生活的影响。在新冠疫情防控中,许多社区都采用社区防疫二维码、出入口控制系统、红外测温设备、非接触式电梯控制技术等智慧技术推动应急管理项目的实施,这既提升了社区疫情防控水平,同时又实现了应急管理措施的便捷化和无感化,有效缓解了公众的消极情绪。结合云计算、物联网、人工智能等手段的防控措施既能高效实现对重点监测人员的信息采集,然后通过对接街道、县级疾控中心等上级有关部门的疫情防控平台实现数据互通,降低社区工作人员上门排查而交叉感染病毒的风险,同时也能解决社区工作人员数量不足、人力物力资源匮乏的问题。针对外部防控管理,对出入口管理、测温等社区应急管理措施可采取数字化手段进行优化,如采用非接触式门禁设备、实现无感测温等,有效应对居民对防控措施的“厌恶”与“惧怕”情绪。在内部防控环节,可使用自主移动消毒机器人等对病毒存在可能性高的区域如垃圾桶、电梯等进行消毒,既提高消毒效率,又保障社区工作人员的安全;通过智能化手段检测电梯的使用频率,在人力物力资源有限的情况下,可通过分析电梯使用情况有序安排电梯消毒工作频次,提高资源使用效率等。
本研究使用爬虫技术抓取新浪微博上与社区应急管理项目九类关键措施相关的新闻评论与个人原创微博舆情数据,构建了基于SnowNLP的情感打分模型与基于情感词典的情感七分类模型,基于措施类型与时空因素,对突发公共卫生事件社区应急管理项目的实施效果进行系统分析,讨论不同时空演化下公众对社区应急管理项目实施的关注度与情感态度的不同,结合疫情数据与关键词提取技术分析社区应急管理项目实施中存在的问题,并分别从疫情演化、社区异质性和智慧化技术三个角度对社区应急管理项目的实施提出有针对性的提升建议。
但受限于微博数据的特点和有限时间内数据获取的局限性,研究仍存在诸多不足之处,可在后续研究中加以改进。由于数据集来自新浪微博,舆情分析的对象主要为微博平台的使用者,因此忽视了对新浪微博使用频率低、甚至不使用的老年人等群体。此外由于香港特别行政区、台湾等地区的主流社交媒体并不是新浪微博,因此对于这些地区民众的情感态度数据有所缺失。本研究所采用的情感七分类模型还不能有效地识别出新浪微博平台上的网络用语及讽刺语气,因此模型结果中存在大量的“无感情偏向”文本。在今后的研究中,可以考虑预先提取一部分与话题相关的微博文本进行训练,使得情感分析的结果更适用于社交媒体平台;同时,对于数据不可得的人群或地区可以考虑采用问卷调研的方式进行补足,保证数据集的完整性。