突发公共事件下教育舆情评析
——以新冠疫情期间“停课不停学”舆情为例

2020-04-16 05:29郭晓航闵素芹
关键词:停课不停学舆情新冠

郭晓航,闵素芹

(中国传媒大学 数据科学与智能媒体学院,北京 100024)

1 引言

教育舆情是社会舆情的重要组成部分,反映了公众对于教育相关事件的感受、认知和讨论。互联网时代的开放性,使得群众有便捷的机会对教育相关热点事件发表自己的看法,教育舆情发展的空间和传播的速度也不断提升。互联网时代的到来,给教育治理带来了新的挑战,同时危机处置与科学决策迫切需要教育舆情研究强大的助力[1]。

目前深入的教育舆情研究虽然还未完全形成,国内关于教育舆情研究的文章已有不少。卢珂和赵丽娟基于教育满意度舆情调查数据及网络舆情数据,进行北京市中高考改革舆情研究,结果发现:公众对北京市中高考改革的总体满意度较高,少数人对中高考改革现状不够满意,在网络舆情上,公众对课业负担、学生发展、教育公平等关注度较高[2];朱乐,李秋萍,朱燚丹在基于深度学习的“教育公平”网络舆情分析中,构建了一个基于内容与结构的舆情分析模型,其中利用 BiLSTM-CNN深度模型对舆情内容进行情感分析,运用社会网络分析法对舆情网络进行结构分析[3];潘文浩,李金津,何必凯,赵守盈在突发公共卫生事件中网络用户的情感与心理动态分析——以“新冠肺炎”事件为例中,借助大数据深度学习技术与自然语言处理方法,对92347条“新冠肺炎”相关的微博文本数据进行关键词词云与情感倾向分析,结果显示,网络用户的关注点主要包括对疫情动态的担忧、对疫情防控的关切、对战胜疫情的信心等方面,不同时期网络用户情感倾向存在差异,且女性情感表达倾向高于男性,事件成熟后期,信心、希望等积极情感文本数大幅提升[4];张琛,马祥元,周扬,郭仁忠. 基于用户情感变化的新冠疫情舆情演变分析中,以2020年1月23日至4月8日期间“人民日报”每日疫情通报的微博评论为信息基底,首先使用中文自然语言处理工具SnowNLP对语料进行情感倾向性抽取,完成正负向的情感分类,然后基于Single-Pass聚类算法实现文本语料的聚类分析,探索疫情热点话题,最后利用Louvain社团发现算法实现舆情被关注度的信息挖掘[5]。

自2020年1月新冠肺炎疫情在全国暴发以来,各地都严阵以待。这场突发公共卫生事件,影响着世界各国的经济、社会的安全,人民的健康,并带来了前所未有的挑战,考验着国家公共卫生体系、应急治理体系和教育管理体系。面对这种突发情况,教育工作该如何开展成为人们热议的话题之一,各级教育部门按照教育部和当地党委政府统一部署要求,全力防控,坚决防止疫情在学校蔓延,同时也全力保障防控疫情期间各地学校“停课不停教、不停学”。教育部门的迅速反应对于后续教育舆情的发展、演变及治理有重要的现实意义。

本文利用数据挖掘的方法,运用 Python 对于微博上“停课不停学”相关话题进行收集,分析群众对于“停课不停学”教育舆情的情感动态、教育舆情话题、随着时间产生的变化特征,获取群众对突发公共事件下“停课不停学”教育舆情的主要情感观点和价值取向,可为教育舆情分析等相关研究提供新的研究视角。本文余下部分安排如下:第二部分介绍了数据来源以及研究方法;第三部分展示了新冠肺炎疫情期间关于教育话题的热词,对相关话题微博数据进行时间序列分析,最后对“停课不停学”教育舆情进行情感分析;第四部分总结全文并提出建议。

2 研究设计

2.1 数据来源

本文对于新冠疫情期间新浪微博上全国高校“停课不停学”教育舆情相关信息进行采集,对微博数据整合、清洗后,共产生相关原创微博 31849篇。时间跨度为2020年1月24日至3月30日,囊括了疫情暴发后湖北省武汉市实行“封城”政策后到1月29日教育部下发通知要求2020年春季学期延期开学,再到三月末疫情基本得到控制。其中,1月24号至1月29号 “开学” 等话题最受舆论关注,相关资讯3784篇;1月30号至3月30号“网课”等话题热议起来,相关资讯28065篇。期间全国各地迅速启动并开展疫情防控工作,同时各地教育部门迅速启动应急预案并有序地开展教育教学工作,与教育相关的微博话题讨论活跃度持续升高。

2.2 研究方法和框架

本文研究运用数据挖掘和情感分析技术,首先运用“后羿采集器”爬取1月24日至3月30日原创微博文本数据,再通过 Python 软件分析新冠肺炎疫情的热点教育主题情感态势,深入分析突发公共事件教育舆情特征及应对策略,从发博数量、时间、热点词、情感倾向等方面描述新冠疫情期间高校“停课不停学”教育舆情的基本特征,并重点分析了相关热点话题,揭示新媒体参与背景下,突发公共事件时教育舆情的演化过程。本文研究框架如图1所示。

图1 “停课不停学”教育舆情研究框架

3 舆情呈现及评析

本文将对相关话题中全部原创微博进行时间序列分析,对微博内容构建词频、词云和情感分析,进而分析出“停课不停学”教育舆情的阶段特征和公众主要情感倾向,对于研究突发公共事件下教育舆情的发展进程、公众的情感具有重要意义。

3.1 “停课不停学”教育舆情时间序列分析

教育舆情演化存在阶段性,根据教育舆情的演变,本文以天为统计单位对“停课不停学”教育舆情中“网课”、“云课堂”等相关话题的原创微博数据进行时间序列分析,得出“日微博发布数量随时间变化的曲线图”。结果发现,随着舆情的发展,网络用户的微博数量呈现阶段性变化,且微博数量与教育舆情相关事件节点显著正相关。由图3.1.1可见,1月30日至3月30日“网课”、“云课堂”等话题原创微博发布数量的动态变化情况。发博数量自2020年2月10日起呈现暴发式增长,此后呈现波动式曲线,舆情高峰期分别出现在2月10日至2月12日、2月17日至2月19日、2月24日至2月26日、3月2日至3月4日这4个时间段,其中2月24日至26日期间达到舆情最高峰。

2月10日至2月12日期间,教育部财务司、财政部科教和文化司联合印发《关于做好新型冠状病毒感染肺炎疫情防控期间学生资助工作的通知》,要求各地各校切实保障家庭经济困难学生基本学习生活需求,全面助力打赢疫情防控阻击战。微博上关于“上网课如何保证教学质量”、“线上课堂如何开展”等话题成为人们关注的热点。这些热点话题推动了教育舆情发博量出现第一个高峰。

2月17日至2月19日期间,习近平总书记主持中共中央政治局会议研究新冠肺炎疫情防控工作,部署统筹做好疫情防控和经济社会发展工作,有序推动复工复产,稳定就业举措。中共中央办公厅、国务院办公厅印发了《关于深化新时代教育督导体制机制改革的意见》,进一步深化教育督导运行机制改革。教育部于2月17日开通国家网络云课堂,有不少中小学正式开启网上教学模式,使得“高校毕业生线上答辩 ”、“云课堂”话题成为舆论讨论的热点。

2月24日至2月26日期间,国务院总理李克强主持召开国务院常务会议,推出鼓励吸纳高校毕业生和农民工就业的措施,扩大今年硕士研究生招生和专升本规模,同时各地发布紧急通知学校开学时间不早于2月24日,微博话题“云毕业”、“网课”、“上网课软件卡顿”等话题持续发酵使舆情达到最高峰。

3月2日至3月4日期间,教育部《关于应对新冠肺炎疫情做好2020届全国普通高等学校毕业生就业创业工作的通知》,引发公众多次讨论“高校毕业生就业”、“疫情期间如何答辩”等话题。

总体而言,公众在国家召开关于疫情会议期间与教育部下发通知发布了数量较多的微博,发文数量曲线与这些时间节点正相关,在重要通知下达期间有几次高潮点段。

图2为2020年1月30日至3月30日全国各地区“网课”、“云课堂”等教育相关话题原创微博发布数量可视化地图。由图可知,2020年1月30日至3月30日期间关于“停课不停学”教育相关话题讨论发博量最多的省份是北京、湖北和江苏,发博量较多的省份包括河南、山东、广东、浙江等,发博量较少的有内蒙古、甘肃、贵州、新疆等,发博量最少的省份为青海、西藏、台湾和澳门。

图2 发博量时间序列变化

探究发博量最多具体原因有:发博量较多的地区是因为疫情暴发初期湖北较为严重,封城后学生和家长迫切地想要了解如何开展“网课”、“云课堂”;北京作为各类教育的集中地,公众对于“网课”、“开学”等话题的关注度高,公众对于开展“网课”效果展开热烈地讨论。发博量最少具体原因有:发博量最少的地区可能因为网络设施落后、学生数较少、使用微博人数较少、教育舆情话题参与度较低等多种因素导致青海、西藏、台湾和澳门成为教育舆情关注度最低的地区。

3.2 “停课不停学”教育舆情词频、词云分析

本文这一部分分阶段分析网络用户微博文本词频和词云,根据不同阶段网络用户关注程度以及关注点的差异,探讨其情感和认知变化的表现。下面将以1月29日教育部下发通知要求2020年春季学期延期开学为时间节点,研究第一个时间段为1月24日疫情暴发后湖北省武汉市实行“封城”政策后到1月29日教育部下发通知春季学期延期开学,第二个时间段为1月29日到3月30日疫情基本得到控制。

词频分析法源于情报学,利用词频分析能够描述和预测舆情发展趋势,判断事物之间的关联性[6]。词频的某些波动与社会事件的发展波动存在着内在联系。1月24日至1月29日的核心主题词均包括“开学”“疫情”等,这个时间段此阶段微博热词的波动与官方声明有关,新闻报道主要以疫情期间能否开学情况为主,随着1月29日教育部下发通知要求2020年春季学期延期开学后,1月30日至3月30日的核心主题词“上课”、“直播”等也逐渐成为热点话题,此阶段网络用户对“孩子如何上课”“网课如何进行”等的关注度剧增。

图3 全国各地区关于发博量可视化图

图4 “停课不停学”教育舆情相关话题词频统计(1月24日-1月29日)

图5 “停课不停学”教育舆情相关话题词频统计(1月30日-3月30日)

词云旨在凸显文本中出现频率较高的关键词,在视觉上直观呈现,出现频率越多,则字体越大。本文采用 WordCloud 对“停课不停学”教育舆情相关话题微博数据进行词云主题演化分析,以“天”为时间单位绘制图3.2.2和图3.2.3所示的“停课不停学”教育舆情词云图。研究采用 Python 中“Jieba”中文分词对清洗后的微博文本进行分词,提取全部数据关键词,并对关键词词频进行标注[7]。获取关键词后,使用 Python 中 WordCloud 组件绘制“停课不停学”教育舆情的关键词词云,通过关键词词云可以较为直观地研究网络用户对此次教育舆情事件的态度与看法。

图6 “停课不停学”教育舆情相关热词(1月24日-1月29日)

3.3 “停课不停学”教育舆情情感分析

2020年1月29日教育部下发通知要求2020年春季学期延期开学,推行“停课不停教、不停学”举措,本部分主要分析教育部推行“停课不停教、不停学”举措后,即对于1月30日-3月30日微博“停课不停学”话题中“网课”等热词的微博文本进行情感分析。本文采用 SnowNLP 的情感分析原理,以朴素贝叶斯分类算法为理论基础[8],朴素贝叶斯分类算法是一种有监督学习算法,通过对训练集的学习,这种算法的优点是正负面词混杂时,依旧可以根据训练集做出较为准确的判断。

基于先验概率与贝叶斯公式,计算出特定条件下样本属于某一类别的概率(条件概率),从而达到分类的目的。计算公式如下:

(1)

其中,Yk为情感类别,分为积极倾向情感(positive)和消极倾向情感(negative),X为特征词,为微博文本中出现的情感性词语,P(Yk|X)就是在已知特征词X的情况下求Yk情感类别的概率,计算公式可以转化为:

(2)

首先使用分词工具和去停用词工具对微博文本数据进行处理并计算每个词出现的概率P(特征词) 及不同类别的词出现的概率P(特征词|情感类别),最后计算每条微博文本数据属于积极倾向情感或消极倾向情感的后验概率P(情感类别|特征词)来判断出文本的所属情感类别,且将该概率值作为情感值。

使用[0,1]之间的概率值作为情感值得分,当情感值范围为[0,0.5)表明该文本的情感表达为负面情感,当情感值范围为[0.5,1]之间则表明语料的情感表达为正面情感。本文将每日原创微博情感的均值作为当日公众情感均值,汇总得出关于“停课不停学”舆情的正向、负向情绪均值和公众情绪均值,生成用户情感值趋势图,见图7。其中正向、负向情绪差距强烈的主题是突发性公共卫生事件教育舆情治理中值得关注的主题。

图7 “停课不停学”教育舆情相关热词(1月30日-3月30日)

情感分析又称倾向性分析,是指对主观性文本中蕴含的情感倾向进行抽取和分类识别[9]。微博是用户在某一微博话题中发表的主观见解或者建议,可从中挖掘出评论者对于事件、事物、人物等对象的倾向性。情感倾向在分类时通常可分为积极和消极(正面和负面)2种,本文在标注数据时,以情绪类别中的“高兴”、“喜悦”、“强大”、“高效”、“强大”“平安”、“坚定”、“振奋”等为积极倾向的情感,以“惶恐”、“恐惧”、“悲伤”、“生气”、“严峻”、“焦虑”、“祈求”等为消极倾向的情感,

由于新型冠状病毒出现的偶然性、疫情爆发和蔓延形势的突发性,无论是家长还是学生对于何时能开学,如何有效地开展“停课不停学”处于热烈讨论的过程中。1月30日至3月30日期间,网络用户的情感均值变化大致可以分为三个阶段:第一阶段1月30日至2月12日,初期网络用户的整体情感值相对较低,消极情绪占主导,多日情感值均值保持在0.5以下,此阶段为网络教学的准备阶段,人们对于网络教学大多持怀疑不信任的态度,如“在家上网课作息时间规律不规律,我还是想回学校上课”、“上课软件太多”,不同的课用的软件不同,而且还存在卡顿现象”等相关讨论此起彼伏,网络用户的情绪更多表现为焦虑、不安;第二阶段2月13日至3月4日,随着各地部分中小学及高校的开学,网络教学的有序开展,人们对“家长们快被网课逼疯了”、“钉钉又崩了”等热点讨论持续升温,网络用户情绪波动较大,期间网络用户情感值有小幅度回升态势,说明人们在逐渐适应网络教学模式,各地学校网上教学初有成效,网络用户的情绪更多表现为希望、努力;第三阶段3月5日至3月30日,网民绝大多数注意力转移到了“在家上课状态越来越好了”、“钉钉终于不崩了”等热点,人们对于“停课不停学”教育舆情谈论向更为积极的方向发展,积极情绪为主流,网络用户的情绪更多表现为高效、振奋。

图8 疫情期间用户正负情感值趋势

总体来看,网络用户情绪由消极情感逐渐转为积极情感,并最终呈现平稳状态。各级政府、教育管理部门能积极面对由于疫情带来的各种教育相关的热点问题,及时对热点问题进行回应,坚持舆论的正面引导,同时借助微博的等多种途径加强监督和信息公开,有效应对危机,这也说明我国面对突发公共事件能对公众关心的热点问题采取有针对性的措施,及时地推动了教育教学方式的转变和 优化。

4 结论与建议

本研究基于2020年1月30日至3月30日“停课不停学”教育舆情相关话题微博数据,将对相关话题中全部原创微博进行时间序列分析,利用Python对微博内容构建词频、词云和情感分析,进而分析出“停课不停学”教育舆情的阶段特征和公众主要情感倾向。通过发文量的时间序列图发现,网络用户针对本次舆情的微博发文数存在阶段性变化,表示公众对此次疫情期间教育相关话题的关注程度不断提高。在公众情感方面,2020年1月30日至3月30日期间网络用户情绪由消极情感逐渐转为积极情感,并最终呈现平稳状态。通过对新冠疫情期间“停课不停学”教育舆情的研究,一方面我们了解到疫情初期各级政府、教育管理部门通力协作下,公众对新冠肺炎疫情期间“停课不停学”教育舆情的态度变化趋势;另一方面“停课不停学”教育舆情的评析为突发公共事件下教育领域的舆情应对提供了有益借鉴。

本文结合突发公共事件下“停课不停学”教育舆情发生的特点,针对此次教育舆情引导策略提出如下思考和建议。

4.1 探索和运用舆情监测新技术,掌握多样的教育舆论引导方式

互联网的普及性使得公众可以随时随地在网络上表达自己情绪和观点,从而使教育舆情的数量急剧增长。从舆情管理者角度来说,应该清楚网络舆论不是全部民意的来源,既要重视教育舆情,又要把握好分寸。在大数据的背景下,运用舆情监测技术,可以建立教育舆情监测分析系统,从而提升教育舆情的监测与分析能力,及时掌握公众的意见,疏通政府和公众网络讨论渠道,合理地分析网络舆情、判断民意,使得每个群体都能发出自己的声音,保证政府及各个部门能在第一时间获取准确的舆情及预警信息,为科学决策提供有力的支持。

4.2 合理利用技术优化教学方式,引导学生身心健康发展

现在有不少校外教育机构专注于网络教学模式,加速了互联网和教育双向融合的进程,同时也优化了教育教学方式。本次疫情期间各学校也尝试了网络教学,这既是一种机遇也是一种挑战,网络教学模式下,更要保证线上课堂的教学质量。与此同时,这种教学模式给家在偏远山区信号质量不高和家庭困难的学生造成了不小的困扰,所以政府和当地部门要及时了解学生们的实际情况,保证每名孩子能及时接受教育。学校也要掌握每个学生的学习情况,做好对学习困难学生的辅导工作,从而保证线上教学效果。在此基础上,还要了解学生们的心理动态,不仅应关注知识的传授,更应注重与学生的交流,促进学生身心健康发展。

4.3 完善教育舆情反馈机制,加快教育舆情反应速度

在突发公共事件下研究教育舆情事件的反馈时,需要政府在思想层面上具备回应满足群众呼声的工作热情,熟知教育舆情运行的普遍规律,在行动上严格遵守教育舆情反馈机制的工作流程,还需要在能力上不断完善教育舆情反馈机制,通过构建效果评价的反馈框架,不仅为妥善处理教育事件提供研究思路,也为阶段性总结教育评析提供策略依据。

猜你喜欢
停课不停学舆情新冠
新冠疫苗怎么打?
您想知道的新冠疫苗那些事
聚焦新冠肺炎
珍爱生命,远离“新冠”
关于“停课不停学”北京特级教师这么说……
“停课不停学”,家长作用不可或缺
数字舆情
应用在线教育平台实现恶劣天气下的“停课不停学”
数字舆情
利用网络平台实现“停课不停学”的教学新探索