省域教育舆情网络监测系统构建研究*

2018-08-02 01:45徐羡文郑厦君
中国教育信息化 2018年13期
关键词:教育网络主题词舆情

徐羡文 ,叶 扬,郑厦君

(1.福建生物工程职业技术学院,福建 福州 350007;2.福建工业学校,福建 福州 350002;3.福建省教育管理信息中心,福建 福州350003)

一、教育舆情的挑战

教育是老百姓最关心的话题之一,关心决定了涉教育问题的高关注度,于是围绕教育不断有各种热点话题产生,特别是在“好事不出门,坏事传千里”的传播规律下,各种与教育相关的负面信息、热点事件、突发事件、谣言、人物行为等极易在舆论中发酵,最终演变成舆情风暴,席卷网络。如2014年发生的“高考改革方案”、“湖北潜江校园劫持人质”、“初中英语教材现大量广告”、“黑龙江自考舞弊”、“商丘学院大学生表白被开除”、“江西应用科技学院学生被老师群殴”等事件,都曾掀起过一股股舆情风暴。面对社会上不断涌现的教育相关热点话题,省级教育管理者需要全面掌握教育网络舆论动态,做出正确舆论引导,营造有利于教育改革发展的舆情环境。

二、教育舆情网络监测平台的框架

教育舆情网络监测平台的总体架构以教育系统全局为视角,基于特定地域与专业领域,结合社会实践积累的经验和信息调查结果,设定主题与关键词,运用互联网信息采集技术对各大新闻门户网站、微博、知名论坛、帖吧、博客、搜索引擎等相关信息进行采集和抽取,使用大数据技术对采集到的舆情信息进行分析,生成教育舆情报告,为管理者全面掌握教育舆情动态、做出正确舆论引导提供依据。

教育舆情网络监测平台是一个不断发展中的应用系统,主要由数据采集、数据处理、舆情分析与报告三大部分构成。(见图1)

图1 教育舆情网络监测平台工作流程

在数据采集环节,平台实时获取报纸、杂志、网站、论坛、博客、微博、微信等各类型互联网信息载体发布的教育信息。针对需要监控的目标信息载体,自动根据预先设定的关键词进行信息搜索采集并存入数据库。专题监测采集则是根据用户需求精确采集指定信息载体的页面信息,然后用正则表达式解析出网页上的各个数据项,为下一步人工干预提供决策指导的数据依据。通过全网监测或定向监测,系统根据信息的来源、浏览和评论的密集程度,识别出一定时间内的热点舆情,使用者可以在第一时间就将目光聚焦到热点舆情的主题,分析研判舆情的发展,预测舆情将可能引发的次生影响。

在数据处理环节中,系统根据预先设置的主题和关键词对采集到的数据进行识别处理。互联网信息载体发布的信息除了正文以外还有大量其他信息,如图片、HTML格式标记和广告链接等,这些内容数据和格式信息掺杂在一起,因此数据处理是先提取需要的正文内容,提取的内容一般包括来源、标题、正文、时间、访问数、IP等重要数据;然后根据现有的词库进行文本分词,对词性进行标注,对新词进行识别,最后利用关键词词库对获得的内容进行分类归档。系统将处理过的内容信息存入到数据库并建立索引,对于一些重要信息则以网页快照的方式进行存储,以防未来该网页被删除。

最后系统对初步处理过的内容信息进一步分析和统计。系统根据信息阐述的主旨和观点进行倾向性分析,从而明确传播者的倾向和意图,最后定义某信息是正面信息还是负面信息、是否属于敏感信息等。如果需要,系统应能自动预警。在第一时间发现预警信息,以Email、电话、传真、手机短信等多种方式通知管理员。在易用性上,系统提供报表服务,针对指定信息生成曲线形式的趋势浏览图。可按指定时间段绘制出信息趋势浏览图的更新情况,并可生成相关信息的统计数据、信息的柱状图、饼状图以及各类对比图表。另外还可通过内容需求进行报表模版定制,进行简报导出,包括日报、周报、月报、年报等等,以满足使用者的不同需求。

三、教育舆情网络监测的策略

1.教育舆情主题词收集和整理

文本信息的主题提取与舆情信息的发现是系统的核心功能,直接影响到最终的质量。教育舆情网络监测平台根据《综合电子政务主题词表》构建主题词基本表,在构建主题词表时还扩展增加地方政府相关的信息,如行政区划、地方领导姓名、地方机构等术语信息。由于主题词总表的信息量大、覆盖面广,其中必然存在大量的事实和复杂关系,也可能存在逻辑的错误,需要对构建的主题词总表进行知识的一致性检查。随着时间的推移,很多主题词和地方政府相关信息也会随着需求而变化,因此还需要定时对教育舆情网络监测平台的主题词进行维护和扩展。

2.教育舆情主题内容和热点信息的发现

教育舆情网络监测系统的首要任务是及时发现教育部门所关注的教育舆情信息,为了有效解决教育网络舆情信息中的“一词多义”、“一义多词”等问题,全面掌握互联网上省域内的教育网络舆情信息。监测系统在发现教育舆情信息时采用了语义匹配的方式,抓取与教育舆情相关的信息。

热点教育信息在一定程度上反映在网页信息的主题词中,某个主题词在特定时间段出现的网页数量越多,表明该主题就是一个热点。由于已对采集的网页信息进行了语义标引,因此在统计时只需要统计主题出现的网页数量即可发现热点信息。

3.教育舆情的分析范围

教育舆情网络监测系统采集的信息数据巨大、内容繁杂,教育舆情网络监测分析可以从人物、事件、时间三个维度展开,从而更好地展现教育网络舆情事件的发展状况。教育网络舆情的分析范围一般由时间和空间两个维度决定,不论是热点人物还是事件,在时间维度上都是动态变化的。教育网络舆情的爆发绝对不是没有先兆的,只要将监测分析的教育舆情要素放置在三维空间中,通过前后的时序关系就可以找到舆情事件背后的因果关系,发现教育舆情信息的内在规律。通过人物、事件、时间的三维属性特征的监测分析,可以更好地全面掌握教育网络舆论动态,做出正确舆论引导。

四、教育舆情网络监测分析

回顾去年教育行业舆情,经对该年影响较大的教育网络舆情事件进行筛选,并从时间、空间、事件类型、情感特征和事件周期等进行分析对比,总结出教育网络舆情的传播特点和规律。

1.时间分布解析

教育网络舆情的数量分布(见图2)充分体现了舆情发生时间上的规律性,伴随一月份研究生入学考试、学校期末考试和寒假的到来,教育网络舆情会出现一个小高峰,二月底到三月份开学期间,教育网络舆情数量会开始上升,四五月份相对比较平稳,六月份随着一年一度高考的来临,高考及其衍生话题如“高考作文”、“广场舞拒绝让步高考”、“少年明星参加高考”等,均成为网民关注的焦点,教育网络舆情的数量也达到顶峰,七月份处于各地市中学毕业考试和招生阶段,教育网络舆情又出现小高峰,八九月份伴随着新学期开学,教育网络舆情数量呈现上升趋势,而后两三个月趋于稳定,起伏不大。

图2 教育网络舆情事件数量分布示意图

2.空间分布解析

从地域分布上看,教育舆情事件分布呈现出整体分散、局部集中的特点,省域间教育发展差异性比较大,群众对教育的关注点存在区域差异。如在经济比较发达的地市里,择校问题、重点班和教师有偿家教等主题成为焦点,而在偏远山区等农村区域,群众更多关注的是优秀教师流失和减缓撤办村小等问题。这启示我们在今后的教育网络舆情监控工作中,必须要有跨区域意识,把教育舆情的来源地与舆情分析、解读对应起来,建立区域性的教育网络舆情分析机制,有针对性地开展监测和引导。

3.事件类型分析(见图3)

图3 教育网络舆情事件类型比例

从教育网络舆情的总体上看,学校管理是较多重大舆情的引爆点,教育管理不到位,形成的学生道德和法制教育的弱化与缺失,导致青少年犯罪等问题是网民较为关心的。另外,师德师风、教育改革和考试招生也是舆情热点。

4.情感特征分析(见图4)

情感特征分析依据正负面情感词库和特殊句法去分析句子,从而判断数据源中每句话的情感倾向性,最后综合所有句子的情感值将舆情分为正面、负面、中性。从事件的情感特征来看,将近一半的教育网络舆情是中性消息,而负面信息更多是“多米诺骨牌”效应,教育网络舆情往往具有举一反三的能力,一个具体的点式问题可能弥散成整体性教育事件,如教师有偿家教的讨论,可能变成对教师队伍师德师风的质疑,从而引发对教育管理的失望、对整个教育的不满。

图4 教育网络舆情情感特征比例

五、结束语

教育关系着千家万户,一直以来都是社会关注的焦点,正确处理好政府、学校、社会之间的关系,提高政府在教育领域的危机管理水平,离不开准确的教育舆情监测。互联网时代,网络成为信息交互和教育舆情迸发的主要战场,构建覆盖教育各领域的教育舆情网络监测平台,借助大数据支撑技术,通过对各类媒介平台、博客、帖吧、微博、微信、论坛、新闻等网络载体的监测,及时发现教育舆论热点、突发事件和重大公共事件信息,并通过邮件、短信等形式做出预警,启动应急处置,全面提升教育网络舆情监管、应对能力。

猜你喜欢
教育网络主题词舆情
基于人工智能辅助的职业教育网络培训管理研究
关键词的提取与确定
《中国医学计算机成像杂志》2020 年第26 卷主题词索引
长沙市教育局召开教育网络信息安全工作会议
谈寄宿制高中学生的管理策略
数字舆情
数字舆情
消费舆情
《中国骨与关节杂志》2016 年第五卷英文主题词索引
《中国教育网络》杂志10周岁