胡治宇 利莉
摘 要:大数据技术的合理应用不仅可以有效地发现影响高校舆情走向的各种因素,而且可以促使高校运用科学的方式方法来开展舆情处理应急方案。本文主要对大数据技术的特点在高校舆情监测中的应用进行分析,又具体说明舆情应急机制的疏导办法,不断分析其原理,得出大数据下高校舆情应急机制的研究结果。
关键词:大数据;高校舆情;应急机制
中图分类号:TP391.1;TP393.2 文献标识码:A 文章编号:2096-4706(2019)18-0051-03
Abstract:The rational application of big data technology can not only effectively discover various factors affecting the trend of public opinion in universities,but also can urge universities to use scientific methods to carry out public opinion emergency plans. This paper mainly analyzes the characteristics of big data technology based on the application of public opinion monitoring in universities,and specifically explains the approach of public opinion emergency mechanism,and continuously analyzes its principle to obtain the research results of public opinion emergency mechanism under the big data.
Keywords:big data;public opinion in universities;emergency mechanism
0 引 言
当代大学生在大数据时代的浪潮里缺乏社会阅历和成熟的思想,在认识问题上不够深刻清晰,易发生偏差或是做出错误的决定。在论坛中的观点易受集体化思维引导,导致舆情发酵,引发错误思想的大面积扩张,或是受到负面情绪影响而被其主导自己的思想[1]。高校网络舆情在大学生生活中占据很重要的地位,高校舆情反映了在校大学生的思想状况和校园的稳定和谐,大数据时代下的网络环境影响着校园安全的一部分。
1 大数据环境下高校舆情监测技术分析
1.1 网络舆情信息采集及其预处理技术分析
该网络舆情监测系统主要采取了专门的抓取器在网页上进行舆情信息的采集,比如import.io、Gooseeker等编程语言。抓取器能够将采集的数据进行结构化处理,并将这些数据存储起来。在进行数据采集时需要对数据进行筛选和过滤,而这就需要依靠网页清洗技术来完成,这项技术能够将网页当中的“噪声”数据过滤掉,目前运用最为广泛的网页数据清洗技术主要为开源软件HTMLParser和DataWrangler。另外,在网络舆情监测系统当中还利用了Shark-Search搜索策略算法来进行改进,其主要依靠面向主题爬虫Heritrixs实现。为了更加快速便捷地对网页数据信息进行预处理,在该网络舆情监测系统当中还利用了基于统计信息和语意理解相结合的算法来进行网页内容的自动摘要处理。高校舆情监测系统舆情采集功能总体架构设计图如图1所示。
1.2 开源软件HTML Parser
现如今,互联网上的信息量呈现出几何式增长的趋势,人们要想从这些海量的信息当中快速、准确地获取自己真正需要的信息,比如:图片、标题、链接等,那么就必须要借助一些自动化工具[2]。但是目前Web网页中所采取的HTML语言需要经过浏览器解析后才能够正常浏览,而HTML语言并不适合作为数据交换的方式交由机器处理。但是现在在网络上所获取的资料大多为HTML文档,在这些文档当中包含着大量的信息和数据,其中有很多信息和数据都是无用的,甚至还隐藏着错误。如果在获取网页信息时,将这些资料全部看作字符流,会加大数据处理的难度。因此,为了更好地解析和提取Web网页上的信息,我们通常会采用HTML Parser开源软件来完成。该软件会将整个信息处理的过程分为页面装载、页面判断以及信息提取这三个环节。首先,将页面装载到程序当中,装载成功之后才会进行下一步,如果失败那么本次信息提取就会结束。接下来就是进行页面判断,这一步骤会由程序自动完成,程序会将符合模板规定的信息部分提取出来。
整个页面信息提取的过程都是由HTML Parser的过滤器来完成的,这主要是因为每个网站页面格式以及风格都存在较大的差异,在提取网页信息时,需要先分析网页的结构,然后再根据不同网站,编写不同的模块程序。但是用半结构化HTML语言编写的网页,浏览器解析起来是比较麻烦的,这时采用HTML Parser开源软件中的过滤器和Parser解析器来对HTML标签进行解析无疑是最好的一种方法。
1.3 基于大数据技术的高校舆情分析系统在微博中的具体应用
微博具有影响范围广、传播速度快等特点,受到了当代大学生的广泛青睐,并成为他们应用最为广泛的一种社交平台。这也使得微博逐渐成为了高校舆情的一种重要的表现形式。学生可以在微博平台上,通过关注他人的方式来获取他人所发表的信息,并形成自己的朋友圈。而高校就可以通过网络舆情监测系统对师生在微博上所发表的信息進行有效的监管,全面掌握高校舆情的发展态势,并针对突发舆情事件及时做出应对措施,进而有效地提升高校舆情治理的水平。
2 大数据技术的高校舆情分析系统的作用
2.1 利用大数据分析功能,主导舆论导向
作为高校中的学生,有自己的意见和思想是一件必备的技能,做到今日事今日解决,不要拖泥带水,对生活中的任何情况都要有自己的主见,不要因为集体思想或者从众心理打败了独特的见解,更不要别人做什么自己就要跟着做,不一样不代表着另类,只有有头脑有想法的人才能主导自己的人生[3]。比如是提前预习的效率高还是课后复习的效率高,记单词是早晨记忆力好还是深夜牢固,走出大门是从A路线快速还是B路线方便,这都是我们将会遇到的问题。在大数据时代,我们不能随时掌握别的思想,但是我们要把住的根基和底线,不会轻易动摇。同时,学生中的一些代表性人物,比如学生会主席、班长、学习委员、生活委员等等一些活泼开朗、待人接物有准则又灵活的同学或是和同学们打成一片的同学,这些人的一举一动经常会带动一部分同学的行为。组织高校人才在高校论坛上进行言论发表,多和同学进行积极的互动,传播真实有效的信息,在论坛上发表积极正能量的帖子并适时终止错误导向,树立鲜明的旗帜、坚定立场,有利于在舆情中抓紧主动权、发展健康的大数据时代舆论。
2.2 利用舆情监控机制,降低高校輿论危机的发生率
大数据环境下高校舆情形成与传播的过程如图2所示。
从图2中可以看出,某个事件形成一定的声势舆论往往都是需要某个导火索所引发的,一旦导火索被点燃,那么就会超出舆情触发的阈值,进而导致均衡被打破,进而爆发舆情危机。因此,高校应当要建立舆情预见机制,随时监控舆情的发生和演变,及时把控舆情走向,防止发生不良校园现象。降低突发事件的发生概率,维护学校的声誉和威望。在零碎的碎片信息中找到有用信息,合理分类,有效使用大数据找出潜在的危险,从源头杜绝舆情,控制走向,从而保证将舆情控制在合理范围内。
2.3 基于大数据技术的高校舆情监测效果
通过大数据技术能够对高校舆情中的种种不确定因素进行有效的捕捉,进而推动高校舆情治理的科学开展[4]。并且大数据技术还能够为高校的舆情管理提供更多监测和判别工具,这样一来就可以使得高校的舆情危机预判能力以及处理能力大大提升,同时大数据技术还能够对高校舆情管理的模式和思维方式产生较大的影响,这对于高校的舆情管理具有非常重要的意义。
3 结 论
综上所述,大数据技术对于高校舆情的监测和引导都具有非常重要的作用。高校的舆情能够反映出全体师生的心态,并通过社交媒体形成舆情大数据。这就要求高校应当合理地运用大数据技术,来为高校舆情的管理提供更加先进的理念和工具,以此来帮助高校更好地对舆情数据进行查找、监督,并在此基础上制定出科学的应对策略,从而帮助高校掌握舆情的主导权,提升高校舆情管理的水平。
参考文献:
[1] 侯菲菲,张帆,梁玉琪.大数据环境下突发事件网络舆情分析及应对策略 [J].新闻研究导刊,2016,7(18):74-75.
[2] 王曰芬.大数据环境下社会舆情及其演化分析研究 [J].情报资料工作,2016(3):5.
[3] 徐萍.大数据在高校网络舆情应急处置中的应用探讨 [J].图书馆工作与研究,2016(5):55-58.
[4] 岑咏华,王曰芬.大数据环境下社会舆情分析与决策支持的研究视角和关键问题 [J].现代图书情报技术,2016(Z1):3-11.
作者简介:胡治宇(1983.03-),男,汉族,安徽黄山人,讲师,硕士,研究方向:网络工程、图形图像、多媒体技术;利莉(1983.12-),女,汉族,江西景德镇人,讲师,硕士,研究方向:网络工程、计算机科学与应用。