探析大数据技术在网络舆情监控的应用

2021-10-29 12:18刘娟高嘉敏纪学师
网络安全技术与应用 2021年10期
关键词:舆情网民监控

◆刘娟 高嘉敏 纪学师

探析大数据技术在网络舆情监控的应用

◆刘娟 高嘉敏 纪学师

(山东医学高等专科学校 山东 276000)

大数据时代全面到来后网络舆情发生了变化,其数据规模大幅提升、增长速度显著加快,网络舆情监管工作在这种情况下变得更加困难。鉴于此,本文就网络舆情与大数据技术的适用性展开讨论,研究大数据思维方法在网络舆情监控中的重要作用,对大数据技术应用于网络监控后可能出现的问题进行深入讨论,以期为网络舆情监控提供全新的思维方式和解决办法,对相关监管部门提供借鉴和参考。

大数据;网络舆情;监控

我国网络社会已经全面进入Web2.0时代,大数据技术以迅猛的态势发展,互联网每天产生以PB计的海量信息,这些信息汇集在一起形成庞大的数据资源。在这种网络背景下,原本具有封闭性特点的数据已经全面转变为具有基础性特征的重要资源,对互联网中的大量有价值信息进行挖掘并将无用、虚假信息摒弃已经是大势所趋。

移动终端技术的日趋成熟使其制造成本大幅度降低,加之无线网络传输速度呈指数性增长的特性使移动终端迅速普及,各种信息以不同的表现形式存在于互联网中,互联网作为各类人群无差别的集散地成为舆论的放大器,能够吸纳大量舆论也能够放大一些意见或看法,而海量信息中极易存在一些带有感情偏向的数据,这些言论会迅速发酵形成网络舆情。

网络舆情是不同社会群体在同一时间和空间内发表观点的总和,是各类人群对某一社会热点或焦点事件发表的带有倾向性和影响力的情绪和认知。在大数据的环境下网络舆情具有诸多特点,以信息复杂、数据离散、跨越性强为主,大数据同时也为网络舆情监控提供了全新的思路与解决方式。采用大数据技术对舆情数据进行分析、挖掘可以构建网络舆情监控体系,对正确引导网络舆论、纯正社会政治生态具有重要意义。

1 大数据和网络舆情的适用性分析

1.1 二者具有一致性

现阶段,大数据以其科学实用的特点被广泛用于社会的各个行业中,大数据与网络舆情同样具有适用性,这种一致性主要体现在以下三个方面中。

一是网络舆情具有海量信息的特性,在大数据时代背景下这种信息量的特点更加凸显,各种自媒体平台使信息的聚集方式与传播方式彻底改变,人们可以在网络中突破时间空间的限制,快速高效进行信息发布,形成即时信息选择与反馈机制,产生海量信息流。二是网络舆情信息具有多样性特点,这种多样性特点体现在网络舆情的信息形态与交互方式上,具体以非结构化的数据为主流数据形式,以结构化和半结构化的数据为辅助数据形式,网络舆情信息同样可以通过文本信息、图像信息和视频信息形式进行传播。三是网络舆情信息转变同样具有快速性,作为一个实时动态的传播过程,网络舆情在原始信息的基础上出现扭曲和延伸,受到网民情绪的刺激,使一些关键信息迅速发生转变。

1.2 网络舆情监控需要大数据技术

实际上,网络舆情体现的是民众的看法与情绪,其数据信息以碎片化和颗粒化的方式存在于网络空间中,而这种信息形式通常是隐性数据,需要大数据技术的支持以实现数据可视化以及信息价值的增值。从本质上对网络舆情进行分析可以发现,网络舆情所需要的数据信息可视化技术恰恰是大数据所能够提供的技术,大数据可以为精准判断舆论走势提供技术上的支持,因此对网络舆情进行监控迫切需要大数据技术的支持。

1.3 二者的增值过程没有差异

大数据的增值需要经历挖掘信息、打通渠道、充分流转的过程,最终的全新数据流量都要回到具体的业务当中才能实现增值过程,也在数据信息的运转流通中自动形成一个信息流通闭环,价值增值过程如图1所示。网络舆情的信息价值增值过程与之并无差异,首先要在一些网络社区中进行信息采集,对有价值的信息进行深入挖掘,明确碎片化信息之间的关联情况,打通渠道以实现信息融合,使有价值的网络舆情信息在媒体、公众与政府之间充分流转,从流通特点和数据增值方式上看二者的增值过程相同。

图1 价值增值过程

综上,大数据和网络舆情在数据特征、技术需求以及增值过程等方面具有较高的适用性,大数据在网络舆情监控方面有技术上实现的可能性。

2 构建模型与监控方法分析

大数据技术对这个时代的影响是显而易见的,人们对数据结构和功能的认识以及数据使用方法都发生了质的改变。以大数据技术为基础、用大数据思维构建模型可以将舆情监控工作分为数据的采集、处理与分析三个过程,实现大数据的思维模式、技术特点与舆情监控紧密结合,开创舆情治理的全新局面。

2.1 数据采集

一是要注重广泛采集各种数据,其中包含冷、温、热数据三种形式的数据。三种形式的数据是通过数据跨度时间区分的,冷数据的跨度时间较长的数据形式,温数据与热数据分别是非实时数据和实时数据形式,热数据更倾向于表示用户实时位置状态、浏览行为与反馈的数据类型。目前冷数据占大数据总信息量的八成以上,温数据和热数据共占大数据总信息量的两成,要完成模型构建与舆情监控任务就要并行采集三种不同类型的数据。

二是使隐性舆情显性化,网络上的各种数据不以显性的文字、图片和视频存在,但是零碎的信息可以体现出网民情绪倾向特点、体现出网民关注点,这种信息体现出舆情的隐性特点。在进行隐性舆情处理时可利用大数据技术分析其浏览痕迹、关注重点以及关键词的搜索记录,这样就可以建立舆情社会化网络,通过该网络可以实时监控重大舆情的产生与发展,选择合适的时机对网络舆情的重要节点进行强制切断,这样就可以控制住舆情的扩散与蔓延,这就是隐性舆情的显性化过程,其最终目的是切断舆情关键节点。

三是注重舆情数据精准性到容错性的思维模式转变,判断网络舆情不应该过分纠结于单一数据的准确性,而是将舆情放在整体性数据中进行统一考量,引导网络舆情监控判断向整体把握转变,单一数据可以出现错误,这就是网络舆情的容错性思维。大数据技术有能力从海量数据中判断出整体性舆情趋势,在这种技术基础的前提之下,微观层面的绝对精确就显得毫无意义。

在进行舆情处理时传统方法是利用小规模网络爬虫对相关论坛的评论进行数据爬取,因此对于采集的数据,其结构和规模都相对单一,关系型数据库和并行数据仓库即可满足数据处理的技术要求,所采集的样本偏小,不具备普遍舆情的代表性。利用大数据进行网络舆情信息采集时则是通过公开API提取海量非结构化数据,优点在于数据来源广泛,数据类型丰富多样。

2.2 数据处理

第一,高维度舆情数据具有可视化特点。网络舆情普遍存在于分布式数据库中,而这种信息通常以细粒度分布,舆情关联数据已经不再是一维、二维以及三维形式,逐渐转变为高维数据,图2为数据维度四象限示意图。高维度数据有无关性、冗余性特别高的特点,因此只能利用大数据技术使其可视化。

图2 数据维度四象限

第二,碎片舆情信息呈现聚合化特点。由于微博、微信等终端的信息编辑方式是不规则的、散点型的,这就导致大量信息以离散化的形式进行传播,也就是信息具有碎片化特点。碎片化信息中存在大量的虚假、模糊信息,这对于技术人员的数据处理能力与信息认知水平是极大的考验,因此运用大数据技术将网络舆情的碎片化信息加以聚合整理,构建出相互关联的网络舆情逻辑结构,呈现出网络舆情真正的面貌有助于网络舆情的高效治理。

2.3 数据分析

网络舆情信息的产生和发展都不开人这个主体,网络舆情的发展状态随着人内心的体验与态度变化而发生微妙的变化,这种变化是有一定客观规律的。对人的各种状态进行分析可以有效引导舆情朝着乐观的方向发现,而对不同的人群进行差异化的管理也可以使网络舆情的引导工作过程更加具有针对性、实时性与策略性。为了研究舆情数据分析过程,以传染病扩散为研究对象建立模型,我们将扩散模型设计为SIR模型。在模型中S代表易感染人员,I代表感染人员,R代表移出人员,用类似的思路进行分析,可以将舆情信息主体分为S、I、R三种状态,各种状态之间的联系如图3所示。

图3 SIR扩散模型

将网民分为A、B、C三种类型,A类网民是转发了某舆情信息的网民,其状态可以称为I状态;B类网民是针对舆情信息持有保留中性态度的网民,其状态可以称为S状态;C类网民是将自己置于舆情以外的R状态。单位时间内I状态网民与其他网民接触的平均概率为∂,经传播感染为I状态网民(I₁)受舆论走势等外部因素影响转化为R状态网民(R₁)的平均概率为β,那么舆情信息主体的感染模型则可表示为:

I+R+S=N (1)

S+I⇒I₁+I(∂) (2)

I₁⇒R₁(β) (3)

根据上述模型的内在联系与分析可以对网络舆情传播有一个较为清晰的认知,也能够通过模型研究出舆情信息主体的具体状态,可通过信息主体对舆情的态度差异有针对性地制定不同策略,为精准引导不同种类的信息主体奠定坚实基础。

3 存在的问题与展望

3.1 安全与隐私问题

大数据发展速度之快令人诧异又欣喜,但这背后隐藏的危机却一直都没有消除。一个重要问题就是网络安全和个人隐私无法得到保护,大数据技术之下的安全保护与隐私保护技术始终都落后于大数据的主体技术水平。大数据技术在进行舆情监控时通常会查询到个人浏览记录、互动信息等,对这些信息进行有效利用的确可以使舆情监控工作更加高效地开展,但如果这些个人隐私被别有用心之人开发利用就会造成非常严重的后果,因此在相当长的一段时间内大数据技术不仅要提升技术本身的各项水平,还要研究与之配套的安全保护措施。

3.2 人才缺失问题

通过大数据进行舆情监控与处理需要经历非常复杂的程序,要进行信息采集、信息处理、信息主体情感分析、舆情趋势研判与引导等过程,整个过程需要用到很多种专业知识,也需要掌握各种技能和分析方法,在这种条件下选拔人才的过程比较严格、选拔标准相对较高,需要复合型人才从事相关工作。但目前大数据舆情监控学科刚刚处于起步阶段,具有大数据分析处理、统计分析计算、信息挖掘与预测、社会学研究等多种能力的复合型人才严重匮乏,因此从现在开始就应该有针对性、目的性的培养多种能力的复合型人才,为日后的舆情监控事业发展奠定基础。

4 结语

近年来,我国计算机、信息、物联网等技术取得了长足的发展进步,在此基础上产生的大数据技术在多个领域中实现了广泛应用。但大数据应用于舆情监控仍然处于起步阶段,需要科研工作者不断努力,解决各种技术难题,为我国舆情监控和社会稳定作出贡献。

[1]蔡金胜,贾博亚,翁永杰.利用网络舆情监控实施心理战防御的几种路径[J].网信军民融合,2021(03):46-48.

[2]梁瑛楠,于小云.突发公共事件网络舆情政府监控体系构建研究[J].新闻研究导刊,2021,12(02):22-23.

[3]崇阳.面向网络舆情监控的热点话题发现技术研究[J].公关世界,2020(22):176-177.

猜你喜欢
舆情网民监控
The Great Barrier Reef shows coral comeback
你被监控了吗?
Zabbix在ATS系统集中监控中的应用
网民低龄化 “小网虫”的明天谁来守护
有关公路,网民有话说
消费舆情
舆情
舆情
舆情
PDCA循环法在多重耐药菌感染监控中的应用