面向大数据的涉警舆情分析与决策方法研究

2018-06-07 02:40张双狮夏一雪兰月新李亚峰
传播与版权 2018年4期
关键词:警务舆情决策

张双狮 夏一雪 兰月新 李亚峰

移动互联网技术的快速发展使得精彩世界触手可得,随时随地发布新闻、了解咨询、关注国计民生以及发表个人观点和看法成为新常态。网络舆情大数据新生态,给警务工作提出了新的更高要求;境内外敌对势力和一些别有用心的群体蓄意搅乱网络舆论,丑化公安形象,降低公安公信力的活动一刻都没有停止,意识形态领域的斗争更具复杂性和艰巨性[1];公安系统自身仍然存在官僚主义作风强、为人民服务意识弱的现象,社会主义法治推进困难[2];我国学者结合我国国情,借鉴西方科学家在社会学、管理学、心理学、媒体传播学、统计学、信息技术等方面理念、理论及方法对网络舆情的演化发展进行了大量研究,取得了许多重要成果,为政府和执法部门制定舆情引导策略,进行舆情决策处置提供了丰富的理论参考。全国公安系统对网络舆情的重视也在日益加强,成立专门应对机构,启用舆情监测系统等[3][4]。当前,不论是学术领域,还是应用实战中对于涉警网络舆情的监测、分析和决策处置整体上仍然是从对立面的角度出发,采取引导、管控的办法,也就是说处于相对被动的状态。

习近平主席指出,“建设网络良好生态,发挥网络引导舆论、反映民意的作用,让互联网成为我们同群众交流沟通的新平台,成为了解群众、贴近群众、为群众排忧解难的新途径,成为发扬人民民主、接受人民监督的新渠道”[5]。由此可见,时代在进步,技术在发展,工作模式、工作方法的革新势在必行。过去在网络舆情处置中采用过“遮、掩、封、堵、删”等极端手段,随着“大数据+移动互联网”的蓬勃发展,这些方法和手段往往会使问题复杂化,增加问题的神秘感,激发民众的好奇心,给敌对势力以大肆渲染和炒作的借口。不如敞开胸怀,正视问题,走入民众,主动发声,参与互动,利用大数据,依靠新技术,“治理+智理”,在解决问题过程中不断提升解决问题的能力。

为此,本文提出面向大数据的警舆情监测、分析和决策新理念,新方法。按照图1的逻辑流图展开研究,面向大数据,分数据流和控制流两方面。以数据流将涉警舆情的处理分为三个部分,舆情监测,舆情分析和舆情决策。每一个部分又按照研究对象、研究方法及研究结果的控制逻辑展开。

图1:研究逻辑流图

一、面向大数据的涉警舆情监测

网络舆情监测的数据是决策者进行数据分析和决策处置的基础。警务部门首先要从思想上建立大数据战略思维;以改革与开放的态度营造网络舆情大数据新生态;依靠新兴信息技术多角度广泛采集涉警舆情数据,建立和完善舆情数据库、知识库和案例库。

(一)转变观念,直面舆情

首先警务人员要以开放的姿态接受舆论监督,让民众发声,不论是正面的或者是负面的,不论是恰当或者是过激的。面对事件,要积极主动发声,公布事实真相,让民众享有充分的知情权,而不是封堵遮掩删,致使充满神秘感而怀疑与猜测,出现翻墙以探求真相,流言谣言四起的尴尬局面。事实上,当今的新媒体时代,人人都是媒体人,人人都是传声筒,也许一个不经意的涉警图片和视频发布都有可能瞬时引爆整个网络,成为人们线上线下、茶余饭后的谈资,弥漫在整个网络及社会。用“封堵遮掩”的方法显得无能为力,因为堵上论坛微博,堵不了微信朋友圈,堵上此话题,堵不上衍生话题。客观上要求广开言路,让民众敢说、想说、能说,充分表达自己的诉求,表达自己的意见、观点和看法。这些言论整体上反映的是实实在在、真真实实的社情民意,这是我党“立党为公,执政为民”服务宗旨得以实现的不可多得的宝贵资源和财富。对于警务人员自身,只要按照“对党忠诚,服务人民,执法公正,纪律严明”的十六字方针行事,又何所惧?如2016年5月的“雷洋事件”正体现了网络舆论监督以及线上线下联动的作用,有力地推进了我国法治建设的进程[6-9]。舆情大数据使得警务部门对网络舆情从重视到重点关注舆情变化和处置方法,再到着重首先解决自身问题的转变[10]。

(二)依靠科技,多措并举

舆情监测的总体思路由事件驱动向数据驱动转变。有涉警事件发生,针对事件监测舆情的演化,没有事件发生,同样关注民众的涉警言论和行为,甚至日常对警务工作的评价,从中发现潜在的舆情风险和警务工作中的不足。按照图2所示流程展开监测。

涉警舆情数据主要来自三个方面:(1)警务部门官方媒体,如官方微博、微信公众号、门户网站及政务网等。这是民众网络参政议政了解国家动态的重要窗口,网站的结构固定已知,话题多为主动发起,便于设计爬虫,并后期的网页清洗和处理,可以实现动态舆情监测。(2)外部舆情集散地,如微信、微博、论坛、贴吧以及新闻媒体等网站。这些网站众多,是民众了解咨询,发表个人观点的主要场所,可定期进行广度搜索扫描以发现热点话题,了解社情民意,发现可疑人群及不良言论。另外,可以充分利用某些大型网站的媒体接口,如百度和新浪的API,省去大量数据抓取时间,同时可以缓解媒体网站的服务器压力。凭借公安机关的业务优势,与各网站合作,定时接收舆情更新推送,这样可以缓解双方的服务器压力。(3)网上业务系统也是一个民意调查的重要途径。针对民众所办业务进行满意度调查,以及时发现警务工作中的不足。当然,这三种途径都可以设计调查问卷,调查问卷既是民意调查的重要方法,也是舆情监测的重要途径。

图2:面向大数据的网络舆情监测流程

舆情监测分两个层次:第一个层次,主动到舆情集散地抓取数据,发现热点,提取主题,分析情感倾向,缕清社会网络,这个层次对技术要求较高,舆情的特征要素难于把握;第二个层次,设计并抛出舆情主题,以引来围观,引起讨论,这个层次可以事先确定舆情的特征要素,舆情的决策处置方法,可以彻底改变过去被动监测,被动应急的尴尬局面。

网络舆情数据多为非结构性的多元异构数据。舆情监测的步骤为数据采集→数据预处理→数据存储。传统处理网络舆情数据的多为关系型数据库,甚至是Excel文件或者文本文件,也有的数据适合用关系型数据库。如信息检索和分析要求建立关键词倒排索引;文本处理需要进行切分词处理,建立词库;语义分析要求建立语义语料库,词性标注库;情感倾向性分析需要建立情感词库等。而案例数据库是进行舆情分析和决策的基础;通过知识挖掘建立的知识库,舆情分析方法库和舆情决策方法库是舆情智能决策的基础。这些数据和方法不适合用传统的关系型数据库。另外随着移动互联网的发展使得网络舆情的大数据特性日益明显,一方面数据量巨大,单个数据库文件根本无法胜任;另一方面,数据分析对数据的原始性、多媒体性要求越来越强,比如音频、视频、图片和表情也成为非常重要的数据内容,要求新的非关系型数据库及其处理方法。

将抓来的网页进行粗略处理或者不处理直接保存在本地,用非关系型数据库进行管理,如NoSQL数据库HBbase,采用的文件系统随之需改为分布式文件系统,如HDFS。数据存储模式的改变,导致数据处理手段和方法随之改变,大数据对数据处理分析的扩展性、可靠性及时性要求不断提高,需采用各种先进的大数据处理技术。考虑到采集平台的存储计算能力、可扩展性以及后期维护的方便性,可采用当前流行的开源分布式采集、存储、计算和处理框架,如建设基于Hadoop的分布式计算平台,可管理不同类型的数据,包括分布式文件系统HDFS、并行编程框架MapReduce、内存流式计算引擎Spark、大数据引擎Pig等。

二、面向大数据的涉警舆情分析

针对事前、事中及事后的网络舆情大数据,其分析流程为:统计、计数→聚类、分类→学习、识别→回归、预测。舆情大数据分析需结合统计方法、机器学习方法以及人工智能算法进行数据挖掘和知识发现,给出各个阶段的舆情风险评价,提供互动查询、图表可视化和分析报表服务,为决策提供参考,具体流程可参考图3。

图3:网络舆情大数据分析逻辑框图

(一)中文分词和词频统计

舆情分析的核心是自然语言处理,主体是文本数据挖掘,中文分词统计是网络舆情大数据分析的基础,是热点发现,建立倒排索引的关键技术,比如可以对同一时段舆情主题进行分词统计,当前热点便一目了然。对同一主题一个时段内的关注量进行统计可以发现本主题的热度变化。本文以百度搜索指数为例来说明中文分词统计的意义。以“民警”为关键词进行搜索,2017年12月4日—31日4周时间为监测时段,搜索量时序如图4,4日—11日一周内出现了一个大的热度波动。继续统计与之相关度高的搜索词频如图5。

图4:搜索词热度时序图

图5:与关键搜索词相关度最高的热词排序

进一步了解热词相关度如图6,反映了民警及其相关关键词之间的紧密程度,关键词“十九”“心得”“体会”反映出全国民警本周兴起学习十九大热潮,写心得体会,组织参加各类网络知识答题等活动;关键词“抓捕”指的是2017年12月10日河北民警在抓捕嫌犯时被刺牺牲事件。

图6:与“民警”相关度图谱(4日—10日)

以百度搜索指数12月11日—17日,关于“民警”的搜索来看涉警舆情,如图7所示。

图7:与“民警”相关度图谱(11日—17日)

“苍南”指的是2010年苍南女民警被残忍杀害的事件,一直受到广泛关注。

以百度搜索指数12月18日—24日,关于“民警”的搜索来看涉警舆情,如图8所示。

图8:与“民警”相关度图谱(18日—24日)

“闲事”和“交通”是人民警察贴近群众的具体表现,一个是爱管闲事的社区民警,一个是交通警察,这二者是与民众接触最频繁的警察,也是舆论最多的对象。

以百度搜索指数12月24日—31日,关于“民警”的搜索来看涉警舆情,如图9所示。

图9:与“民警”相关度图谱(25日—31日)

近年来“酒驾”和“女司机”成为网络热词,面对民警的检查,许多女司机耍泼耍赖,丑态百出,从另一面体现了民警的素质和执法处置能力在不断提高,其辛苦的工作得到众多网民的理解和赞扬。“值班”和“牺牲”指的是2017年12月25日,广东佛山伦教派出所民警陈顺辉值班时因病牺牲在工作岗位上的事。反映了广大网民对民警及其生死的关注与关心。

除了数字显示外还可以将词频以词云的形式更为直观地显示,如图10为新浪司法转载的微信公众号“长安剑”的一篇关于“雷洋案”评论文章的词云。

图10:词频统计词云

词云以不同大小和形状非常直观地显示关键词的词频,给人以强烈的视觉冲击。通过词云可以看出该文的主题“社会舆论对社会主义法治公平、公正的影响”。

(二)文本聚类和分类

语料文本在分词后可以按照关键词进行聚类分析,提炼评论的观点,然后对整个语料进行分类统计得知持各种观点的人数以及占比,进一步对有关某一话题的网民进行分群统计,研究网民活跃度,发现意见领袖,探索各网民之间的关系,据此绘制相关主题的网民社会关系网络图。如图11是用gephi绘制的社会网络图,可以根据网络节点之间的边及其权重绘制出所有节点的社会网络图。

图11:相关主题网民社会网络图[11]

(三)情感倾向性分析

首先对抓取的舆情数据进行分词处理,然后结合情感语料数据库和情感分析算法对切分后的语料进行情感计算、分析,并进行情感标注[12][13]。通过聚类和分类得出个体情感倾向和群体情感倾向,以便进一步发现个体情感异常和群体情感异动,以便及时采取措施,疏导负面舆情。

(四)舆情风险评价

对网络信息发布者进行用户画像,包括年龄、性别、地域、使用终端等信息,用户画像便于对高舆情风险人群进行动态跟踪监视;建立风险评价指标体系、风险评价模型,根据动态舆情数据,对事前舆情隐患风险、事中舆情恶化风险以及事后舆情衍生风险进行评价,并适时给出舆情风险预警。

(五)趋势分析预测

通过对采集到的时序网络舆情数据运用线性回归分析、决策树回归分析、隐马尔可夫预测、深度学习等方法进行回归预测分析,可给出网络舆情的演变趋势,为风险预警和处置决策提供参考。

(六)互动查询及可视化

涉警网络舆情大数据分析结果需能以操作简单,图表并茂的人机交互方式展现给警务人员,为其决策处置提供科学的数据支持和情报支持。

(七)大数据分析工具

EXCEL内置的财务统计函数可以做一些统计分析,如计数、相关性分析、线性回归等,如果能灵活应用VBA可以大大扩充Excel的统计分析功能;SPSS、SAS是专业的统计分析、数据挖掘工具,功能强大,接口丰富,编程简单,但成本高昂,不便集成到网络舆情系统中;Matlab是通用的数学数值计算、模拟仿真软件,其统计分析、机器学习及人工智能方面有很丰富的函数支持,而且可视化效果也很好,是算法研究的有力工具;R语言是专业的开源大数据统计分析工具,有非常丰富的数据挖掘包,而且方便与第三方函数库和算法库集成,可视化也是其一大优势,是网络舆情大数据分析的首选工具;Python作为一门胶水式的开源编程语言,近年来以其编程简单、功能强大受到各行业青睐,其有很强大的数据挖掘、机器学习和人工智能工具包,而且升级速度很快,是网络舆情大数据分析的理想选择。

三、面向大数据的涉警舆情决策

互联网已经成为舆论的集散地、舆论的放大器和意识形态斗争的主战场。境内外反华势力借此采用各种手段宣传西方社会文化、自由主义思想以及法律制度、政治制度,同时不惜重金雇佣大量汉奸小编,汉奸“大V”写短文、写段子,以丑化国家领导人、抹黑警察执法队伍,降低政府和警察的公信力,离间警民关系、党群关系。文化侵蚀,思想渗透更加广泛、更加深入,不得不引起党和国家的高度重视,这是一场没有硝烟的战争,是一场持久的战争,是一场智慧和技术的较量,是日常警务工作的一个重要组成部分,不能以舆情应急处置简单对待。因此,警务部门不仅要设置专职岗位,配备专职警务人员,更要建设专门从事舆情监测、分析、决策应对的专业队伍。为此既要重视专家决策,又要积极推进智能决策。

(一)涉警舆情的专家决策

面向大数据网络舆情,要求公安队伍“既要能使枪杆子,还能玩转笔杆子”。根本任务有两项,一是充分利用大数据技术和人工智能技术,做好对重点网站、重点人群的舆情监测,及时发现问题,评价风险,提出预警。同时,积极参与到各焦点话题的讨论中,发帖子、发微博、发微信、写文章、写段子,引导舆论导向,为网络注入正能量,注入社会主义核心价值观;二是充分利用移动互联网平台,进行网络民意调研,改变过去走街串巷式的、专门问卷式的调研,学会从网民对各类事件、各种话题所发表的图、文、声、像等多媒体意见的分析中挖掘提炼对警务工作的观点、情感和态度,以找出工作中的不足。

(二)涉警舆情的智能决策

海量异构舆情数据为舆情智能决策的知识挖掘提供了丰富的资源,以机器学习技术为核心的涉警舆情智能决策是未来警务工作的重要发展趋势。网络舆情智能决策的逻辑框图如图12,是决策支持系统和专家系统的合体,建设各种各样的知识库是智能决策的基础,各类机器学习方法是智能决策的主要手段。

图12:网络舆情智能决策支持系统结构框图

以党的路线、方针、政策以及国家的法律、法规和政策的文件、文本、资料为原始数据建立知识库,采用搜索引擎技术建立理论、政策及相关法律智能咨询系统,提供便民服务,同时也为警务人员提供决策支持。

按照预设,到指定舆情集散地、重点人物微博、微信采集多媒体数据,识别舆情主题,分析情感倾向,建立主题识别知识库、情感识别知识库、决策模型库,决策知识库,最终实现政策解读专家系统,机器人聊天交流系统,决策建议推送系统。其中决策建议推送可以结合微信公众号、公安业务APP以及电子邮件等多种方式展开。另外智能邮件系统也是一种非常方便的民意调查方式。

四、结语

本文针对涉警舆情研究其面向大数据的监测、分析及决策方法,按照源于大数据,归于决策方案的总体思路展开研究。得出网络舆情并非“洪水猛兽”,而是建设服务型智慧政府不可或缺的宝贵资源和财富。需以人工智能为牵引,大数据为支撑,充分利用信息技术的最新成果使警务工作深深扎根于广大人民群众中,以共产党人博大的政治胸怀接受人民群众的广泛监督,切实将党的群众路线落到实处,不忘初心,牢记使命,在为人民服务的实践中不断提升执法能力和水平。

[1]徐亮武,罗云锋.武警部队网络涉警舆情研判和舆论引导研究[D].上海:华东政法大学,2014.

[2]林辉煌,贺雪峰.法治的权力网络-林乡派出所的警务改革与社会控制(2003—2012)[D].武汉:华中科技大学,2013.

[3]张振龙,娄树旺,周忠高.东营市公安舆情引导问题研究[D].济南:山东师范大学,2017.

[4]陈剑滨,吴小颖.福建省网络涉警舆情应对策略研究[D].福州:福建农林大学,2016.

[5]习近平.在网络安全和信息化工作座谈会上的讲话[EB/OL].http://www.qstheory.cn/yaowen/2016-04/25/c_1118731738.htm.

[6]百度百科.雷洋[EB/OL].https://baike.baidu.com/item/雷洋/19658789?fr=aladdin.

[7]雷洋案尸检结果公布 发现社会已经悄然改变?[EB/OL].http://finance.sina.com.cn/sf/news/2016-06-30/183235487.html.

[8]中国好网民.超越信与不信 雷洋案的舆论、谣言与真相[EB/OL].http://news.china.com.cn/2016-05/18/content_38476617.htm.

[9]人民政协网.雷洋案涉案警察处理结果公布:派出所副所长被双开[EB/OL].http://www.rmzxb.com.cn/c/2016-12-29/1252361.shtml.

[10]姜华.互联网时代提高公安民警媒介素养的必要性[J].辽宁公安司法管理干部学院学报,2015(3):86-88.

[11]SmartCountryLee.如何系统的绘制自己的人际关系网络图?[EB/OL].https://www.zhihu.com/question/53706132.

[12]吕姣兰.网络舆情评论文本信息的R挖掘研究[D].昆明:云南师范大学,2017.

[13]付光涛.大型电视节目网络舆情大数据分析技术方案及实现[J].广播电视信息,2017(7):97-98.

猜你喜欢
警务舆情决策
为可持续决策提供依据
决策为什么失误了
舆情
HIV感染的警务预防与处置
舆情
警务训练中腹痛的成因及预防
舆情
警务实战训练教学中开设
警务指挥与战术研究现状及发展趋势
微博的舆情控制与言论自由