面向大数据的反恐决策方法研究

2018-11-10 08:39屈健张双狮兰月新张鹏夏一雪
中国管理信息化 2018年17期
关键词:恐怖分子大数据决策

屈健 张双狮 兰月新 张鹏 夏一雪

[摘 要] 近年来恐怖主义对国家安定团结的政治局面、人民安居乐业的生命财产安全造成越来越大的威胁,反恐成为每一个组织和个人必须面对的现实问题。决策方法研究成为反恐成功的关键。本文提出了面向大数据的反恐信息监测、数据分析及智能决策的方法和舆论宣传策略,通过采用大数据技术、云计算技术,并结合社会主义国家放手发动群众,集中消灭敌人的优势,建立全民参与、全民监控、多联分析、风险决策的反恐网络与反恐体系,将恐怖主义置于全民反恐的汪洋大海之中。从心理上给予恐怖分子不敢动的压力,从技术上给予恐怖分子不能动的压力,从舆论上给予恐怖分子不想动的感化和教育,以期从根本上减少和消除恐怖主义隐患和行为,为国家反恐决策行动部门提供理论和技术支持。

[关键词] 大数据;反恐;恐怖分子;效用情报;决策

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2018. 17. 057

[中图分类号] TP39 [文献标识码] A [文章编号] 1673 - 0194(2018)17- 0149- 06

1 引 言

恐怖主义是近年来世界各国普遍面对的问题,随着智能科技和移动互联网的发展,恐怖主义有愈演愈烈、国际化、网络化、线上线下联动的发展趋势。我国正处于改革发展的关键时期,受到国际社会的广泛关注,同时也受到境内外敌对势力的仇视与嫉恨,由此引发的恐怖活动时有发生,给国家稳定,人民生命财产安全造成很大的威胁。党和国家高度重视防恐和反恐,制定专门法律法规,建设反恐精兵队伍,广泛开展国际及区域合作,多措并举,极大地打击了恐怖主义在我国扩散的嚣张气焰。学术界从法律法规、队伍建设、情报、大数据、决策行动等多个方面进行了深入而广泛的研究。其中,梅建明教授团队对英、美、法、俄等西方国家反恐的经验进行了深入细致的分析,从情报的角度对反恐情报特征、情报体系构建、情报分析、情报决策、情报预警以及从大数据角度用各种方法做了数据挖掘分析[1-4];兰月新团队从大数据角度研究了反恐情报采集、数据库的建设及保障等方面的研究[5-7];裴毅东对大数据提升国家反恐能力的重要性进行了全面的分析和阐述,并对美国利用大数据实施监控与反恐的策略进行了细致的解读,给我们以重要启示[8];郑国用从军事运筹学角度研究了反恐行动决策,陈明等研究了反恐情报决策和行动[9]。这些研究对我国反恐理论和实践都起到非常重要的作用,但是,主要针对专门部门的情报决策行动展开,属于单方面反恐,着重强调警察、特战队等专业部门的作用,这也是西方国家反恐惯用的方法,也是造成当前国际上越反越恐尴尬局面的重要原因[10-12]。恐怖主义威胁社会每一分子的安全,因此,反恐反暴人人有责,完全依靠公安、部队等专门部门的单方面反恐已经无法适应当今互连互通,一体化的社会发展要求。其实,我国在建国初期镇压反革命(国民党遗留在大陆的大量军统特务及残余武装)运动中就已经积累了非常丰富的反恐防暴经验,如构建以情报部门、公安部门、部队为主,交通、邮电、银行等各业务部门密切配合以及广大人民群众大力支持的多维度镇压反革命网络。这种全民反恐的方法非常适合我国当前国情,当前依然有非常重要的借鉴意义,只是需要借用现代大数据技术构建起数据驱动的新型反恐网络。其中,群众路线,广泛的发动群众,依靠群众,依然是我国反恐的基石。

本文研究面向大数据的全民反恐决策方法,逻辑思路如图1所示,按照研究方法以控制流将反恐决策分成研究对象、研究方法和研究结果三个部分,以数据流将反恐决策分为三个步骤,数据采集,数据分析和反恐决策。

2 面向反恐决策的大数据采集

广泛的数据采集是反恐决策的前提。随着物联网、移动互联网技术的发展,大数据成为现实生活的映射空间。任何人的言行举止逐步的都数字化,其吃、喝、拉、撒、睡,行、立、坐、卧、走都不可避免的在日常居住地的交通、住宿、通信、金融、消费、社交等等多个子空间留下数据脚印,这是大数据采集的基础。因此,全民数据采集与重点分子跟踪监控相结合成为科学的反恐大数据采集策略。

通常恐怖分子与普通民众生活在一起,存在于现实生活和虚拟网络中,而且普通民众受蛊惑胁迫可能变成恐怖分子,参与恐怖活动,而恐怖分子也有可能经过宣传教育感化变成普通民众和合法公民。因此,在没有锁定目标之前,数据采集是针对全民的,其流程如图2所示。可将数据来源分为业务部门、媒体网站和人民群众三个方面,按照采集渠道将数据分为互联网络数据、业务网络数据和物联网络数据。由公安反恐部门牵头,建立起各媒体网站、各业务部门协同配合,广大人民群众积极参与的反恐大数据采集通道。

业务网数据采集如社交、工作、生活、娱乐中的财务往来、投资理财、债券交易、电子商务中产生的账单数据,出行旅游在铁路、汽运、航空、路卡等地的交通数据,日常在电信部门的通话交流数据等等;物联网数据采集如生活居住区、购物娱乐场所等处的视频监控数据和导航定位数据,各处保安、人民群众的异常发现,及时投诉和报警;互联网数据采集如微信、微博、论坛、贴吧等媒体平台的互动交流数据,各媒体网站提问咨询,发表意见,搜索引擎中的搜索历史、爱好等信息。所有这些构成了日常生活大数据,它将所有人在生活中线上线下公共场所的言谈举止和各类行为都记录下来,形成图、文、声、视的数据资料。通过大数据的采集、处理、存储,映射到可供分析决策的数据空间。

采用分布式网络爬虫对散布在互联网上的社交舆情数据进行采集,可以主动到微信、微博、媒体客户端、论坛、贴吧等舆情集散地抓取含有图、文、声、视各类数据的网页。或者凭借各大网站的API进行重点人物、公众号的数据采集。或者与各媒体网站联合,启动涉恐嫌疑人员言论异动推送,引导各大网站专门设立不良言论投诉和举报窗口,方便网民对整个网络空间的监督和维护;视频监控数据目前主要靠各个小区单位分散记录,需要进行广泛宣传教育,建立起全体居民监视投诉渠道,畅通居民保安报警,居民报警的多重渠道,有条件的地方和单位可以安装基于图大数据的流式存储处理APP,以实现智能分析、识别、决策报警;目前业务数据也主要由各单位分别采集,如有涉案的嫌疑对象,公安机关会进驻相应单位进行调查,此情况属于事后型反恐。对目前状况稍作调整便可实现事前型主动反恐,现在各业务系统(包括通信、金融、交通、电子商务等)都已实名制,每一单业务都需要进行身份验证,访问公安的身份数据库。这样,一方面可以在访问身份数据库时在公安业务系统留下日志,另一方面也可以要求业务部门将用户的业务行为写成摘要,包含时间、地点、人物和事件等信息,返回给身份证系统,形成日志。这样既不會给业务系统带来太大压力,也不会给公安系统带来更多负荷,只需公安系统扩容部分存储设备。

反恐部门通过多方宣传,以提高媒体网站、社交网站、业务部门、网民、普通民的反恐意识和警惕,进而积极配合,及时举报。反恐大数据的采集处理存储方法如图3所示,可采用开源架构Hadoop为异构大数据处理框架。采用分布式文件系统HDFS为基本存储平台,管理互联网网络爬虫,网站推送,业务部门推送,业务部门爬虫,网民投诉举报,日常民众报警等数据。以MapReduce为基本计算平台,YARN为任务调度框架,在此基础上针对不同数据环境,采用不同的开源大数据处理框架,如:流数据Storm、内存计算Spark、在线异构数据存储Hbase以及动态交互数据处理Tez等等。通过进一步数据清洗、转换和集成,形成面向大数据分析决策的数据仓库,面向智能决策的数据集市,以及进行反恐决策所需要的其他基础知识库、方法库和案例库。

3 面向反恐决策的数据分析

多联数据分析是反恐决策的基础。首先,需建立分布式的多元异构大数据处理系统(如Hadoop),包括分布式存储系统(如HDFS)和分布式计算系统(如MapReduce)。然后建立面向主题的、集成的、稳定的和时变的数据仓库,从多角度处理海量信息并从中获取支持决策的信息,具体流程可参考图4。如从微信、微博、电信、社交等数据库集成涉恐分子通信分析数据集;从高速监测、GPS定位、手机定位等数据库集成涉恐分子交通出行分析数据集;从电子商务网站、银行、债券等数据集成涉恐分子交易分析数据集。从业务智能分析(如基于Mahout的业务大数据智能分析框架)、实时查询(如基于Solr、Redis和Hbase的实时大数据查询框架)和离线分析(如基于Hive和Pig的离线大数据分析框架)三个角度进行数据挖掘、关联分析以及风险建模。最终给出面向决策的可视化结果(如各种图、表、报表等),为反恐人员隐患挖掘、效用情报提取和涉恐分子异动发现提供决策依据[13-15]。

具体而言,面对通信、交通、金融、网购等业务数据,需要开展业务智能分析。运用分类统计、聚类识别等方法是从不同种类的账单中发现关聯关系。面对业务数据,数据分析涉及的基本问题是谁来分析反恐大数据。当前,反恐需要各种数据时往往需要专人进驻业务部门,要求业务部门配合,对重点对象的业务数据进行查询分析,这样做费时、费力,还效率低下,且给业务部门的正常工作带来麻烦,不能发挥大数据的优势。为了更好地利用各个业务部门的数据,一种方法,可在各业务平台增加针对反恐的数据分析应用接口,反恐部门随时可以下达任务,各业务部门根据任务要求,启动反恐数据分析应用,并返回数据挖掘结果;另一种方法,反恐部门利用之前业务部门在办理各项业务时针对各个用户返回的摘要文件,对其进行大数据分析。其中,前一种方法,要求各业务部门增加反恐数据挖掘模块,增加与反恐部门的通信接口,反恐部门需要增加针对各个业务部门任务下达功能模块,这会给业务系统和反恐情报系统增加较大的升级难度,增加较大的软件成本,而且其利用率可能非常低。后一种方法,只需在业务部门的系统中增加给公安系统发送业务摘要的功能,即账单数据存储时顺带发送业务摘要,其软件升级成本相对较小,公安部门的分布式反恐数据分析系统中适当增加存储空间。第二种方案更为实际,便于实施。基于历史数据的交互式查询,数据分析的对象是由业务系统产生的大量业务日志,个人业务数据的交互式查询,各类业务账单的批量数据处理,快速批处理。总之,不论是反恐部门主动采集还是业务部门实时推送,要求各业务部门高度认识反恐的重要性和与公安部门密切配合的重要性。

面对物联网数据,如分散在各处的视频监控数据,目前还基本上没有分析的功能,只是记录当时的情景。为此,需公安部门牵头,倡导引入视频流分析功能,可增加定时拍照和抓图处理,一方面识别在逃通缉犯,另一方面对本小区的住户行为进行分析,识别行为异常并向门卫或保安提出风险预警。对视频及图结构数据,需建立基于视频流截取的图数据库,采用基于实时数据流的流式大数据计算、实时查询的方法。

对于互联网数据,主要进行基于历史数据的数据挖掘和在线交互式查询。针对事前、事中及事后的网络舆情大数据,其分析流程为,统计、计数聚类、分类学习、识别回归、预测。结合统计方法、机器学习方法以及人工智能算法进行数据挖掘和知识发现,给出各个阶段的舆情风险评价,并将分析结果可视化,为决策提供参考。舆情分析的核心是自然语言处理、文本数据挖掘。

数据分析后的关键一步是面向决策的可视化,如人员监控异常告警,个人暴恐风险评级,回归分析预测,暴恐分子分类聚类,涉恐分子画像,趋势分析显示,涉恐组织暴恐行动风险评价,暴恐组织社会网络分析,暴恐人员社会网络分析等可视化图表。

4 面向大数据的反恐决策方法

从自动化角度可将决策方法分为人工决策和智能决策。总的发展方向是从当前的以人工决策为主向以智能决策过渡,其决策流程如图5。面向决策,来自互联网、物联网及业务网等的大数据存储在分布式文件系统中,这些元数据无法直接用于决策,须进行科学的抽取、转换、加载等数据清洗的过程,形成可供决策的数据仓库、数据集市,还要结合决策支持的各类案例库、知识库和方法库共同构成决策的支撑系统。通过对元数据的处理构建面向决策的数据仓库,包括如涉恐分子通信分析数据集、涉恐分子交通分析数据集、涉恐分子交易数据集等,以方便进行联机分析和数据挖掘。利用数据仓库,进一步可构建供机器学习的模式库和面向决策分析的数据集市,如涉恐分子行为分析数据集、涉恐分子喜好分析数据集和涉恐分子性格分析数据集等。根据防暴处置专家的经验和方法构建知识库,以供人工推理和智能推理所用。建立基于大数据的识别模型、评价模型、学习模型、预测模型和分类模型等。专门构建基于案例推理智能决策和查询的涉恐事件案例库、涉恐人员案例库和涉恐舆情案例库等案例库[16-17]。

人工决策主要有采用集合理论、统计理论、进化思想、信息理论、符号推理等手段对涉恐分子的各类数据集合进行机器学习和决策分析建模,最终进行联机分析和数据挖掘,发现效用情报,为决策行动提供支持。

智能决策是近年人工智能技术发展的一个热点方向,在反恐决策中充分结合反恐专家经验建立反恐知识库,结合成熟的专家系统技术和大数据挖掘技术,可开发涉恐人员风险等级分析自动推荐系统;采用案例推理的方法可建立基于涉恐人员信息数据库的不良倾向智能识别,恐怖分子智能识别系统等;可建立基于涉恐事件案例库的智能决策方法推送系统;可建立基于涉恐舆情案例库的舆情处置智能决策推送系统;可采用决策树和语义网络等技术构建专家系统,实现在线决策咨询;可建立基于运筹理论、图结构理论、案例推理技术的行动决策智能推送系统。

智能决策支持系统的设计流程:①目标分解,如针对涉恐人员,可将人员识别、暴恐倾向鉴定、暴恐风险评价等作为目标;针对反恐方案,可将反恐路线规划、反恐资源配置等作为目标;针对在线查询,可将搜索引擎作为目标。②价值准则,针对目标设计价值准则,即判断规则。③拟订方案,在建立大量规则的基础上设计自动推理机方案,如专家系统、案例推理系統等。④分析评估与优选,对多种方案进行分析评估,针对不同的目标选择最优的推理方案。⑤试验验证,不断调整智能决策参数,即机器学习和模式识别的参数对决策支持系统进行试验验证。通常智能决策中涉及关键技术有案例推理,专家系统,计算智能,机器学习,模式识别,自然语言处理等。在反恐智能决策中案例推理技术既可用于涉恐舆情决策处置中,也可用于反恐资源配置中。而专家系统则可以运用咨询、培训、学习以及在线机器人聊天中。计算智能、机器学习及模式识别主要用于风险评价、人员评级、人员识别、涉恐行为异动中。自然语言处理主要用于网络舆情涉恐数据分析和决策推送中[18-19]。

5 面向反恐决策的舆论队伍

随着移动互联网技术的发展,随时随地了解咨询、关注国计民生以及发表个人观点成为广大民众日常生活的重要组成部分,网络越来越成为意识形态领域斗争的主战场。各种反华势力、恐怖组织或明或暗遍布网络,进行着各种形式的文化舆论攻击、腐朽思想渗透以从根本上动摇我国民众的价值观念。面对这样的严峻问题,公安反恐部门和国家相关部门切不可掉以轻心,而要和现实恐怖活动的危害性同等重视,甚至更加重视,摒弃过去事发之后的被动观测,而应建立网络舆情大数据思维,加强日常的观测、分析和决策,将恐怖主义消灭在思想之初,萌芽状态。为此需做好以下几项工作:①建立专业的网络舆情数据监测、分析、决策队伍,网络舆情的持续发酵往往会在线上形成一些具有相同意见观点的群体,进而容易引起线下聚集以致引发群体性事件的发生。舆情专业队伍利用网络舆情监测系统广泛抓取各舆情集散地的舆情信息,对舆情进行大数据分析和挖掘,对其进行风险评价,及时提出预警并采取果断的决策措施,主动参与,主动回应,以化解矛盾的激化,稀释集聚的怨愤。②采取技术手段,打入涉恐分子内部网络社交圈,如QQ群、主播平台、网络视频语音会议平台、网络游戏平台等等,了解涉恐分子的性格特征、情感动向,及时收集重要情报。虚拟世界的生活、娱乐、交往已经成为当代生活不可缺少的重要部分,涉恐分子也不可能脱离虚拟世界而存在,狡猾的恐怖分子往往有内部的交流网络和平台以便互相联络,开展培训学习或布置任务,如果能打入恐怖分子的社交圈,对反恐决策将起到事半功倍的效果,往往可以给恐怖分子以毁灭性打击或者将恐怖分子一网打尽。③主动发声,广泛宣传。每一个人都需要建立正确的世界观、人生观和价值观,一方面要去经历,另一方面需要学习。在意识形态领域,不是西风压倒东风,就是东风压倒西风,如果网络上腐朽、暴力、偏激等负面言论、音视频占主导地位,必然会对广大网民建立正确的三观产生消极的负面影响。因此,要求建立专门的弘扬社会主义核心价值观的舆论宣传队伍,广泛宣传党的理论、路线、方针、政策,宣传新时代中国社会充满正能量的人物、事件、言论、文章等等,让正义的舆论刷满广大人民群众的电脑终端屏幕,把涉恐的舆论、观点踩在广大网民脚下,没有立足之地。一方面涉恐分子孤掌难鸣,自然作罢,另一方面,正能量的舆论越来越多,涉恐分子不可避免地会受到正面的感化和教育而逐渐转变观念,打消暴恐念头。如百度搜索引擎将正面新闻置顶的做法将会对引导正确健康的舆论起到积极的作用,对所有使用百度搜索的网民有着良好的教育意义。

6 讨 论

以广泛数据采集为前提,多联大数据分析为基础,人工智能方法为牵引的反恐决策方法,既强调依靠各类大数据的战略资源作用和智能科技的分析决策作用,又要求依靠社会各个部门的支持与配合和广大人民群众的觉醒与行动。通过“敌动我动”的行动决策和“敌不动我仍然在动”的风险决策,既有全民参与的坚决行动,又有铺天盖地的政治宣传,必将给恐怖分子布下无处遁形的天罗地网,使其不敢动,不能动和不想动,从而从根本上减少和消除恐怖主义。

本文仅提出了框架性的理论和技术方法,其中每一部分的实现还需进一步广泛深入的研究和不断的实践。这种面向大数据的全民参与的集情报、舆论和行动三位一体的决策方法不仅适用于反恐,而且可广泛用于打击犯罪、惩治腐败等事务中。

注:通讯作者,张双狮

主要参考文献

[1]梅建明.千锤百炼打造利刃神兵[N].人民日报,2014-08-01.

[2]梅建明.构筑有中国特色的反恐法律体系[N].法制日报,2014-06-17.

[3]李本先,张薇,梅建明,等.大数据在反恐情报工作中的应用研究[J].情报杂志,2014,33(12):1-5.

[4]李勇男,蒋东龙,梅建明.基于基尼系数的决策树在涉恐情报分析中

猜你喜欢
恐怖分子大数据决策
为可持续决策提供依据
决策为什么失误了
如何探测到城市里的恐怖分子
谁杀了那个恐怖分子?
AK—47为何成为恐怖分子的杀人利器
基于大数据背景下的智慧城市建设研究
关于抗美援朝出兵决策的几点认识
湘赣边秋收起义的决策经过