漆世钱,孟春宁
(武警海警学院 情报侦察系,浙江 宁波 315801)
随着网络信息技术的发展与普及,人们的生活方式和信息渠道发生了重大的改变,开源情报也迎来了变革和快速发展的时期。在互联网发展的初期,获取开源情报的主要途径是整理来源于电台、报纸、政府文件中内容和网络新闻门户网站的信息,随着互联网尤其是移动互联网的发展,开源情报的地位、源头和价值发生了根本性的变革。以微信、新浪微博、Facebook、Twitter等为代表的网络社交用户范围和数量急剧扩大,仅一天,Twitter博客中就大约发4亿张帖子,而类似帖子仅仅是Facebook、谷歌、聊天室、公告板以及其他电子论坛等网络社交中信息的一小部分[1]。网络社交已是人们相互交流、传递信息的主要手段,成为日常生活不可或缺的一部分,同时也越来越被情报部门重视,成为各国情报工作人员取得有价值情报的重要情报源。美国的情报部门与其“五眼”同盟(包括澳大利亚、加拿大、新西兰和英国)及其他政府机构也涉足网络社交的监控业务[2]。2018年互联网安全大会上,以色列情报与网络安全专家罗伊津曼做了主题为“开源情报的第三次变革”的报告,他表示,网络社交上的海量个人数据已成为开源情报的重要来源[3]。
所谓开源情报,是指通过规划、收集、分析、分发的手段公开获得组织或个体发布的信息。当然,获取信息时也存在一些灰色地带,比如盗取别人的密码、使用假的网络身份获取信息等。目前各机构对开源情报的理解不尽相同,但从根本上是一致的,基本包括以下几个方面:一是特定的服务对象;二是获取情报目的性非常强;三是来源范围明确为公开来源;四是确立了“采集—分析—分发”完整的情报活动过程[4]。
网络社交是指人与人之间交流的网络化,它是建立在Web3.0技术基础上的一组互联网应用程序,在多元价值观念的激荡中,用户创造自己的用户资料(profile)、可以创造内容,并保留一些通信的记录、允许大众通过某种权限浏览和访问特定用户发布的信息、可以通过某种方式寻找到新的社交对象,通过学习、交往和借鉴,达到沟通、理解或共识。随着网络社交慢慢地转移到移动互联网上,网络社交上的数据无论是数量还是数据价值发生指数性的增长,各种网络社交几乎涵盖了人们日常生活的各个领域。正因用户在网络社交平台上能相互交流、自由表达观点、分享自己的生活状态等,使得从互联网中获取开源情报带来了广阔的空间和无限的潜能。
(1)用户注册信息
很多社交网络应用在用户注册时需要填入电话号码、电子邮箱、性别、兴趣等个人信息。如果填写的是单位邮箱,通过后缀可能推断出用户的年龄、工作单位等个人信息,例如某个用户的电子邮箱名为wangwenjing19840203@whu.edu.cn,则可以大概推断出这个人名叫wangwenjing,有可能是个女生,她的生日为1984年2月3日,在武汉大学学习或工作过。所以说注册信息往往是一种隐性的社交网络数据。
(2)用户位置数据
在网页上最容易拿到的用户位置信息就是IP地址,对于手机等移动设备,我们可以拿到更详细的GPS数据,用户的位置数据也可能会间接反映出其社交关系的一些信息。例如很多人在微信中发微信朋友圈或微博时喜欢把自己此时的位置顺带上,情报分析人员通过给定的位置信息,可以查询地图了解用户发信息时的地址,这些地址有的可能只显示出到哪个城市或区,但大多数时候可以精确到那条路哪个单位,这个时候我们就可以推断某个小区或者某个单位的用户可能是好友关系,还可能经常活动在这一区域。
(3)论坛和讨论组
比如天涯论坛有很多不同内容的版块,如球迷一家、舞文弄墨、天涯诗会和股市论坛等,每个版块都会聚集一些意气相投的会员,假如某些会员同时加入了三个或者四个不同的版块,就可以推断出这些会员大概有相似的爱好,如果几个会员经常在股市论坛中的帖子互动和交流,能进一步推断出他们彼此的爱好和熟识程度非常接近。
(4)即时聊天工具
即时聊天工具是目前用户数最多、应用最广泛的网络社交工具,比较常见的有Facebook、QQ、Twitter等聊天App,在国内社交App一骑绝尘的微信在2018年10月全球综合的社交网络App月活跃用户数也才排名第五位,如图1所示。除了用户之间聊天内容广泛,可用情报丰富外,软件上面还有联系人通讯录,用户根据需要还会给联系人分成“同事”“亲戚朋友”“相同爱好”等不同的类型,通过通讯录分组和联系人信息资料就可以推断出用户的网络社交范围,也可以通过用户之间相互交流次数推断出他们的熟悉程度。
图1 2018年10月全球月活跃用户数最多的社交网络(以百万人为单位)
(5)社交网站
在信息爆炸的当下,各种互联网媒体承担着大部分信息的传播,而社交网站大大减少了信息过载的难题。不同类型的社交网站所表达的主题会有差异,选准合适的社交网站通过好友来过滤信息获取自己需要的情报往往能事半功倍。例如在新浪微博中,只需要阅读和关注与我们兴趣爱好相同的用户所发的信息,就能避免阅读大量重复、无关紧要的信息。很多社交网站还有个性化的推送系统,通过大数据分析和利用用户在社交网站中的行为数据,有目的的及时将用户感兴趣的信息主动发送给用户,帮助用户更好地过滤信息,更快更好地提高情报搜集效率[5]。
(1)网络社交具有丰富的情报素材
网络社交是以交友娱乐、互换资源、传播为目的而在网络上以真实社交关系或昵称方式建立的虚拟社交平台,用户根据爱好在网络社交平台上进行视频的观看、图片的欣赏和实时热点事件的评论与点赞等行为,留下了自己的爱好、抉择和观点的活动记录。大多数社交网站里的数据深入到了政治、经济、科技、文化等生活的方方面面,包含从公共民生到个人不同层面的实时信息,数量和种类繁多,有图片、文字、视频,有宏观的信息,也有微观的数据,内容丰富,蕴藏着大量可利用情报,这些情报素材成为了社交网络用户的讨论话题,种类繁多、数量巨大。例如通过分析下图2中 95前和95后不同年纪网络社交目的和诉求的数据,可以得到以下情报:除了沟通交流外,95后在社交网站中娱乐消遣、讨论兴趣话题、拓展交际圈等方面的诉求突出,而95前用户在工作学习需要、获取资讯方面诉求突出[6]。
图2 社交产品的使用目的和诉求
(2)使开源情报的搜集更加风险低、效率高
网络社交监控改变了以往市场研究技术和卧底、线人等危险的情报搜集方式。情报人员只需“聆听”网络社交,通过特殊工具和平台查询、检索各种社交用户的数据信息,避免繁琐的市场调研,也可远离危险环境,减少无人机侦查、卫星侦查和电磁侦查等成本高的技术方法。利用开源情报能解决问题的,就没有必要动用风险性很高的人力情报手段,不但节约了情报获取成本,也为人力情报提供了一个有力的补充,情报人员能够投入更多精力在情报分析上,提高情报工作的效率。
(3)使开源情报的实时化程度更高
电报和电话允许我们以前所未有的速度从远处亲自连接,无线电和电视允许一个人向许多人广播,网络社交所做的是将两者结合起来,允许前所未有的个人联系,以及接触整个世界的能力。随着社交网络功能日益强大,网络社交平台扩散的速度、更新的频次、传播的范围较传统信息媒体发生了巨大的变化,一些主流的网络社交平台已变成热点事件的主要传播途径。普通网民可以随时随地方便的在知乎、微信、微博等移动互联网交互软件自由阅读和发表观点,利用网络平台共同参与讨论。很多事件的现场经历者喜欢在网络社交平台第一时间分享自己的所见所闻,并发表自己的观点与意见,对各种消息的传播达到了实时化的程度,尤其在突发事件中,社交网络通常成为信息首发源。例如2012年一场5.9级地震袭击美国华盛顿,造成包括国家大教堂与华盛顿纪念碑在内的众多建筑受损,1分钟后,纽约及其他东海岸城市也有震感,令人吃惊的是,许多纽约居民并非通过感官察觉华盛顿地震,他们的第一消息源是Twitter,换言之,网上消息传播得比地震波还快。震后几秒钟,Twitter上就出现了“华盛顿地震”的消息并被大量转发,最高峰时期,这类信息流量达到了创纪录的每秒7500条[7]。
(1)采取主动的方式套取情报
情报人员确定情报搜集的目标后,在计划的实施过程中通过社交平台主动关注情报搜集的目标,利用各种手段套取所需情报[8]。2018年7月,位于加沙地区恐怖组织的情报人员就通过两个在线交友网站在目标手机上安装间谍软件获取情报。他们首先盗用现实世界中真实的女性Facebook个人资料中的照片和个人信息,通过在社交媒体上寻找以色列士兵并添加好友,然后引诱他们下载虚假的应用程序,最终情报人员启用以色列士兵的手机摄像头和麦克风,并访问手机里面的内容,控制某些手机功能,获取到某些军事机密信息或者可用于勒索士兵的照片。
(2)对数据进行综合分析
情报人员从繁杂多样的网络社交数据集当中搜集、处理、分析和提取有价值的情报。由于网络社交平台上的用户数和信息类别繁多,美国政府一直积极组织Facebook、Twitter、YouTube等该国主要社交媒体网站创建一个共享数据库,并建立网络社交情报分析的逻辑过程,先后由界定目标—情报分解—组建目标模型—评估选择—提炼—结构性预测的分析流程。特别是在反恐的作战中,美英两国情报部门专门建立了一种“社交式”的国际恐怖分子数据库,通过在该大数据中输入若干名可疑分子的信息,然后运用网络社交分析工具理清与其有过聊天交流的嫌疑人,分析其关系网,最终挖掘出核心人物,以此推断出恐怖分子的首领,对即将发生的恐怖主义袭击进行预测与防范。虽然这种情报获取的方式比较被动,需要守株待兔式的等待目标对象更新,且当关注目标对象数量多时,人工甄别耗时、耗力,但是美英在对伊斯兰国和基地组织的反恐作战中应用此方法获取情报已屡试不爽。
(3)引导网络社交用户参与
通过事先的周密计划和营销活动吸引网络社交上的会员参与并提供建议来获取需要的情报。美国的通用电气公司就使用这个“社交点子”的方法吸引社交平台上近10万用户参与讨论收集公司所需的信息,谁的建议被采纳,就能获公司提供的优惠机票。结果,半天时间不到,公司就征集到了上千条意见,有的建议为了倡导节能减排,应在所有公司航班上推出“绿色餐具”,用玉米淀粉等天然生物质降解材料制成的一次性水杯、刀叉用具、垃圾袋等取代耗能大、污染重的塑料或纸制餐盒、筷子;还有用户建议飞机上应提供更多影音设施和美食预订服务,那样会让乘客感觉没有那么乏味,而且还可以品尝到美食,即使吃不惯飞机餐也能事先预订汉堡等食物。公司及时选用网络用户的合理建议,改善流程和服务体制,使客户的满意度有了大大提升[9]。
网络社交情报就像一把双刃剑,由于其内容丰富实时性强等特点,给新时期情报工作的发展、改革提供了便利与机遇,但同时也由于其自由度大、数量和种类繁多给情报工作人员带来了挑战,例如分析难度大、情报搜集与个人隐私之间的矛盾、信息泄露安全等多方面风险。
(1)分析难度大
面对呈指数级增长的网络社交数据,情报人员正在开发“瘦身”技术来对数据进行研究和分析。目前研究领域正面临包括对多种外语的分析以及特定类型网络社交的独特性等多个难题。一是外语的翻译不准确,虽然可以使用像百度翻译、谷歌翻译和雅虎翻译等工具让情报分析者对网络社交讨论的内容有一个大致的了解,但却无法传达不同语种之间词意的细微差别;二是拼写和词汇在不同媒体上的变化也带来了巨大的挑战,特别是在Twitter中,拼写错误、缩写和文体拼写变化都使标准的规范化技术变得困难;三是个人或团体可以在博客、Twitter或其他网站上建立新的身份,根据安全设置隐藏他们的身份和位置,对任何人或话题无论对错随意发表看法,给开源情报的分析与甄别带来难度[10];四是认知方面的挑战,由于网络社交是一个没有对偏见、主观意愿误导等进行过滤的平台,许多人可以通过自己的观察角度和个人偏见来观察事件和感知事物发表观点,情报分析人员必须根据自己的经验、理解和知识对这些信息做出价值判断。因此,在网络社交的海量数据中充分保证情报的准确性,要求情报分析人员对所搜集的每一则情报都要进行筛选、鉴别、删除,对信息的分析能力提出了更高条件。
(2)情报搜集与隐私的矛盾
一方面,用户的信息在网络社交应用的侵蚀下,已经越来越像“皇帝的新衣”,个人隐私被使用甚至被滥用。随着大数据在社交应用日益普及和深入,更多的搜集方式对社交应用数据和用户隐私进行不知不觉、随时随地侵入。现在很多社交网站或App在用户设置、隐私和安全、参与用户体验改进计划,其中可以选择“是”“否”或者“谢谢”,但是否存在拒绝参加用户体验改进计划后后台仍会收集信息就不得而知了。由于用户的多元化,网络社交上除了聊天交流的内容信息,还蕴藏着上网地点、时间、兴趣爱好、使用习惯与个人需求等用户的日常行为与数据,这些隐私信息可能被情报部门和执法机关使用,如果管理不善还可能为违法犯罪和恐怖分子利用。另一方面,个人数据隐私保护法令的不断增加,这些法规的制约,再加上社交用户自我保护意识的增强,使得情报获取的过程越来越复杂,想要获得有价值的情报更是难上加难。据英国《卫报》爆料称,“9·11事件”之后,美国前总统布什在2002年秘密授权美国国家安全局可以对全美任何人进行监控,其中包括图像、视频、邮件、聊天记录、登录信息等网络社交的用户隐私活动与数据,监听的深度与广度都令人哗然,事件一经“棱镜门”曝光,很快就激起了众怒[11]。
(3)信息安全风险
现在移动互联网端的网络社交平台几乎都带定位功能,不但会泄露出涉密场所的位置,还能揭示有关的行迹信息;一些军工或涉密岗位的用户不经意上传到社交平台上的生活照片,很可能含有重要的情报价值,为间谍所利用,给国家安全带来损失与威胁。以军事实战化作为出发点,敌对分子不仅能利用网络社交平台传播谣言,采取“攻心术”进行蛊惑或欺骗,还可以通过隐瞒真实身份、木马病毒攻击等手段获取情报、跟踪目标的位置信息,渗透到对方内部。网络社交平台还为反情报能力提供了可乘之机,使社交信息毫无安全可言。近日一篇文章描述了美国空军研究计划可能会被用于“通过社交媒体操纵个人,像无人机一样”。据说英国情报机关能够篡改网络民调结果、伪装成Facebook的留言板以及操纵网站浏览。
网络社交情报作为形式多样、内容丰富的重要情报源之一,在情报工作中的价值越来越无可取代。随着互联网的普及和智能手机的广泛应用,在线社交用户规模将继续保持增长态势,对我国情报部门来说,这是一个极为诱人的情报源泉,但这又是一个巨大的信息安全陷阱。社交工具会被“坏人”利用,也为“好人”所用,围绕网络社交进行的情报获取和反情报斗争必将日趋激烈,网络社交应用平台势必成为情报战的下一个战略高地。