◆严立鹏
大数据背景下情报收集对信息安全的影响与应对措施
◆严立鹏
(南开大学商学院信息管理系 天津 300100)
大数据时代宣告了低成本程式化提供批量数据时代的到来,但与此同时批量提供的数据预示着用户的信息安全受到了很大的威胁。本文将在大数据背景下针对情报采集行为与信息安全问题进行分析和研究。
大数据;信息安全;情报采集
随着大数据时代的到来,数据已经渗透到当今几乎所有的行业和业务职能领域,当然少不了在情报采集工作中的应用。在信息社会化进程日益累计的大数据环境下,情报采集工作也由传统手工记录,较为简单的统计方法向对海量开元信息中隐含的表面内容,深层语义,隐含信息等进行提炼。但这就使得信息安全保护与信息价值挖掘之间产生了很大的矛盾。再加上我国对信息安全立法的保护还不完善,信息法规对信息安全保护还不能切实落实到位,所以在此背景下分析情报采集与信息安全之间的影响与应对措施是很有必要的。
“大数据”战略在国际社会讨论得如火如荼,对于公司以及其他组织数据共享开源的进程也在加速,如何有效地从海量的网络信息源中采集有价值的情报支持企业的战略决策, 是一个亟待解决的难题。之前个人组织和企业主要依靠手动浏览或搜索引擎获取网络信息人工浏览具有很强的针对性,能够获得准确有效的竞争情报,但工作量大,且范围有限获取的信息也有限。大数据时代到来后,可以利用搜索引擎搜索任务自动检索大量信息,并有助于获取情报甚至竞争情报。但是目前主流搜索引擎使用流行的服务模式来回答所有用户的所有查询,因此核心的采集思想还是尽可能多地收集所有的信息。这种不区分主体、不涵盖一切没有轻重点的策略,给情报的收集带来了一定的负面影响,如降低情报的精确性和使用价值。大数据环境下面向主题的信息收集策略为解决这一问题提供了一种新的途径。面向主题的网络情报收集系统只访问相关页面的网页的相关主题,这有助于提高相关情报收集的关联度,从而缩小了页面的收集范围,进一步也提高了情报收集的速度和效率。这只是大数据运用于情报采集的一个小点,数据开源后在原有的情报采集要求和主题的基础上,可以提出更多样的面向主题的网络竞争情报收集系统,与此同时还可以并行地分析影响网络竞争情报收集的一些关键因素。
而早在上世纪八十年代,在大数据时代到来三十余年之前,就有研究者提出了风险社会和现代社会的概念,指出随着现代化的推进、科技的发展及经济全球化的加速,我们已经面临风险频发,安全问题频出的现实问题。而现代风险具有整体性、不可感知性、不确定性、全球性、自反性等传统风险所不具备的特性。科技发展越快,现代化越完善越成熟,那么我们面临的风险也会越多越突出。实质上这些分析也完全契合了大数据新环境下信息安全的特点。
首先,我们会面临比以前更加大规模的数据信息,覆盖了各个领域行业。海量数据在数据云的汇集,让信息安全风险规模和危害风险达到了从未有过的高度。大数据时代对个人信息安全的巨大威胁正在形成。近年几千万乃至数亿的信息安全事件已成为一种新的常态。这是大数据时代信息安全的一个新特点。如最近爆出的Facebook用户隐私泄露就影响了成千上亿的用户信息安全,不法人士完全可以利用这些得来的信息向用户推销,甚至根据提供的地址编号等对特定用户进行犯罪等。
其次大数据驱动时代,科技水平一直在革新,人们的信息浏览手段不再局限于电脑,有智能手表、平板、手机等多平台终端出现,许多人的工作场所已经不再是固定的物理模式,而是更多的空间模式。移动互联网环境下新的网络结构也为信息传递提供了新的空间和新渠道,甚至连智能手环都可以传输信息。这些革新不仅是便利了人们的生活,对信息安全源的测定监测,对各平台的管控也成了信息安全的新难题。
此外,由于大数据时代的发展,数据信息化带来了信息流,无法通过传统情报收集手法收集到的跨业跨国际的信息,在大数据时代可以通过数据库平台和数据挖掘技术追踪网络行为而获取相关信息。但因此也造成了技术流以及知识流等的跨界流动,各行业各区域的信息实现了互连互通,且国家间的数据隔阂也因为经济,信息全球化被打破,网络安全和网络空间安全将面临跨域安全的挑战。
信息全球化和数据库技术,信息流开源是双刃剑,既满足了人们和组织对信息的需求,与此同时也暴露出了很多问题。很多情报收集的新兴手段(如大数据时代的网络搜索)具有破坏性和侵略性,在可能威胁到用户以及系统安全的同时也可能触犯到法律(因为大数据时代的网络搜索可以认为对海量的用户及系统信息进行了监控,人们在搜索和使用软件时留下的信息是情报收集的重点搜寻对象)。譬如最近网络流行的人肉高利贷家庭个人信息导致“一家三口车内自杀2死1伤”就可见个人信息泄露公开对安全的隐患是巨大的。
除了上文中提到的多平台数据流通之外,比于传统的数据环境,在大数据时代,网络社交账号被盗窃的风险更高。很多用户经常使用同一个账号登录很多网站,所以会产生一定的数据关联。一旦其中一个账户被盗,就会产生连锁反应,后果将是不可预料的。通讯方面,由于通讯运营商巨头中垄断了所有使用移动电话的用户的隐私信息(如流量使用详情,短信内容,通话录音通话记录等等),如果这些被掌握的大量通讯信息被第三方不法人士盗取,将会对个人乃至社会造成困扰。除此之外,就算是正当的情报收集手段也有可能对人们的信息安全造成威胁,所有收集过程中使用的搜索记录,数据库记录有可能被人为监控从而造成信息泄露。
如何在情报收集时保护信息安全?
许多来自数据库采集的情报数据是不可用的。大数据背景下海量数据的堆积决定了在情报搜集中不可能非常准确,而且由于有第三方或者反竞争情报搜集者的出现,释放了大量虚假信息,对于真实的信息覆盖也造成了情报搜集困难,因此,收集的情报应承认不是完全准确的,不可能追求每个情报信息的完善,应充分发挥情报人员的主观能动性辅以情报收集检验和使用。
在以往的情报收集过程中,用户的数据安全往往需要宏观的法律手段进行管制才能得到保护。这层用户信息的“屏障”的效果另当别论,就算能完全维护用户的隐私安全,那其实这只能保护用户的一次信息。在情报收集的过程中,往往对象不仅仅是一次信息,还包含很多的二次信息甚至三次信息数据。因此在管控一次信息的同时,还要想办法对二次信息三次信息进行检查和甄别。特别是二次信息包含了更多的隐私信息,更需要在情报收集时剔除掉这些无关的隐私信息,在入口处对信息安全进行保障。
作为信息主体,用户个体信息安全的防范意识也很关键,有关部门要做好引导,提高用户在使用多平台时对自己信息的保护。与此同时用户也要养成良好的上网使用习惯,减少自己的信息被曝光频率。
大数据时代情报收集带来的隐形安全隐患无非体现在以下几个方面:(1)信息泛滥和信息冗余,需要多加以甄别,这里不再赘述。(2)收集来的数据零散不能为情报分析所用,需要利用零散的巨量数据进行跨域全连接,使其整合为聚合的有价值信息。这里也需要有主题跟踪,深度分析的技术手段进行保障。(3)在情报收集过程中保证信息安全。需要有防监控,预防网袭的技术手段保障在情报收集时用到的信息不被不法人士“开后门”获取。总而言之,大数据时代的情报收集与传统的显性信息收集安全是不一样的,在信息安全管理这方面还需要不断探索和与时俱进。
[1]王世伟.论大数据时代信息安全的新特点与新要求[J].图书情报工作,2016.
[2]王翠波,吴金红.大数据环境下技术竞争情报分析的挑战及其应对策略[J].情报杂志,2014.