吴明丹 胡 江 张 鹤 中国兵器工业计算机应用技术研究所
大数据分析技术及在军事领域中的应用
吴明丹 胡 江 张 鹤 中国兵器工业计算机应用技术研究所
【文章摘要】
【关键词】
大数据;信息时代;Hadoop;军事领域
现在人们能够存储远比过去多得多的数据,我们已经度过了存储的临界点,我们不再需要决定要保留哪一半数据或者要保留多久的历史数据。保存所有你的历史数据和变量,以及当你有了新的问题开始寻找答案时追溯历史已经经济可行。更多的数据,更加廉价但更加快速的硬件的融合驱动了变化的产生。今天,我们能够以可负担的价格获得惊人的速度。
工业界对大数据有一个在不断发展的定义,目前从以下3个维度来定义:大小、多样性、速度。
数据量大小可以通过交易、事件的绝对数量或者产生数据的历史长度来衡量,但是属性、维度和预测变量会进一步加大数据量。
数据的多样性代表了数据的混杂程度。传统的数据尤其是操作型数据,是“结构化的”,所以能以数据类型(如字符型、数字型和浮点型)为基础导入数据库。最近的几十年来,数据越来越多地变成“非结构化的”,因为数据源激增超过了操作型应用。
数据的速度是指数据创建、积累、接收和处理的速度。快速发展的世界要求我们进行实时信息处理或者是准实时的响应。
工业时代是一个社会巨大变化的时代。企业先后以蒸汽、电力作为原动力,在生产率上释放了惊人的增长。
但是企业在进化,它变得更加注意周边环境并且更快速地进行反应,与之相伴随的是信息时代的到来。
从20世纪50年代开始,企业通过使用计算机让那些已有的系统自动化起来,这是企业和信息技术共生进化的开始,是信息时代的第一个阶段——数字化时代。
大概30年前,迎来了信息时代的第二个阶段——网络时代。企业利用计算机和互联网有了显著的进化,它从被动、僵化转变为复杂和主动,从而能够适应更加复杂的世界。
但是更大的变革还在前方,我们将看到信息技术升级为对企业智能的支撑,大数据代表了存储和分析方式两者的全然转变,而不仅仅只是和大小相关。这预示着大数据时代的到来,将开辟信息时代的新纪元。
在大数据分析的早期时代,人们并不知道数据的价值,所以大多数人还是强调以统计为主的分析方法。随着人们不断地发现数据的价值,分析方法也开始向预测性、规范性的方向发展。
大数据技术正在从根本上改变数据生成、处理、分析和消耗的策略。一方面,大数据技术促使我们的数据源更加多元和高效;另一方面,随着数据源的海量激增,大数据技术能使我们处理数据更加快速高效,与此同时,辅以数据可视化技术,使我们的决策更加有理有据。
3.1预测分析
“预测分析”的提出是为了区别传统的统计概念。预测是一种更加高级的计算类型,主要被用于计算未来事件发生的可能性。特定的行业,诸如银行、保险以及数字广告都早已全面采用了这项技术,但大多数的企业仍然停留在较初级的阶段。通过掌握分析技能,企业家将从被动的反应位置(商业智能)发展为领导位置(预测分析)。使用所有可用数据(传统的内部数据资源与新的、丰富的外部数据资源相结合)可以使得预测更精确、更有意义,可以大大地减少商业冲突。
3.2数据分析可视化
数据可视化是利用数据模式识别使数据变得实用化的一项技术。对于目前的信息量而言,描述和总结报告已经足够了,但是当数据量继续扩大到海量时,描述和总结报告就开始失效了。图表、图形、仪表盘中数十亿的数据已经无法帮助我们达到辨识数据模式的目的,它们使数据显得令人窒息。于是,出现了新的技术和工具,它们利用现有的新可视化和动画来描述数据。
①可视化提供了一个强有力的使数据有意义的方法,即通过映射数据属性到可视的特征,如:位置、大小、形状、颜色。
②交互性是动画的必要补充,使用户可以控制帧动画的节奏、方向和片段的选择,这对最完整的数据理解是至关重要的。
③交互式数据可视化和发现工具,如Tableau,正在洞察发现从特有的技能向商业中每一个人转移,它使得分析师可以不需要夹在数据中间,从而做更多的分析工作。
3.3Hadoop并行计算
在许多对大数据处理有深远影响的大数据技术中,Apache Hadoop绝对是备受瞩目的一个。Apache Hadoop是一个由Apache软件公司管理的、用于存储和处理多元海量数据的开源平台,这个平台能够使数据驱动型企业快速高效地从他们的数据中获取价值。Hadoop为人们在海量多元数据上发现问题提供了可行性和易用性,而这些问题在以前是不可能被发现和解决的。
①数据的规模和种类已经大大超过了通过传统平台高效处理数据提取价值的负载能力。
②运行于标准硬件之上的Hadoop所具有的可伸缩性和灵活性使人们在付出比以往的专有解决方案更低的成本后,获得比以往更多的数据。
③Hadoop可以在很多领域胜任工作,包括搜索系统、登录系统、数据仓库、语音/图像分析。使得人们可以把简便的数据模型用于最现代的超规模体系中。
④与传统技术不同的是,Hadoop能够在它原有格式里存储任意种类数据,并基于这些数据衍生一系列分析和变化。
⑤Hadoop运行于商用服务器集群之上,每个服务器都具有可以被Hadoop系统统一调度的本地CPU和硬盘空间。
4.1提升情报获取能力
现代战争是“信息主导”的战争,信息获取能力的强弱对于战争的进程和胜负具有极为重要的作用,强化信息获取能力是精确释放及提升体系作战能力的重要前提和抓手。应用大数据技术,能够大幅提高指挥机关的情报获取能力,主要体现在两个方面:一是大大提高情报信息处理效率,现代战争中战场情报信息数量极其巨大,并且大部分是非结构化数据,如采用常规方式处理这些海量信息,犹如“大海捞针”,不但高耗时,而且效率也会极其低下。而利用大数据对情报信息进行处理,则理论耗时可达到秒级,处理速度呈指数级跃升,可大大提高单位时间内的情报信息获取处理能力。二是能够发现更多有价值的情报。在信息受侦查手段、战场环境等因素制约下,利用大数据技术能够对来自于多渠道的信息快速进行自动分类、整理、分析和反馈,能够从大量相关或看似不相关的、秘密的或公开的信息中挖掘分析出目标对象的高价值的军事情报,从而有效解决情报、监视和侦察系统不足的问题。
4.2提升指挥决策能力
现代条件下信息在作战中的功能,地位和作用大大提高,信息已成为影响战争全局的极其重要的巨大资源和力量。指挥员凭借自身的专业知识和作战经验,难以从当前海量的战场信息中迅速、准确地获取有用的战场知识,最终直接影响指挥决策的效果,而在激增的数据背后隐藏着许多重要的信息,我们希望能够对其进行更高层次的分析,以便更好地利用这些数据。而利用大数据分析技术,可为指挥员的决策分析提供智能的、自动化的辅助手段,提高系统的智能化程度及决策科学性、实效性,从而极大地提高作战的指挥效能和整体作战能力。
大数据分析技术作为一项从大量数据中获取有用知识的实用技术,已被广泛应用于各行各业并取得了较大的经济和社会效益,而其在军事领域的应用也具有很大的潜力。目前,有关这方面的研究正处于蓬勃的发展之中,相信在不久的将来,此方面的研究一定能取得更大的突破,它必将成为军事领域信息综合处理过程中的一项崭新的、必不可少的技术。
【参考文献】
[1]McKinsey Global Institute,” Big Data: The next Frontier for Innovation,Competition,and Productivity,” June 2011.
[2]Avinash Kaushik,Web Analytics 2.0:The Art of Online Accountability and Science of Customer Centricity(Indianapolis,India na:Sybex,2010).
本文通过阐述什么是大数据来引出大数据时代的到来,接着从3方面论述了大数据分析技术,最后从提升情报获取能力、提升指挥决策能力两方面阐明了大数据在军事领域中的应用前景。大数据分析技术作为一项从海量数据中获取有用知识的实用技术,必将在军事领域发挥巨大作用。