姚俊萍 李晓军 李琳琳
【摘要】大数据是移动互联网、云计算、物联网等新技术发展的必然趋势,将大数据技术应用到军事领域具有重要的意义,院校教育是人才培养的主渠道。文章首次明确给出大数据思维的概念及特点,论述了大数据在军事领域应用的价值及挑战,最后针对问题给出了对策及建议。
【关键词】大数据思维;军官信息能力培养;应用价值;对策
信息能力,是指指挥员及其指挥机关基于信息系统实现信息共享、信息流程优化、信息优势等过程中表现出来的对信息有效利用能力的总和,它集中反映了人员能动作用、有效利用信息、处理信息、提高作战效益、完成作战目标的能力素质。全球已经由“IT”时代跨入“DT”时代,在信息时代的一体化联合作战背景下,大数据思维能力是军官信息能力的一个重要组成部分。
目前,依靠经验直觉进行作战指挥的优势正在急剧下降,大多数军事强国已经认识到将大数据技术应用在军事领域的意义,将大数据技术作为国防科技发展的重要方向。美军投入巨额资金,确定了“数据支持决策、弹性系统设计、网络空间战、电子战与电子防护、反大规模杀伤性武器、自主系统和人工系统”等重点研究领域。对于我国来说,加强军事数据的发展建设刻不容缓。充分利用军事大数据的潜在价值,培养大数据思维,完善制度机制,加强数据专业技术人才培养,构建大数据决策支持系统,对推动我国国防和军队建设具有重要的战略意义。
一、军事领域大数据应用价值及挑战
(一)大数据技术在军事领域的应用价值
对于“大数据”这一概念,目前没有权威性的定义,较为普遍的解释是“难以用常规的软件工具在容许的时间内对其内容进行抓取、管理和处理的数据集合”。大数据的“大”首先体现在其规模和容量远远超出传统数据的测量尺度,目前的数据规模已经从TB级升级至ZB级,一般的软件工具难以捕捉、存储、管理和分析。同时,大数据之“大”还表现在其采集范围和内容的丰富多变,能存入数據库的不仅包含各种具有规律性的结构化数据,而且包括各种如图片、视频、声音等非结构化数据。大数据技术的核心就是在海量数据中找出关联,发现规律,验证趋势。大数据时代,“行动即数据”,个体任何一项微小的行动(比如点击鼠标、刷卡等)都会被编码,这些编码乍看之下杂乱无章,而结合编码的时间、地点、频率等数据,通过特定的复杂运算之后,其意义便能体现出来。
在数据日益开源的情况下,将大数据分析技术应用到军事领域具有重大意义。首先,大数据是制订军事战略计划的基础,构建军事大数据技术平台,是科学制定国家战略的重要环节。大数据的重要特点之一是整体性,而不是样本性,建立军事大数据仓库,可以详细记录和获取军事领域所需要的全部数据,避免出现以偏概全的情况。通过对大量多源数据的采集、分析、处理和配置,结合人工智能、计算分析等方法来关联挖掘分析,可以发现有价值的规律,完成科学的预测,帮助制订合理有效的国防战略规划。其次,大数据是进行信息化战争研究的重要手段,在战场情报获取、作战指挥决策等方面能够发挥重要作用。对战争的传统研究模式可以感知交战过程和作战结果,却无法模拟复杂多变的战场态势,无法呈现战争内在的关联和规律。运用大数据分析技术可以对各渠道得来的海量信息进行实时化、智能化处理和仿真模拟,更加科学地分配兵力兵器,形成高效的打击方案。再次,大数据是打破体系内壁垒的有效方法。我军刚刚进行了一体化联合作战的改革,很多体制机制还不健全,原有的各军兵种之间的差异和壁垒很大。此前,各军兵种之间各自为战,各自拥有自主的指挥平台,没有实现互联互通,数据规模不等,格式不一,质量各异,无法实现共享。通过大数据加强一体化指挥作战平台的建设和数据共享,增强各基层部队搜集数据、存储数据、共享数据的意识,可大大提高体系作战能力。
(二)大数据在军事领域面临的主要问题
一是缺乏应用大数据的思想意识,不能用大数据解决问题。大数据思维是决策方式的变革,决策依靠数据分析而不是直觉经验。思维决定成败,思维决定命运,这正是军事指挥打仗所必需的。发展国防大数据应用的一项阻碍因素,就在于军内人员对于运用大数据技术的观念较为淡薄。无论是在作战指挥、装备保障还是用人管理方面,军队管理者还是习惯于凭借经验进行主观臆断做出决策,基本没有应用大数据的思想意识,更谈不上主动搜集数据,存储数据,共享数据。
二是缺乏大数据处理技术专业人才,不会用大数据关联分析。在一体化联合作战的大形势下,现代战场的突发性、严酷性、毁伤性、立体性、多维交错性大大增强,信息化、网络化、智能化、太空化特点日益突出。在这个过程中,战场的数据量呈现出爆炸式增长的态势。因此,对战场数据进行全面开发,高效集成和充分利用,成为掌握数据优势,把握战场主动权的关键。步入大数据时代,最大的亮点就是数据分析和计算,将大数据分析的方法应用于信息化战争和国防军队的现代化建设,对于推动国防跨越式发展具有至关重要的作用。但目前军内很多人认为大数据是热点概念炒作,认为大数据与军队建设没有什么关系,忽视大数据的技术内核。
三是缺乏上层建筑总体设计,不敢用大数据解决现实矛盾。在部队体制层面上,由于体系内各部门相对隔离脱节,缺乏信息数据共享的平台和机遇,导致信息化建设过程中大量数据遭到弃置,难以实现体系内各军种之间数据的共享。具体而言,一方面,各军兵种使用的信息操作平台并未得到统一,数据存储以及数据的操作方式有较大差别,数据的规模量级、质量格式等都没有在同一水准之上,导致了信息数据天生的隔离现象;另一方面,受到组织体制的影响,军兵种之间严明的划分使得横向之间产生数据交流交换的抵触心态,制约了大数据的广泛普及和发展。
综上所述,“不能用、不敢用、不会用、不够用”成为大数据在当前军队应用的真实情况。
二、大数据思维概念及其特征
从大数据产生的动态成因和概念来看,我们认为,大数据思维是指建立在全数据分析基础上的思维方式,是运用大数据技术对问题进行分析、研判、预见、谋划的过程。具体而言,大数据思维具有以下特征。
第一,整体性而非样本性。人的思维方式与所获信息数据有直接联系。根据互联网数据中心预测,全球新产生的数据年增40%,全球信息总量每两年就可以翻番。基于这样的大背景,人们可以从多个渠道获得整体数据。正如舍恩伯格所说的:“我们总是习惯把统计抽样看作文明得以建立的牢固基石,就如同几何学定理和万有引力定律一样。但是,统计抽样其实只是为了在技术受限的特定时期,解决当时存在的一些特定问题而产生的,其历史不足一百年。如今,技术环境已经有了很大的改善。在大数据时代进行抽样分析就像是在汽车时代骑马一样。在某些特定的情况下,我们依然可以使用样本分析法,但这不再是我们分析数据的主要方式。”这充分说明了整体性思维已成为全面、系统认识客观事物的主要思维方式。
第二,多源性而非单一性。2013年全球新产生的数据达到4.1ZB,到2020年将达到40ZB。在ZB级庞大的数据中,只有5%是结构化数据,另外95%为非结构化数据。以往,由于获得信息数据的能力有限,人们只能对结构化的信息数据进行收集和分析。大数据时代的到来,使人们有能力在获取和处理结构化信息数据的同时,获取和处理半结构化和非结构化的信息数据。大数据思维的多源性主要体现在信息数据源的多样性。由于一个数据集中的信息数据来自不同的数据源,如网站、微博、论坛、微信等渠道,其形式有文本、图片、音频、视频等,有结构化数据、半结构化数据、非结构化数据等,其思维方式必须考虑如何将从不同信息数据源挖掘的不同结构的信息数据聚合在一起,形成统一著录或标引形式并能够方便使用的数据集,还要考虑多源数据集在揭示某一事物或实现某一目标时客观完整地反映事物或目标的本来状态。
第三,关联性而非因果性。关联性是大数据思维的一个重要特征。舍恩伯格对关联性的思维方式有深刻的理解,他指出:“大数据的出现让人们放弃了对因果关系的渴求,转而关注相关关系,人们只需知道是什么,而不用知道为什么。我们不必知道事物或现象背后的复杂深层原因,而只需要通过大数据分析获知是什么就意义非凡,这会给我们提供非常新颖且有价值的观点、信息和知识。”这就清楚地描述了思维方式已不再追求从原因、条件的分析、思考推导出结论的固有方式,而是从海量信息数据挖掘、整合过程中直接获得结果。从因果关系转变到相关关系的思维方式是人们思维方式的一次革命,它对于准确预测事物未来的发展、变化具有极其重要的作用。2008年“谷歌预测流感”就是使用了大数据思维中的相关思维。通过对“咳嗽”“发烧”等关键词的监测以及对相关地区的关注,研究人员发现搜索流感信息的人数与实际患病人数之间存在密切关联。相应的关键词密度越高,出现越频繁,该地区爆发流感的可能性就越大。因此,2009年,谷歌较为准确地预测了甲型H1N1流感的爆发,比美国疾病预防控制中心还要早1—2周的时间。
三、大数据思维培养的对策及建议
(一)结合专业能力发展,有意识地培养大数据思維
一直以来,大数据技术并没有得到军队的重视,整治思想上的弊病,要从根本上重视大数据专业化发展做起。大数据作为一项新兴技术,需要大量优质的人力资源作为顺利发展的保障。大数据人才培养具有核心奠基石的作用,我们必须要从人才培养抓起,制订人才培养方案,为未来大数据发展打下人才基础。从人才培养计划来看,数据技术人才应该系统地掌握数据分析的相关技能,主要包括数学、统计学、数据分析、自然语言处理等,要具有较宽的知识面,具有独立获取知识的能力,具有较强的实践能力和创新意识。大数据人才培养可以分成两大类:一类是学位培养,包括以学术型人才培养为主的研究生教育,以及以基础型人才培养为主的本科教育,培养过程具有体系化、系统性的特点;另一类是任职培训,以掌握某种大数据相关技能和掌握某些大数据实用工具产品或开源软件为主,培养过程具有快速化、针对性的特点。
一是针对学位培养。在大学本科阶段,针对全校生长干部学员,开设数据文化漫谈、大数据技术(Hardoop或Spark)、Pathon基础教程等网络公共选修课;针对计算机专业学员在已经学习过概率论与数理统计、线性代数、计算机操作系统、算法和数据结构、数据库系统原理课程的基础上,再开设机器学习、数据挖掘、数据可视化、非结构化大数据分析等数据类课程,并在大四学员的综合演练基础上,开设数据获取、数据存储、数据检索等数据工程类实践课,使学员具有扎实的数据分析素质,能满足军队对数据人才的需求。
二是针对任职培训。通过短时间、高强度、系统化地讲授数据科学知识,紧急弥补军队对高端数据人才的缺口。在具体制定课程体系时,以掌握某种大数据具体相关技能和掌握某些大数据实用工具产品或开源软件为主,增强课程讲授的针对性。面向在职人员的大数据技能培训将成为后期大数据人才培养的重点。
(二)统一制定数据标准,推动一体化联合作战数据平台建设
在有大数据方向人才培养基石的基础上,在军队人员具有初步大数据思维的推动下,借鉴外军的先进做法,结合我军实际制定战略性发展规划,做好上层设计。克服体系内各军种单位之间条块分割、各自为战的体制弊端,搭建大数据的硬件支持平台,统一各军种之间的数据管理标准,保证大数据在交流互通过程中的流畅性,形成数据共享的一体化联合作战指挥平台。外军,尤其是美军,非常重视借鉴当代科技的顶尖研究成果,将其利用至全面优化和提升军事力量当中。以美军的C4ISR的情报系统为例,就是提高以大数据分析技术为基础的情报系统集成能力,提高各种情报支援系统的横向兼容与纵向互通能力,从而达成情报、信息的共享互通,实现“从传感器到射手”的快速精确打击。
(三)以实际应用为牵引,挖掘大数据思维的价值
1990年,美国情报分析家首次提出“互联网公开来源情报资料搜集”的概念。和平时期,情报中有95%是来自公开来源物。比如美国海军战争学院、海军分析中心、布鲁金斯学会、日本防卫研究所等各类智库专家正在通过我国公开的数据,开展对我国国防信息的分析研究。例如,美国海军战争学院肯尼斯·艾伦教授根据《解放军报》《中国国防生》等媒体著作,经过数据清洗和整合分析,分散获得了中国所有国防院校的招生计划,对国防生的招生数量和专攻领域、国防生后续的分配及训练项目等都有了全面而系统的认识,并通过表格形式予以公开。在反恐维稳行动中,丰富的开源数据为情报分析提供了更加有力的决策支持,提高了反恐情报的综合分析能力。2002年,阿富汗境内的大毒枭准备为基地组织等恐怖分子提供资金时,美军的情报分析人员通过数据挖掘,把作战方案库里的数据与有关基地组织情况库里的资金数据进行实时、自主关联,从而指导了美军先敌一步采取行动。基于这种实际情况,就要利用大数据技术对开源数据实施分级管理,首先要对开源数据的等级进行甄别,这就需要系统性地提高大数据分析能力。在国外智库对我国开源信息进行大数据筛选和分析之前,我们必须首先对自己的数据了如指掌。通过对分散数据的统计分析,建立开源数据管理体系,对数据会泄露我国国防信息的风险等级进行标识处理,做到能公开的谨慎公开,不能公开的严禁公开。同时加强对大数据软件技术的开发,软件开发是大数据预测的核心,挖掘数据与数据之间的相关关系,最终提供数据预测,完成决策参考。
四、结束语
数据思维以泰勒模式在100年前统御了美国企业与产业管理之道,在美国的政治、经济、军事领域起到了关键作用,促使美国成为全球第一大经济体;也在半个世纪前以戴明模式契合并提高了日本企业全球竞争的能力,从而促进了日本的崛起。是否追求科技与精准是发达国家与发展中国家的显著文化区别。而精准核心是数据,没有数据意识就没有现代科技的进步。强国必先强军,在军队中普及数据文化,提升数据素养,培养大数据思维,对信息化时代下的国防建设具有举足轻重的作用。
【参考文献】
[1]维克托·迈尔-舍恩伯格.大数据时代[M].杭州:浙江人民出版社,2012:3.
[2]前瞻研究院.2014-2018年中国大数据产业发展前景与投资战略规划分析报告[R].北京: 清华大学,2014.
[3]胡琦民.未来战争形态将改变,军事大数据决定战争主动权[DB/OL].(2014-08-01)[2018-11-20].http://tech.southcn.com/t/2014-08/01/content_105664455.htm.
[4]潘云鹤,宗宇伟,张绍华,等.大数据产业发展总体战略研究[M].上海:上海科学技术出版社,2017.
[5]涂子沛.数据之巅[M].北京:中信出版社,2017.
[6]陈军君.中国大数据应用发展报告[R].北京:社会科学文献出版社,2017.
[7]沈浩,黄晓兰.大数据助力科学研究:挑战与创新[J].现代传播,2013(08):13-18.
[8]冯文全,马星光,张倩.论我国教育研究范式的转变——基于大数据的视角[J].教书育人(教师新概念),2016(12):4-6.