朱亚平,杨 亮,尹建平
(91001部队,北京 100841)
“大数据”(Big Data)的概念起源于美国,早在20世纪80年代,未来学家阿尔文·托夫勒(Alvin Toffler)在所著的《第三次浪潮(The Third Wave)》中就将其描述为“第三次浪潮的华彩乐章”[1]。2008年,《自然》杂志开辟了名为大数据的封面专栏,大数据作为一个专用名词首次出现在公共刊物上。而真正让大数据成为互联网信息时代科技界热词的是世界著名咨询公司麦肯锡全球研究院,2011年5月一篇名为《大数据:下一个创新、竞争和生产力的前沿》的研究报告发布,该报告的发布引起了极大关注,推动了大数据的迅猛发展。
大数据目前尚无统一公认的定义。(1)大数据主要研究机构之一Gartner认为,大数据是新处理模式才能具有更强的决策力、洞察发现和流程优化能力的海量、高增长率和多样化的信息资产。(2)根据维基百科的定义,大数据是指无法使用传统和常规软件技术和工具,在一定时间内完成获取、管理和处理的数据集。(3)全球著名的IT公司IBM最早在《分析:大数据在现实世界中的应用》中将大数据归纳为以下4个特征:数量大(至少应该是PB级的)、种类全(能覆盖所研究领域的各种特征信息)、速度快(数据增长非常快)、价值高(数据的实际应用价值比较高,也有人把这一点理解为数据的真实性)。大数据一词的重点并不在于数据规模的定义,更代表着信息技术进入一个新时代,爆炸性的数据信息给传统的计算技术和信息技术带来的新挑战[2-5]。
为了应对大数据带来的挑战,取得信息处理分析方面的优势,国外较早开展了相关研究。前些年,美国国防部围绕“大数据”展开了一系列研究项目,如多尺度异常检测、影像检索与分析、机器读取、数据决策等,期望提高和改进从海量与复杂数据中高效提取信息的能力,加快科学与工程领域的创新步伐。国内基于气象大数据的分析刚刚起步,很多机构和学者针对大数据、人工智能、云计算等相关研究展开了积极的探索和尝试。2014年5月,中国气象局公共服务中心联手阿里云计算,开展气象大数据合作。2020年,中国气象局气象大数据云平台通过业务验收,在全国投入业务试运行,作为气象部门全网协调互联、信息实时互通的云平台,将对内承载气象业务应用,对外提供数据共享服务,为气象业务带来全链条效能提升和全流程业务优化[6-10]。虽然目前来看,大数据和人工智能等新理念新技术尚不能颠覆传统的气象分析预报方法,但大数据处理和分析技术极有可能会突破传统预报预测方式,带来海量数据分析预报方法的思维方式突破和创新。
本文将分析大数据时代背景下海洋环境信息化服务面临的种种挑战,着重讨论气象水文等常规观探测传统手段以及颇具代表性的卫星遥感领域在数据管理、智能算法和决策服务等方面面临的新问题,并对大数据在气象水文信息支撑服务领域的应用前景进行了展望。
在水文气象领域,常规观探测数据的资料种类、数据体量、存储分析等多方面越来越体现出大数据的显著特征。(1)从种类而言,收集引接地面常规观探测、雷达、浮标、航空报等多种观探测手段的信息数据,同时提供全球范围内各种时空尺度从大气到海洋到空间的多达上百种环境要素,预报尺度从远至几个月的气候预测到中小尺度的几个小时预警。(2)从数据体量而言,每天接收处理制作的实时观测数据已达几百GB,数值预报产品制作每天达上百GB,再分析资料存储需求已达PB级。目前,国家气象信息中心的常规观测数据统计显示,地面观测资料从21世纪初的不到3 000个,迅速扩展到目前的4万多个,观测频度从原来的3小时一次提高到目前每5分钟一次,未来可能继续加密到7 000到10 000个,观测频度有可能加密到每分钟一次,由现在每天百万条记录增长到超过一亿条。(3)在大数据接收和存储呈现的新挑战来看,水文气象数据的空间覆盖更广,时间序列更长,观测手段愈加丰富,异类异构数据更加庞杂,数据的存储、分析和显示效率面临巨大难题[11-14]。
引起数据爆炸式增长的除常规观探测数据外,具有一定代表性的是卫星遥感信息,遥感专业的大数据处理和分析面临巨大挑战和深层次的应用价值[15-17]。相对于传统的气象常规观探测数据,卫星遥感数据的体量高达3~4个数量级。随着航天、航空等多种遥感平台的快速发展,遥感数据空间分辨率、时间分辨率、光谱分辨率和辐射分辨率越来越高,数据类型越来越丰富,多源遥感信息愈发体现出大容量、多类型、难辨识、高价值的大数据特征。如国家新一代风云四号卫星相对上一代风云二号,载荷由两个增加到4个,成像仪光谱通道从原来的5个增加到14个,空间分辨率从原来的1.25 km提高到最高500 m,每天接收的数据量是原来的几十倍。高分系列卫星的传感器种类包括全色、多光谱、高光谱、合成孔径雷达(SAR)等,获取的数据反映了不同目标物的特征,异类异构的数据加剧了遥感数据的复杂性。这些高维、多尺度的巨量遥感数据也带来了存储、管理、处理分析上的难题。
另外,更高频次分布式雷达站数据和更加精细化的数值预报产品也愈发体现出大数据的显著特征。在海洋环境信息化服务的其它领域(如测绘、导航等),随着信息化进程的加快,“地理大数据”“环境大数据”等也将引起重点关注,各类气象、水文、遥感等数据的信息快速汇集、产品加工处理分析、信息传播访问服务等大数据的应用技术必将成为新信息时代海洋环境信息服务的趋势[18-20]。
大数据既指海量数据,也指处理技术和工具,还指利用海量数据的思维方式。大数据的战略意义不仅仅在于掌握庞杂的信息,更在于以崭新的思维和技术去分析海量数据,对这些含有意义的数据进行专业化处理。所以,海洋环境数据的多类异构数据的收集、处理和分析,对软、硬件的要求更为苛刻,传统的处理设备和算法如何突破大数据处理的功能,如何利用云计算、人工智能等算法快速从多尺度多维度的水文气象信息中深入分析挖掘有价值信息,并高效反应服务于用户并及时做出响应决策将是一项新挑战[21-24]。
从技术上看,大数据管理应用将依托分布式处理和云计算技术已基本成为共识。在云计算日益成熟和深入应用的当下,计算、存储和网络资源的应用服务已不仅仅局限于能够提供精准的计算、弹性的存储,而应包含对现有和在建新信息化业务系统进行云端改造,以及分布式计算、人工智能分析等专业性很强的技术处理。当前的业务系统在操作系统、数据库、中间件、GIS平台、绘图软件甚至开发语言等方面或多或少存在差异,系统间存在交叉重叠、重复开发的情况,系统彼此有效地移植或整合成果还存在一定困难。
值得注意的是,当前关于大数据云平台、云计算、人工智能等智慧学习和高速响应的新兴技术尚处于探索试用阶段,还不能完全替代传统的机理分析和复杂的科学研究。探求科学机理是非常艰难的,在没有把握科学机理的情况下,复杂的精确计算和深度分析即使能够提供“大价值”的客观信息,也不能完全替代自然规律的科学研究。由大数据直接分析的客观结果与传统业务系统的复杂机理分析结果之间还存在很大的不确定性,如何利用大数据云平台、人工智能算法与传统专业领域业务系统有效结合,促进传统专业信息应用价值深度挖掘和有效发展,是未来一段时间内信息化保障面临的新课题。
大数据对信息化决策服务的作用很重要的在于事前预测、事中感知和事后反馈。大数据增强了对决策场景和活动的预测功能,在行动开展之前,能够综合利用多维度多种类环境信息进行模拟与预测;同时,大数据可以根据动态数据的变化情况,及时高效追踪时态演变情况,从而把握进展细节,有助于随时调整计划和决策;由于大数据的实时监测能力,可以随时了解行动或计划行动的时效性,事后进行效能反馈。
由此可见,大数据信息化决策服务不再追求数据的准确性,而是接受数据管理的复杂性和结构的多样性,其决策思维方法更在于灵活应用,决策方式由业务经验驱动向数据量化驱动转型,通过对海洋数据进行挖掘,形成非线性的、面向不确定性的决策模式。其关键技术要在信息采集和管理的基础上,通过云计算和人工智能技术,为用户提供决策辅助的可视化图形和数据展示,提高信息感知和应急响应能力。大数据信息化决策服务存在不确定性、动态性、全局性以及各专业间的关联性,如何处理好大数据信息化决策服务带来的不确定性和复杂性发挥效能和作用,将是一项巨大的挑战[25-26]。
大数据蕴含着丰富的信息资源,其科学有效的技术应用能够为海洋环境信息化服务领域带来巨大的经济效益,具有广阔的应用前景。
(1)大数据开发将为传统观测方式和信息处理技术带来创新性发展,引发新时代信息技术革命,物联网、云计算、人工智能等新兴技术将对海洋环境的认知带来深远改变。一方面,物联网、5G、人工智能等技术赋予了未来终端设备的感知能力,各类车载终端、无人机、手持移动终端等均可提供快速、灵活、高分辨率的观测信息。另一方面,支撑AI算法将成为数据处理、产品加工的重要工具,未来的气象水文信息中心不仅是数据存储、产品加工和服务提供者,更是态势感知、预警发布等创新技术的重要组成部分,云计算将是未来基础资源、数据资源和应用资源存在和应用的主要形式。
(2)大数据应用促进信息数据各领域深度融合,传感器、智能终端、高速网络、云平台、地理信息技术等多种技术领域的交叉融合将对多领域造成深远影响,加速各保障职能的调整和重构。海洋环境信息化将突破基础资源建设管理服务,触及各部门顶层设计、标准规范、科学管理等领域,打破学科领域壁垒,归并同类功能,优化标准规范,加速各学科之间的信息融合,有效发挥其应用领域的交叉。
(3)大数据将成为提升海洋环境信息化综合决策能力的新途径,管理决策部门可以透过大数据揭示传统技术难以展现的关联关系,并对环境形势和动态做出准确预判,从而在复杂情况下做出合理优化的决策。信息化时代、互联网时代、大数据时代需要用更科学的顶层设计和管理思维来思考,从固有的技术层面突围,向上延伸到管理层面和决策层面。
大数据是信息化发展的新阶段,大数据浪潮汹涌来袭,与互联网的发明一样,这绝不仅仅是信息技术领域革命,更是在全球范围内加速科学技术革命、引领社会变革的利器。未来的海洋环境信息服务可以把大数据技术融入“态势分析”,通过对气象、水文、测绘、导航等多种来源数据进行综合分析,提炼海洋环境中多源信息中本质性的事实和趋势,揭示信息中含有的隐藏内容,对事态发展做出预报预测,实现海洋环境信息服务的快速反应,助力行动感知决策,有效提升海洋环境智慧认知和应用能力,在海洋气象防灾减灾、公共服务、气候预测等方面发挥重要作用。