编译 徐宁
在科幻小说《云球》中,科学家在计算机中模拟出了一个和地球几乎完全一样的数字地球。今天,数字地球已经完全成为现实。
传说中护送一众英雄开启寻宝之途的“阿尔戈号”
在古希腊神话中,伊阿宋和一众英雄前往黑海沿岸地区,寻找稀世宝物“金羊毛”,他们乘坐的是传奇船工阿尔戈打造的“阿尔戈号”。2007 年11 月,由3000 个浮标组成的全球海洋观测网全面建成,这个由30 多个国家共同参与的海洋监测项目被命名为“阿尔戈计划”,其正式名称为“地转海洋学实时观测阵”。就像地面上由天文台和地震监测站分别组成的天文观测网和地震台网一样,阿尔戈计划建立的是一个覆盖海洋的监测网络。
今天,阿尔戈计划分布在全球海洋中的3000 多个由卫星跟踪的剖面浮标,能够快速、准确地收集全球海洋范围内的海水温度、盐度、洋流运动等数据。浮标以10 天为一个工作周期,其中前9 天浮标会在海面下1000 米处悬浮;第10 天,浮标会下潜到2000米深的海洋区域,收集那里的海水温度信息后返回海面。科学家也可以根据需求调整浮标的工作周期。
阿尔戈计划每日能收集海量的海洋数据,其中绝大部分数据是卫星无法采集的深层海水数据。在阿尔戈计划等海洋监测网的帮助下,全球海洋科学家在21 世纪的前20 多年时间里就收集了数倍于过去100 年的深海剖面数据。
阿尔戈计划浮标工作周期
阿尔戈计划将全球海洋数字化,而科学家甚至希望将整个地球数字化。1998 年,时任美国副总统的戈尔提出“数字地球”的概念,即充分采集地球上每一个角落方方面面的信息,并将它们存入分布式计算网络中,构成一个地球的实时数字模型,让全世界的人们快速、直观地了解到地球上发生的变化。
为了实现数字地球的目标,我们需要在以下技术手段上取得长足发展:
数字地球工程随时都会有海量的信息进入分布式计算网络。在戈尔提出数字地球概念的1998 年,个人计算机上安装的硬盘存储器容量绝大多数仅为几十GB。而在今天,大数据处理中心的数据存储量已经从TB 级逐渐上升到PB 级,甚至是EB 级、ZB 级和YB 级。
截至2019 年,全球在轨的卫星数量达2460 颗。卫星成像的精度近年来也在逐渐提高。我国的高分十一号02 星光学遥感卫星的近距离(卫星在椭圆轨道上靠近地球的运行时段)分辨率可达0.1 米。除了卫星网络,海洋、大气、河流等众多实时监测网络也为数字地球源源不断地提供各类信息。
数字地球不但需要输入大量信息,也需要在网络上发布各种信息,这一进一出的庞大数据吞吐量要求与之相适应的大容量网络带宽。否则,大量数据就难以及时上传或下载,将会大大影响数字地球的实用性。
互联网能够得到快速普及,在很大程度上是因为采用了一系列通用的底层协议,统一标准让数据交换得以顺利进行。数字地球的应用也面临着统一标准的问题,也就是“互操作性”,指的是不同系统和组织机构之间相互合作、协同工作的能力。
元数据是“描述数据的数据”。《三国演义》中是这样描绘张飞外貌的:身长八尺,豹头环眼,燕颔虎须,声若巨雷,势如奔马。在这段描写中,读者可以得到关于张飞身高、长相、说话声音和行为特点这四个方面的信息,而“身高”“长相”这类数据就属于元数据。如果要让数字地球从全世界汇总来的各种数据能够被各地科学家解读,就要在这些数据上标明“名称”“采集地点”“作者或来源”“数据格式”“分辨率”等一系列信息,以增加这些数据的可利用度。
计算机架构的提出者冯·诺依曼曾经说过:“科学从不试图去解释自然现象,甚至连诠释自然现象的企图都未曾有过,反而仅仅是建立科学模型。”建立科学模型是指使用数学公式、电脑模拟或简单的图示来表示一个简化的自然界。随着人类在算法等领域取得越来越多的突破,科学家已经可以为大气活动等自然现象建模。
差别细微的始终参数,可能输出完全不同的结果
2021 年诺贝尔物理学奖被授予日裔美籍科学家真锅淑郎、德国科学家克劳斯·哈塞尔曼和意大利科学家乔治·帕里西,他们为人类理解大气运动等复杂的现象做出了开创性贡献。
复杂系统由许多能够相互作用的成分组成,其内部充斥着随机和无序。天气就是典型的复杂系统之一,预测天气需要用到大量方程组。科学家目前只能保证短期天气预报的准确性,一旦预测中长期天气,准确度就会大大下降。
20 世纪60 年代,美国气象学家洛伦茨在一次研究数值天气预报时偷了个懒,输入了迭代计算代码。所谓迭代计算,就是将这一次计算的结果作为下一次计算的原始数据,再进行计算,如此反复。迭代算法能免去人工输入原始数据的麻烦。不过,当时的计算机运行速度十分缓慢,洛伦茨趁计算机运行时外出喝咖啡。等他回到实验室时,却发现计算机得出的结果乱七八糟。当时他百思不得其解,认为哪怕将误差考虑进来,计算结果也不应该相差这么离谱。又过了十多年,他终于从当年的事件中得到启发,提出“蝴蝶效应”来解释当年发生的现象。“蝴蝶效应”是指:在复杂系统中,一个不起眼的变量改变可能会产生无法预知的巨大后果。
由于复杂系统中涉及过多的相互作用因素,过去许多相关的科学实验一直受制于计算机性能而无法进一步开展。但在今天,计算机的运算能力大大提升,不仅如此,存储设备、移动设备、高速宽带和分布式计算网络的进步,让处理复杂系统不再是不可能完成的任务。
复杂系统是魔鬼也是真相
为了推动欧盟提出的2050 年实现碳中和的计划,欧盟科学家于2021 年启动了“目的地地球”计划。该计划有望运行10 年,在此期间,高精度的数字地球模型会在时空精度上尽可能准确、及时地反映地球上的气候变化模式和极端事件。科学家将此模型称为“地球双胞胎”,它除了能实时模拟地球的大气和海洋系统,更重要的功能是预测未来。
将数字地球打造成地球的双胞胎
地球双胞胎能为决策提供帮助。例如,如果荷兰某地区需要规划一个水电站,通过地球双胞胎的模拟,计算机就能推测出这个水电站在未来几十年内的大致发电量,及其对环境产生的一系列影响。风力发电厂、光伏发电厂乃至农场的规划选择,都可以参考地球双胞胎的预测结果。
地球双胞胎的作用主要还体现在模拟未来世界各地的气候模式和预测极端天气。地球双胞胎对大气的预测不仅结合传统天气预测所采用的天气图法、数值预报法和数理预报法,而且可以结合一系列以往容易被忽略的小尺度天气因素,实现高精度的天气模拟和预测,从而描绘整个地球大气的复杂运动过程。
数字地球是科学大数据的典型学科。科学家不满足于目前的信息收集规模,他们希望下一步能将地球上的人类活动信息也输入地球双胞胎模型,让该模型能真实模拟人类活动对地球的影响,从而真正实现地球的数字化。
数字地球需要借助卫星遥感