一张日均点击10亿次的全球疫情地图

2020-07-29 12:28爱新觉罗华苡
知识窗 2020年7期
关键词:邮轮钻石肺炎

爱新觉罗华苡

在美国约翰斯·霍普金斯大学土木与系统工程系攻读博士学位的中国留学生董恩盛和杜鸿儒,做梦也没有想到,他们竟然会成为世界瞩目的焦点。

这一切要从一场新冠肺炎疫情的爆发说起。

2019年年底,新冠肺炎疫情在武汉爆发,身在美国学习疾病模型的董恩盛心里始终牵挂着中国的同胞。他迫不及待地想研究新冠肺炎疫情是怎么爆发的、数据是如何增长的,并希望通过追踪数据,观察一场疫情从发生到结束的整个过程,为全球新冠肺炎疫情的发展趋势做出基本的判断和推测。于是,他向导师劳伦·加德纳提出了这个想法,导师支持他建立一个数据地图,以追踪疫情的数据。董恩盛立刻着手从事这项研究,经过7个多小时的苦战,他很快就开发出了交互式数据地图。

统计系统有了,去哪里找数据呢?为了保证新冠肺炎疫情数据来源的准确性,董恩盛从世界卫生组织、美国疾病控制与预防中心、欧洲疾病预防控制中心、中华人民共和国国家卫生健康委员会等权威组织及网站上获取信息。就这样,董恩盛通过筛选海量的信息,整理出了精确的数据,并从2020年1月22日起上传到相关的学术网站。

起初,数据收集完全靠手动进行,每天两次的更新,通常是在美国东部时间的早、晚进行,最多时要更新4至5次,工作量非常大。特别是随着新冠肺炎疫情向全球蔓延,董恩盛发现手动更新的数据已经赶不上疫情的发展变化,导致数据滞后。这时,博士生杜鸿儒也加入收集、整理、发布疫情的行列中。

在数据来源和数据结构搭建上,董恩盛和杜鸿儒遇到了一个棘手的问题:数据的半自动化比较费事,它需要考虑到地图上标注点的放置,一个小小功能的增加往往会让数据产生很大的变动。另外,在数据更新的时候,他们还遇到了如何标注时间的麻烦。因为世界各地的时间不一样,要想在同一时间,反映世界各地的疫情变化,就需要把地图的时间调整为格林威治时间,而要将世界各地的时间都换算成格林威治时间,则是一组庞大的数据。

为此,董恩盛和杜鸿儒加快了工作进度,编写出一个程序,可以从各个数据源收集数据,再整理成统一格式,更新到服务器,增加了时间上的准确性,同时也增加了工作的难度。

1月20日,董恩盛和杜鸿儒从数据中发现,“钻石公主号”邮轮从日本横滨港出发,航行10天后,船上有一名香港乘客被确诊为新冠肺炎。2月3日,该邮轮被迫返回横滨港。不过,邮轮上所有人都被要求留在船上,接受隔离检查。当他们被隔离14天之后,邮轮上的乘客开始分批下船,而船上有789名外籍人士,他们离开了邮轮,返回了自己的国家。

对于这种特殊情况应该如何标注呢?一开始大家把“钻石公主号”的所有案例归结为日本当地的案例,之后又把日本国内的案例与“钻石公主号”分开计算,于是就需要重新调整数据。有部分“钻石公主号”的旅客回到了美国,由于他们中的患者具体位置不明,给地图的标注增加了难度,董恩盛和杜鸿儒就选择了美国的一个地理中心进行标注。结果,有些美国人通过放大地图,找到了这个标注点上的小区,贸然上报了小区,小区又将这一情况上报给了当地卫生部门,最后经过核实此地并没有出现这一患者,后来相关部门找到了他们,希望能够更正信息。这时,董恩盛和杜鸿儒才意识到,它在地图上仅仅代表一个小小的标注点,却在现实中很可能被人对号入座,所以标记必须非常准确才行。于是,他们不断完善数据的表现方式,以便消除人们在解读上的误会。

近期,董恩盛和杜鸿儒还增加了更多可视化的工具,让任何数据、形式和位置都包含在同一个视图中,并且精确地公布出每座城市新冠肺炎确诊的人数,同时做到全天候实时维护地图。

正是由于董恩盛和杜鸿儒精益求精的努力工作,才使得他们的数据统计工作比美国疾病控制与预防中心的数据更胜一筹,因而受到世界各地的广泛关注,平均每日点击量高达10亿次,最高日点击量达到45亿次。他们接下来要做的,就是尽快让数据更新变成全自动化,只要是某个地方出现疫情数据的变化,他们就像獵手一样迅速捕捉到,从而为防控疫情提供第一手的可靠资料。他们希望早日找到新冠病毒的起因与源头,为人类战胜新冠病魔谱写医学史上新的篇章。

猜你喜欢
邮轮钻石肺炎
来势汹汹的肺炎
一分钟了解新型冠状病毒感染的肺炎
My Heroes
时间嵌入钻石
看,这个肺炎最大“祸因”
被调包的钻石
钻石妙贼
意大利邮轮触礁酿惨剧
全球最大的豪华邮轮“独立之海”号下水