奎克
曼宁在金边的国家过敏和传染病研究所疟疾和媒介研究实验室工作,这是美国国家过敏和传染病研究所(NIAID)与柬埔寨国家寄生虫学、昆虫学和疟疾控制中心数十年合作的一部分。在过去的几个月中,他们一直在使用新的测序仪来查明除了登革热病毒之外,哪些细菌是柬埔寨大量发烧的原因,机器可以逐一读出DNA字母。
IDSeq是基于云的开放式源的生物信息学流水线,用于宏基因组测序。用非科学家的话来说,它是计算机代码包,可以对从样本中提取的所有遗传物质进行梳理。例如,一根人的血液管,或者被粘上唾液的棉签。它会将所有那些DNA和RNA杂乱无章的碎片与已知微生物的大量数据库进行匹配,告诉你哪些错误在混合中。运行IDSeq只需要拥有一个知道如何使用的音序器和一个互联网连接。
IDSeq最初是加州大学旧金山分校生物化学家约瑟夫·德里西实验室的一项研究项目,在那里17年前,他的团队建立了识别导致SARS的冠状病毒的技术。最近,德力西的实验室一直在推动临床宏基因组测序的发展,开发了有助于解开在附近医院接受治疗的患者的医学奥秘的测试方法,包括脑侵袭性worm虫。
2016年当儿科医生普莉希拉·陈和她的丈夫——Facebook创始人马克·扎克伯格承诺在10年内抗击传染病投入30亿美元时,他们选择了德里西共同承担他们的第一笔投资:一个新的6亿美元的研究中心,称为Chan Zuckerberg Biohub。加入Biohub之后不久,德里西带来了一个庞大的设计师和工程师团队,将他实验室中多年拼凑而成的代码转变为具有工业实力的软件包。在2018年10月,他们向一小群测试用户进行了IDSeq的软启动,而Facebook财富为所有这些数据计算奠定了基础。
为了让更多科学家(尤其是在资源匮乏的地方)掌握这一技术,德里西与比尔·盖茨和梅琳达·盖茨基金会合作。该基金会的赠款已开始将10个来自南非、孟加拉国和马达加斯加等国家的研究人员带到Biohub,以学习如何使用IDSeq。除了培训外,赠款还为每个国际团队配备了一个小型音序器,可以带回他们的家庭实验室。
柬埔寨金边的卫生官员检查了从中国香港出发的游轮上乘客的体温
曼宁获得了其中一项赠款,以扩大她在柬埔寨调查未诊断出的发烧的工作。去年夏季末,正值柬埔寨历史上最严重的登革热流行高峰,她与实验室里的两名技术人员一起飞往旧金山,在Biohub接受了为期一周的培训。到2019年11月,她的团队已启用IDSeq,并处理柬埔寨各地现场医院发烧患者的血液样本。
2020年1月初,德里西带领Biohub团队访问了曼宁的实验室,并对他们遇到的任何问题进行了故障排除。曼宁回忆说,在旅途中他们讨论了新闻报道,当时关于医护人员生病的报道不多,因此他们希望这种情况会很快结束,并飞回了加利福尼亚,“然后事态的发展表明一切美好的愿望都破灭了。”曼宁说。
全球卫生专家担心,如果这种病毒传播到技术水平较低的南太平洋邻国将会发生什么。当一种新疾病出现时,追踪其传播至关重要。这意味着不仅仅是收集新案件的数量,收集有关病毒的遗传信息可以帮助公共卫生官员了解该病毒如何到达其国家,并采取措施减缓其发展,它还可以帮助研究人员监控病毒中可能使诊断测试效率降低的突变。
但是在资源匮乏的环境中,阻碍识别和控制此类病毒的爆发并不顺畅。以寨卡病毒为例,该病毒在巴西报告第一例之前已经在巴西传播了两年。研究人员只是在很久以后才发现这一点,方法是将整个美洲患者的病毒基因组拼凑在一起。
因此,流行病学家有理由相信,新冠肺炎病毒可能会继续在马来西亚、印度尼西亚和柬埔寨等国未被发现的情况下传播,这些国家的公共卫生基础设施弱于中国,而且历来缺乏测序能力。他们担心,一些未被诊断的感染会悄无声息地爆发。
随着测序仪进入曼宁实验室,柬埔寨现在可以对患者样品进行宏基因组测序。1月26日,巴斯德研究所的技术人员从刚从武汉赶来发烧的60岁中国男子的鼻子和咽喉拭纸中提取病毒RNA。第二天卫生部官员宣布,这些样本对Covid-19呈阳性反应,成为该国首例。
近期,曼宁的实验室收到了几瓶从患者拭纸中提取的RNA。她的团队为进行测序做好了准备,将样品通过他们的新机器运行,并将结果数据传输到IDSeq。然后,他们等待IDSeq的算法筛选所有遗传密码块,然后将每个片断与GenBank(所有公共可用遗传序列的集合)进行比较。尽管当时中国的科学家已经对导致Covid-19的新冠肺炎病毒进行了测序,并将基因组数据保存在GenBank中,但德力西的团队尚未更新其软件以搜索数据库的最新版本,他们想让IDSeq盲测,看看它会变成什么样。
两个小时后结果出现了,电脑屏幕一张热图显示的红色阴影(表示最多的“读数”)是GenBank中样品与序列之间的匹配,证明是引起SARS的冠状病毒,几乎相等数量的读段映射显现是蝙蝠中发现的冠状病毒。曼宁说:“可以说这是一种与SARS密切相关但尚未鉴定的新型冠状病毒。”
大约一周后,IDSeq团队将其索引更新为GenBank的最新版本。该数据库现在有将近85000个新的添加项,其中包括从世界各地的患者那里收集的54个Covid-19致冠状病毒序列。当团队运行他们的样本时,该软件返回了一个明确的答案:大多数读取完全与前几周在武汉出现的病毒相匹配。
这两个测试共同证明IDSeq可以完成DeRisi所承诺的:检测已知病原体的传播并作为新兴病原体的预警系统。Biohub还发布了柬埔寨冠状病毒案的项目页面,向公众提供了该软件的信息。
“我对此感到兴奋。” 德力西说,IDSeq的主要目标是使科学家有能力在自己的国家进行先进的分子诊断,以解决当地问题。但是第二个目标是在资源贫乏地区扩大宏基因组测序的能力,这样如果确实发生了大流行,全球的科学家就可以发现它。
德力西认为:“证明该技术不仅适用于拥有许多服务器的发达国家,还可以在一些临场应用。”使用IDSeq,再加上增加样本中病毒物质含量的新技术,曼宁的团队最终得以查询在柬埔寨出现的该病毒株的整个基因组。上个月,当他们将其添加到公共数据库中时,科学家们正在使用它来追踪病毒的传播和突变方式,它是来自疫情中心附近的低收入国家的唯一序列。
曼宁表示目前她的小组随时待命,对该国公共卫生官员确认的其他病例进行排序。但直到最近,柬埔寨才開始积极测试Covid-19,此前一位前往柬埔寨的日本公民在返回日本后就对该病进行了阳性检测。据报道他与40名柬埔寨人接触,目前正在医疗隔离中对其进行监视。柬埔寨卫生部证实,其中一名被诊断出患有Covid-19。
随着确诊病例的到来,曼宁希望向GenBank贡献更多的病毒序列。她说,团队目前正在对一个周末确认的病例进行测序。这个数字化冠状病毒库不仅可以帮助流行病学家追踪其传播和演变,而且可以帮助确保在柬埔寨开发的任何潜在疗法或疫苗都能有效抵抗那里传播的毒株:“这些序列让我们几乎实时地看到了这种病毒的突变速度,并为制定对策提供了路线图。”但是她的团队将受到新测序仪吞吐量的限制,该测序仪一次只能运行一个样品。如果柬埔寨的案件数量激增,则积压的案件将迅速增加。尽管如此,至少柬埔寨出现在了流行病监控的地图上,任何排序总比没有好。