云贺
基因测序仪器的普及,将使更多普通民众成为人类乃至全物种云端基因数据库的构建者。届时,海量的基因组数据将形成一个庞大且复杂的“生物互联网”。
基因测序作为一种新型基因检测技术,近年来在全球范围内引起广泛关注。通过采集和分析人类的血液或唾液样本,基因序列可以预判疾病、评定个体健康状况乃至行为特点,部分媒体甚至以“高科技算命”来形容这一前沿技术。
随着人工智能技术的进步和便携式测序设备的普及,业界普遍认为,未来基因测序产业规模不可限量,人类将迈入“第二次基因革命”的门槛,并带动精准医疗、传染病防控等事业的颠覆性发展。
今年7月,美国知名智库威尔逊中心研究员艾兰诺·保韦尔斯(Eleonore Pauwels)发表了名为《生物互联网》的文章,认为基因测序仪器的普及将使更多普通民众成为人类乃至全物种云端基因数据库的构建者,届时,海量的基因组数据将形成一个庞大且复杂的“生物互联网”。不过,数据的法定权属、数据库的门槛设定等诸多棘手问题能否圆满解决,将是决定未来生物互联网愿景是否成真的关键。
基因测序仪大显身手
在《生物互联网》一文中,艾兰诺·保韦尔斯描述了这样一幅场景:巴西的医务人员将一名病患的血样放入U盘大小的基因组测序仪中,并与电脑相连接;立等片刻,基因分析结果就显示,病患血液中检测出一种新型寨卡病毒突变;随后,医务人员迅速将此消息上报当地疾控机构,以便评判风险。
其实,上述场景并非是艾兰诺·保韦尔斯对于未来世界天马行空的想象。就当今世界基因测序技术水平而言,这一场景已成现实。
如今,便携式DNA测序仪已开始在全球各个领域投入使用。无论是在医院检测抗病性的新菌株、在南极冰谷探索微生物的多样性,还是在食品供应链条中鉴别传染性病原体,如一个U盘大小的轻便型DNA测序仪都能大展拳脚。
例如,在2015年,伦敦帝国理工学院公共卫生专业的乔安娜·伯兹博士(Dr.Johanna Rhodes),就曾利用一台便携式基因测序仪成功检测出耳道假丝酵母菌——一种多重耐药的“超级病菌”——是造成伦敦一家医院病患大规模感染的源头。
同年,伯明翰大学的研究团队使用相同的基因测序技术,在几内亚地区的人体血液中发现了埃博拉病毒株。短短数月间,这个团队就对142个埃博拉病毒基因组进行了测序,而且,团队在收到样本的24小时内就能得到分析结果,极大地促进了当地疾控工作的开展。
第二次基因革命
在艾蘭诺·保韦尔斯的设想中,未来每一位社会公民——科学家、病患、官员、学生——都有可能利用方便携带、操作简便的基因检测仪器或软件,成为自身健康的检测者和公共卫生安全的预警者和保卫者。
随着人工智能、云计算等前沿技术的融合发展,特别是基因测序技术及其设备的普及,未来将会形成一个包括人类和其他物种的庞大的DNA数据库乃至云端数据市场。艾兰诺·保韦尔斯认为,这就是所谓的“第二次基因革命”。届时,数以亿计的基因组数据将组成一个庞大的“生物互联网”,这会对人类社会预判大规模传染病、发展精准医疗等发挥巨大的积极作用。
不过,要完成这次全民范围的基因革命,必须具备两大条件。首先就是相关仪器设备的普及应用。现在,只需要一个U盘大小的测序仪,几乎就能在任何时间和地点完成基因信息的读取工作,而且人们只要掌握简单的采血样方式和仪器操作方法就能完成这一步。甚至在不久前,测序公司新秀——英国Oxford Nanopore公司生产的一款名为MinION的测序仪,还被美国宇航局带上太空,在国际空间站完成了DNA测序实验。如今需要做的,就是在更大范围内普及相关仪器设备。
此外,还需要功能较为完善的基因分析平台来帮助人们解读基因数据。当前,Oxford Nanopore公司已设计出一款名为Metrichor的智能云端软件,它可以与手机APP相关联,具体解读和分析基因组反映出的信息。
四大难题待解
虽然建立生物基因互联网的前景美好、意义重大,但在《生物互联网》一文中,艾兰诺·保韦尔斯也表示出对如何维护好这样一个规模庞大的数据库的担心。毕竟,基因信息的存储、监管、更新和保护,不仅需要大量人力财力的支持,还要经过谨慎考虑,设计出一个复杂且精细的制度架构。
可以说,与现在我们相对熟悉的大数据库相比,基因数据库监管涉及到的难点更多、也更具敏感性。
首当其冲的是如何合理设立基因数据库的门槛。现在,包括谷歌和亚马逊等公司都推出了基因组云端存储服务,但这些服务基本都是收费项目。
艾兰诺·保韦尔斯预测,由于数据库的更新和维护并非一笔小数目,因此未来无论是医院、科研机构还是普通公民,想要存储、分析和转移基因组数据,很可能要继续缴费。这无疑会将一部分无力承担这笔费用的组织和个人排除在“生物互联网”之外,让本就分布不均、水平不一的医疗资源更加向着权势一族倾斜。
同时,随着越来越多的角色加入到采集、上传、分析和存储基因组数据的队伍中,基因信息的法定归属问题将愈加复杂。
当前,数据私有化趋势与网络信息的滥用和泄露问题并行。《生物互联网》一文认为,未来很有可能会是出现如下情境:拥有强大计算能力和机器学习平台的大型互联网企业,占据着生物互联网的优势位置,围绕基因数据归属权的商业战一触即发,而为了公众长远利益,公益医疗机构和科研机构将不得不为提倡数据开源而奔走呼号。
另外,保证基因组数据的准确性更是至关重要。可以预见,误测埃博拉病毒将会造成严重的社会恐慌。如何在采集样本、上传数据、机器分析等每个环节都保证准确、可控,对制度设计者和技术研发者而言,都是极大的挑战。
一个最棘手的问题是,基因测序产业的发展与成熟或将带来社会经济鸿沟的不断扩大,一端是掌握着海量基因数据的硅谷巨擘,而另一端则是数据的来源——普通公众。《生物互联网》一文认为,信息、技术手段和话语权的不对等,可能将进一步固化全球本就亟待改良的社会地位强弱对比状况。而这一问题能否圆满解决,将是决定生物互联网美好愿景是否成真且步入良性循环的关键。endprint