最近,谷歌宣布它已经开发出一种人工智能(AI)系统,能够在检测乳腺癌方面胜过人类放射科医生。这仅仅是机器学习和大数据如何引领新的医学诊断、治疗和发现的最新例子。而为了实现人工智能的巨大潜力,我们必须制定一个务实的、全球一致同意的方法,来管理“真实世界数据”的收集和使用。
真实世界的数据,包括任何有助于指导新医学研究的信息。其中一些已经存在很长一段时间了。例如,癌症研究人员长期以来一直使用匿名健康记录,来选择最适合新疗法和实验性疗法的病人。但是其他类型的数据直到最近才出现,同时出现的还有大规模分析数据的技术。
人工智能和相关技术提供的新功能,引发了有关隐私和数据所有权的复杂、有时甚至有争议的问题。但我们可以通过制定保护个人信息的全面规则,来应对这些挑战。在美国,医学科学巨头们已经在推动现实世界的数据计划,匿名患者数据的广泛可用性,正在推动一波新的创新浪潮。
例如,美国国家癌症研究所正准备启动“儿童癌症数据行动”。这是一个雄心勃勃的十年项目,将汇集美国所有儿童和青年癌症患者的数据,以寻找新的目标和治疗机制。类似地,苏珊科曼基金会已经启动了乳腺癌大数据计划,其中包括一个使用算法分析梳理出一些最难治疗的乳腺癌的生物学过程的项目。
然而,由于这些举措严格使用从美国患者群体收集的数据,它们的适用性有限,尤其是在全球层面。人类生物学在种群内部和种群间差异很大,部分原因是遗传差异本身受到环境因素和其他长期趋势的影响,如隔离、迁移、历史性疾病负担等。镰状细胞性贫血、德系犹太人遗传疾病和囊胞性纤维化,仅仅是许多疾病与人口特异性相关的三个例子。
这些个体生理学上的差异意味着,对一个亚群有效的方法可能对另一个亚群无效,我们应该尽可能广泛地收集真实世界的数据。尽管如此,在大规模提供匿名真实数据方面,欧洲仍落后于美国。
此类失败,部分源于对病人隐私和数据所有权的担忧,是可以被理解的。为了解决这些问题,我们必须采取一切预防措施,通过建立真正全球性的规则来防止数据的滥用。卫生当局需要就指导现实世界数据的收集和使用出台标准,并建立共享基因组研究的国际标准。
为此,制药公司和其他主要利益相关者,正与欧盟监管机构、美国食品和药物管理局以及其他世界各地的卫生当局合作,确定研究人员可以使用的数据,同时维护病人隐私、要求提供者负责。
在医学研究上的最新突破,暗示了如果我们的政策正确,能够获得怎么样的结果。这很吸引人。比如,获得了一个包含220万癌症患者匿名数据的数据库后,罗氏公司的研究人员开发了一个预后评分系统,根据一系列因素来预测患者对不同癌症治疗方案的反应。另一项研究,使我们能够预测自身免疫性疾病患者对免疫治疗可能产生的不良反应。这是该领域的一个显著进展。因为在新疗法的临床试验中,出现这种反应的患者只占很小的比例。
通过部署新技术和利用世界上最大的癌症基因组数据库,我们可以加快个性化治疗的发展,满足患致命疾病的患者的需求。但是,除了其广阔的前景,现实世界的数据也向我们提出了关于如何共享个人数据的复杂问题。简单地对这些问题置之不理,既不现实也不负责任,因为这意味着放弃也许是医学史上最伟大的进步。
国际社会必须携手应对这些政策挑战。只有到那时,我们才能充分认识到卫生保健技术革命的好处。
本文由Project Syndicate授权《南风窗》独家刊发中文版。多米尼克·吕特廷格是罗氏(Roche)早期临床肿瘤学全球负责人。