罗芳 李昊旻
(1.浙江大学医学院附属第一医院儿科,浙江杭州 310003;2.浙江大学医学院附属儿童医院,浙江杭州 310052)
随着新生儿或儿童重症监护相关医疗技术的发展,感染、营养、早产等疾病的诊治已有了长足的进步,新生儿或小婴儿遗传性疾病所致死亡或预后不良的发生比例凸显。遗传性疾病中的单基因疾病目前估计6 500余种,且每年以200种的速度增加[1‐2]。据相关研究报道北美新生儿/儿童重症监护室(NICU/PICU)和儿童心胸外科重症监护室中因遗传性疾病导致的死亡高达15%[3‐4]。一方面由于此类疾病病情恶化迅速,未及时诊治常致预后不良,快速进行病因诊断并针对性给予干预措施,可为患儿提供最佳的临床管理决策,促进经验治疗向精准治疗的转型,实现诊断率的提升和病死率的下降;另一方面对于预后差的一些遗传疾病,快速诊断也有助于做出临终照顾的决定,从而减轻痛苦并减少医疗资源的浪费。可见基因诊断在NICU/PICU的开展具有迫切性、高需求性和适合性。
目前临床上常用的基因检测主要有基因芯片、panel筛查、全外显子测序(whole exome sequencing, WES)等,但各自提供的信息不够全面,在诊断时长、诊断率方面也存在不足。全基因组测序(whole genome sequencing, WGS)则涵盖包括点突变、拷贝数、内含子区域的结构及重组变异等更为全面的信息[5‐6]。随着测序成本的不断降低,其临床接受度不断提高。但测序数据获取后需要极高专业的判读和解释,常规的基因组测序、数据分析和遗传诊断报告需要数周才能返回临床,无法满足临床诊治病情快速发展的遗传性疾病的需求。针对WGS现有的局限性,科研工作者从2012年起在测序及诊断时长上不懈努力:2012年5月Saunders等[7]采用快速全基因组测序(rapid whole genome sequencing, rWGS)技术在50 h内诊断新生儿遗传疾病;2015年10月该团队将此技术的诊断时长缩短至26 h[8];2019年4月该团队的进一步研究成果发表[9]:建立了人工智能快速全基因组自动分析诊断系统,并完成其回顾性验证和前瞻性研究。该系统中全基因组测序时长为15.5 h,系统的另一关键组件提供自动分析数据功能解决数据获取后的解读,使得整个诊断流程可在24 h之内完成,也被称为超快速全基因组学测序(ultra‐rapid whole‐genome sequencing, urWGS),从时间上和功能上解决了常规基因组测序解读周期长及解读专业依赖的现状。本文介绍rWGS在NICU/PICU的临床应用并简述人工智能快速全基因组自动分析诊断系统的相关技术。
2012年Saunders等[7]采用rWGS在50 h内对NICU中疑似遗传性疾病患儿做出了基因诊断,其中回顾性明确了两名已知病因患儿的基因诊断(1例Tay Sachs病,1例Menkes病);并前瞻性对5例未确诊新生儿中的4例做出了诊断:1例GJB2基因相关重症皮损,1例BRAT1基因相关的致死性新生儿强直和多灶性癫痫综合征,在1个家系中鉴定了BCL9L为一新的隐性内脏异位基因,排除了1例患儿已知的候选基因。所采用的软件是症状和体征辅助的基因组分析(symptom‐and sign‐assisted genome analysis, SSAGA)软件,该软件为遗传性疾病的诊断提供了1个诊疗框架:即由医生输入患儿的临床表型,根据表型软件列出与之相关的候选致病基因列表,从而加快基因分析进程,在后续的一些文献中被称为表型驱动的WGS。在2012年该软件已经囊括了当时591种遗传病相关的227个临床术语,诊断的敏感性达到了77%~96%,特异性高达99.5%。
2015年该团队采用升级后的rWGS技术,包括Illumina HiSeq 2500快速运行模式下18 h的全基因组测序,Edico DRAGEN序列比对和变异检出,以及三款软件(VIKING、RUNES和SSAGA)联合对数据进行分析,该技术将诊断的敏感性和特异性提高到99.5%以上[8]。同年一项回顾性研究[10]比较了在NICU、PICU内重症患儿常规基因检测和rWGS在诊断率、诊断时间、临床管理两者之间的差异。结果显示35例患儿中20例(57%)通过rWGS明确了基因诊断,32例患儿中3例(9%)通过常规基因检测方法明确诊断,两者差异有统计学意义。在接受rWGS诊断的20例患儿中,13例(65%)被认为具有及时的临床指导价值,4例(20%)被认为对临床治疗管理具有非常有利的指导意义,6例(30%)确诊后开始接受姑息治疗。根据研究对象的随访结果,120 d病死率达到57%(12/21),揭示了在NICU和PICU中采用rWGS的方法诊断遗传疾病的高需求性和迫切性。
2018年一项部分双盲随机对照试验的研究[11]结果发表,纳入对象是NICU和PICU中4月龄以下的患儿,试验组采用rWGS +常规基因检测,对照组仅采用常规基因检测。由于两组之间诊断率的严重失衡,研究提早结束。在这项纳入了65例婴儿的随机对照试验中,28 d内rWGS的诊断敏感性为31%,而常规基因测序为3%,认为对于病因不明的危重症婴儿,rWGS可作为首选的一线诊断检测方法。
之后这一技术也被推广应用于较大年龄PICU中的危重症患儿,在一项由38例4月龄至17岁的接受了rWGS检测的PICU患儿组成的回顾性队列研究中,17例(45%)患儿经rWGS明确了基因诊断,其中4例(24%)因基因诊断直接导致管理策略改变,9例(53%)临床上并无畸形特征或发育迟缓[12]。结果提示早期的基因诊断影响到患儿和/或其家庭在住院期间或出院后的临床管理,部分患儿避免活检,部分患儿采取了替代治疗,部分患儿进行了疾病相关后遗症的监测。另一项回顾性研究也证实了24例平均年龄为16月龄的危重症患儿中有42%的儿童明确了基因诊断[13]。可见对于PICU中潜在的病因不明确的患儿也同样受益于入院早期的rWGS诊断。需要提及的是超过70%的病例是由重症监护室医生提出并进行测序的,这表明临床医生有能力识别出具有高度疑似携带疾病相关突变基因的儿童,已确定的变异涉及广泛的疾病范围,包括癫痫、脑病、心肌病、室性心律失常、自身免疫、免疫和炎症性疾病[14]。
自2012年起,将全基因组学用于临床的系列研究,显示WGS在重症患儿中遗传性疾病的诊断率从42%上升到57%,改变了30%~72%的医疗管理及 24%~34% 病例的预后[7‐8,10,15‐16]。2018 年一项回顾性队列研究[15]利用专家咨询法(Delphi法)进行成本分析,并采用平行比较的方法进行评估(之前曾有类似的病例在该医学中心诊断过,或者有医疗成本和治疗费用价目呈现的既往病例)。该研究发现基于rWGS的诊断让医疗成本降低了80万美元,并将住院时间缩短了124 d;认为对重症监护室中疑似患有遗传病的患儿进行rWGS诊断,不但能够挽救患儿的生命,而且具有良好的成本效益。经过rWGS诊断后43%的患儿获得了诊断,节省医疗保健费用近13万美元;其中11例患儿避免了并发症,4例患儿避免了严重并发症。
2019年rWGS进一步发展,与人工智能有机结合,组成了人工智能快速全基因组自动分析诊断系统[9],也被称为urWGS。该系统所采纳的数据一是来源于血标本的rWGS产生的测序数据,二是来源于患儿临床资料的电子病历(electronic health record, EHR)。在自动分析的过程中集成了目前在基因组测序、人工智能领域的多种新兴技术[17‐19]:美国Illumina公司的Nextera DNA Flex Library Prep Kit直接从血样或干血斑(常规应用于新生儿疾病筛查)中快速制备基因组文库,之后采用NovaSeq 6000测序仪搭配S1型流动槽,在平均15.5 h内完成基因组测序;DRAGEN Bio‐IT生物信息分析平台可在20 min内完成1个人类基因组的30X测序数据的分析,并自动将所读序列与参考基因组对齐,识别和分析核苷酸变异。英国Clinithink公司的临床自然语言处理平台CliX ENRICH可在20 s内梳理患者的EHR并自动提取关键表型信息,并将EHR中提取的表型特征从临床术语概念自动转换为可直接服务于遗传报告分析的标准人类表型术语;Diploid开发的MOON系统自动解析基因组,并对疑似致病变异进行自动过滤和筛查;深度集成现有遗传性疾病知识库和自然语言处理医学文献驱动基因变异的自动解读,可在5 min内在全基因组450万个基因变异中筛选致病变异。上述技术流程有机结合可最终在24 h内为疑似遗传病重症儿童提供快速诊断。
利用该系统,研究人员针对圣地亚哥儿童医院的101例患有105种遗传病的患儿开展回顾性分析,在表型提取阶段,临床自然语言处理技术提取的患者表型数据比专家提取的表型数据多27倍,同时比在线人类孟德尔遗传(Online Mendelian Inheritance in Man, OMIM)数据库中匹配遗传疾病的预期表型特征高出4倍,显示临床自然语言处理技术提取表型的高效率和高的覆盖率。以专家诊断结果作为参照,该自动化诊断系统的精确度为99%(93/94),查全率为97%(94/97)[9]。为进一步验证诊断系统的有效性,研究人员利用该系统在7例重症婴儿中开展了前瞻性研究,其中3例患儿诊断为遗传性疾病,均通过人工分析方法和Sanger测序证实。第1例女,7周龄,因酮症酸中毒入住PICU,在血标本送检及EHR建档后19.2 h,自动诊断系统识别出了胰岛素基因中先前未报道的杂合错义变异(c.26C>G,pPro9Arg)与常染色体显性永久性新生儿糖尿病(OMIM疾病记录606176)相关。第2例是1个既往健康的17月龄男孩,因败血症性休克、代谢性酸中毒、坏疽性脓肿和低丙种球蛋白血症住院。单例、先证者、快速测序和自动解释鉴定出存在布鲁顿酪氨酸激酶基因中的致病性杂合突变(c.974+2T>C)与X‐连锁的无丙种球蛋白血症(OMIM #300755)相关。为大剂量静脉注射免疫球蛋白和6周抗生素治疗提供了治疗指导和治疗信心。第3例为3日龄男孩因反复惊厥并家族史收住NICU。自动诊断系统鉴定为钾离子电压门控通道kqt样亚家族成员2基因中可能致病的杂合变异(c.1051C>G),该基因与常染色体显性良性家族性新生儿癫痫(OMIM 121200)发作相关,诊断时长为20.9 h。
人工智能rWGS的诊断效率在后续开展的第二项随机对照试验中[20]也得以体现。该试验的研究结果在2019年10月发表:213例婴儿中24例(11%)因病情严重直接给予urWGS检测,其余随机分为rWES组95例,rWGS组94例。后两者的诊断率分别为19%和20%,诊断时长的中位数分别是11.0 d和11.2 d,无明显差异。但在分析可能影响蛋白功能的变异和ClinVar数据库收录的致病性/可能致病性的变异上,rWGS的分析性能明显优于rWES。而在这一组病例中urWGS诊断的比例(11/24,46%)高于rWES及rWGS,且诊断结果时间更短(平均4.6 d),提示urWGS在临床应用上的良好前景。
综上,人工智能快速全基因组自动分析诊断系统的开发为促进基因测序技术成为儿童尤其是NICU/PICU重症患儿的一线诊断检测手段提供了强有力的技术支持。诊断流程的自动化有助于减少经验稀缺的临床医学遗传学家的人工分析和数据解释的需求,减少临床诊断中数据分析和解读的耗时,消除WGS临床应用的障碍。但该系统向临床的推广仍会面临一些障碍,自动化的平台需要进行一定程度的改装才能在不同的医院体系中实施,特别是针对不同文化和环境,其中部分技术还不完善,中文环境下的患者表型自动采集将是首先面临的困难。其次,进行rWGS检测的最佳时机也有待进一步探索,开展rWGS所需的费用昂贵也将是推广应用的一个障碍。再就是该项技术应用于临床所面临的伦理问题[21‐22]:从样本的选择性送检、家长的知情同意到以rWGS诊断为基础决定是否姑息治疗或是积极救治的疾病管理过程均涉及到伦理问题,是该项技术发展必须面临且需要不断讨论的问题;而且关于在NICU/PICU环境下对婴儿进行rWGS的潜在风险的数据尚收集或预估不足等[23]。但毫无疑问早期快速的基因诊断对危重症患儿临床管理决策、家庭治疗选择、远期预后评估及医疗系统的资源调配具有重大或决定性意义,相信危重症患儿早期快速精准诊疗的时代即将到来。