姜烈君 陆晓旭 黄华艺,2★
•述评•
下一代测序技术的临床应用规范化问题
——参考美国医学遗传学与基因组学会行业标准
姜烈君1陆晓旭1黄华艺1,2★
[摘要]下一代测序(next generation sequencing,NGS)技术已经在临床实验室中得到应用。该技术的发展以及检测规模和应用范围的扩大,使基因检测成本大大降低。NGS技术在临床上的应用在不断地扩大,如疾病靶向基因组套检测、个体外显子组或全基因组分析等。同时,NGS技术也进一步改善了治疗决策和对某疾病高危人群的预测。然而,NGS技术的发展也充满了挑战性,包括测序平台和技术更新带来的选择困惑、测序结果的临床验证的不一致性问题等。为了帮助临床实验室更好地了解NGS技术、解决临床验证和正确选择NGS测序平台和方法,以及持续监控NGS并保证高质量的测序结果及其临床解释,本文结合美国医学遗传学和基因组学会(American College of Medical Genetics and Genomics,ACMG)关于NGS技术在临床上的应用的专业标准和指南进行归纳和讨论,供我国分子诊断工作者制定国内行业标准时参考。
[关键词]美国医学遗传学和基因组学会;下一代测序;疾病靶向的基因组套测序;外显子组测序;全基因组测序
下一代测序(next generation sequencing,NGS)技术是一种利用克隆扩增或单分子模板技术进行的大规模平行测序。NGS技术发展很快,目前已广泛应用于临床。NGS技术具有高通量和低单碱基成本的特点,但至今为止,该技术用于临床检测仍存在许多问题。比如,测序流程的标准化、测序平台和技术原理不同使用户在选择上产生困扰、测序结果中数据分析的差异性以及结果与临床的不一致性问题等。为此,本文结合美国医学遗传学和基因组学会(American College of Medical Ge⁃netics and Genomics,ACMG)关于NGS技术的专业标准和指南进行归纳和讨论,供我国分子诊断工作者参考。
1.1NGS的3种分析水平
NGS技术按复杂度从低到高分为疾病靶向的基因检测组套、外显子测序(exome sequencing,ES)和基因组测序(genome sequencing,GS)3种。疾病靶向基因检测组套用于检测已知的疾病相关基因,它只对与某疾病相关的基因进行测序,因此分析的灵敏度和特异性较高。在设备选择方面,小型的台式测序仪即可满足此类检测的要求,其所产生的数据量也较小,对数据存储需求也不高。ES是一种检测基因组中所有编码区域的测序方法,该方法主要用于检测已知疾病相关基因突变或发现新型致病基因。ES的测序能力和成本介于疾病靶向基因组套和GS之间,分析灵敏度低于大多数疾病靶向基因组套测序,分析的特异性也可能随测序效率的减弱而相应地降低,因此需要进行Sanger测序确认以排除假阳性突变信号。GS是全基因组测序,覆盖编码和非编码区域,其优点是预测序样品制备简单,不需要靶区域的PCR或杂交富集步骤。由于GS在非编码变异体的解释上不理想,所以通常先对编码区进行分析。如果未发现致病突变,那么可对数据进行重新分析寻找非编码区域的调节区域是否有变异。另外,GS分析产生的数据庞大,数据分析费时,结果差异大,目前广泛应用于临床尚不成熟。
1.2NGS的操作流程
包括3个主要步骤:样品制备、测序和数据分析。样品制备包括患者样本的采集处理、DNA提取、文库构建、生物分子标签(barcode)、目的区域/基因捕获富集、连接和扩增等;测序步骤即把制备好的标本上机测序;数据分析即对测序完成后所产生的序列数据通过专门检测DNA变异的计算机流水线进行分析处理,这种数据分析的主要流程包括碱基识别、读取对齐、变异识别和变异注释。
实验室开发NGS检测分析的影响因素主要有:测序内容、测序平台和方法的选择、数据分析工具的选择、变异体过滤、同源区域测序及变异文件格式等,这些是开展测序工作前必须考虑的重要因素。
2.1测序内容
在进行NGS时,选择与疾病高度相关的靶向基因组套来开展,即这些组套已经有充足的科学证据证明其与该疾病的相关性。如果某靶向组套包含多重表型的基因,那么实验室应该向临床医生提供亚组套检测来达到进一步的针对性和减少实验分析的工作量。一般来说,分析的区域越大,所得的与临床表型相关的变异体数量也越多,数据分析的工作量也越大。
2.2测序平台和方法的选择
选择测序平台时,实验室须仔细考虑测序区域的大小、需要的覆盖范围、预计的样本量、运行时间要求以及成本等来决定购买仪器的标准;也要根据要检测的变异体数量和规模来选择检测平台;测序模式有单向测序和双向测序,双向测序能使读长更明晰,尤其对重复区域碱基数据的读取十分必要。
2.3数据分析工具
每个NGS检测平台均安装特定的碱基识别运算公式软件,一般用Phred样评分评估碱基识别的正确性。对于疾病靶向检测和ES,建议以参考基因组进行全长校准,以减少检测组套以外的错误测序信息产生,同时增加测序覆盖度来提高变异体识别的准确度;对于GS,序列比对后再进行局部比对有助于发现插入或缺失突变信息。
2.4变异体过滤
实验室要设定变异体筛查方法,排除常见的良性变异,识别罕见疾病的分子。对于疾病靶向组套的NGS,实验室需要建立自动分类工具,从罕见高外显率变异体中过滤掉常见的良性变异。可用参考使用的数据库工具包括dbSNP、NHLBI外显子组测序项目和1000基因组项目的自动分类。而在ES或GS分析中,为识别罕见疾病的分子可采用适当的家庭成员作参照。同时实验室必须把握好过度排除与过低排除的度,过度排除导致无意中排除掉致病突变,过低排除导致需分析过多的突变体,增加工作量。实验室可循序渐进,首先确定明确和明显的病因,必要时可以重设筛选标准,扩大搜索突变基因的范围。
2.5同源区域测序
同源序列如假基因对短读测序法有干扰。当读取的序列被不正确地与同源区域对齐时,NGS序列读取的有限长度可能会导致假阳性变异应答;但当含突变的读取与同源位点对齐时也可能导致假阴性结果。因此,需找到在已知同源区域内能检测致病变异的方法,如用整体定位后再进行局部定位或配对末端测序的方法。实际上,在某些情况下可用Sanger测序法及其特异的互补引物配对来确认变异体所在区域。因此,实验室必须具备丰富的NGS技术相关经验,充分意识到所用技术的局限性,必要时使用同类技术对所有疾病靶向或诊断性检测结果进行确认。Sanger测序法是最常使用的确认性检测方法。
2.6文件格式
NGS检测产物应遵守常用的格式(如.bam文件代表信号对合,.fastq文件记录序列信息与碱基质量),所采用的数据格式要易于转换到标准格式。目前标准格式⁃变异检出格式(.vcf)已被1000基因组项目使用。
NGS检测的设备和试剂应有合法的产品注册证,其相关商品化产品需经临床实验室验证后才能成为诊断工具,其它未获批准的应注明“仅用于探索性”、“仅用于研究”或“专一性分析试剂”;被视为实验室自行开发的项目,需要进行一系列完整的批准程序。
3.1测试验证和优化
验证的内容包括样品制备、测序平台和数据分析方法等。测试流程选定后,应进行反复操作直到所有的测定条件以及分析设置达到最优化为止;实验室应通过分析各种已知序列的变异体数据(例如:SNPs、小的插入/缺失、大的拷贝数变异和结构变异)建立变异体识别操作规程。值得说明的是,使用合成的突变体有助于创建大批量试验数据,可用于不同测序平台的比较和优化、设置各平台阈值,因此,各实验室要建立测试的标准操作文件并严格执行。另外,优化过程应包含临床上所有的样本类型(例如:全血、唾液、福尔马林固定的石蜡包埋组织)。
实验室应利用Sanger数据库中存在的具有特征性的参考样品来确定NGS的有效性,这些样品不需包含特异的病理性突变,最好是可再生资源,用于设立基线数据,作为后续测试校准的参照。对于疾病靶向基因检测组套的实验验证应包括基因与疾病的特异相关性,及广谱的致病性突变基因。此外,还应留意高度同源区域测序是否准确。对于ES和GS,验证的重点在于高质量的外显子/基因组等指标上,比如外显子/基因组应达到平均覆盖率或所含碱基的百分比应达到最小覆盖阈值。实验室的任何变动,需使用先前的实验样本或特征性的参照样本,进行从头到尾的测试验证。
3.2性能参数的验证
需要验证的性能包括分析的灵敏度、特异性、重复性和重现性。参数可以从技术层面开始制定,必须能反映整个测试的操作过程。
实验室必须制定质量控制(quality control,QC)措施并用于监测每个检测,包括分析前、分析中及分析后的质量监测。监测内容包括样本质量、检测参数、人员资质、数据存储、参考材料、能力验证。
4.1样本质量要求
运行NGS的DNA可从多种样本中提取。实验室应规定样本类型、最小样本量等。不同样本类型的DNA质量和突变检测需求并不一样,实验室需确定各种样本类型的可接受指标(例如样本体积、组织量),制定实验室操作手册与DNA提取和定量分析的质量管理方案,并在患者报告中注明这些参数。对于不符合要求的样品需重新采样,若无法重新采样,在实验室精通全基因组扩增技术的前提下可行全基因组扩增,在报告单上备注可能存在的固有偏差以便临床医生和患者能悉知该技术的局限性。在任何情况下,实验室都应把操作时间、方法学选择等内容录入实验室操作手册中。
4.2检测参数要求
实验室应建立QC监测点来进行质量保证监控。QC监测的内容包括:DNA质量、测序过程中错误率的监测、运行后/分析前数据质量的评估;QC操作记录还应包括使用的仪器和试剂批号。在验证过程中,实验室应记录偏离标准规程的偏差及纠正措施;还必须记录NGS数据分析中的生物信息学操作流程,记录分析操作流程中的特殊性数据的情况;完善分析系统,以便实验室追踪软件的版本及每个具体版本的特异性变化。
4.3人员资质要求
从事NGS的技术人员应该经过专门的岗前培训并获得资质,在变异序列评估方面有丰富经验;通晓疾病的发病机制及NGS技术性能。若实验室提供ES和GS服务,应配备精通基因与突变及疾病表型之间关系的专家。
4.4数据存储
NGS数据存储方法应遵循法规的要求,从而保证患者数据的可溯源性。实验室应在规程中明确标明文件类型和确定每种类型的保存时间,建议实验室每种文件类型至少保存2年以上,以便可以追溯初始实验结果、分析流程改进后重新分析的数据。此外,实验室应考虑记录保留.vcf文件及相关变异亚型的最终临床报告及解释,条件允许时,可重新解释突变基因与疾病相关的可能意义。
4.5参考材料
实验室应使用具有广泛特征性的参考材料(reference materials,RMs)作为测序和拷贝数变异检测的参照。Coriell提供的人类细胞系具有高度特异的基因组区域和非共有区域,这些材料已用于GS实验,但要注意随着时间推移基因组稳定性降低的情况;此外,还有其他一些组织如美国病理家学会(College of American Pathologists,CAP),美国食品药品监督管理局用于评估仪器和测试性能的RMs。实际上,从全血中提取的基因组DNA是稳定的,可通过全基因组扩增技术,从少部分样本中获得大量可长期使用的DNA。通过计算方法获得模拟电子序列作为RM,可以和QC或能力验证的过程整合。这类模拟序列用于解决某一个特定区域的问题,如重复序列、已知的插入和缺失及SNPs。
4.6能力验证
根据美国临床实验室改进修订(Clinical Labo⁃ratory Improvement Amendments,CLIA)的要求,必须建立能力验证(proficiency testing)操作程序并且定期进行能力验证。实验室须采用当前公认的能力验证方法来进行,若没有其他实验室进行平行的NGS测试,则需要实验室内部自定的能力验证方法来验证。
5.1测序申请单
基因检测项目的申请要求开单医生提供患者的详细临床资料,如患者的临床特征、家族史及体格检查等来申请遗传学检测,以便实验室判断检测出的基因变异与患者一系列临床症状、体征是否相符,以及对患者预后进行评估。实验室则根据医生的要求进行基因测试和报告所检测的基因中潜在的致病变异,并说明检测方法和每个检测的操作参数。
5.2报告格式
实验室主任确定报告的细节,报告必须清晰、简明地阐明任何相关结果及其临床意义,以便医生对检测结果的理解,并对所使用方法的优点和局限性进行描述。
所有NGS报告必须包括已鉴定的突变列表,以人类基因组变异协会命名指南进行注释,并根据ACMG指南进行临床分类(该指南定期更新,实验室应关注该指南的变更情况);另外,基因命名应遵循人类基因组组织基因命名的命名法进行。报告中需要详细列出每个变异位点对应的转录物的外显子编号、任意突变、方法学、引用的互联网站。建议实验室以结构形式来报告突变体数据,报告中还应提供靶向区域、外显子组或基因组有效区域水平的技术参数与分析检测中的局限性;对于伴随发现结果的报告,在符合公认的医学实践和道德伦理的基础上,实验室应制定相关的方案来决定某些类型的伴随发现是否应该报告、什么时候报告。
5.3结果解释
根据ACMG指南,在疾病靶向基因检测组套报告中每一种突变鉴定都需进行评估并归类,应包括与疾病相关突变基因功能和基因产物可能性的循证评估。ES和GS测试中得到的实验结果,除了鉴定变异是否会改变基因或蛋白质功能外,还应评估已知的基因断裂表型与患者临床表型是否相关;如果检测到具有潜在临床意义的多联突变体,在解释中应讨论每个突变体与患者的表型可能存在的相关性,并排列突变的优先次序;ES和GS测试的报告中,对无任何疾病关联的基因变异,即与诊断无关、意义未明的变异(variants of un⁃certain significance,VUSs),实验室应制定关于如何报告VUSs的规程,并且如实客观地报告检测中的首次发现,直至找到基因与疾病有关联的证据,也鼓励实验室存储临床测序数据到公共数据库中。
实验室应就遗传学检测结果数据再分析,及再分析是否另外收费等相关问题制定明确的政策。建议实验室定期与临床沟通,并告知VUSs的相关知识是否已经更新。测序结果的解释必须慎重,实验室必须与临床保持充分沟通以避免产生不合理的解释。
探究遗传异质性疾病的病因是一项长期艰苦的工作,NGS克服了传统Sanger测序中无法大规模测序的缺点。然而,从与疾病相关的基因组套到整个基因组,NGS在产生高质量序列数据的同时,还面临着许多难题,包括处理大量信息的障碍,生物学上的解释和数据的引用参考等等。未来关于该技术的具体临床应用还需要进一步完善。
参考文献
[1]Rehm HL,Bale SJ,Bayrak⁃Toydemir P,et al.Work⁃ing Group of the American College of Medical Genetics and Genomics Laboratory Quality Assurance Com⁃mitee.ACMG clinical laboratory standards for next⁃gen⁃eration sequencing[J].Genet Med,2013,15(9):733⁃747.
2.罗斯维尔帕克癌症研究所肿瘤外科,美国,纽约,布法罗14263★通讯作者:黄华艺,E⁃mail:Huayi.Huang@Roswellpark.org
作者单位:1.广西壮族自治区人民医院检验科,广西,南宁530021
The standardization of the next generation sequencing technologies in clinical application:in reference to the ACMG clinical laboratory standards for next⁃generation sequencing
JIANG Liejun1,LU Xiaoxu1,HUANG Huayi1,2★
(1.Department of Laboratory Medicine,the People’s Hospital of Guangxi Zhuang Autonomous Region,Nanning,Guangxi,China,530021;2.Department of Surgical Oncology,Roswell Park Cancer Institute,Elm &Carlton Streets,Buffalo,New York,USA,14263)
[ABSTRACT]Next⁃generation sequencing(NGS)technologies have been utilized in clinical laboratories. The advancement of technologies and expansion of the test scales and applications led to significant reductions in the cost of NGS test.The NGS technologies are still advancing in clinical laboratories,such as disease targeted gene panel,exome,and the whole genome sequencing.NGS technologies are also enhancing further advances in therapeutic decision making and disease prediction for populations who are at high risk of a potential disease.Nevertheless,the advancement of NGS is full of challenges in clinical applications including the fast update of platform and technologies leading to confusion in platform selection,the difficulties in clinical verification of sequencing data,etc.In order to help clinical laboratories with the validation of NGS methods and platforms,the ongoing monitoring of NGS testing to ensure quality results,and the interpretation and reporting of variants obtained using these technologies,this paper briefly summarized and discussed the standard and guidelines of NGS technologies in clinical applications in reference to the American College of Medical Genetics and Genomics to serve as a reference guidelines in establishing a local standard and guidelines for clinical laboratories in China.
[KEY WORDS]American College of Medical Genetics and Genomics;Next⁃generation sequencing;Disease⁃targeted gene panels;Exome sequencing;Genome sequencing