李婕张鹏李小宁
(皖南医学院第一附属医院弋矶山医院检验科,安徽芜湖241001)
在现代生命科技手段中,涉及分子检测的主要方法有:聚合酶链反应 (polymerase chain reaction,PCR)、Sanger测序即一代测序、高通量测序(next generation sequencing,NGS)、单分子测序即三代测序等。其中,一代测序技术开始于1977年,Sanger法只能对已知区域的单个或多个位点进行检测,通量低,精度高;三代测序虽然能达到高通量,但需要投入的成本高,产出错误率高;而二代测序法即NGS具有目前除三代测序以外其他分子测序技术不能达到的通量高和成本低、精确度高且信息量丰富等特点,可以一次性检测全外显子和全基因组区域的所有位点,目前分子诊断测序领域应用最多的技术仍然是NGS。近十几年间,它促进了基因组学科的飞速发展,其特点是合成与测序同时进行,通过定位辨识新合成的DNA或RNA片段末端的荧光标记来确定待测定序列。自2004年第1台应用焦磷酸测序方法的NGS仪投入使用后,多种技术平台相继出现。例如,Illumina公司在2年后推出了Solexa测序平台;2007年美国应用生物系统公司推出了以4色荧光标记寡核苷酸的连接合成为基础,使得测序准确性得以提高的SOLiD测序平台;2010年,半导体测序平台和第三代单分子实时 (single molecule realtime,SMRT)DNA测序平台正式走进部分实验室[1]。但是每一种测序平台在读序长度、精准性、测序通量、成本消耗等多个方面具有一定的差异。Solexa测序系统,测序平均读长50 bp,全基因组覆盖率大于95%,错误率低于十万分之一;SOLiD测序平台每次运行可以产生4 Gb的数据,可实现大规模扩增和高通量并行测序;半导体及SMRT测序平台则简化了工作流程,缩短工作时间,缺点在于测序成本和错误率都相对较高[2-3]。新一代NGS揽括主全基因组测序(whole-genome sequencing,WGS)、全外显子组测序 (whole-exome sequencing,WES)以及靶向目标测序 (targeted region sequencing,TRS)[4-5],根据需求,既可以选择多个样品的浅层扫描,也可以对复杂难以获取的少量样本进行深度测序。NGS技术在临床分子诊断和治疗方面具有两大导向:(1)设计芯片,直接对已知的致病基因进行靶向基因组测序;(2)根据未知病因的疾病对外显子组或全基因组进行测序,然后对得到的遗传信息进行有效地解读。NGS测序工作流程主要分为测序前文库制备,样本上机,测序后数据分析三个步骤,其中数据分析流程主要包含碱基识别,序列比对,识别序列变异,变异注释这四个方面。另外,二代高通量测序既可以在较短时间内对目的基因做到准确定位,对未知序列进行检测,也可以对某组织在某一时间表达的mRNA进行测序[6]。因此,在相同条件下进行综合比较,NGS具有不可替代的优势。
2.1 现阶段,NGS在临床肿瘤学的研究中呈现出巨大的检测应用价值,在临床分子诊断方面涉及到的DNA或者RNA测序在最广泛的是针对肿瘤细胞来源进行的诊断与治疗。肿瘤细胞具有异质性和低频突变的特点。癌症基因组图谱的制定和国际癌症基因组计划等大量繁琐关键的工作内容就是通过全基因组和外显子测序完成的。一方面,NGS可以用于肿瘤基因的突变筛查,指导癌症相关疾病的一级预防工作;另一方面,在治疗上,通过NGS发现癌症关联基因,从中探索敲定新的治疗靶点,用于个性化的用药依据和监测肿瘤预后情况。据报道,利亚德基因公司利用二代基因测序平台关于突变位点开发了相关基因芯片,目的是结合肿瘤病人家谱遗传信息,针对消化道和腹腔的8种癌型进行风险评估[7]。无独有偶,llumina公司针对肺癌、结肠癌、胃癌、宫颈癌关联的26个基因突变位点,设计开发了名称为 “Tru Sight Tumor panel”芯片,用于癌症的靶向治疗[8]。除了在肿瘤学研究进展中备受青睐,NGS也被广泛应用于肾病[9]、糖尿病[10]、心血管疾病[11]等其他复杂疾病的临床诊断和治疗中。
2.2 转座子 (Transposon)几乎存在于所有的真核生物中,并在基因组中占有较大比例,是基因组中一段可以从原位上单独复制或断裂下来,经过自身环化,然后插入到另一基因位置,能够对其后的基因起到调控作用的NDA分子片段。在临床相关诊断学实验室,高通量测序技术不乏在转座子研究中起到重要作用,例如测定计算转座子含量、分析多体性分布规律、鉴定罕见类型转座子等。利用高通量测序数据获得的转座子含量的信息,可以更加全面加深对DNA、RNA进行更加深刻详尽的剖析和认识。
2.3 在遗传性疾病的检测方面,NGS以其更加成熟的技术、更加低廉的费用、更短的实验周期,为此提供了更加优质的选择。2015年初,国家卫生和计划生育委员会批准了NGS在临床4个方面的试点,包括遗传病诊断、产前筛查与诊断、植入前胚胎遗传学诊断。有实验表明,高通量测序技术通过对孕妇血浆进行STR分型,使得无创产前亲子鉴定存在可能[12]。此外,面对疑难罕见疾病诊疗难的窘境,全基因组测序引发了新的思路。例如对于染色体微阵列基因芯片可以用于儿童染色体病、基因组病、单基因病的诊断和治疗。CNV-sep在无创产前基因组病检测方面的应用将进一步降低智力障碍或者多发畸形等患儿的出生率,从而减少家庭和社会负担,保证理疗资源更合理高效配置。
2.4 人体最庞大、最复杂的系统为细菌、真菌、病毒等微生物构成的胃肠道系统,在临床微生物病原学检测方面,检验医学微生物学实验室已经开始将高通量测序用于对微生物的深入研究,并尝试对细菌、病毒等微生物进行全貌描述。近年来,分子生物学技术得到快速发展,特别是以高通量测序为代表的宏基因组学技术的突破,为病原微生物研究开拓了新的思考途径,并提供了新的考究方法和解决难题的手段,特别用于肠道、口腔、粪便、新生母婴微生物高通量宏基因组菌群分类以及在传染病溯源、预测中的作用。16S rRNA克隆文库技术是应用最为广泛的菌种鉴定技术之一,它可以提供许多无法培养或难以培养的微生物的信息,如复杂的粪便标本,NGS都能做到准确度高,通过全基因组测序分析,从而确定微生物种群优势菌的具体种属信息。由此可见,未来关于微生物群落与疾病的研究方面,一定能够取得既独特又新颖的见解和突破。
不仅仅在医学,高通量测序技术目前被广泛地应用于生物学研究的多个领域,自热环境检测、畜牧养殖业微生物研究、食品和工业领域等。NGS技术使众多学者们对各生物研究对象的研究发生了从量到质的革新,拓宽了对遗传信息研究的广度和深度。NGS开启了基因探索和学习的新时代,它的应用不断拓宽和提高了人类对物质微小分子水平的根透彻认识,尤其是临床医师面对病因不明、机制机理复杂的遗传性疾病。NGS技术的诞生促使临床分子水平基因诊断从单基因时代跨越到多基因时代,具有划时代意义,是测序技术发展历程中的一个里程碑。另一方面,随着高通量测序技术而涌现的小RNAs测序、降解组测序、DNA甲基化测序等新方法为众研究人员进行分子生物学相关探究提供了更多便捷的选择。但是目前NGS技术仍然处于起步阶段,对临床诊断医学乃至于各个领域应用还不够完全渗透,国际测序技术的临床应用标准还有待加强完善补充。由于高通量测序技术产生的序列片段冗长,数据含量信息巨大,因此对数据分析增加了难度,对基因组中重复序列的研究也提出了严峻的挑战。由于现行算法可能存在有灰区、假阳性率高等缺陷,所以需要开发复杂的算法以为临床提高更精准的结果。如果临床实验室能够在有效处理分析高通量数据的同时,还能挖掘出更有效的信息以适用于临床诊断,那么高通量技术必将引领临床医学迈向更高一个阶梯。总而言之,NGS技术给基因组学研究带来了一个崭新的发展机遇,将更加深入临床实践,守护生命传承。