谭奎璧(综述),戴 勇(审校)
(深圳市人民医院肾内科,暨南大学第二临床医学院,广东深圳 518020)
遗传流行病学产生于20世纪70年代,是由人类医学遗传学和流行病学紧密结合形成的[1]。它运用遗传学方法和理论基础,研究和分析人类群体中遗传性疾病的流行学问题,着重辨析某些遗传因素和环境因素在疾病发病中所起的不同作用,以及它们相互作用的后果,并为遗传性疾病的群体监控和预防制订适当的对策和措施。经过这几十年的长足发展,遗传流行病学在肿瘤、精神疾病、心血管病、糖尿病等复杂疾病领域得到了广泛应用,为疾病的病因诊断、个体化治疗以及选择性用药等作出了重大贡献。因此,选择合适的研究方法,吸取先进的科学技术来为遗传流行病学服务,显得格外重要。现主要介绍一些常见的遗传流行病学研究方法以及全基因组关联研究(genome-wide association study,GWAS)在遗传流行病学中的应用。
遗传流行病学是遗传学和流行病学的结合,是近代对复杂疾病病因认识的需要。作为遗传流行病学的基础,不管是现在还是将来,遗传学和流行病学将会通过以下几个交互作用点更加紧密地联系在一起:①遗传学在判断遗传性疾病中可以发挥重要作用;②遗传学对分析研究设计有一定的影响;③利用全基因组数据可以有效地克服由选择性偏差所造成的人群混杂误差;④遗传学是重要的流行病学调查工具;⑤流行病学可以收集足够的显型样本用来遗传学研究;⑥流行病学有助于解开基因变异与临床和治疗的相关性[2]。由此可见,充分地利用遗传学先进的科学技术和手段,并将其与流行病学有效地结合,可以让遗传流行病学得到更好的发展。
遗传流行病学主要研究环境与遗传因素及其交互作用在疾病发生中的作用。近些年,遗传流行病学已经分为两个分支:宏观遗传流行病学和微观遗传流行病学。
2.1 宏观遗传流行病学宏观遗传流行病学主要研究家系和群体的资料,可以用来探明疾病有无家族聚集性。包括代与代之间,同胞之间两水平的研究。
2.1.1 家系研究 家系研究即家族聚集性研究,家族聚集性现象间接反映了遗传因素的存在,包括病例对照和定群研究。其判断标准如下:①患者亲属的患病率或发病率高于对照亲属或普通人群;②有家族史患者亲属的发病率高于随机人群患者亲属;③与患者血缘关系越近发病率越高;④数量性亲属对之间的相关性大于非亲属对[3]。刘卓等[4]在家系研究的基础上,对30个候选基因进行了病例对照研究,提示KCNJ11基因是中国汉族2型糖尿病的易感基因之一。
2.1.2 群体研究 遗传流行病学的群体研究是指对一定人群进行某病发生频率及特点的研究,是在积累个体资料的基础上,进一步探讨群体中遗传性疾病的发生、分布和流行的特点。研究发病率在时间、地点、胎次等的变化,以及比较疾病易感基因在病例与对照分布的关联研究都属于群体研究的范围。单晶等[5]采用了人群为基础的病例对照家系设计和病例对照设计,分别研究了有关基因多态性与家庭乙型病毒性肝炎表面抗原阳性者聚集和乙型肝炎病毒感染不同结局的关系,并分析了基因-环境交互在慢性乙型病毒性肝炎发生中的作用。
2.1.3 双生子和养子研究 双生子研究是指主要通过调查,利用双生子资料来研究某些疾病或性状中遗传和环境因素相互作用的程度。使单卵双生子在不同环境中发育成长,可以研究不同环境因素对表型的影响。而使异卵双生子处于相同的环境中,又可以研究不同基因型的表型效应。
养子研究用于探讨遗传与环境对疾病发生的影响。通过比较患病养子的血缘亲属和非血缘亲属的患病率,或比较患病养子和未患病养子的血缘亲属的患病率来证实遗传因素的存在,适用于行为和精神性状的遗传学分析。
2.2 微观遗传流行病学 微观遗传流行病学即细胞及分子水平的遗传流行病学,主要应用分子遗传学的方法,在基因水平进一步分析从群体和家系资料得到的结果,提供证据。
2.2.1 分离分析 分离分析是医学遗传学上经典的分析方法,以孟德尔的分离定律为理论基础,主要通过家系调查对基因的分离行为进行遗传学分析,借助分离分析可以确定某一性状或遗传病的遗传方式。在分析单基因遗传的显性形状和隐性形状时,应用分离分析可以消除调查中的抽样误差或系统误差。但对于那些复杂病因不明的多基因或多因素疾病,则不能单独运用分离分析进行研究。
2.2.2 连锁分析 连锁分析即基于家系研究,观察遗传标记等位基因和假定的遗传性状是否发生共分离来进行遗传分析的一种方法。连锁分析是利用连锁的原理研究致病基因与遗传标记位点的关系的。根据孟德尔分离率,如果同一染色体上的位点不连锁,那么遗传标记将独立于致病基因而分离,与致病基因位于同一单倍体或不同单倍体的机会各占一半,否则表明连锁的存在。连锁与减数分裂期间两个染色体位点重组的概率有关[6],当两个基因位点离得很远时,各有50%的概率发生交叉和重组,当两个位点离得很近或相连时,重组的概率会降低或很少发生。如今用于连锁分析最典型的遗传标记是单核苷酸多态性位点。
全基因组关联研究(genome-wide aqssociation studies,GWAS)是指在全基因组层面上,开展多中心、大样本、反复验证的基因与疾病的关联研究,全面揭示疾病发生、发展与治疗相关的遗传基因。因此,GWAS也属于微观遗传流行病学的研究方法的范畴。
在单核苷酸多态性成功分型以前,人们都是利用微卫星来进行遗传学研究的。王剑青等[7]通过研究COL4A5基因连锁的12个微卫星遗传标志扩增后形成的单倍体图,对一个遗传性肾炎综合征家系进行治病基因的排除定位,得到了遗传性肾炎综合征并非是通过X染色体连锁的方式遗传,而可能是常染色体上基因突变致病的结论。
在人类基因组计划与人类基因组单体型图计划圆满完成后,单核苷酸多态性成为第3代遗传标志,高密度的单核苷酸多态性位点,为GWAS提供了可能。Hom等[8]运用GWAS进行病例对照研究,在具有欧洲血统的北美人群中找到了两个关于系统性红斑狼疮的易感基因位点:8号染色体开放读码框13-B淋巴细胞酪氨酸激酶和α-整合素M-α-整合素X。
复杂疾病也被称为多基因遗传病,是指由多个微效应基因的累加效应结合环境因素共同作用所导致的疾病。大多数人类常见疾病都属于复杂疾病,如糖尿病、冠心病、银屑病、精神分裂症、阿尔茨海默病等。因其具有患病率高,发病机制复杂,难以治愈等特点,一直是困扰医学界的难题。
Sladek等[9]利用GWAS方法在法国人的病例对照同期群组研究中测试了329 935个单核苷酸多态性位点,找到了4个新的与2型糖尿病相关的易感基因位点:TCF7L2、SLC30A8、胰岛素降解酶-驱动蛋白家族成员11-造血细胞特异表达同源盒 和 EXT2-ALX4。随后,Barrett等[10]也找到了 40多个与 1型糖尿病相关的易感基因位点。我国的GWAS研究虽然起步较晚,但如今也在慢慢兴起。2009年初,Zhang等[11]研究者率先完成了对汉族人银屑病易感基因GWAS的研究,成功发现了其易感基因:非免疫相关基因晚期角化包膜。随后顺利完成了系统性红斑狼疮[12]、麻风[13]、白癜风、食管癌易感基因 GWAS的研究,成功发现了几十种与汉族人相关这些复杂疾病的易感基因。
遗传流行病学在复杂疾病领域得到了广泛应用,对疾病的病因诊断、个体化治疗以及选择性用药等也有着积极的作用。但其今后的发展依然面临着巨大的挑战:①进行遗传流行病学研究需要多中心、大样本、反复验证,想要进行大样本研究的相互重复,数据共享是必由之路[14]。未来的遗传流行病学研究应该建立一个专门的数据平台,收集全球的研究结果与相关数据,还需多中心、多学科(临床医学、遗传学、流行病学、分子生物学、统计学等)的各位专家相互协作[15]。②目前大多数的遗传流行病学研究还停留在基因水平——易感基因的找寻和确定上。如何将研究成果应用于临床,进行基因诊断和靶向治疗,研制出相关的基因靶向药物是今后关注的重点。③GWAS始终面临着人群遗传结构导致的假阳性结果问题。亚洲人群历史悠久,其形成是一个群体分化、群体接触、交流、联结和融合的复杂过程。全面解析亚洲人群的遗传结构、量化个地区人群的遗传差异以及充分了解亚洲人群遗传结构对GWAS的影响程度,是合理设计的前提,也是保证GWAS结果可靠的必要条件。④目前的遗传流行病学研究多数集中在常见疾病的研究阶段,对于那些具有遗传易感性罕见性疾病(如儿童脑肿瘤[16]),应该在以后的工作中给予更多的关注。⑤在遗传流行病学研究中,还应进一步阐释基因-基因、基因-环境之间的相互作用以及它们对疾病的发展变化所起的作用。
[1]马慰国,吕宝忠.遗传流行病学[M].武汉:湖北科学技术出版社,1988:1.
[2]Traynor BJ.The era of genomic epidemiology[J].Neuroepidemiology,2009,33(30):276-279.
[3]张卫华.遗传流行病学[J].中华流行病学杂志,1998,19(4):345-346.
[4]刘卓,张永伟,冯起平,等.中国汉族人群2型糖尿病30个候选基因相关性分析[J].中国医学科学院学报,2006,28(2):124-128.
[5]单晶,王璐,李卓,等.维生素D受体基因多态性与乙型肝炎阳性者家庭聚集性关系[J].中国医学科学院学报,2006,28(2):148-153.
[6]Benke KS,Fallin MD.Methods:genetic epidemiology[J].Clin Lab Med,2010,30(4):795-814.
[7]王剑青,戴勇,刘木根,等.遗传性肾炎一家系col4a5基因微卫星遗传标记单倍体图研究[J].中华肾脏病杂志,2005,21(4):177-181.
[8]HoMG,GrahaMRR,Modrek B,etal.Association ofsystemic lupus erythematosus with C8orf13-BLK and ITGAM-ITGAX[J].N Engl JMed,2008,358(9):900-909.
[9]Sladek R,Rocheleau G,Rung J,etal.A genome-wide association study identifies novel risk loci for type 2 diabetes[J].Nature,2007,445(7130):881-885.
[10]Barrett JC,Clayton DG,Concannon P,etal.Genome-wide association study and meta-analysis find that over 40 loci affect risk of type 1 diabetes[J].Nat Genet,2009,41(6):703-707.
[11]Zhang XJ,HuangW,Yang S,etal.Psoriasis genome-wide association study identifies susceptibility variantswithin LCE gene cluster at1q21[J].Nat Genet,2009,41(2):205-210.
[12]Han JW,Zheng HF,Cui Y,etal.Genome-wide association study in a Chinese Han population identifies nine new susceptibility loci for systemic lupus erythematosus[J].Nat Genet,2009,41(11):1234-1237.
[13]Zhang FR,Huang W,Chen SM,etal.Genomewide association study of leprosy[J].N Eng JMed,2009,361(27):2609-2618.
[14]严卫丽.复杂疾病全基因组关联研究进展——遗传统计分析[J].遗传,2008,5(4):543-549.
[15]王蕾.专访安医大校长张学军:用最先进的方法赶超国际水平[EB/OL].(2010-11-25).http://www.ebiotrade.com/newsf/201011/20101124102838107.html.
[16]Andersson U,McKean-Cowdin R,Hjalmars U,etal.Genetic variants in association studies——review of strengths and weaknesses in study design and current knowledge of impact on cancer risk[J].Acta Oncol,2009,48(7):948-954.