精准医学:全基因组关联研究在药物基因组学中的进展

2019-01-10 04:29牟奕肖恒怡董碧蓉
中国老年学杂志 2019年24期
关键词:表型基因组位点

牟奕 肖恒怡 董碧蓉

(1成都市第八人民医院,四川 成都 610083;四川大学华西医院 2老年病研究室;3老年医学中心)

现代医学一直遵循精准理念,不断融入新理论、新技术、新设备以提高临床实践的准确性和客观性〔1〕,比如CT、磁共振成像、染色体诊断等技术。精准理念克服传统医疗的盲目性,减少漏诊和误诊,避免治疗不足或过度,是现代医学进步的推动力。在世界范围内,精准医学被研究者广泛接受〔1,2〕。精准用药是精准医学的重要分支;在美国,三分之一的处方药被认为无效,每年浪费约7 126亿元人民币(1 000亿美元);对患者健康不仅无益,反而具有潜在危险性〔3〕。药物反应与个体遗传差异的密切联系早已引起研究者重视,并先后提出了药物遗传学和药物基因组学(PGx)〔4〕的概念。如ryanodine受体基因突变是导致全身麻醉药后高热的重要原因之一〔5〕。所以,基于药物遗传的精准用药可以减少临床用药的试错法,避免患者暴露于无效或有毒的药物。鉴于药物遗传研究是实现精准用药和精准医学的必要途径,本文主要综述药物遗传的重要领域PGx全基因组关联研究(GWAS),阐述药物遗传研究的策略共性和特点、最新的进展和发展趋势。

1 PGx与GWAS

药物遗传学和PGx的概念并不严格区分。但特指研究方法时,两者也存在差异:药物遗传学是从单基因水平研究药物反应;而PGx是基因组水平的研究。药物反应多数属于复杂性状;复杂性状是由许多遗传和环境因子共同作用的结果;其中,每个基因对性状的遗传贡献非常微弱〔5〕。

药物遗传学和PGx的研究思路存在明显区别。药物遗传学研究多采用候选基因法,即根据已有的药理学知识推测相关的基因并加以验证的方法,包括药物转运蛋白和代谢酶。然而,许多药物反应的生物机制并不清楚,这限制了候选基因法的药物遗传研究。PGx采用全基因组关联研究的方法,这种方法无须假设,可系统地检测基因组中成千上万的遗传变异,无须任何相关先验知识,甚至可发现复杂的生物机制。

药物的临床转化不能遗漏任何与药物反应有重要关系的遗传因子,PGx GWAS可以排除未知基因对药物反应的影响,比如,最初华法林和氯吡格雷在临床研究开展之前都进行了GWAS验证。事实上,研究者已经知道华法林的剂量稳定性与维生素K环氧化物还原酶复合体(VKORC)1和细胞色素氧化酶(CYP)2C9基因相关,但并不清楚是否存在其他影响华法林剂量的基因〔6〕。

值得注意的是,GWAS的主要研究领域是常见病和常见表型研究,包括老年视网膜黄斑退行性变、2型糖尿病、炎症性肠病、肥胖等;而PGx GWAS发展则相对较为缓慢,PGx GWAS在全世界所有的GWAS研究中所占比例非常小,还不到10%〔7〕。截至2017年,GWAS catalog一共收录了216个关于药物治疗的PGx GWAS研究;其中145个是关于药物疗效,69个是关于药物不良反应(ADR)或毒性反应〔7〕。研究者认识到,药物反应的遗传效应可能要比常见疾病的要强,有助于发现新的药物靶点、阐明病理生理和促进精准治疗〔8〕。

2 PGx GWAS的方法、特点与进展

2.1GWAS的方法学 概括地说,PGx GWAS是在符合药学特点的流行病学设计基础上,收集大量符合纳入条件受试者的基因组DNA,在基因组水平进行遗传关联研究〔9〕。遗传关联是研究基因型和表型关系的重要方法;有学者1996年提出了GWAS,适用于常见疾病/复杂表型的遗传研究,可检验等位基因频率和表型在人群中的统计差异;单核苷酸多态性(SNP)是当时基因分型的主要技术之一〔10〕。GWAS研究主要基于常见疾病-常见变异假设(CD-CV)和常见疾病-多重稀有变异(CO-MRV)假说。GWAS不仅是一种复杂的系统研究方法,而且其快速发展使标准流程建立存在困难。本节就GWAS在流行病学设计、基因分型和数据处理、统计分析与数据解释等共性问题进行简要概述。

同所有GWAS研究一样,PGx GWAS流行病学设计的第一步是准确界定药物反应的表型(或性状),分为定性和定量两类;表型定义的严谨性会影响统计分析。PGx GWAS主要采用病例-对照、队列研究,而横断面研究和家系的样本较难获得〔6〕。研究设计必须充分考虑各种因子间潜在的修饰效应或效应交互作用,其是指一种风险因子改变另一种风险因子同疾病的关联强度,可能会影响检出疾病风险因子的能力〔6〕。常见病SNP的遗传效应微弱,因此GWAS所需样本量非常大。遗传富集来提高GWAS的统计能力,有助于减小样本量和筛选出更可能携带遗传风险因子的个体〔11〕。

SNP基因芯片、外显子组和全基因组测序是目前主要的基因分型方法。SNP基因芯片的遗传信息含量远高于传统常规测序且市场价格相对低,在PGx GWAS的研究中有很大的应用前景。本文以SNP基因芯片为例,论述GWAS在PGx中的应用。SNP是GWAS研究的重要分子标记〔次要等位基因频率(MAF)>0.01〕。第一例SNP基因芯片的报道是在1998年;高密度基因分型芯片是目前市场上主要的产品,比如Illumina公司已开发出能检测1.1M的SNP位点的芯片。自2005年,SNP的GWAS研究方法已经趋向成熟,研究结果重复性好,提供了许多关于遗传变异、生物路径、人类性状之间内在关系的认识。药物反应是一类特别的表型,在临床药物治疗中非常重要,为遗传研究提供了独特的机遇和挑战〔4〕。

SNP基因芯片的工作原理是基于碱基的互补,SNP基因芯片的数据需要严格的质量控制,避免细微偏倚累积所导致的假阳性结果〔12〕,包括数据的清除和增补。数据增补可能会带入一些稀有变异,但对次等位基因频率小于1%的位点需要进行测序证实〔13〕。质量控制需要在SNP、个体和人群三个水平依次进行〔12〕。

GWAS基因分型的统计学研究通常被分成发现阶段和重复阶段。遗传学中,重复被认为是关联研究的金标准。GWAS重复研究是在另一个独立样本中验证发现阶段提示有全基因组显著性的遗传位点,这能减少发现阶段的大量假阳性结果(Ⅰ型错误)〔14〕。

遗传关联是研究需要区分不同的模式包括加性、显性和隐性等。表型的性质不同,检验方法也有所差异;定性性状采用常用基因型检验或等位位点趋势检验。常用基因型检验是一种基于人群的列联表统计,近似于卡方分布,采用卡方检验。关联强度可以采用相对风险和比值比来进行衡量,关联强度>3被认为是强关联。趋势检验是判断被检验位点是否为表型的协变量,采用Cochran-armitage检验。定量性状的常用基因型检验可以采用单因素方差分析(ANOVA),加性模型采用线性回归模型。GWAS数据依靠统计软件来完成,包括基于人群的连锁分析软件(PLINK);GWAS统计显著性水平通常为P<5× 10-8。为防止大量的统计分析产生的假阳性,GWAS可采用多参数回归模型、分层分析和Mantel-Haenszelχ2检验等多种方法,寻找独立效应的风险因素〔10〕。

2.2PGx GWAS的特点 PGx GWAS同常见疾病GWAS方法学有很多共性,同时PGx GWAS也存在一些特性,主要是指样本量、表型特征、结果重复和效应量〔4〕。首先,复杂疾病GWAS所需样本量巨大,PGx GWAS对样本量的需求视情况而定。截至2012年2月,如果以P<10-7为统计显著性标准,PGx GWAS的样本量多数是几百例,极少有超过1 000例受试者;而常见病GWAS在初筛阶段,受试者常需数千例〔15〕。但是,大样本量依然是PGx GWAS不可忽视的潜在限制因素。

其次,效应量与遗传力缺失。效应量是指GWAS所发现的遗传关联位点占遗传度的百分数。遗传度是指个体间遗传差异引起人群表型差异的比例,遗传度的统计估计来自于疾病集群的家系研究。实际效应量小于预测遗传度的现象被称为“遗传力缺失”,比如关于身高的GWAS研究可以解释10%~16%的身高的遗传变异,远远小于30%~40%的预测值〔4〕。PGx GWAS中,药物反应相关的遗传位点的效应量可以超过10%,这与常见病GWAS显著不同。

第三,GWAS 有助于阐明药物反应的群体遗传结构。GWAS可以获知群体中各种基因型在数量上的分布情况,即群体遗传结构。药物反应分为药物疗效和ADR两大类。药物疗效的PGx GWAS主要关联到微弱到中等的遗传效应,这与常见疾病相似。ADR的遗传结构更接近于孟德尔疾病,表现出较大的遗传效应(OR>3),这提示ADR存在较强的药物-机体相互作用。目前尚不清楚这种PGx 发现是一种例外或是正常现象〔15〕。

第四,PGx GWAS作为无偏倚的研究方法,可以在没有先验证知识的情况下寻找关联的遗传因子,实验结果常常超过候选基因法的预期〔4〕。编码区是候选基因法的主要研究对象,然而PGx GWAS发现的遗传关联位点仅有18%位于基因编码区;换言之,更多与药物反应关联的遗传位点多位于非编码区的DNase超敏位点〔16〕。DNase超敏位点通常是基因调节区,这有助于更好地理解药物反应的生物机制。

第五,PGx GWAS研究很少采用家系作为研究对象。药物基因学采用病例-对照研究和队列研究比收集扩展家系和核心家系更为容易,因为患者的家属并不一定都接受药物治疗,也无从知道药物反应的表型。

2.3PGx GWAS研究进展 药物反应是继常见病/常见表型之后的GWAS研究热点领域,近两年主要集中在药物肝毒性、心血管疾病、内分泌代谢性疾病、精神疾病和镇痛相关的药物,比如依法韦仑〔14〕、米诺环素〔17〕、多黏菌素〔18〕、氯吡格雷〔19,20〕、血管紧张素转化酶抑制剂(ACEI)〔21〕、二甲双胍〔22〕、帕利哌酮〔23〕、芬太尼〔24〕和瑞芬太尼〔25〕等。

肝是药物代谢的重要器官,药物诱导的肝毒性(DIH)是临床关注的重要问题,具有显著的自体免疫特征。GWAS研究证实HLA-B *35:02与米诺环素〔17〕、SNP rs199650082和依法韦仑〔14〕、rs4842407和依法韦伦-抗结核药联合治疗〔14〕的DIH存在统计显著性关联。多黏菌素是用于严重革兰阴性菌感染抗生素,具有显著的细胞毒性;GWAS研究发现转化生长因子β诱导的同源异形盒1因子(TGIF1)和同源异形盒基因(HOX)D10同细胞毒性存在密切关系。氯吡格雷是心血管事件二级预防的常用药物,第一例氯吡格雷活性代谢产物的GWAS研究提示CYP2C19是决定代谢产物的最强遗传决定因子〔19〕;另一项汉族冠状动脉性心脏病患者的研究中发现了新的氯吡格雷的活性代谢产物浓度相关遗传位点〔溶质运载体基因家族成员14变异体(SLC14)A2 rs12456693,ATP结合盒转运体(ABC)A1 rs2487032和N6-甲基转移酶(N6AMT)1 rs2254638〕〔19〕。芬太尼的镇痛效果受遗传因素影响,rs13093031,rs12633508和rs6961071同冷加压诱导的疼痛显著关联〔24〕;瑞芬太尼的术中镇痛效果与TMEM8A基因的rs199670311和SLC9A9基因的rs4839603存在显著性关联〔25〕。在抗精神药物帕利哌酮的PGx研究中,12项GWAS结果的Meta分析提示ADCK1内含子的rs56240334可以预测帕利哌酮的疗效〔23〕。Meta分析是改善GWAS统计显著性的重要途径,来自鹿特丹研究和Tayside苏格兰研究的ACEI不耐受者进行了GWAS研究,发现了8个SNP位点达到了基因组水平的显著性,结果提示相关基因可能增加ACEI的不良反应〔21〕。

然而,PGx GWAS发现了许多微弱效应的遗传位点,其中不少遗传变异参与了用药的风险,但由于全基因组关联的多重检验而达不到统计的显著性水平;构建遗传风险评分(GRS)用于概括大规模关联研究中达不到显著性的单个遗传标记的组合分值〔26~28〕。如果组合分值同被研究性的关联达到统计显著性,那么就具有对个体性状的预测价值。这个方法可应用于GWAS无显著性发现、寻找相关疾病的共同遗传基础和构建风险预测模型。偏头痛个体差异的遗传因素据估计是在38%~53%,是许多作用微弱、常见变异的联合效果,可用于分析不同头痛类型与偏头痛的内在表型、评估药物遗传的效果,比如即将上市的偏头痛治疗的降钙素基因相关肽单克隆抗体。在他汀药物治疗反应的研究中,研究者采用随机森林模型构建了加权的GRS(wGRS),wGRS是评估他汀药物反应的遗传加性效应的有力工具〔27〕。遗传性QT评分包括了61个常见遗传变异,能解释相当一部分药物诱导的QT延长和作为药物诱导的尖端扭转型室速的重要预测因子〔28〕。

老年人群是临床用药的特殊人群,PGx GWAS的成果逐渐引起老年领域的关注。抑郁症在老年人群中高发,而服用三环/四环抗抑郁剂常常导致QT间期的延长,增加心血管疾病的发病率和死亡率〔29〕。为此,基因组流行病学的心脏与衰老队列研究(CHARGE)开展了一项三环/四环抗抑郁剂与RR/QT间期的GWAS研究,显示欧洲人的RR间期受BRE和泛素结合酶2E2基因(UBE2E2)基因同三环类药物相互作用的影响,拉丁人的QT间期受到TGFBR3遗传变异同三环类药物相互作用的影响〔29〕。老年人是服用他汀药物的主要人群,rs7412、 rs4420638、rs2002042和rs646776对他汀药效有重要影响;在75~80岁的人群中,wGRS同低水平的低密度脂蛋白胆固醇(LDL-C)显著相关〔27〕。

3 展望

借助科技的日新月异,精准医学将不断得以完善。一方面,随着测序成本的降低,全基因组测序(WGS)会最终取代基于芯片的基因分型;但GWAS作为遗传研究方法,依旧保持重要作用。另一方面,基因组虽是精准医学的重要支柱,但精准医学的发展不会局限在遗传领域〔30〕,还将延伸到包括转录组、蛋白组、干细胞、营养、代谢、微生物、微量元素等多个领域,形成环境-社会等外界因素与人体自稳态维持为核心的多层次健康管理模式。老年用药风险和医药支出需要精准医学的支持。衰老过程中,由于老年人器官功能及功能储备下降、多病共存及多药联用等因素,老年药物不良反应的发生率是青年人的7倍。例如,镇静、催眠和抗抑郁药物增高了老年跌倒风险〔31〕。据报道,药物遗传检测能使65岁以上患者的住院率从16.1%下降到9.8%,每个患者平均节约1 553元人民币(218美元)〔32〕。因此,精准医学和精准用药将会成为老年医学探索的重要未知领域,并为临床提供诊疗的指南。

猜你喜欢
表型基因组位点
Pd改性多活性位点催化剂NH3-SCR脱硝反应机理研究
“植物界大熊猫”完整基因组图谱首次发布
承德所选实生核桃资源果实表型性状评价初报
牛参考基因组中发现被忽视基因
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
基于网络公开测序数据的K326烟草线粒体基因组RNA编辑位点的鉴定与分析
体型表型与亚临床动脉粥样硬化有关
科学家找到母爱改变基因组的证据
慢性阻塞性肺疾病急性加重期临床表型及特征分析
血清HBV前基因组RNA的研究进展