侯卓良,岳莹莹,袁勇贵,
(1.东南大学 医学院,江苏 南京 210009; 2.东南大学附属中大医院 心理精神科,江苏 南京 210009)
抑郁症(major depressive disorder,MDD)是最常见的精神疾病之一,终身患病率约为10.8%[1],全球约有3.2亿人罹患此病[2]。2019年最新数据显示我国MDD终身患病率达3.4%,据此估计,约有4 420万人罹患此病[3]。MDD已成为困扰人类身心健康的重大精神疾患,给患者、家庭和社会带来沉重负担。然而,MDD受遗传、社会环境、心理应激等多种因素交互作用的影响,其具体发病机制目前尚不明确。双胞胎研究显示,MDD的遗传度为31%~42%[4]。因此,遗传学研究有助于进一步挖掘MDD的发病机制,为MDD的预防和治疗提供理论依据。
MDD现行的诊断标准主要依据患者的临床症状群,诊断的一致性较差,MDD人群的异质性高,给MDD遗传学机制阐明带来巨大困难。因此,研究者提出可以使用“中间表型”(intermediate phenotype)代替疾病表型进行研究。中间表型是指介于基因型和临床疾病表型之间的可测量的性状[5],在精神疾病中,神经结构、功能是常见的中间表型。由于中间表型是可测量的客观指标,可以减少疾病诊断异质性和自我报告偏倚对研究结果的影响[6]。
影像遗传学(imaging genetics)是一种遗传关联方法,通过影像学技术检测遗传变异对神经精神疾病的相关脑结构和功能的影响[7]。最初影像遗传学仅研究遗传变异- 影像中间表型- 疾病表型的传递通路,随后环境因素也被纳入影像遗传学的研究范畴,研究基因- 环境交互作用、基因- 环境- 脑- 疾病各环节间的直接间接关联等。如今,影像遗传学研究已成为深入理解精神疾病生物学机制的重要工具。
影像遗传学方法用于MDD生物学机制研究已有多年,作者总结近年来研究不同类型遗传变异的MDD影像遗传研究,根据所研究的遗传变异的类型,影像遗传研究可以分为4类:(1) 基于单基因的影像遗传学研究;(2) 基于多基因的影像遗传学研究;(3) 基于通路基因的影像遗传学研究;(4) 基于全基因组关联研究(genome- wide association study,GWAS)的影像遗传学研究。此外,上述研究通常使用单变量分析方法研究遗传和影像中间表型的关联,近年来发展出了多变量分析方法,文章中作者也对基于多元数据分析的影像遗传学研究进行了总结。本文作者最后讨论了当前研究的不足及未来发展方向。
早期的影像遗传学分析,通常根据先验知识选择单核苷酸多态性和单个脑区结构功能进行单变量关联分析。这类候选基因研究报告了大量单核苷酸多态性(single nucleotide polymorphisms,SNP)与脑区的相关性,然而,研究结果并不一致,一项Meta分析[8]总结了脑源性神经营养因子(brain derived neurotrophic factor,BDNF)的Val66Met多态性、5- 羟色胺转运基因启动序列(5- hydroxytryptamine- transporter- linked polymorphic region,5- HTTLPR)多态性分别与MDD患者海马体积及5- HTTLPR多态性与杏仁核功能的关联,结果均未发现相关。MDD是高异质性的复杂疾病,这是研究结果不一致的可能原因之一,选择同质性更高的患者进行研究可能会得到更为一致的结果。因此,近来的研究将更多因素纳入考察范围,如症状表型、环境因素等。例如,Yuan等[9]关注晚发性抑郁患者的认知症状,发现携带载脂蛋白E ε4等位基因的缓解期患者的认知功能较差,与右额内侧回灰质体积明显减小、后扣带皮层和右内侧颞叶之间的功能连接降低[10]、左侧海马与背侧前扣带皮层(anterior cingulate cortex,ACC)功能连接破坏相关[11]。杨昱音等[12]发现携带FK506结合蛋白5(FK506 binding protein 5,FKBP5)基因rs160780 T等位基因的MDD患者右额下回岛盖部局部一致性降低,与焦虑症状呈正相关。早期负性生活事件史如儿童期虐待是最受关注的环境因素之一。例如,Grabe等[13]发现具有早期负性生活事件史的个体中,携带FKBP5 rs160780 T等位基因与海马、杏仁核、ACC等情感网络区域的灰质体积减少相关。环境因素可能通过表观遗传学的甲基化机制影响基因的表达。Tozzi等[14]发现在携带FKBP5基因rs1360780 T等位基因的MDD患者中,儿童期虐待可能诱导FKBP5的低甲基化,与眶额叶的灰质密度降低和激活增加相关。这些研究结果提示了压力等环境因素是将FKBP5基因表达与MDD相关大脑改变联系起来的一个重要环节。
由于单个SNP的遗传效应微弱,并且可能受到同一基因中其他SNP的影响,已有研究纳入了分布在同一基因中的多个多态性所构成的单倍型进行遗传关联研究。例如,Swartz等[15]在负面情绪面孔匹配任务中发现,携带白细胞介素- 18(interleukin- 18,IL18)基因mRNA高表达单倍型的女性MDD患者左侧杏仁核激活相对增加,并与抑郁和焦虑症状增加相关。单倍型由于关注具有功能的一组基因位点,可能更好地将基因、分子机制与脑功能联系起来,反映了MDD的生物学机制。单基因与影像的关联研究可以得到较为直观的解释,在影像遗传学的初步研究中发挥了重要作用。然而,候选基因研究严重依赖于疾病的先验知识,遗传变异、脑区的选择受到局限。MDD受到多种基因的影响,研究单基因的效应显然不足以解释MDD复杂的遗传结构。
现有研究表明许多常见遗传变异单独的生物学效应微小,但可能由于累积或协同效应,介导特定疾病的发生风险。因此,影像遗传学研究多基因对脑影像表型的综合影响,此类多基因研究根据先验知识选择多个与MDD相关的候选基因。例如,5- 羟色胺(5- hydroxytryptamine,5- HT)相关基因研究中报告了叠加效应和非叠加效应。Kostic等[16]报告了在MDD患者中儿茶酚- O- 甲基转移酶(catechol- O- methyltransferase) Val158Met、BDNF Val66Met及5- HTTLPR多态性在前额叶皮层和枕叶皮质厚度中具有叠加效应。Han等[17]发现5- HTTLPR和BDNF Val66Met对额极体积有非线性交互作用。Kautzky等[18]通过健康受试者PET研究发现BDNF Val66Met和5- 羟色胺受体1A(5- hydroxytryptamine receptor 1A,HTR1A)的rs6295非叠加性地影响5- HTR1A的结合潜力,携带3个或3个以上风险等位基因的受试者才会显示出5- HTR1A 表面结合潜力的增加。这些研究提示5- HT通路在MDD中的作用,并且这些基因间的相互作用表明存在一个复杂的网络,共同影响MDD的脑结构功能改变。然而多基因方法研究的候选多态性数量有限,影像遗传学研究进一步发展出通路基因相关的研究。
基于通路基因的影像遗传学研究特定生物功能通路相关的基因,为遗传变异、生物过程与脑影像表型的联系提供更有力的解释。早期的方法根据先验知识选择与某一通路相关的一组基因,逐个比较相关SNP,研究其与脑影像的关联,例如,尹营营[19]报告多巴胺通路4个基因的7个SNPs与伴有精神运动迟滞MDD患者的运动、情感及认知相关脑区的脑血流量相关。但是,这种方法虽然可以从通路中识别有效应的基因,却不能识别通路基因间的相互作用。生物信息多位点遗传谱评分(biologically- informed multi- locus profile score,BIMPS)是一种基于通路基因的多基因评分方法,可以量化根据功能相关选择的多个遗传变异的叠加效应[20]。Gong等[21]发现多巴胺通路活性MPS影响MDD患者的奖励网络,与伏隔核和下丘脑之间的功能连接呈正相关,并与焦虑抑郁症状相关。Piel等[22]研究5- HT通路MPS,在健康受试者中发现MPS与右侧杏仁核功能激活呈正相关,与双侧前扣带皮层和右背外侧前额叶对刺激的习惯化呈负相关。BIMPS从通路的层面上捕获多基因结构,涉及通路中的多个环节,反映信号通路的整体功能,可以与大脑区域大量神经元和胶质细胞的整体活动更好地联系起来。但是,BIMPS将SNPs间的相互作用假定为叠加效应,忽视了下游调节和异位显性;而且,通路相关的遗传变异可以选择的组合过多,可能纳入一些无关的变异,导致假阳性结果的出现。
全基因组的影像遗传学研究基于GWAS的研究方法,不依赖先验知识,使用数据驱动的方法,从全基因组范围内发现影响疾病相关脑影像表型的遗传变异。GWAS是识别疾病相关遗传变异的重要研究方法,利用全基因组测序技术逐一比较单个SNP与疾病风险的关联,最终筛选出差异有统计学意义的SNPs。GWAS无须先验假设,为MDD的遗传机制提供了新的发现,是对候选基因研究的有力补充;相应的,候选基因研究方法成为验证从GWAS获得的新候选基因的工具。例如,Cui等[23]报告了LHPP基因(phospholysine phosphohistidine inorganic pyrophosphate phosphatase)rs35936514 T等位基因与MDD患者的双侧舌回、双侧背外侧前额叶皮层和左内侧前额叶的异常自发活动相关。GWAS研究也可以将脑影像改变作为与遗传变异关联的表型。Mathias等[24]选择复发MDD和右侧海马体积作为GWAS关联的表型,发现SMCHD1基因(structural maintenance of chromosomes flexible hinge domain containing 1)内含子内的rs574972同时影响抑郁发生风险和右侧海马体积。然而,由于不能通过严格的多重比较校正,很多有意义的微效位点在GWAS研究中被忽略。此外,GWAS只能发现遗传变异与性状之间的关联程度,并不能对其机制给出很好的解释。为解决上述问题,发展出更为可靠的分析方法,如多基因风险评分(polygenic risk scores,PRS)、基因富集分析(gene set enrichment analysis,GSEA)。
PRS方法研究基于先前的GWAS发现的风险等位基因,为全基因组内或特定基因组内的特定条件提供“风险”评分,研究遗传变异的叠加效应,从而识别与精神病理学的遗传风险相关的机制[25]。使用这一方法的研究较多,如Yüksel等[26]发现健康受试者的MDD- PRS在工作记忆任务中与双侧枕中回、双侧额中回和右侧中央前回等多个脑区的激活相关。Smeeth等[27]发现了雌二醇PRS与海马体积相关,较高雌二醇水平的遗传风险与较小的海马体积相关,但未发现与MDD或产后抑郁的风险相关。Guffanti等[28]报告了MDD表型相关的PRS分值较高在健康女性中与纹状体较小、应激相关的奖赏预期误差更低相关。PRS表明了MDD遗传易感性对于脑结构和功能的综合影响,但不能提供关于这些SNPs对观察到的结构功能改变的贡献大小。还有一些研究报告了阴性的发现。Wang等[29]研究包括MDD在内的5种精神疾病PRS对健康人群双侧岛叶功能连接的影响,未发现MDD- PRS与岛叶功能连接的关联。Wigmore等[30]依据ENIGMA(Enhancing NeuroImaging Genetics through Meta- Analysis)工作组汇总数据中与每个大脑区域体积相关的基因来生成大脑区域体积的PRSs,未发现任一脑区体积相关PRS与MDD之间的关联。一个可能的原因是由于PRS仅考虑了遗传变异的叠加效应,而不能研究可能存在的通路内及通路间基因相互作用。
GSEA可以测试与给定复杂性状具有适度关联的多个基因是否富含特定的生物过程,即检测先前的GWAS等研究发现的SNPs是否位于特定生物过程相关的一组基因集中[31]。Petrovska等[32]通过GSEA方法发现健康受试者中同时与较高的亚临床抑郁症状评分、胼胝体额钳和左上纵束颞部的白质完整性降低相关的基因集,神经细胞黏附分子1(neural cell adhesion molecule- 1),相互作用的基因集,这些基因涉及神经发育和突触可塑性。GSEA方法将GWAS发现的MDD遗传风险与生物过程联系起来,有助于理解抑郁症状的分子遗传基础。
影像遗传学研究扩展到全基因组全脑关联范围后,由于涉及的遗传、影像数据量巨大,为了分析主要问题,并提取出核心的脑影像与遗传信息之间关联,多种多变量分析方法常用于降低数据的维度。其中,独立成分分析(independent component analysis,ICA)在精神障碍的研究中应用较为广泛。平行独立成分分析方法(parallel ICA,pICA)是ICA方法中的一种,pICA从遗传和影像数据中分别提取独立成分,之后计算遗传和影像独立成分之间的关联[33]。姜文颢[34]运用pICA的方法研究快感缺失相关的灰质网络及遗传信息,发现CACNA1C 和LAMA2基因多个SNPs共同影响下的额叶- 眶额叶- 小脑- 纹状体灰质网络,可能是MDD快感缺失的潜在遗传影像中介表型。Zhang等[35]发现默认模式网络的灰质体积减少与G蛋白偶联受体、阿尔兹海默症患者中表达上调的一组基因相关,且在MDD患者中比健康对照中有更高的相关性。机器学习的方法也被用于进行多元数据分析,可以处理高维数据集,捕获单个预测变量的主要影响及复杂的相互作用,如基因的上位效应[36]。Inkster等[36]研究一组与糖原合成酶激酶- 3β(glycogen synthesis kinase 3β)直接相互作用的蛋白质的编码基因,使用机器学习随机森林算法探索影响MDD患者海马体积的基因型网络,发现了组蛋白脱乙酰基酶4(histone deacetylase 4,HDAC4)rs12469994和Ⅰ型1,4,5- 三磷酸肌醇受体(inositol 1,4,5- trisphosphate receptor Type 1,ITPR1)rs2291862之间的相互作用,在MDD患者中与海马体积减少相关,HDAC4、ITPR1均与内质网应激相关。可见,数据驱动的多变量研究有助于在大量数据中识别与MDD中间表型相关的基因相互作用网络。
大量的影像遗传学研究发现了与MDD相关的脑区和风险基因,在一定程度上阐述了MDD的发生机制。随着影像遗传学的发展,多变量分析方法已在精神疾病研究中得到初步应用,但目前研究仍然较少。例如,已有酒精滥用相关研究将pICA由遗传、影像2个模态推广到遗传、结构和功能影像3个模态[37],但这种三维平行独立成分分析方法(3- way pICA,3pICA)在MDD领域中还未有报道。3pICA也可用于研究遗传、影像、临床表型,有潜力实现整合症状、脑影像和遗传信息的效果,为“基因- 脑- 疾病”这一通路提供更为直接的证据。现有的影像遗传学中,研究基因间相互作用以叠加效应为主,对上位效应和发育调控等研究较少;此外,基于通路的研究关注单个通路内的基因交互作用,很少关注多个通路间的相互作用,多变量分析方法的应用也有助于复杂的基因间、通路间相互作用的阐明。
目前MDD影像遗传学研究关注的影像中间表型包括灰质的结构与功能、白质结构,尚无研究关注白质功能。已有研究发现白质同样组成功能网络[38],未来的研究可关注白质功能异常作为MDD影像中间表型的可行性。
MDD受环境因素影响,其影像遗传学研究已经涉及了表观遗传学。然而,这些研究仅限于少数DNA甲基化位点。表观基因组关联研究(epigenome- wide association studies,EWAS)可以研究全基因组甲基化位点与疾病的关联。已有EWAS研究发现了与抑郁症状相关的3个甲基化位点[39]。将来可以结合EWAS和影像数据,深入探索基因- 环境相互作用对大脑结构和功能的影响。
当前MDD影像遗传学研究的视角是静态的,很少有研究关注不同时期遗传效应的动态变化。未来影像遗传学研究可能需要建立新的纵向研究模型,同时整合遗传、神经影像和环境数据,探索MDD发展过程中基因- 环境- 脑- 行为之间的动态相互作用。
声明:所有作者均声明不存在利益冲突。侯卓良负责文献收集与分析、撰写论文与修改;岳莹莹负责论文修改;袁勇贵负责选题、文章修改。