阿尔茨海默病影像基因组学研究进展

2020-09-25 02:23吕玉婷姚旭峰卜溪溪
中国医学影像技术 2020年8期
关键词:基因组学表型关联

吕玉婷,姚旭峰,3*,卜溪溪,徐 松,黄 钢

(1.上海理工大学医疗器械与食品学院,上海 200082;2.上海健康医学院医学影像学院,上海 201318;3.上海市分子影像学重点实验室,上海健康医学院,上海 201318)

阿尔茨海默病(Alzheimer disease, AD)是一种病因未明的进行性神经系统退行性疾病,也是最常见的痴呆类型,占全部痴呆的50%~70%,病因尚未明确,且无可有效治愈药物或改变其病理进程的手段[1]。为诊断及预测AD,有学者[2]基于影像组学方法,将影像学特征与临床信息等相结合,并建立模型进行个性化评估;分子生物学研究[3]也证实多个易感基因与AD密切相关。本文从AD相关影像学表型、基因组学特征及影像-基因关联各方面对影像基因组学AD研究现状及进展进行综述。

1 影像基因组学简介

影像基因组学对影像学表型与基因组数据进行关联分析,剖析其间的关联性,以影像学表型作为遗传变异和诊断之间的中间表型来探究AD的发病机制,兼具可早期预测疾病及多模态、高通量、非入侵式获取病变表型特征的双重优势。将多模态脑影像学表型与基因数据结合分析,通过影像学表型检测遗传变异或评估已确定的遗传风险对大脑的影响,比单纯基因研究更为有效。

2 AD影像基因组学研究现状

2.1 相关影像学表型的研究现状 目前AD常用影像学检查方法有MRI和PET。MRI主要包括结构MRI(structural MRI, sMRI)、功能MRI(functional MRI, fMRI)和弥散张量成像(diffusion tensor imaging, DTI)。sMRI能直接反映脑区关键部位的形态学改变,清楚显示大脑灰白质体积萎缩程度;fMRI特指血氧水平依赖(blood oxygenation level dependent, BOLD)-fMRI,通过检验脑细胞在血液流动时的磁场变化完成脑部功能成像;DTI通过检测水分子扩散运动的各向异性来显示脑白质纤维束的走向和完整性,是目前唯一可精确显示活体脑白质纤维束的成像方法。PET则依据标记物分为18F标记的氟代脱氧葡萄糖(18F-fluorodeoxyglucose,18F-FDG)PET和淀粉样PET,分别用于评估大脑糖代谢和淀粉样蛋白变化,显示早期AD患者脑部代谢。见表1。

国内外影像基因组学AD研究所选取的影像学表型特征大多来自MRI。研究[4]表明,海马体积萎缩是鉴别AD临床前阶段的关键影像学表型。海马区及内嗅皮层等结构体积明显变小的遗传性强,故海马体积和皮层厚度是较为适用的AD影像学特征参数,LORENZI等[5]、CACCIAGLIA等[6]及LI等[7]对影像学表型与基因进行关联分析时,所选取大脑皮层厚度、灰质体积和右侧海马体积参数均来自sMRI。由于常规脑影像学特征难以表征AD全部特点,根据既往研究结果,可结合高维影像组学特征对AD影像学特征与易感基因进行关联分析,如SCELSI等[8]对MRI所示双侧海马体积和PET所见皮层蛋白样沉积负荷进行其与基因的关联研究,ZHANG等[9]自sMRI和fMRI中提取海马体积和部分脑功能特性进行相关性分析。随着脑网络研究的进展,有学者[10]开始利用DTI构建大脑结构网络,并对网络特征进行脑影像学表型相关研究。

2.2 基因组学方法研究现状 AD基因研究方法现已从经典的基于连接和候选基因的关联研究发展到全基因组关联研究(genome-wide association study, GWAS)和下一代测序(next generation sequencing, NGS)。鉴定新易感基因有助于深入理解AD发病机制。GWAS是目前最常用的AD影像基因组学基因分析方法,以单核苷酸多态性(single nucleotide polymorphism, SNP)为标记单位,在全基因组水平进行比对分析,挖掘与疾病表型存在强相关性基因的变异位点,可鉴定与AD表型或病理变化具有强相关的特定SNP组合,于基因层面反映AD的病理特征。DERRK等[11]以GWAS分析来自50个群组的30 717个个体的皮层体积和颅内体积,确定了影响核壳和尾状核体积的5个新的遗传变异,并证实3个新位点对海马体积和颅内体积存在影响。NHO等[12]通过整合遗传学信息与影像学表型,利用全基因组测序对PESN1基因与负载定量生物标记物进行关联分析,证明PESN1变异与关键脑区萎缩显著相关。此外,基因分析方法还包括主成分分析(principal component analysis, PCA)、多因子降维(multifactor dimensionality reduction, MDR)和独立成分相关算法(independent component correlation algorithm, ICA)[13],但均未考虑之前的研究结果,且需对大量数据集进行多重校正,造成很多微小风险位点被遗漏。基因本体 (gene ontology, GO)、京都基因和基因组数据库(Kyoto Encyclopedia of Genes and Genomes, KEGG)富集分析可解决上述问题,故常用于分析具有各异性表达基因的通路。ZENG等[14]分析AD相关基因通路富集分析和蛋白质-蛋白质相互作用(protein-protein interaction, PPI),确定了6个潜在影响微小核糖核酸(micro RNA, miRNA)结合的先导SNP(rs10119、rs1048699、rs148763909、rs610932、rs6857和rs714948)和2个代理SNP(rs12539172和rs2847655),表明SNP通过影响miRNA的结合而作用于AD。朱士胜等[15]利用从数据库中得到的差异表达基因(differentially expressed genes, DEG)进行GO富集分析和KEGG通路富集分析,筛选出在AD发展过程中起重要作用的关键基因。考虑到此两种方法可能存在富集假阳性和一定主观性,实际分析时可加入加权基因共表达网络构建(weighted gene co-expression network analysis, WGCNA)[16],以鉴定共表达的基因模块,分析基因模块与样本特征间的相关性,利于挖掘潜在标记基因,因其可信度高于GO和KEGG富集分析而应用广泛。

表1 不同成像方式下影像学表型提取及相关变化

2.3 影像-基因关联分析方法研究进展 关联分析方法是目前用影像基因组学AD研究重点。早期单变量研究需要对候选基因变异和候选脑影像学特征进行科学假设,且必须同时检验大量假设,并对结果加以多重校正,过程十分繁复,故应用较少。STEIN等[17]首先以多变量关联分析观察受试者整个大脑31 622个体素中的448 293个SNP,并以集群节点来执行计算;HIBAR等[18]也在基因水平进行类似分析;二者均应用PCA将多维遗传数据归一化,得到特征SNP,最后回归到单变量线性分析。WANG等[19]提出群稀疏多任务回归模型,对多模态的影像学表型与候选基因进行关联分析,不仅毋须将多变量影像数据归一化,免于存在大量独立性假设的问题,还具有更强的抗噪声能力。ZHU等[20]开发的贝叶斯简化秩模型利用贝叶斯框架中的函数来最大化影像学表型与基因数据的关联,既能降低单变量回归中独立性假设的数量,又具有更高的检测遗传变异能力。GE等[21]在此基础上提出一种基于核机的多维变量集交互效应检测方法,可同时检测多个遗传变异之间的相互影响。STINGO等[22]利用分层混合模型对整个大脑功能连接网络和全基因进行关联分析;HUANG等[23]开发的快速全基因组关联分析(fast genome-wide association study, FGWAS)框架在GWAS基础上结合大脑功能特性,显著提高了对重要基因变异的检测能力。目前大量多元数据关联研究均对已有统计学分析模型进行扩展与改进,以简化结果的多重验证和解释。有学者[24]建立新的快速多任务稀疏正则相关分析,在相关系数和正则权值模式方面均具有更好的性能,且运行速度快,易于实现。茹峰等[25]提出一种新的基于典型相关分析(canonical correlation analysis, CCA)的高阶统计量结构化稀疏算法,以探索大量基因与脑影像学数据之间的关联性,便于提取两类数据中高度相关的特征,并保持其相互独立。

近来AD研究多转向纵向影像基因组学,以观察大脑结构动态变化与基因之间的相关性,但总体而言仍处于起步阶段(表2)。SZEFER等[26]分析75 845个SNP与56个大脑区域结构MRI变化率的关系,以引导程序增强的稀疏正则相关分析验证了1 649个SNP对促进AD结构缺失具有较大可能性,并首次用逆概率加权解释了ADNI研究中存在的偏置采样设计和低关联信号的高维数据。LU等[27]将ZHU等[20]的贝叶斯低秩模型扩展为纵向设置,将时变影像学数据直接与遗传标记联系起来进行剖析。WANG 等[28]将机器学习方法扩展到纵向影像基因组学研究中,通过输入3 123个SNP位点,基于体素分析法(voxel-based morphometry, VBM)和Freesurfer两种成像标记物自动检测其间的关系,发现APOE-rs429358与大脑皮层体积、MS4A4E- rs670139与脑白质体积、MS4A6A- rs66798与灰质密度之间存在相关性,有望为未来将人工智能融入纵向影像基因组学研究提供参考依据。

表2 不同影像-基因关联分析方法的优点

3 小结与展望

影像基因组学目前已大量用于AD研究,通过对多维脑部特征和特异性风险基因进行多方位有效信息的提取和关联分析而实现AD诊断、分型、预测及预防,但用于影像学表型及基因分析方面仍存在限制。未来将聚焦于扩充影像学表型和选取易感基因,改进关联分析模型,提高分析的准确性;还可考虑在影像基因组学研究应用深度学习相关算法,通过融合影像学表型与基因而进一步探究其相关性。

猜你喜欢
基因组学表型关联
基于宏基因组学方法分析化肥减施对热带地区菜地土壤微生物群落的影响
承德所选实生核桃资源果实表型性状评价初报
不惧于新,不困于形——一道函数“关联”题的剖析与拓展
体型表型与亚临床动脉粥样硬化有关
山西在谷子功能基因组学研究领域取得重大突破
慢性阻塞性肺疾病急性加重期临床表型及特征分析
新疆和西藏少数民族的群体基因组学研究
系统基因组学解码反刍动物的演化
“一带一路”递进,关联民生更紧
土壤盐碱对不同表型猴樟渗透调节物质的影响