基于生物医学大数据寻找不孕症关键致病基因及通路

2022-01-07 10:02魏佳乐刘鑫奕陆绍永芦雪峰
上海交通大学学报(医学版) 2021年10期
关键词:还原酶类固醇频数

魏佳乐,刘鑫奕,陆绍永,芦雪峰,张 健#

1.上海交通大学基础医学院药物化学与生物信息学中心,上海 200025;2.上海交通大学医学院细胞分化与凋亡教育部重点实验室,上海 200025;3.上海交通大学医学院附属第九人民医院辅助生殖科,上海 200011

目前,不孕症的医学定义为有1年以上未采取任何避孕措施的正常性生活而不能成功妊娠[1],其根据发病因素可分为男性不育和女性不孕。许多疾病都可以导致不孕不育,例如低促性腺素性功能减退症、早发性卵巢功能不全、无精子症、子宫内膜异位等[2]。尽管不孕症的治疗是研究热点和亟待解决的问题,但在分子层面研究其致病机制仍是新兴领域,许多不孕症的发病原因并不清楚[3]。为了促进系统研究,我们率先建立了不孕症疾病数据库(Infertility Disease Database,IDDB)的大数据平台。这是一个不孕症相关遗传致病因素的数据库[4],但蕴藏在大数据中的基因规律及致病因素仍有待挖掘。本研究拟在搜集的大数据病例致病基因突变的频数层面,初步探索不孕症患者的基因突变特点。

不孕症是多因素控制的复杂疾病,解剖学上表现的缺陷、精卵发生的功能障碍、内分泌失调、免疫疾病等都是造成不孕症的关键因素[5]。其中,内分泌系统至关重要,在生殖、生育过程中,它不仅调控精子形成与睾丸功能,还与正常的卵泡发育和排出有密切关系[5-6]。有研究指出,类固醇在人类生殖系统复杂的功能中发挥至关重要的作用,对男性和女性的生育都有重要影响[7]。当然,雄激素和雌激素这些关键的生殖激素也包括在类固醇激素中,主要在性腺中合成。类固醇激素相关的疾病,例如先天性肾上腺增生症,主要是由于合成所必需的酶存在缺陷致使皮质激素合成不正常,在影响生育的遗传性肾上腺类固醇紊乱疾病中是最常见的[8]。类固醇激素体内生成过程主要在肾上腺、性腺以及胎盘进行[9],其中许多相关基因的突变会导致不孕症。在此之前,相关研究主要针对单一症状的个别致病基因进行不孕症研究;而本研究基于IDDB大数据系统分析人类不孕症致病基因,揭示重要的蛋白类别及通路。此外,小鼠中导致不孕症的同源基因对人类也具有重要的启示作用[10],因此,本研究计划以小鼠为切入点评估新的潜在致病基因。

1 资料与方法

1.1 数据及分析工具

人类不孕症大数据来源于IDDB,不孕症基因的蛋白分类映射采用UniProt数据库中的Keyword本体系统(https://www.uniprot.org)[11],功能和通路分析使用生物信 息 注 释 分 析 库 (the Database for Annotation,Visualization and Integrated Discovery,DAVID)(https://david.ncifcrf.gov/)[12]和 京 都 基 因 与 基 因 组 百 科 全 书(Kyoto Encyclopedia of Genes and Genomes,KEGG)(https://www.kegg.jp/)[13],小鼠的同源基因及不孕症信息 来 自MGI数 据 库(http://www.informatics.jax.org/)[14],基因互作分析使用蛋白质互作数据库(Search Tool for Recurring Instances of Neighbouring Genes,STRING)(https://string-db.org/)[15]及Cytoscape工具[16],数据分析及统计绘图使用Python及OmicShare Tools工具(https://www.omicshare.com/tools)。

1.2 分析方法

1.2.1 致病基因的分类统计 在IDDB中获取307个致病基因,它们均为由文献证实的不孕症致病基因,而经高通量测序或者大样本统计学分析得到的基因不纳入其中。使用UniProt数据库的Keywords本体系统对307个基因进行蛋白分类,并统计每类基因具有PDB三维结构格式文件的数目[17]。

1.2.2 致病基因的突变频数统计 分析IDDB中2 245条不孕症患者临床样本突变数据。对每类基因,计算样本中出现的总突变频数,并统计其中已具有PDB三维结构的基因所出现的突变频数。

1.2.3 氧化还原酶通路分析 将11个人类不孕症相关氧化还原酶映射至KEGG通路[13]。使用Omicshare Tools进行富集分析及图片绘制,按照格式要求输入氧化还原酶基因,选用人类的背景基因,对应合适的版本进行提交。1.2.4 涉及内分泌系统的致病基因的聚类分析 基于IDDB人类不孕不育致病基因KEGG富集分析,对34个与内分泌系统相关的基因在DAVID网站进行聚类分析。提交标准基因名,基因背景设置为“人类”,设置高置信度,选取打分最高的基因聚类簇。

1.2.5 人类类固醇激素生成通路的基因及小鼠同源基因信息获取 在KEGG网站获得类固醇激素生成通路(通路ID:map00140)涉及的所有基因,保留通用通路中属于人类的通路相关基因,在MGI数据库中查找对应的小鼠同源基因及其突变与生殖系统的相关情况。构建人类与小鼠同源基因列表,其中已知的人类致病基因直接标注,直接影响小鼠生殖而于人类尚未确定或发现的基因也进行标注,作为潜在基因。

1.2.6 通路及基因互作分析 通过查阅文献获得在此通路中与不孕不育相关的关键分子,并通过KEGG分析对应分子的合成路径。分析聚集于此通路的已知的8个人类不孕不育致病基因,通过使用KEGG Mapper工具映射在合成路径里,结合类固醇激素合成的文献[18]绘制通路图,寻找规律,对小鼠致病的潜在基因进行评估。同时,借助STRING对此通路已知不孕不育致病及潜在基因进行相互作用分析,采用高置信度,互作结果经过Cytoscape基于结合分数的Prefuse Force Directed Layout的加工,根据网络拓扑结构寻找已知基因的互作规律,最终在潜在基因里筛选出最可能引起人类不孕不育的基因。

2 结果

2.1 人类不孕症致病基因的分类总览及突变频数统计

获得的307个基因,除外Others类149个无法归类的基因,其余基因分为13类。Lyase与Initiation Factor类的所有基因都有PDB文件解析。氧化还原酶类基因解析率次高(图1A),此类基因涉及的所有致病突变频数最高(图1B),达到450个。氧化还原酶类只有11个基因,基因个数少,平均突变频数最高,突变频率最高;说明根据IDDB搜集的已有数据来看,氧化还原酶类基因是不孕症最常见的突变基因类型,不孕症可能最易涉及此类基因的突变。

图1 人类不孕症基因的分类及突变频数统计Fig 1 Classification and statistics of mutation frequency for infertility-causative genes in human

2.2 氧化还原酶类基因的聚集通路及与内分泌系统的相关性

对致病的氧化还原酶类基因(CYP21A2、CYP17A1、POR、HSD3B2、CYP11B1、CYP19A1、SRD5A2、CYP11A1、HSD17B3、ALOX15、HSD17B4)通路映射的结果显示:聚集通路中类固醇激素合成的显著性最高,基因主要集中于此通路,包括8个基因(图2A)。此类基因的KEGG分级通路数目统计结果显示,其基本属于脂质代谢通路,通过脂质代谢影响生育,而过半的基因又与内分泌系统相关(图2B)。男女共致病基因与内分泌系统相关联,将涉及内分泌系统的34个已知基因聚类分析[4],显著性最高的通路为类固醇激素生成(图2C);说明涉及的内分泌基因与合成类固醇激素紧密相关,主要通过此途径的基因突变致病。

图2 氧化还原酶类基因的KEGG通路富集分析及与内分泌系统的关系Fig 2 Oxidoreductase genes of KEGG pathway enrichment analysis and its correlation with endocrine system

2.3 类固醇激素生成通路中同源小鼠不孕症的潜在基因评估

分析人类类固醇激素生成通路,发现的其中与不孕不育相关的关键分子有睾酮、雌二醇、孕酮、皮质醇等;其中已知致病基因基本落在关键分子的合成主途径上(图3A),大多为限速酶,SRD5A2负责5α-双氢睾酮(5α-dihydro-testosterone,DHT)合成。6个潜在基因(表1)中,只有Akr1c18的人类同源基因AKR1C3(醛酮还原酶家族1成员C3,aldo-keto reductase family 1 member C3)落在雌激素与雄激素相互转化的主路径上(图3A),缺失催化反应中辅因子结合位点的Akr1c18小鼠模型,其发情周期、怀孕期明显延长,存活幼崽数显著减少[19]。缺失Akr1c18部分活性位点的小鼠,孕酮水平持续较高,造成妊娠延迟,胎鼠死亡[20]。因此,Akr1c18基因突变的小鼠会产生长妊娠期、分娩失败等生殖问题。同时,Akr1c18的同源基因AKR1C3的基因互作分析显示:已知的不孕症基因相互结合、相互连接,致病基因具有聚集的趋势;而AKR1C3符合这一特点,也与这些已知基因相互结合(图3B)。因此,AKR1C3被评估为在类固醇激素生成通路借助小鼠发现的潜在基因中最有可能导致人类不孕不育的基因。

图3 已知不孕症基因在类固醇激素生成通路及互作分析中的规律Fig 3 Regularity of known infertility genes in steroid hormone biosynthesis and interaction analysis

表1 类固醇激素生成通路中人类与小鼠同源基因致病情况Tab 1 Pathogenicity for human and mouse orthology genes in the pathway of steroid hormone biosynthesis

Continued Tab

3 讨论

本研究发现,在文献报道的不孕症临床病例基因检测中,氧化还原酶类基因的突变最广泛且最频繁,此类基因主要涉及与内分泌相关的类固醇激素生成途径。该途径受到促肾上腺皮质激素(adreno-cortico-tropichormone,ACTH)刺激,从胆固醇开始,通过细胞色素P450酶(cytochrome P450,CYP450)和羟基类固醇脱氢酶这2类氧化还原酶的脱氢、羟化等作用,逐步生成生殖所需要的激素,激素结合细胞激素受体调控生理活动。研究[21]结果显示,先天性肾上腺增生症是此途径导致不孕症的重要疾病,绝大多数的先天性肾上腺增生症由21-羟化酶缺乏引起,不仅表现激素水平异常,还可出现生殖器官异常。

这些氧化还原酶基因聚集的通路,被StAR(steroidogenic acute regulatory protein)这一关键蛋白快调节,这一调节蛋白激活时可以将大量的胆固醇分子从线粒体外膜转移到内膜[22]。而类固醇产生还需要其他因子的辅助,包括转录因子,如GATA结合蛋白4(GATA binding protein 4,GATA4)、类 固 醇 生 成 因 子-1(steroidogenic factor-1,SF-1)[9],这些基因也都属于不孕症的致病基因。在分类的氧化还原酶基因中,有3个不属于此通路,分别为POR、ALOX15和HSD17B4;其中POR是所有Ⅱ型细胞色素的关键电子供体,其突变会严重影响CYP17A1、CYP21A2和CYP19A1的活性,进而影响类固醇生成。

人类不孕症有许多尚未明确的发病原因,遗传因素有重要影响[5]。然而,在导致男性不育的因素中,已知的遗传因素只占15%~30%[23];导致女性不孕的因素更加复杂,一般表现为多基因致病[24]。因此,发现新的致病基因并明确其作用机制,对于了解生殖系统的功能及调节机制至关重要。我们试图依靠重要的模式动物小鼠找出这样的基因。许多文献未发现小鼠的不孕症基因在人类机体中也存在突变[3],因此需要对这些潜在基因进行评估。经过评估,本研究发现AKR1C3最有可能导致不孕症,而其在子宫内膜细胞的表达对于组织功能障碍发生有重要作用[25],可能与子宫内膜异位相关。在子宫内膜癌中,存在AKR1C3mRNA或蛋白表达异常[26]。有研究[27]显示,在女性中,AKR1C3与患多囊卵巢综合征的风险有相关性。于男性而言,AKR1C3可能不仅在与隐睾相关的睾丸下降中发挥作用,而且与生殖器官的整体男性化也有关系[28]。AKR1C3作为将体内雄烯二酮与睾酮相互转化的重要酶,有很多不同的功能,包括前列腺素、雄激素和雌激素的产生以及调控。AKR1C3异常表达与前列腺癌和乳腺癌有关,卵巢功能障碍和雄激素过多症也与其相关联[29]。另外,AKR1C3还与一种分娩激素的产生有关[30]。总的来看,AKR1C3与不孕症的发生、发展有重要关系,但AKR1C3的具体致病机制,还需要深入探索。

参·考·文·献

[1]Evers JLH.Female subfertility[J].Lancet,2002,360(9327):151-159.

[2]Vander Borght M,Wyns C.Fertility and infertility:definition and epidemiology[J].Clin Biochem,2018,62:2-10.

[3]Matzuk MM,Lamb DJ.The biology of infertility:research advances and clinical challenges[J].Nat Med,2008,14(11):1197-1213.

[4]Wu J,Li D,Liu X,et al.IDDB:a comprehensive resource featuring genes,variants and characteristics associated with infertility[J].Nucleic Acids Res,2021,49(d1):D1218-D1224.

[5]Matzuk MM,Lamb DJ.Genetic dissection of mammalian fertility pathways[J].Nat Med,2002,8(S10):S41-S49.

[6]McGriff SC,Lo EM,Hotaling JM,et al.Optimal endocrine evaluation and treatment of male infertility[J].Urol Clin North Am,2020,47(2):139-146.

[7]Reichman D,Rosenwaks Z.The impact of genetic steroid disorders on human fertility[J].J Steroid Biochem Mol Biol,2017,165(Pt A):131-136.

[8]Therrell BL,Jr.,Berenbaum SA,Manter-Kapanke V,et al.Results of screening 1.9 million Texas newborns for 21-hydroxylase-deficient congenital adrenal hyperplasia[J].Pediatrics,1998,101(4 Pt1):583-590.

[9]Ghayee HK,Auchus RJ.Basic concepts and recent developments in human steroid hormone biosynthesis[J].Rev Endocr Metab Disord,2007,8(4):289-300.

[10]Brugh VM,Maduro MR,Lamb DJ.Genetic disorders and infertility[J].Urol Clin North Am,2003,30(1):143-152.

[11]ConsortiumUniProt.UniProt:a worldwide hub of protein know ledge[J].Nucleic Acids Res,2019,47(d1):D506-D515.

[12]Huang da W,Sherman BT,Lempicki RA.Bioinformatics enrichment tools:paths toward the comprehensive functional analysis of large gene lists[J].Nucleic Acids Res,2009,37(1):1-13.

[13]Kanehisa M,Sato Y,Furumichi M,et al.New approach for understanding genome variations in KEGG[J].Nucleic Acids Res,2019,47(d1):D590-D595.[14]Bult CJ,Blake JA,Smith CL,et al.Mouse Genome Database(MGD)2019[J].Nucleic Acids Res,2019,47(d1):D801-D806.

[15]Szklarczyk D,Gable AL,Lyon D,et al.STRING v11:protein-protein association networks with increased coverage,supporting functional discovery in genome-wide experimental datasets[J].Nucleic Acids Res,2019,47(d1):D607-D613.

[16]Shannon P,Markiel A,Ozier O,et al.Cytoscape:a software environment for integrated models of biomolecular interaction networks[J].Genome Res,2003,13(11):2498-2504.

[17]Berman HM,Westbrook J,Feng Z,et al.The protein data bank[J].Nucleic Acids Res,2000,28(1):235-242.

[18]Biason-Lauber A.Molecular medicine of steroid hormone biosynthesis[J].Mol Aspects Med,1998,19(3):155-220.

[19]Ishida M,Choi JH,Hirabayashi K,et al.Reproductive phenotypes in mice with targeted disruption of the 20alpha-hydroxysteroid dehydrogenase gene[J].J Reprod Dev,2007,53(3):499-508.

[20]Piekorz RP,Gingras S,Hoffmeyer A,et al.Regulation of progesterone levels during pregnancy and parturition by signal transducer and activator of transcription 5 and 20alpha-hydroxysteroid dehydrogenase[J].Mol Endocrinol,2005,19(2):431-440.

[21]El-Maouche D,Arlt W,Merke DP.Congenital adrenal hyperplasia[J].Lancet,2017,390(10108):2194-2210.

[22]Artemenko IP,Zhao D,Hales DB,et al.Mitochondrial processing of newly synthesized steroidogenic acute regulatory protein(StAR),but not total StAR,mediates cholesterol transfer to cytochrome P450 side chain cleavage enzyme in adrenal cells[J].J Biol Chem,2001,276(49):46583-46596.

[23]Neto FT,Bach PV,Najari BB,et al.Genetics of male infertility[J].Curr Urol Rep,2016,17(10):70.

[24]Patel B,Parets S,Akana M,et al.Comprehensive genetic testing for female and male infertility using next-generation sequencing[J].J Assist Reprod Genet,2018,35(8):1489-1496.

[25]Gibson DA,Simitsidellis I,Collins F,et al.Androgens,oestrogens and endometrium:a fine balance between perfection and pathology[J].J Endocrinol,2020,246(3):R75-R93.

[26]Ito K,Miki Y,Suzuki T,et al.In situandrogen and estrogen biosynthesis in endometrial cancer:focus on androgen actions and intratumoral production[J].Endocr Relat Cancer,2016,23(7):R323-R335.

[27]Ju R,Wu W,Fei J,et al.Association analysis between the polymorphisms of HSD17B5 and HSD17B6 and risk of polycystic ovary syndrome in Chinese population[J].Eur J Endocrinol,2015,172(3):227-233.

[28]Ashley RA,Yu Z,Fung KM,et al.Developmental evaluation of aldo-keto reductase 1C3 expression in the cryptorchid testis[J].Urology,2010,76(1):67-72.

[29]Sagvekar P,Kumar P,Mangoli V,et al.DNA methylome profiling of granulosa cells reveals altered methylation in genes regulating vital ovarian functions in polycystic ovary syndrome[J].Clin Epigenetics,2019,11(1):61.

[30]Penning TM,Burczynski ME,Jez JM,et al.Human 3alpha-hydroxysteroid dehydrogenase isoforms(AKR1C1-AKR1C4)of the aldo-keto reductase superfamily:functional plasticity and tissue distribution reveals roles in the inactivation and formation of male and female sex hormones[J].Biochem J,2000,351(pt1):67-77.

猜你喜欢
还原酶类固醇频数
四氢叶酸还原酶基因多态性与冠心病严重程度的相关性
类固醇治疗肾病综合征儿童致激素性青光眼的相关进展
面部整形术后水肿的治疗进展
频数与频率:“统计学”的两个重要指标
类固醇糖尿病患者动态血糖谱的特点及意义观察
类固醇激素的低温等离子体质谱研究
中考频数分布直方图题型展示
亚硝酸盐降解进展研究
山葡萄DFR基因全长cDNA的克隆与序列分析
学习制作频数分布直方图三部曲