王昱欢,丁奕岑,蔡瑶雨,康亚妮
1.上海交通大学生物医学工程学院,上海 200240;2.上海交通大学医学院,上海 200025
多囊卵巢综合征(polycystic ovary syndrome,PCOS)是育龄女性最常见的一种内分泌失调性疾病,以慢性无排卵(排卵功能紊乱或丧失)和高雄激素血症为特征,主要临床表现为月经周期不规律、不孕、多毛和痤疮。几乎半数以上的肥胖女性患有PCOS,不仅导致近期和远期的生活质量下降,还会增加癌症、心脑血管疾病的发生风险。50%~70% PCOS 患者的生殖功能障碍且内分泌代谢紊乱[1]。
微RNA(microRNAs,miRNAs)是长度为18~25 nt的非编码小RNA,通过与靶mRNA 的3′UTR 区互补序列结合,抑制其翻译或诱导其降解,从而抑制基因表达,参与多种疾病的调节,如糖尿病、胰岛素抵抗、炎症疾病和癌症等。研究[2]表明,miRNA 可能通过在PCOS 患者的血液、卵泡液及颗粒细胞中异常表达,来调节生殖、激素分泌和代谢、细胞增殖和凋亡、卵巢卵泡发育相关基因,从而发挥其生物学功能,参与PCOS疾病的发生发展机制。国内外相关研究[3]证明miR-21 及miR-93 在PCOS 患者中表达水平异常,这可能与PCOS 高雄激素表型的发病机制相关,这表明miRNA 的表达水平与PCOS的发病有密切的关联性,是调节PCOS及其相关疾病的潜在生物标志物。
随着对PCOS检测技术和相关分子机制研究的不断深入,基于高通量测序技术筛选PCOS相关易感基因及诊断标志物的研究也在深入展开[4]。本研究基于高通量测序的miRNA-seq技术,从全基因组范围筛选出可作为PCOS生物标志物的miRNA,为阐明PCOS 的发病机制、探求诊断新靶点提供新的思路。
选取上海交通大学医学院附属仁济医院2019年1月—10月收治的5例PCOS患者作为观察组,入选标准:符合PCOS的诊断标准,并经B超、生化检验及临床症状确诊。另选取5例体检健康的女性作为对照组。样本收集和临床信息采集均符合医院伦理委员会要求。2 组对象的性别、年龄、病程等基本资料差异无统计学意义,具有可比性。
采集2组对象的颗粒细胞,用TRIzol法分离颗粒细胞中的总RNA。使用Nanodrop One 超微量分光光度计对分离得到的总RNA 进行定量,之后用琼脂糖凝胶电泳检测RNA 的完整性,保证提取得到的总RNA 质量较好;质检合格后按照TruSeq Small RNA Library Prep 试剂盒(Illumina 公司,美国)说明书步骤进行miRNA-seq 文库构建,利用Qubit 定量和2100 生物分析仪(Agilent 公司,美国) 进行文库质量鉴定;文库质检合格后用NextSeq500(Illumina 公司,美国)进行高通量测序;获得测序结果的原始数据后对其进行数据分析。采用RTqPCR 实验检测转录组测序结果的可靠性,同时检验候选miRNA标志物是否确实存在差异表达。
miRNA-seq 测序后获得原始数据(raw reads),经过过滤去接头,去污染、比对参考基因组,得到干净数据(clean reads)进行后续的信息分析,包括以下步骤。
(1)使用Cutadapt(version 3.4)程序去掉原始下机数据中的接头序列。
(2)使用Trimmomatic(version 0.39)程序去掉低质量序列,得到clean reads。
(3) 使用FastQC (version 0.11.9) 程序统计clean reads的数据量,保留15~35 nt的片段进行后续分析。
(4)使用bowti2(version 2.1.)程序将clean reads 比对到参考基因组上,用miRDeep2(version 2.0.1.2)工具进行novel miRNA的预测。
(5)使用bowti2(version 2.1.)程序将clean reads比对到miRBase(version 22.1)中的known miRNA数据库上。
(6)使用edgeR、DESeq2和limma 3种方法进行基因表达差异性分析,并对差异表达miRNA 进行靶基因预测。
(7)使用clusterProfiler(release 3.13)进行基因本体数据库(Gene Ontology,GO)和京都基因和基因组百科全书 (Kyoto Encyclopedia of Genes and Genomes,KEGG)富集分析。
设计合成miRNA 的引物(表1),使用PrimeScript™RT 试剂Kit(RR037,TAKARA)进行逆转录,逆转录后利用合成的引物进行qPCR,实验重复3次,再利用Excel对实验所获得的Ct值进行计算,得出每个miRNA 的2-ΔΔCT,利用Graph Pad Prism 7 进行作图及差异分析,进一步明确可用于PCOS诊断的生物标志物。
表1 miRNA引物序列(5′→3′)Tab 1 miRNA primer sequence(5′→3′)
本研究对5 对样本的测序数据进行初步的质量评估后,对测序结果进行过滤、分类,并计算了miRNA 的表达量,得到了5对样本中1 191条miRNA 的表达量。我们进一步分别使用edgeR 包、DESeq2 包和limma 包,对1 191 条miRNA 进行基因表达差异性分析,对三大R 包的差异分析结果取交集,最终得到了20 条表达量差异具有统计学意义的miRNA(图1A),其中包括hsa-miR-188-3p等11条表达上调miRNA 和hsa-miR-2355-5p等9条表达下调miRNA(图1B)。随后,我们对差异表达的miRNA 进行了层次聚类分析,分析了PCOS患者与正常女性的颗粒细胞中miRNA 表达的模式差异与相似性,便于推测未知基因的功能或已知基因的新功能(图1C)。
通过对20 条差异表达miRNA 进一步筛选,选取P<0.02 的13 条miRNA 和表达量差异倍数超过8 倍的11 条miRNA,取两者交集,获得了9 条miRNA 作为候选生物标志物,其中hsa-miR-10a-5p、hsa-miR-1299、hsa-miR-4440、hsa-miR-451a、hsa-miR-196a-5p 和hsa-miR-188-3p为表达上调基因,hsa-miR-2355-5p、hsa-miR-6509-5p 和hsa-miR-877-5p为表达下调基因。
为了探究差异表达miRNA 在PCOS 颗粒细胞中的调控作用,分别使用数据库mirDB 和TargetScan 对这9 条候选生物标志物miRNA 进行靶基因预测,并将2 个数据库的靶基因预测结果取交集,得到最终的靶基因预测结果。随后,使用ClusterProfiler 包对靶基因进行了GO 富集分析和KEGG 富集分析,进一步探究显著差异表达miRNA在PCOS 发病机制中的生物学意义。根据GO 富集分析结果表明,候选生物标志物miRNA 的靶基因集合富集于上皮细胞增殖及其调节、细胞黏附的正调控、腺发育等,其中主要集中于上皮细胞增殖的调节(图2A)。KEGG富集分析结果表明,差异表达miRNA 的靶基因主要富集于T细胞受体信号通路、类固醇激素生物合成、调节多功能干细胞信号通路、泌乳素信号通路和视黄醇代谢等通路(图2B)。
图2 靶基因的功能富集分析结果Fig 2 Results of functional enrichment analysis of target genes
基于miRNA-Seq数据处理后得到的基因表达信息,在显著性差异表达的miRNA中随机挑选5个基因(3个上调,2 个下调,即miR-196a-5p、miR-877-5p、miR-2355-5p、miR-10a-5p和miR-451a)设计引物,然后利用qRT-PCR实验对PCOS组与对照组临床样本进行了检测验证。结果如图3所示,5个miRNA的qRT-PCR结果与测序数据分析结果高度一致,说明转录组测序结果的可靠性。同时,miR-196a-5p(P=0.005)、miR-10a-5p(P=0.009)、miR-877-5p(P=0.002)、 miR-2355-5p (P=0.008)、 miR-451a (P=0.041),5条miRNA的表达差异均具有统计学意义,表明这5条miRNA具有作为PCOS生物标志物的潜能。
图3 利用RT-qPCR实验验证5个miRNA候选生物标志物的基因表达结果Fig 3 RT-qPCR validation of 5 miRNA candidate markers
PCOS 是育龄妇女常见的内分泌系统疾病,是引起不孕不育的主要原因。临床上针对PCOS的诊断依然依赖于其诊断标准,与PCOS相关的易感基因及诊断生物标志物仍有待研究。研究[3,5-7]表明,多种miRNA 参与了PCOS疾病的发生和发展过程。miRNA 的异常表达被认为可能参与PCOS的基本病理生理过程,包括细胞增殖、胰岛素抵抗、雌激素分泌、雄激素生成和细胞凋亡等[2]。本研究利用基于高通量测序的miRNA(miRNA-seq)技术,通过生物信息学方法筛选分析了与PCOS 有关的miRNA作为生物标志物。经分析证明颗粒细胞中miR-196a-5p、miR-877-5p、miR-2355-5p、miR-10a-5p 和miR-451a 表达差异具有统计学意义,RT-qPCR 实验结果表明筛选出的miRNA具有作为PCOS生物标志物的潜能。
miR-196a-5p 是一种新报道的与多种肿瘤相关的miRNA[8-10]。Zhao 等[11]的研究发现,miR-196a-5p 会被长链非编码RNA(long noncoding RNA,lncRNA)GAS5直接靶向调控,从而抑制卵巢癌的发展。PCOS是一种复杂的内分泌疾病,患有PCOS的女性新陈代谢和激素环境改变可能会增加其罹患某些类型癌症的风险。而一些研究与统计调查发现,在某些患有PCOS的女性中,卵巢癌的发病率也可能上升[12-13],PCOS患者与卵巢癌患者之间也存在一些相同的症状,如月经不调、少经等。但PCOS与卵巢癌之间的关联非常复杂,目前尚不清楚[14-15]。
关于miR-877-5p 的研究目前主要集中在肿瘤领域,而其与PCOS 疾病的相关性还有待研究。Yan 等[16]发现,miR-877-5p通过靶向CDK14抑制细胞生长、迁移和侵袭,在肝细胞癌细胞中起到抑癌作用。正常情况下,女性每个月卵巢有1~2 个卵泡发育成熟、排卵,之后形成黄体,卵泡闭锁,而PCOS患者的卵泡不能发育成熟,卵巢内聚积多个小的卵泡,所以卵巢呈现多囊改变。Yan 等[16]的研究发现miR-877-5p 可以通过靶向CDK14抑制细胞生长,但CDK14是否会影响卵巢中卵泡的发育还有待研究。
目前关于miR-2355-5p 的研究较少。现有的一些研究表明,miR-2355-5p 不仅与癌症的发展相关[17-18],还与慢性疾病的发生相关。Iacomino 等[19]发现了3 条循环miRNA 有作为肥胖和相关代谢紊乱的新型生物标志物的可能性,miR-2355-5p 便是其中1 条;而肥胖和相关代谢紊乱也是PCOS 患者可能出现的症状,这预示着miR-2355-5p也具有作为PCOS诊断生物标志物的潜能。
Wang 等[20]发现miR-10a-5p 在卵巢癌患者的血浆中显著过表达,可以作为卵巢癌非侵入性诊断生物标志物;而Guo等[21]发现miR-10a-5p的基因组扩增和低表达促进卵巢癌细胞的增殖和侵袭。这些研究表明miR-10a-5p 与卵巢癌的发生发展有关,预示了miR-10a-5p与PCOS之间可能存在联系。此外,有研究[22]表明,miR-10a-5p 的mRNA 基因靶标与结缔组织增殖显著相关,猪卵泡中的miR-10a-5p 可以调节结缔组织生长因子(connective tissue growth factor,CTGF)[23],而CTGF 在PCOS 的卵泡发育障碍及排卵障碍过程中发挥重要作用,可能和胰岛素样生长因子1(insulin-like growth factor 1,IGF-1)协同作用促使PCOS 发生[24]。这些证据表明,miR-10a-5p可能参与了PCOS的发生发展。
miR-451a 被认为在多种肿瘤中发挥作用。在宫颈癌中,有研究[25]表明miR-451a 在宫颈癌样本中下调,并可能通过调节PI3K-Akt信号通路和EREG参与宫颈癌的发生发展,但一些研究[12]表明PCOS 与宫颈癌之间并不存在明显关联。此外,Díaz等[26]针对患有PCOS 的31例青春期女孩展开了PCOS诊断生物标志物的研究,他们发现miR-451a 对于诊断PCOS 具有100%的敏感度和特异度,可以作为青春期PCOS诊断和治疗的生物标志物。
总结以上讨论内容,我们发现miR-196a-5p 和miR-10a-5p 均与卵巢癌的发病相关,且miR-10a-5p 可通过调控CTGF促使PCOS 发生,miR-2355-5p 和miR-451a 都具有作为PCOS 及其相关复杂疾病的诊断生物标志物的潜能,而miR-877-5p 也可能与PCOS 的发生发展有关。GO和KEGG 富集分析结果表明,miR-196a-5p、miR-877-5p、miR-10a-5p和miR-451a与细胞的生长、增殖和凋亡有关,miR-2355-5p 则与激素分泌与代谢紊乱相关,miR-196a-5p、miR-877-5p、miR-2355-5p、miR-10a-5p 和miR-451a均可能通过影响相关基因的表达,参与信号通路的调控,从而影响PCOS的发生发展。
研究表明,过量的雄激素会引起PCOS 的发生[27],而视黄醇会引起氧化应激(oxi-dation stress,OS)水平的失衡,从而产生过多的活性氧(reactive oxygen species,ROS)自由基,并最终导致胰岛素抵抗[28-31]。胰岛素会增强人体内黄体生成素(luteinizing hormone,LH)对雄激素分泌过程的刺激作用[32-33],促使雄激素水平升高并产生一系列PCOS表型。在本研究中,我们发现miR-2355-5p 的靶基因DHRS4和DHRS4L2通过视黄醇代谢通路引起OS 失衡,间接导致雄激素水平增加与PCOS的发生;我们还发现miR-188-3p/MAPK13、miR-196a-5p/NRAS和miR-4440/GSK3B均通过催乳素信号通路促进胰岛素分泌,导致体内LH水平上升并最终产生PCOS表型。我们对本研究所发现的PCOS疾病发生发展的转录调控机制进行了总结,见图4。
图4 PCOS疾病发生发展的转录调控机制Fig 4 Transcriptional regulatory mechanism of PCOS occurrence and development
本研究利用基于高通量测序的miRNA-seq 技术,从全基因组范围进行了颗粒细胞miRNA 作为PCOS 疾病生物标志物的研究,建立了PCOS 疾病miRNA 表达谱,并通过计算预测与实验验证分析了特异性差异表达的miRNA 及其靶基因,证明了颗粒细胞中miR-196a-5p、miR-877-5p、miR-2355-5p、miR-10a-5p 和miR-451a 具有作为PCOS 生物标志物的潜能。通过对差异表达miRNA的靶基因进行功能富集分析,在全基因组水平初步探索了PCOS 疾病的发生机制,探究了miRNA 在PCOS 发病机制中的生物学意义,总结出了PCOS疾病发生发展的转录调控机制,为阐明PCOS的发病机制、探求诊断新靶点提供了研究思路和理论依据。