胡学会, 闫 红, 吴计划, 赵忠礼, 汪晓翠, 杨 斌
(1. 安徽省儿童医院 神经内科, 安徽 合肥, 230000; 2. 中国科学技术大学第一附属医院 临床病理中心, 安徽 合肥, 230001)
脊髓性肌萎缩症(SMA)是一种常染色体隐性遗传性疾病,由5号染色体运动神经元生存基因(SMN)突变导致。2018年, SMA被列入中国《第一批罕见病目录》,发生率仅约1/10 000[1]。人类SMN基因有SMN1和SMN2,SMN1基因主要编码蛋白基因,SMN2是备用基因,也是SMA的主要疾病修饰因子[2]。根据发病年龄和达到的最大运动里程碑, SMA分为0、1、2、3、4共5型[3]。SMA患者的肌无力、肌萎缩症状,主要是由于患者体内不能编码产生足够的SMN蛋白,其缺失导致脊髓前角运动神经元逐渐丢失,进而引发一系列临床表现,重型可导致死亡。
环状RNA(circRNA)是一类内源性非编码RNA分子(ncRNA), 具有高度保守、结构稳定、自然抵抗外切酶的降解和组织特异性等优点,有成为生物标志物的巨大潜力[4-6]。多项研究[7-11]表明circRNA参与了神经退行性疾病并扮演了重要的角色,例如颞叶癫痫、阿尔兹海默症、帕金森病、多发性硬化症以及肌萎缩性脊髓侧索硬化症。本研究通过芯片技术筛选儿童SMA2型患者和健康人群血浆中显著差异表达的circRNA, 并分析这些circRNA可能参与的生物学过程及通路,同时构建circRNA-miRNA网络,从circRNA的视角探讨SMA的发病机制,现报告如下。
选取2021年9月—2022年3月安徽省儿童医院收治的5例SMA2型患儿作为SMA组。收集患儿的性别、就诊年龄、发病年龄、肌张力、骨密度以及遗传学等临床资料。所有患儿按照《脊髓性肌萎缩症遗传学诊断专家共识》[12]的标准进行诊断及分型。另选取同期年龄匹配的5例健康儿童作为对照组。纳入标准为: 患儿就诊时年龄不超过18岁,未接受基因修饰治疗; 排除合并其他系统性疾病者,排除SMN1基因外显子发生纯合性缺失及拷贝数异常者。本研究已通过安徽省儿童医院伦理委员会批准(批件号: EYLL-2020-015), 全部受试者及其监护人均知晓并签订知情同意书。
1.2.1 RNA样品抽提和上机测序: 采集2组受试者的空腹静脉血各5 mL置于抗凝管中, 4 ℃低温下1 200转/min离心10 min, 吸取上层液体分离出血浆,保存于-80 ℃冰箱中。采用Trizol法对血浆中游离RNA进行抽提。采用NanoDrop检测方法测定RNA浓度和纯度。采用Agilent 2100 Bioanalyzer检测RNA的完整性。样品质检合格后,取1~10 ng RNA, 使用Clontech SMARTer Stranded Total RNA seq kit V2 pico input试剂盒进行文库构建,所有样品的互补DNA文库均采用Illumina HiSeq 2000测序平台(广州吉赛生物科技股份有限公司)进行测序。
1.2.2 差异circRNAs的筛选: 对获得的原始数据进行过滤,同时删掉接头序列、含N较多的序列及低质量的reads, 获得高质量数据(clean reads); 将clean reads与参考基因组进行比对,比对结果用于下一步 circRNA的鉴定。采用 DCC软件综合鉴定circRNA, 得到高可信circRNA。应用edgeR工具进一步对鉴定到的circRNA进行序列预测、表达值计算和表达差异分析。显著差异表达的circRNA进行热图(Heatmap)和聚类分析(差异倍数≥1.5, 统计学显著性P<0.05), 用于后续功能的挖掘。
1.2.3 竞争性内源RNA(ceRNA)网络构建: circRNA可作为ceRNA来保护mRNA免受微小RNA(miRNA)的降解,进而调控mRNA的表达丰度。利用TargetScan和miRanda软件预测circRNAs可能结合的miRNA, 以及所有对应物种的miRNA与差异表达 circRNA 的关系,判断两者关系的主要依据包括序列匹配、circRNA-miRNA双链结合热稳定性等。根据 miRanda比对得分>140, 自由能<-15构建circRNA-miRNA网络关系调控图。
1.2.4 功能富集分析: 使用R软件clusterProfiler对差异表达的circRNA分别进行基因本体论(GO)功能分析、京都基因和基因组百科全书(KEGG)通路富集以及Reactome通路富集分析,以查看可能参与的生物学过程和通路。
为了获得表达更准确的差异表达circRNA转录本,对circRNA进行了M-值的加权截尾均值(TMM)标准化并过滤表达过低的circRNA(基因表达谱CPM值>0.1), 随后根据分组信息采用edgeR对circRNA进行了差异表达分析(差异倍数≥1.5,P<0.05, FDR<1)。差异表达基因集合是否显著富集到GO/KEGG/Reactome term, 不仅仅要看P值,还需要关注overlap Gene Count, 如果其太小(<3), 即使P值很显著,也没有太大的生物学意义。
结合发病年龄和运动里程碑, SMA组5例均为SMA2型,其中男2例,中位年龄3岁,女3例,中位年龄10岁。见表1。对照组性别及年龄均按1∶1匹配入组。
表1 SMA组5例SMA患儿临床资料
层次聚类分析显示了SMA组与对照组circRNA的差异表达谱。相对表达较高的circRNA用红色表示,表达较低的用蓝色表示,见图1, 热图展示将SMA患者与健康对照组区分开来。以差异倍数绝对值≥1.5、统计学显著性P<0.05为标准,相较于对照组, SMA组中共鉴定出136个显著差异表达的circRNA, 其中55个circRNA表达上调, 81个circRNA表达下调,见图2。根据变化差异倍数和P值,分别选取上升和下降排名前10位的circRNAs, 见表2。
图1 SMA组与对照组差异表达的circRNA热图(S为SMA组, N为对照组)
图2 SMA组与对照组差异表达的circRNA火山图
表2 SMA组与正常对照组差异表达的circRNA
使用TargetScan和miRanda数据库预测差异表达circRNA的靶向miRNA, circRNA序列上的miRNA结合位点数目越多, miRNA越有可能结合到circRNA上。根据差异倍数排序,各选取前5位的上调、下调circRNA进行预测,筛选出匹配值较高的5个miRNA进行注释,见表3。通过对预测结果过滤,保留总分最大的前1 000个miRNA, 应用Cytoscape软件绘制circRNA-miRNA调控网络图,见图3。
表3 差异表达的circRNA与miRNA结合位点的预测结果
红色节点代表上调circRNA, 绿色节点代表下调circRNA, 蓝色节点代表miRNA。图3 circRNA-miRNA调控网络图
根据差异表达的circRNA进行GO功能注释,结果显示主要富集于去磷酸化作用、DNA复制、有丝分裂等生物过程。细胞成分的定位主要在高尔基外侧网络、纺锤体和细胞质膜侧等,其主要分子功能为ATP酶活性、磷酸酶、磷酸酯水解酶活性和组蛋白结合等,见图4。KEGG分析发现,差异的circRNA可能涉及的通路包括MAPK信号通路、HIV病毒感染、VEGF信号通路、同源重组修复、DNA复制等,见图5。Reactome分析结果显示,差异的circRNA主要富集在高尔基体和内质网的运输、DNA双链断裂修复、同源重组和非同源末端连接等信号通路,见图6。
图4 差异表达的circRNA的GO富集分析
图5 KEGG通路分析条形图
图6 Reactome通路分析条形图
SMA是最常见的神经退行性疾病之一,与儿童的死亡率有关。目前诊断SMA的金标准是基因检测,但仍需结合典型的临床症状和家族史[13]。近年来,基因疗法成为第2种被批准治疗SMA的方法,其能够恢复SMN2外显子7的小分子化合物,进一步扩展了用于SMA治疗的RNA靶向分子类别,除SMN2pre-mRNA外,内源性RNA靶标如miRNA和circRNA, 也可能被用于开发额外的SMA疗法[14]。
研究[15]显示, circRNA具有独特的闭环结构,使其可以高度稳定地存在于血清、血浆等细胞外坏境中,这也提高了circRNA作为miRNA海绵通过ceRNA网络调节亲本基因表达的有效性[16]。目前已有多项研究[17-18]表明,血浆circRNA分子能够作为诊断疾病和肿瘤的分子标志物,不仅与治疗敏感性密切相关,还可作为预后相关的重要分子标志物,具有很强的临床诊断意义[19-20]。然而,目前circRNA在儿童SMA患者中的研究仍较少。本研究首次使用来自儿童SMA2型患者和健康对照组血浆中circRNA的表达谱进行多层综合分析,发现共有136个显著差异表达的circRNA, 其中55个在SMA组表达上调, 81个表达下调,这些circRNA可以在血浆样本中作为SMA的候选生物标志物,同时高通量数据为SMA可能的致病作用也提供了线索。
研究[21]表明miRNA在运动神经元的发生发展、SMA发病机制方面发挥着至关重要的作用,识别潜在的SMA相关miRNA及其相应的伴侣RNA结合蛋白,不仅可以提供监测疾病进展的生物标记物,还可以代表潜在的治疗靶点。ABIUSI E等[22]发现miR-181a-5p、miR-324-5p和miR-451a在SMA患者血清中显著上调,并提高了SMA的表型预测价值。本研究对SMA患者血浆中差异表达的circRNA进行了miRNA位点的预测,筛选出匹配值较高的5个circRNA, 并在此基础上构建了circRNA-miRNA调控网络。初步分析发现除了上述3种miRNA均在预测范围内,这些差异表达的circRNA还具有与神经元发育相关miRNAs(miR-9、miR-124 和 miR-133)、富含运动神经元miRNAs(miR-183和miR-218)、肌肉特异性miR-206以及星形细胞产生的miR-146等在SMA的发病机制中发挥重要调控作用的miRNA的结合位点[23-26]。因此,这些circRNA可能通过靶向吸附miRNA调控SMA的发生和发展。此外,本研究绘制的ceRNA调节网络也为SMA中circRNA-miRNA级联放大协同效应的调控途径提供了线索。
GO功能富集分析显示,多数差异表达的circRNA参与了ATP酶活性以及磷酸酶活性。研究[27]表明, SMN蛋白的缺失影响了线粒体稳态的维持以及能量代谢的调控,其中包括ATP酶活性。PTEN是一种磷酸酶和张力蛋白同源物,其缺失可激活抗凋亡因子,该通路在许多神经退行性疾病中起着重要的保护作用[28]。因此,PTEN基因的敲除、缺失或突变通过调节其磷酸酶活性可能是促进SMA运动神经元存活的重要治疗策略。此外, KEGG及Reactome通路富集分析均显示,候选circRNA的靶基因在同源重组修复(HR)、非同源末端连接(NHEJ)以及DNA复制途径中富集。KANNAN A等[29]研究指出长期低水平的SMN蛋白会导致感觉神经毒素(SETX)缺乏,诱导DNA双链断裂(DSB)增加,以及DNA活化蛋白激酶催化亚单位(DNA-PKcs)的缺乏,从而损害DSB修复。因此, DNA损伤在SMA患者脊髓组织中积累,在细胞分裂过程中, DSB通过HR和NHEJ途径修复[30]。另外, TAY S H等[31]利用同源重组修复机制产生了一个具有中等水平SMN蛋白的斑马鱼突变体,用于研究晚期SMN蛋白的缺失对运动神经元和肌肉的影响。据此推测,这些circRNA可能通过同源重组修复参与调控SMA的发生和发展。
综上所述,本研究通过对儿童SMA2型患者血浆中提取的circRNA的差异表达进行详细的生物信息学分析,并基于该假设构建了circRNA-miRNA网络,这些结果可能有助于阐明SMA的发病机制,以指导治疗策略的制订。鉴于SMA发病率低,临床罕见,本研究纳入病例量较少,后续仍需进一步扩充临床样本,考虑在其他亚型SMA患者、肌肉活检组织或细胞水平进行验证,以期为SMA的早期检测、精确诊断以及靶向治疗提供新的策略方向和更多的数据基础。